Saltar al contenido principal
LibreTexts Español

4.1: Introducción al Análisis Espectral

  • Page ID
    148659
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Muchas de las series temporales discutidas en los capítulos anteriores mostraron fuertes componentes periódicos: Los números de manchas solares del Ejemplo 1.1.1, el número de lince atrapado del Ejemplo 1.1.2 y los datos de ventas de vino australiano del Ejemplo 1.4.1. A menudo, hay una opción obvia para el periodo\(d\) de esta parte cíclica como un patrón anual en las ventas de vino. Dado\(d\), entonces se podría proceder eliminando los efectos estacionales como en la Sección 1.4. En los dos primeros ejemplos es, sin embargo, algo más difícil determinar el valor preciso de\(d\). En este capítulo, se discute un método general para tratar los componentes periódicos de una serie temporal. Para complicar las cosas, suele darse el caso de que varios patrones cíclicos se presentan simultáneamente en una serie de tiempo. Como ejemplo, se recuerdan los datos del índice de oscilación sur (SOI) que exhiben tanto un patrón anual como el denominado patrón El Ni\(\tilde{n}\) o.

    Las funciones seno y coseno son los prototipos de funciones periódicas. Se van a utilizar aquí para describir el comportamiento cíclico en series de tiempo. Antes de hacerlo, un ciclo se define como un período completo de una función sinusoidal o coseno en un intervalo de tiempo de duración\(2\pi\). Definir también la frecuencia

    \[ \omega=\dfrac 1d \nonumber \]

    como el número de ciclos por observación, donde\(d\) denota el periodo de una serie temporal (es decir, el número de observaciones en un ciclo). Para observaciones mensuales con periodo anual,\(d=12\) y por ende\(\omega=1/12=0.083\) ciclos por observación. Ahora reconsidere el proceso

    \[ X_t=R\sin(2\pi\omega t+\varphi) \nonumber \]

    como se introdujo en el Ejemplo 1.2.2, utilizando la convención\(\lambda=2\pi\omega\). Para incluir aleatoriedad en este proceso, elija la amplitud\(R\) y la fase\(\varphi\) para que sean variables aleatorias. Una representación equivalente de este proceso viene dada por

    \[ X_t=A\cos(2\pi\omega t)+B\sin(2\pi\omega t), \nonumber \]

    con\(A=R\sin(\varphi)\) y\(B=R\cos(\varphi)\) generalmente siendo variables normales estándar independientes. Entonces,\(R^2=A^2+B^2\) es una variable aleatoria\(\chi\) -cuadrada con 2 grados de libertad y\(\varphi=\tan^{-1}(B/A)\) se distribuye uniformemente sobre\((-\pi,\pi]\). Además,\(R\) y\(\varphi\) son independientes. Elegir ahora el valor de\(\omega\) una periodicidad particular se puede describir. Para dar cabida a más de una, parece natural considerar mezclas de estas series periódicas con múltiples frecuencias y amplitudes:

    \[ X_t=\sum_{j=1}^m \big[A_j\cos(2\pi\omega_jt)+B_j\sin(2\pi\omega_jt)\big], \qquad t\in\mathbb{Z}, \nonumber \]

    donde\(A_1,\ldots,A_m\) y\(B_1,\ldots,B_m\) son variables aleatorias independientes con media cero y varianzas\(\sigma_1^2,\ldots,\sigma_m^2\), y\(\omega_1,\ldots,\omega_m\) son frecuencias distintas. Se puede demostrar que\((X_t\colon t\in\mathbb{Z})\) es un proceso débilmente estacionario con lag- h ACVF

    \[ \gamma(h)=\sum_{j=1}^m\sigma_j^2\cos(2\pi\omega_j h),\qquad h\in\mathbb{Z}. \nonumber \]

    Este último resultado arroja en particular eso\(\gamma(0)=\sigma_1^2+\ldots+\sigma_m^2\). La varianza de\(X_t\) es consecuentemente la suma de las varianzas de componentes.

    Ejemplo 4.1.1. Dejar\(m=2\) y elegir\(A_1=B_1=1\),\(A_2=B_2=4\) ser constante así como\(\omega_1=1/12\) y\(\omega_2=1/6\). Esto significa que

    \[ X_t=X_t^{(1)}+X_t^{(2)} =\big[\cos(2\pi t/12)+\sin(2\pi t/12)\big]+\big[4\cos(2\pi t/6)+4\sin(2\pi t/6)\big] \nonumber \]

    es la suma de dos componentes periódicos de los cuales uno exhibe un ciclo anual y el otro un ciclo de seis meses. Para todos los procesos involucrados, las realizaciones de\(n=48\) observaciones (4 años de datos) se muestran en la Figura 4.1. También se muestra una cuarta gráfica de serie de tiempo que contiene el ruido independiente normal\(X_t\) distorsionado por estándar,\(\tilde X_t\). El código R correspondiente es:


    >t= 1:48
    >x1=cos (2*pi*t/12) +sin (2*pi*t/12)
    >x2 = 4*cos (2*pi*t/6) +4*sin (2*pi*t/6)
    >x=x1+x2
    >tildex=x+rnorm (48)

    Tenga en cuenta que la amplitud cuadrada de\(X_t^{(1)}\) es\(1^2+1^2=2\). Los valores máximo y mínimo de\(X_t^{(1)}\) son por lo tanto\(\pm\sqrt{2}\). De igual manera, obtenemos\(\pm\sqrt{32}\) para el segundo componente.

    Para un estadístico ahora es importante desarrollar herramientas para recuperar las periodicidades a partir de los datos. La rama de la estadística que se ocupa de este problema se denomina análisis espectral. El método estándar en esta área se basa en el periodograma que se introduce ahora. Supongamos por el momento que se conoce el parámetro de frecuencia\(\omega_1=1/12\) en el Ejemplo 4.1.1. Para obtener estimaciones de\(A_1\) y\(B_1\), se podría intentar ejecutar una regresión usando las variables explicativas\(Y_{t,1}=\cos(2\pi t/12)\) o\(Y_{t,2}=\sin(2\pi t/12)\) para calcular los estimadores de mínimos cuadrados

    \ begin {alinear*}
    \ hat A_1=&\ dfrac {\ sum_ {t=1} ^nx_ty_ {t,1}} {\ sum_ {t=1} ^ny_ {t,1} ^2} =\ dfrac 2n\ sum_ {t=1} ^nx_t\ cos (2\ pi t/12),\\ [.2cm]
    \ sombrero B_1=&\ dfrac {\ sum_ {t=1} ^nx_ty_ {t,2}} {\ suma_ {t=1} ^ny_ {t,2} ^2} =\ dfrac 2n\ suma_ {t=1} ^nx_t\ sin (2\ pi t/12).
    \ end {alinear*}

    Figura 4.1: Gráficas de series de tiempo de (X t (1)), (X t (2)), (X t) y\(\tilde X_t\)

    Dado que, en general, las frecuencias involucradas no serán conocidas por el estadístico previo al análisis de datos, lo anterior sugiere escoger una serie de potenciales\(\omega's, say j/n for \(j=1,\ldots,n/2\) y ejecutar una regresión larga de la forma

    \[X_t=\sum_{j=0}^{n/2}\big[A_j\cos(2\pi jt/n)+B_j\sin(2\pi jt/n)\big]. \tag{4.1.1} \]

    Esto lleva a estimaciones de mínimos cuadrados\(\hat A_j\) y\(\hat B_j\) de las cuales se deben seleccionar las “significativas”. Tenga en cuenta que la regresión en 4.1.1 es perfecta porque ¡hay tantas incógnitas como variables! Tenga en cuenta también que

    \[ P(j/n)=\hat A_j^2+\hat B_j^2 \nonumber \]

    es esencialmente (hasta una normalización) un estimador para la correlación entre las series de tiempo\(X_t\) y la suma correspondiente de las funciones coseno y seno periódicas en frecuencia\(j/n\). La colección de todos\(P(j/n)\),\(j=1,\ldots,n/2\), se llama el periodograma escalado. Se puede calcular rápidamente a través de un algoritmo conocido como la transformada rápida de Fourier (FFT) que a su vez se basa en la transformada discreta de Fourier (DFT)

    \[ d(j/n)=\dfrac{1}{\sqrt{n}}\sum_{t=1}^nX_t\exp(-2\pi ijt/n). \nonumber \]

    Las frecuencias\(j/n\) se denominan frecuencias de Fourier o fundamentales. Desde\(\exp(-ix)=\cos(x)-i\sin(x)\) y\(|z|^2=z\bar{z}=(a+ib)(a-ib)=a^2+b^2\) para cualquier número complejo\(z=a+ib\), se deduce que

    \[ I(j/n)=|d(j/n)|^2=\dfrac 1n\left(\sum_{t=1}^nX_t\cos(2\pi jt/n)\right)^2+\dfrac 1n\left(\sum_{t=1}^nX_t\sin(2\pi jt/n)\right)^2. \nonumber \]

    La cantidad\(I(j/n)\) es referida como el periodograma. De ello se deduce inmediatamente que el periodograma y el periodograma escalado están relacionados a través de la identidad\(4I(j/n)=nP(j/n)\).

    Ejemplo 4.1.2. Usando las expresiones y notaciones del Ejemplo 4.1.1, el periodograma y el periodograma escalado se calculan en R de la siguiente manera:

    >t= 1:48
    >l=abs (fft (x) /sqrt (48)) ^ 2
    >P=4*I/48
    >f= 0:24 /48
    >plot (f, P [1:25] , type="l”)
    >abline (v=1/12)
    >abline (v=1/6)

    El correspondiente periodograma (escalado) para se\((\tilde X_t)\) puede obtener de manera similar. Los periodogramas escalados se muestran en el panel izquierdo y medio de la Figura 4.2. El panel derecho muestra el periodograma escalado de otra versión\((\tilde X_t)\) en la que el ruido normal estándar ha sido reemplazado por ruido normal con varianza 9. De estas parcelas se puede observar que la periodicidad de seis meses es claramente visible en las gráficas (ver las líneas verticales discontinuas en x=1/6. El ciclo anual menos pronunciado (línea vertical a x=1/12 sigue siendo visible en los dos primeros periodogramas escalados pero se pierde si la varianza de ruido se incrementa como en la gráfica derecha. Tenga en cuenta, sin embargo, que la escala y es diferente para las tres parcelas.

    Figura 4.2: Los periodogramas escalados de (\(X_t\)),\((\tilde X_t^{(1)})\),\((\tilde X_t^{(2)})\)

    En la situación ideal de que observemos el componente periódico sin contaminación adicional por ruido, podemos ver además por qué el periodograma puede ser útil para descubrir la descomposición de varianza desde arriba. Hemos mostrado en las líneas anteriores al Ejemplo 4.1.1 que las amplitudes cuadradas de\(X_{t}^{(1)}\) y\(X_t^{(2)}\) son 2 y 32, respectivamente. Estos valores se leen fácilmente del periodograma escalado en el panel izquierdo de la Figura 4.2. La contaminación con ruido altera estos valores.

    En la siguiente sección, se establece que el enfoque de dominio de tiempo (basado en propiedades de la ACVF, es decir, regresión sobre valores pasados de la serie de tiempo) y el enfoque de dominio de frecuencia (utilizando un enfoque de función periódica a través de frecuencias fundamentales, es decir, regresión en funciones seno y coseno) son equivalente. Se dan algunos detalles sobre la densidad espectral (la contraparte poblacional del periodograma) y sobre las propiedades del propio periodograma.

    Colaboradores y Atribuciones


    This page titled 4.1: Introducción al Análisis Espectral is shared under a not declared license and was authored, remixed, and/or curated by Alexander Aue.