Media Móvil Siempre Estacionaria
4.2 Modelos estacionarios lineales para series temporales donde la variable aleatoria se denomina innovación porque representa la parte de la variable observada que es impredecible dados los valores pasados. El modelo general (4.4) supone que es la salida de un filtro lineal que transforma las innovaciones pasadas, es decir, es un proceso lineal. Esta hipótesis de linealidad se basa en el teorema de la descomposición de Wolds (Wold 1938) que dice que cualquier proceso discreto de covarianza estacionaria puede expresarse como la suma de dos procesos no correlacionados, donde es puramente determinista y es un proceso puramente indeterminista que puede ser escrito como lineal Suma del proceso de innovación: donde está una secuencia de variables aleatorias seriadas no correlacionadas con media cero y varianza común. La condición es necesaria para la estacionariedad. La formulación (4.4) es una reparametrización finita de la representación infinita (4.5) - (4.6) con constante. Por lo general se escribe en términos del operador de retardo definido por, que da una expresión más corta: donde los polinomios del operador de lag y se llaman el polinomio y el polinomio, respectivamente. Para evitar la redundancia de parámetros, se supone que no hay factores comunes entre el y los componentes. A continuación, estudiaremos la trama de algunas series temporales generadas por modelos estacionarios con el objetivo de determinar los patrones principales de su evolución temporal. La figura 4.2 incluye dos series generadas a partir de los siguientes procesos estacionarios calculados por medio del cuantitativo genarma: Figura 4.2: Series temporales generadas por modelos Como era de esperar, ambas series temporales se mueven alrededor de un nivel constante sin cambios en la varianza debido a la propiedad estacionaria. Además, este nivel está próximo a la media teórica del proceso, y la distancia de cada punto a este valor está muy raramente fuera de los límites. Además, la evolución de la serie muestra desviaciones locales de la media del proceso, que se conoce como el comportamiento de reversión media que caracteriza las series temporales estacionarias. Estudiemos con detalle las propiedades de los diferentes procesos, en particular, la función de autocovariancia que capta las propiedades dinámicas de un proceso estacionario estocástico. Esta función depende de las unidades de medida, por lo que la medida habitual del grado de linealidad entre las variables es el coeficiente de correlación. En el caso de procesos estacionarios, el coeficiente de autocorrelación a lag, denotado por, se define como la correlación entre y: Por lo tanto, la función de autocorrelación (ACF) es la función de autocovarianza normalizada por la varianza. Las propiedades de la ACF son: Dada la propiedad de simetría (4.10), la ACF suele estar representada por medio de un gráfico de barras en los retornos no negativos que se denomina correlograma simple. Otra herramienta útil para describir la dinámica de un proceso estacionario es la función de autocorrelación parcial (PACF). El coeficiente de autocorrelación parcial al retraso mide la asociación lineal entre y ajustado para los efectos de los valores intermedios. Por lo tanto, es sólo el coeficiente en el modelo de regresión lineal: Las propiedades de la PACF son equivalentes a las de la ACF (4.8) - (4.10) y es fácil demostrar que (Box y Jenkins 1976). Al igual que la ACF, la función de autocorrelación parcial no depende de las unidades de medida y se representa mediante un gráfico de barras en los retornos no negativos que se denomina correlograma parcial. Las propiedades dinámicas de cada modelo estacionario determinan una forma particular de los correlogramas. Además, se puede demostrar que, para cualquier proceso estacionario, ambas funciones, ACF y PACF, se acercan a cero, ya que el retraso tiende al infinito. Los modelos no son siempre procesos estacionarios, por lo que es necesario determinar primero las condiciones de estacionariedad. Hay subclases de modelos que tienen propiedades especiales por lo que los estudiaremos por separado. Así, cuando y, es un proceso de ruido blanco. Cuando, se trata de un proceso de orden puro y móvil. , Y cuando es un proceso autorregresivo puro de orden. . 4.2.1 Proceso de ruido blanco El modelo más simple es un proceso de ruido blanco, donde está una secuencia de variables de media cero no correlacionadas con varianza constante. Se denomina por. Este proceso es estacionario si su varianza es finita, dado que: verifica las condiciones (4.1) - (4.3). Por otra parte, no está correlacionada con el tiempo, por lo que su función de autocovariancia es: La Figura 4.7 muestra dos series temporales simuladas generadas a partir de procesos con media y parámetros cero y -0,7, respectivamente. El parámetro autorregresivo mide la persistencia de eventos pasados en los valores actuales. Por ejemplo, si un choque positivo (o negativo) afecta positivamente (o negativamente) durante un período de tiempo que es más largo cuanto mayor sea el valor de. Cuando, la serie se mueve más aproximadamente alrededor de la media debido a la alternancia en la dirección del efecto de, es decir, un choque que afecta positivamente en el momento, tiene efectos negativos sobre, positivo en. El proceso es siempre invertible y está parado cuando el parámetro del modelo está limitado a estar en la región. Para probar la condición estacionaria, primero escribimos la forma media móvil mediante la sustitución recursiva de (4.14): Figura 4.8: Correlaciones de la población para los procesos Es decir, es una suma ponderada de las innovaciones pasadas. Los pesos dependen del valor del parámetro: cuando, (o), la influencia de una innovación dada aumenta (o disminuye) a través del tiempo. Tomando las expectativas de (4.15) para calcular la media del proceso, obtenemos: Dado que, el resultado es una suma de términos infinitos que converge para todo el valor de sólo si, en cuyo caso. Un problema similar aparece cuando calculamos el segundo momento. La prueba puede ser simplificada suponiendo que, es decir,. Entonces, la varianza es: Una vez más, la varianza va al infinito excepto para, en cuyo caso. Es fácil verificar que tanto la media como la varianza explotan cuando esa condición no se mantiene. Por tanto, la función de autocorrelación para el modelo estacionario es: Es decir, el correlograma muestra un decaimiento exponencial con valores positivos siempre si es positivo y con oscilaciones positivas negativas si es negativo (ver figura 4.8). Además, la tasa de decaimiento disminuye a medida que aumenta, por lo que cuanto mayor sea el valor de la más fuerte la correlación dinámica en el proceso. Finalmente, hay un corte en la función de autocorrelación parcial en el primer retardo. Se puede demostrar que el proceso general (Box y Jenkins 1976): Es estacionario sólo si las raíces de la ecuación característica del polinomio están fuera del círculo unitario. La media de un modelo estacionario es. Es siempre invertible para cualquier valor de los parámetros. Su ACF va a cero exponencialmente cuando las raíces de son reales o con fluctuaciones de onda seno-coseno cuando son complejas. Su PACF tiene un corte en el retraso, es decir. Algunos ejemplos de Correlogramas para modelos más complejos, como el, se puede ver en la figura 4.9. Son muy similares a los patrones cuando los procesos tienen raíces reales, pero toman una forma muy diferente cuando las raíces son complejas (ver el primer par de gráficos de la figura 4.9). 4.2.4 Modelo de media móvil autorregresiva El modelo de media móvil autorregresiva general (órdenes finitas) de órdenes, es: 2.1 Modelos de media móvil (modelos MA) Los modelos de serie temporal conocidos como modelos ARIMA pueden incluir términos autorregresivos y términos de media móvil. En la semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor retrasado de x t. Por ejemplo, un término autorregresivo de retardo 1 es x t-1 (multiplicado por un coeficiente). Esta lección define los términos del promedio móvil. Un término medio móvil en un modelo de serie temporal es un error pasado (multiplicado por un coeficiente). Dejamos (wt desbordamiento N (0, sigma2w)), lo que significa que los w t son idéntica, independientemente distribuidos, cada uno con una distribución normal que tiene la media 0 y la misma varianza. El modelo de media móvil de primer orden, denotado por MA (1) es (xt mu wt theta1w) El modelo de media móvil de segundo orden, denotado por MA (2) es (xt mu wt theta1w theta2w) , Denotado por MA (q) es (xt mu wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, si bien cambia los signos algebraicos de los valores estimados de los coeficientes y los términos (no cuadrados) en las fórmulas para ACF y las varianzas. Usted necesita comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza signos positivos en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie temporal con un modelo MA (1) Tenga en cuenta que el único valor distinto de cero en el ACF teórico es para el retardo 1. Todas las demás autocorrelaciones son 0. Por lo tanto, una muestra de ACF con una autocorrelación significativa sólo con el retardo 1 es un indicador de un posible modelo MA (1). Para los estudiantes interesados, las pruebas de estas propiedades son un apéndice a este folleto. Ejemplo 1 Supongamos que un modelo MA (1) es x t 10 w t .7 w t-1. Donde (wt overset N (0,1)). Así, el coeficiente 1 0,7. El ACF teórico se da por un diagrama de esta ACF sigue. La gráfica que se muestra es la ACF teórica para una MA (1) con 1 0,7. En la práctica, una muestra no suele proporcionar un patrón tan claro. Utilizando R, simulamos n 100 valores de muestra utilizando el modelo x t 10 w t .7 w t-1 donde w t iid N (0,1). Para esta simulación, sigue un diagrama de series de tiempo de los datos de la muestra. No podemos decir mucho de esta trama. A continuación se muestra el ACF de muestra para los datos simulados. Observamos un pico en el retraso 1 seguido por valores generalmente no significativos para los retrasos de 1. Obsérvese que la muestra ACF no coincide con el patrón teórico del MA subyacente (1), que es que todas las autocorrelaciones para los retrasos de 1 serán 0.Una muestra diferente tendría una ACF de muestra ligeramente diferente mostrada abajo, pero probablemente tendría las mismas características amplias. Propiedades Terapéuticas de una Serie de Tiempo con un Modelo MA (2) Para el modelo MA (2), las propiedades teóricas son las siguientes: Obsérvese que los únicos valores distintos de cero en la ACF teórica son para los retornos 1 y 2. Las autocorrelaciones para retardos mayores son 0 . Por lo tanto, una muestra de ACF con autocorrelaciones significativas en los intervalos 1 y 2, pero autocorrelaciones no significativas para retardos mayores, indica un posible modelo MA (2). Iid N (0,1). Los coeficientes son 1 0,5 y 2 0,3. Dado que se trata de una MA (2), la ACF teórica tendrá valores distintos de cero sólo en los retornos 1 y 2. Los valores de las dos autocorrelaciones distintas de cero son: Un gráfico de la ACF teórica sigue. Como casi siempre es el caso, los datos de la muestra no se comportarán tan perfectamente como la teoría. Se simularon 150 valores de muestra para el modelo x t 10 w t .5 w t-1 .3 w t-2. Donde w t iid N (0,1). A continuación se muestra el gráfico de la serie de tiempo de los datos. Al igual que con el gráfico de la serie de tiempo para los datos de la muestra MA (1), no se puede decir mucho de ella. A continuación se muestra el ACF de muestra para los datos simulados. El patrón es típico para situaciones donde un modelo MA (2) puede ser útil. Hay dos picos estadísticamente significativos en los intervalos 1 y 2, seguidos de valores no significativos para otros desfases. Tenga en cuenta que debido al error de muestreo, la muestra ACF no coincide exactamente con el patrón teórico. ACF para modelos MA (q) Una propiedad de los modelos MA (q) en general es que hay autocorrelaciones no nulas para los primeros q retrasos y autocorrelaciones 0 para todos los retrasos gt q. No unicidad de la conexión entre los valores de 1 y (rho1) en MA (1) Modelo. En el modelo MA (1), para cualquier valor de 1. El 1/1 recíproco da el mismo valor para. Por ejemplo, use 0.5 para 1. Y luego utilice 1 / (0,5) 2 para 1. Youll get (rho1) 0.4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. Limitamos los modelos MA (1) a tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 será un valor de parámetro permisible, mientras que 1 1 / 0,5 2 no. Invertibilidad de los modelos MA Se dice que un modelo MA es invertible si es algebraicamente equivalente a un modelo de orden infinito convergente. Al converger, queremos decir que los coeficientes de AR disminuyen a 0 a medida que retrocedemos en el tiempo. Invertibilidad es una restricción programada en el software de la serie de tiempo usado para estimar los coeficientes de modelos con términos de MA. No es algo que buscamos en el análisis de datos. En el apéndice se proporciona información adicional sobre la restricción de la invertibilidad para los modelos MA (1). Nota de Teoría Avanzada. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para la invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - q y q 0 tiene soluciones para y que caen fuera del círculo unitario. Código R para los Ejemplos En el Ejemplo 1, se representó la ACF teórica del modelo x $ _ {t} $ w $ _ {t} $. 7w t - 1. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R utilizados para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0.7), lag. max10) 10 retardos de ACF para MA (1) con theta1 0.7 lags0: 10 crea una variable llamada lags que oscila entre 0 y 10. plot Abline (h0) añade un eje horizontal al diagrama El primer comando determina el ACF y lo almacena en un objeto (a0) Llamado acfma1 (nuestra elección de nombre). El comando plot (el 3er comando) traza retrasos en comparación con los valores ACF para los retornos 1 a 10. El parámetro ylab etiqueta el eje y y el parámetro principal coloca un título en la gráfica. Para ver los valores numéricos de la ACF simplemente utilice el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. Xcarzim. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 agrega 10 para hacer la media 10. La simulación predeterminada significa 0. plot (x, typeb, mainSimulated MA (1) data) (X, xlimc (1,10), mainACF para datos de muestra simulados) En el Ejemplo 2, se representó el ACF teórico del modelo xt 10 wt. 5 w t-1 .3 w t-2. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5.0.3), lag. max10) acfma2 lags0: 10 trama (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) con theta1 0,5, (X, typeb, principal serie MA simulado) acf (x, xlimc (1,10), x2) (1) Para los estudiantes interesados, aquí hay pruebas de las propiedades teóricas del modelo MA (1). Cuando x 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 (x) La razón es que, por definición de independencia del peso. E (w k w j) 0 para cualquier k j. Además, debido a que w t tiene una media 0, E (w j w j) E (w j 2) w 2. Para una serie de tiempo, aplique este resultado para obtener la ACF indicada anteriormente. Un modelo inversible MA es uno que puede ser escrito como un modelo de orden infinito AR que converge para que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el modelo MA (1). A continuación, sustituimos la relación (2) de wt-1 en la ecuación (1) (3) (zt wt theta1 (z-theta1w) wt theta1z - theta2w) En el momento t-2. La ecuación (2) es entonces sustituimos la relación (4) por w t-2 en la ecuación (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si continuáramos Sin embargo, si 1 1, los coeficientes que multiplican los retrasos de z aumentarán (infinitamente) en tamaño a medida que retrocedemos hacia atrás hora. Para evitar esto, necesitamos 1 lt1. Esta es la condición para un modelo de MA (1) invertible. Infinite Order MA model En la semana 3, veamos bien que un modelo AR (1) puede convertirse en un modelo de orden infinito MA: (xt - mu wt phi1w phi21w puntos phik1 w dots sum phij1w) Esta suma de términos de ruido blanco pasado es conocida Como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos remontándose en el tiempo. Esto se llama un orden infinito MA o MA (). Una orden finita MA es un orden infinito AR y cualquier orden finito AR es un orden infinito MA. Recordemos en la semana 1, observamos que un requisito para un AR estacionario (1) es que 1 lt1. Vamos a calcular el Var (x t) utilizando la representación causal. Este último paso utiliza un hecho básico sobre series geométricas que requiere (phi1lt1) de lo contrario la serie diverge. NavigationMoving modelos de suavidad media y exponencial Como un primer paso para ir más allá de los modelos de media, los modelos de caminata aleatoria, y los modelos de tendencias lineales, los patrones no estacionales y las tendencias pueden extrapolarse usando un modelo de media móvil o suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media que varía lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otros lugares usaré el símbolo 8220Y-hat8221 para permanecer en pie Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo por el cual los pronósticos tenderán a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con el factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad promedio dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior a la predicción del promedio móvil simple (SMA) porque coloca relativamente más peso en la observación más reciente - i. e. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es variable continuamente, por lo que puede optimizarse fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES de esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0,2961 3,4 períodos, que es similar a la de un movimiento simple de 6 términos promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente un menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo está ajustado a ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavizado exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de Pronóstico. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede ser generalizado para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, que utiliza dos series suavizadas diferentes centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en varias formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esta sería la previsión para Y en el período t1). Entonces, Squot denote la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda este problema incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medida ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0.3048 y 946 0.008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, ¿se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observa esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha ocurrido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a causas variadas como la obsolescencia del producto, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápidamente a medida que el 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al inicio de la página.)
Comments
Post a Comment