Modelos ARMA (p, q) para el análisis de series temporales - Parte 3 Este es el tercer y último post de la mini-serie sobre modelos de media móvil autoregresiva (ARMA) para el análisis de series de tiempo. Hemos introducido modelos autorregresivos y modelos de media móvil en los dos artículos anteriores. Ahora es el momento de combinarlos para producir un modelo más sofisticado. En última instancia, esto nos llevará a los modelos ARIMA y GARCH que nos permitirán predecir los rendimientos de los activos y predecir la volatilidad. Estos modelos constituirán la base para las señales comerciales y las técnicas de gestión de riesgos. Si has leído la Parte 1 y la Parte 2 habrás visto que tendemos a seguir un patrón para nuestro análisis de un modelo de series de tiempo. Ill repetirlo brevemente aquí: Fundamento - ¿Por qué estamos interesados en este modelo en particular Definición - Una definición matemática para reducir la ambigüedad. Correlograma - Trazado de un correlograma muestral para visualizar el comportamiento de un modelo. Simulación y ajuste - Ajuste del modelo a simulaciones, para asegurar que hemos entendido correctamente el modelo. Datos financieros reales - Aplicar el modelo a los precios reales de los activos históricos. Predicción - Predecir los valores posteriores para generar señales comerciales o filtros. Con el fin de seguir este artículo es aconsejable echar un vistazo a los artículos anteriores sobre el análisis de series de tiempo. Todos se pueden encontrar aquí. Criterio Bayesiano de Información En la Parte 1 de esta serie de artículos vimos el Criterio de Información de Akaike (AIC) como un medio para ayudarnos a elegir entre los mejores modelos de series temporales. Una herramienta estrechamente relacionada es el Criterio de Información Bayesiano (BIC). Esencialmente, tiene un comportamiento similar al AIC, ya que penaliza los modelos por tener demasiados parámetros. Esto puede conducir a un ajuste excesivo. La diferencia entre el BIC y el AIC es que el BIC es más estricto con su penalización de parámetros adicionales. Criterio Bayesiano de Información Si tomamos la función de verosimilitud para un modelo estadístico, que tiene k parámetros, y L maximiza la probabilidad. Entonces el Criterio de Información Bayesiano viene dado por: Donde n es el número de puntos de datos en la serie temporal. Usaremos el AIC y el BIC a continuación al elegir los modelos ARMA (p, q) apropiados. Prueba de Ljung-Box En la parte 1 de esta serie de artículos Rajan mencionó en los comentarios de Disqus que la prueba de Ljung-Box era más apropiada que usar el Criterio de Información Akaike del Criterio de Información Bayesiano para decidir si un modelo de ARMA era un buen ajuste a un tiempo serie. La prueba de Ljung-Box es una prueba de hipótesis clásica que está diseñada para probar si un conjunto de autocorrelaciones de un modelo de series temporales ajustadas difieren significativamente de cero. La prueba no prueba cada retraso individual por aleatoriedad, sino que prueba la aleatoriedad sobre un grupo de retrasos. Ljung-Box Test Definimos la hipótesis nula como: Los datos de series de tiempo en cada lag son i. i.d .. es decir, las correlaciones entre los valores de la serie de población son cero. Definimos la hipótesis alternativa como: Los datos de la serie temporal no son i. i.d. Y poseen correlación serial. Calculamos la siguiente estadística de prueba. Q: Donde n es la longitud de la muestra de la serie temporal, el sombrero k es la autocorrelación de la muestra en el retraso kyh es el número de retardos bajo el ensayo. La regla de decisión sobre si rechazar la hipótesis nula es verificar si Q gt chi2, para una distribución de chi cuadrado con h grados de libertad en el percentil 100 (1-alfa). Aunque los detalles de la prueba pueden parecer un poco complejos, de hecho podemos usar R para calcular la prueba para nosotros, simplificando un poco el procedimiento. Ahora que hemos discutido el BIC y la prueba de Ljung-Box, estábamos listos para discutir nuestro primer modelo mixto, es decir, el promedio móvil auto-regresivo de orden p, q, o ARMA (p, Q). Justificación Hasta la fecha hemos considerado procesos autorregresivos y procesos de media móvil. El modelo anterior considera su propio comportamiento pasado como insumos para el modelo y, como tal, intenta captar los efectos de los participantes en el mercado, tales como el impulso y la reversión media en el comercio de valores. Este último modelo se utiliza para caracterizar la información de choque en una serie, como un anuncio sorpresivo de ganancias o un evento inesperado (como el derrame de petróleo BP Deepwater Horizon). Por lo tanto, un modelo de ARMA intenta capturar ambos aspectos al modelar series de tiempo financieras. Obsérvese que un modelo ARMA no tiene en cuenta el agrupamiento de volatilidad, un fenómeno empírico clave de muchas series de tiempo financieras. No es un modelo condicionalmente heteroscedásico. Para eso tendremos que esperar a los modelos ARCH y GARCH. Definición El modelo ARMA (p, q) es una combinación lineal de dos modelos lineales y por lo tanto sigue siendo lineal: Modelo de orden temporal p, q Un modelo de serie temporal,, es un modelo de media móvil autorregresiva de orden p, q . ARMA (p, q), si: begin xt alpha1 x alfa2 x ldots wt beta1 w beta2 w ldots betaq w ¿Dónde está el ruido blanco con E (wt) 0 y variance sigma2. Si consideramos al operador de cambio hacia atrás. (Ver un artículo anterior), entonces podemos reescribir lo anterior como una función theta y phi de: Podemos ver directamente que mediante el establecimiento de p neq 0 y q0 recuperamos el modelo AR (p). Similarmente si ponemos p 0 y q neq 0 recuperamos el modelo MA (q). Una de las características clave del modelo ARMA es que es parsimonioso y redundante en sus parámetros. Es decir, un modelo ARMA a menudo requerirá menos parámetros que un modelo AR (p) o MA (q) solo. Además, si reescribimos la ecuación en términos del BSO, entonces los polinomios theta y phi pueden a veces compartir un factor común, lo que conduce a un modelo más simple. Simulaciones y Correlogramas Al igual que con los modelos de media autorregresiva y móvil, ahora simularemos varias series ARMA y luego intentaremos ajustar modelos ARMA a estas realizaciones. Llevamos a cabo esto porque queremos asegurarnos de que entendemos el procedimiento de ajuste, incluyendo cómo calcular los intervalos de confianza para los modelos, así como asegurar que el procedimiento realmente recupera estimaciones razonables para los parámetros ARMA originales. En la Parte 1 y la Parte 2 construimos manualmente las series AR y MA dibujando N muestras de una distribución normal y luego elaborando el modelo de series temporales específicas utilizando rezagos de estas muestras. Sin embargo, hay una manera más directa de simular AR, MA, ARMA e incluso ARIMA datos, simplemente utilizando el método arima. sim en R. Vamos a empezar con el más simple posible no triviales ARMA modelo, a saber, el ARMA (1,1 ). Es decir, un modelo autorregresivo de orden combinado con un modelo de media móvil de orden uno. Tal modelo tiene sólo dos coeficientes, alfa y beta, que representan los primeros rezagos de la serie de tiempo en sí y los términos de ruido blanco de choque. Este modelo está dado por: Necesitamos especificar los coeficientes antes de la simulación. Vamos a tomar alfa 0,5 y beta -0,5: La salida es la siguiente: Lets también trazar el correlograma: Podemos ver que no hay autocorrelación significativa, lo que es de esperar de un modelo ARMA (1,1). Por último, vamos a tratar de determinar los coeficientes y sus errores estándar utilizando la función arima: Podemos calcular los intervalos de confianza para cada parámetro utilizando los errores estándar: Los intervalos de confianza sí contienen los valores de los parámetros reales para ambos casos, sin embargo, 95 intervalos de confianza son muy amplios (una consecuencia de los errores estándar razonablemente grandes). Ahora vamos a probar un modelo ARMA (2,2). Es decir, un modelo AR (2) combinado con un modelo MA (2). Necesitamos especificar cuatro parámetros para este modelo: alpha1, alpha2, beta1 y beta2. Vamos a tomar alpha1 0.5, alpha2-0.25 beta10.5 y beta2-0.3: La salida de nuestro modelo ARMA (2,2) es la siguiente: Y la autocorelación correspondiente: Ahora podemos intentar ajustar un modelo ARMA (2,2) a Los datos: También podemos calcular los intervalos de confianza para cada parámetro: Obsérvese que los intervalos de confianza para los coeficientes para el componente de media móvil (beta1 y beta2) no contienen realmente el valor del parámetro original. Sin embargo, con fines de negociación sólo necesitamos tener un poder predictivo que supere el azar y produzca un beneficio suficiente por encima de los costos de transacción, para ser rentable en los costos de transacción. El largo plazo. Ahora que hemos visto algunos ejemplos de modelos ARMA simulados necesitamos un mecanismo para elegir los valores de p y q cuando se ajusta a los modelos a datos financieros reales. Para determinar qué orden p, q del modelo ARMA es apropiado para una serie, necesitamos usar el AIC (o BIC) a través de un subconjunto de valores para p, q, y A continuación, aplicar la prueba de Ljung-Box para determinar si se ha logrado un buen ajuste, para valores particulares de p, q. Para mostrar este método vamos a simular en primer lugar un determinado ARMA (p, q) proceso. A continuación, analizaremos todos los valores pairwise de p in y q in y calcularemos el AIC. Seleccionaremos el modelo con el AIC más bajo y luego ejecutaremos una prueba de Ljung-Box sobre los residuos para determinar si hemos logrado un buen ajuste. Comencemos simulando una serie ARMA (3,2): Ahora crearemos un objeto final para almacenar el mejor ajuste de modelo y el valor AIC más bajo. Hacemos un bucle sobre las diversas combinaciones p, q y usamos el objeto actual para almacenar el ajuste de un modelo ARMA (i, j), para las variables de bucle i y j. Si el AIC actual es menor que cualquier AIC previamente calculado, ajustamos el AIC final a este valor actual y seleccionamos ese orden. A la terminación del bucle tenemos el orden del modelo ARMA almacenado en final. order y el ARIMA (p, d, q) se ajusta a sí mismo (con el componente d integrado a 0) almacenado como final. arma: Deja salir el AIC , Orden y coeficientes de ARIMA: Podemos ver que se recuperó el orden original del modelo ARMA simulado, es decir, con p3 y q2. Podemos trazar el corelograma de los residuos del modelo para ver si parecen una realización de ruido blanco discreto (DWN): El corelograma realmente parece una realización de DWN. Por último, realizamos la prueba de Ljung-Box para 20 retrasos para confirmar esto: Obsérvese que el valor p es mayor que 0,05, lo que indica que los residuos son independientes en el nivel 95 y por lo tanto un modelo ARMA (3,2) Buen ajuste del modelo. Sin embargo, este es precisamente el procedimiento que usaremos cuando lleguemos a ajustar modelos ARMA (p, q) al índice SampP500 en la siguiente sección. Datos financieros Ahora que hemos esbozado el procedimiento para elegir el modelo de serie temporal óptimo para una serie simulada, es bastante sencillo aplicarla a los datos financieros. Para este ejemplo vamos a elegir nuevamente el SampP500 US Equity Index. Permite descargar los precios de cierre diarios usando quantmod y luego crear el flujo de devoluciones de registros: Debe realizar el mismo procedimiento de ajuste que para la serie ARMA (3,2) simulada en la serie de devoluciones de registros del SampP500 usando el AIC: El mejor modelo de ajuste Tiene orden ARMA (3,3): Permite trazar los residuos del modelo ajustado a la corriente de devoluciones diarias de log SampP500: Observe que hay algunos picos significativos, especialmente a retrasos mayores. Esto es indicativo de un ajuste pobre. Vamos a realizar una prueba de Ljung-Box para ver si tenemos evidencia estadística de esto: Como sospechábamos, el valor p es menor que 0,05 y como tal no podemos decir que los residuos son una realización de ruido blanco discreto. Por lo tanto, hay autocorrelación adicional en los residuos que no se explica por el modelo ARMA (3,3). Próximos Pasos Como hemos discutido a lo largo de esta serie de artículos, hemos visto evidencias de heterocedasticidad condicional (agrupación de volatilidad) en la serie SampP500, especialmente en los periodos alrededor de 2007-2008. Cuando usamos un modelo GARCH más adelante en la serie de artículos veremos cómo eliminar estas autocorrelaciones. En la práctica, los modelos de ARMA nunca son generalmente buenos ajustes para los logs de las ganancias del registro. Tenemos que tener en cuenta la heterocedasticidad condicional y utilizar una combinación de ARIMA y GARCH. El siguiente artículo considerará ARIMA y mostrará cómo el componente integrado difiere del modelo ARMA que hemos estado considerando en este artículo. Haga clic abajo para aprender más sobre. La información contenida en este sitio web es la opinión de los autores individuales sobre la base de su observación personal, investigación y años de experiencia. El editor y sus autores no son asesores de inversiones, abogados, CPA u otros profesionales de servicios financieros registrados y no prestan asesoría legal, fiscal, contable, de inversión u otros servicios profesionales. La información ofrecida por este sitio web es sólo educación general. Debido a que cada situación de hecho individual es diferente, el lector debe buscar a su propio asesor personal. Ni el autor ni el editor asumen responsabilidad alguna por errores u omisiones y no tendrán responsabilidad ni responsabilidad con ninguna persona o entidad con respecto a los daños causados o presuntamente causados directa o indirectamente por la información contenida en este sitio. Úselo bajo su propio riesgo. Además, este sitio web puede recibir compensación financiera de las empresas mencionadas a través de publicidad, programas de afiliados o de otra manera. Las tarifas y ofertas de los anunciantes que se muestran en este sitio web cambian con frecuencia, a veces sin previo aviso. Mientras nos esforzamos por mantener información oportuna y precisa, los detalles de la oferta pueden estar desactualizados. Los visitantes deben verificar los términos de tales ofertas antes de participar en ellas. El autor y su editor se niegan a la responsabilidad de actualizar la información y renunciar a la responsabilidad de los contenidos de terceros, los productos y servicios, incluyendo cuando se accede a través de hipervínculos y / o anuncios en este sitio. Arabic Búlgaro Chino Croata Checo Danés Holandés Inglés Estonio Finlandés Francés Alemán Griego Hebreo Hindi Húngaro Islandés Indonesio Italiano Japonés Coreano Letón Lituano Malgache Noruego Persa Polaco Portugués Rumano Ruso Serbio Eslovaco Esloveno Español Sueco Tailandés Turco Vietnamita Árabe Búlgaro Chino Croata Checo Danés Holandés Inglés Estonio Finlandés Francés Alemán Griego Hebreo Hindú Húngaro Islandés Indonesio Italiano Japonés Coreano Letón Lituano Malgache Noruego Persa Polaco portugués rumano ruso serbio eslovaco esloveno español sueco tailandés turco vietnamita definición - Autoregressivemoving-average model Para otros usos de ARMA, véase Arma. En estadísticas y procesamiento de señales. Autoregressivemoving-media (ARMA). A veces llamados modelos de BoxJenkins después de la metodología iterativa de BoxJenkins usualmente usada para estimarlos, se aplican típicamente a datos de series de tiempo autocorrelacionados. Dada una serie temporal de datos X t. El modelo ARMA es una herramienta para comprender y, quizás, para predecir valores futuros en esta serie. El modelo consta de dos partes, una parte autorregresiva (AR) y una parte de media móvil (MA). El modelo se denomina normalmente el modelo ARMA (p, q) donde p es el orden de la parte autorregresiva y q es el orden de la parte media móvil (como se define más adelante). Índice Modelo autorregresivo La notación AR (p) se refiere al modelo autorregresivo de orden p. El modelo AR (p) está escrito Un modelo autorregresivo es esencialmente un filtro de respuesta de impulso infinito de todo el polo con alguna interpretación adicional puesta en él. Algunas limitaciones son necesarias sobre los valores de los parámetros de este modelo para que el modelo permanezca estacionario. Por ejemplo, los procesos en el modelo AR (1) con 1 1 no son estacionarios. Modelo de media móvil La notación MA (q) se refiere al modelo de media móvil de orden q: Modelo de media móvil de retransmisión La notación ARMA (p. q) se refiere al modelo con p términos autorregresivos y q términos de media móvil. Este modelo contiene los modelos AR (p) y MA (q), Nota sobre los términos de error N (0, 2) donde 2 es la varianza. Estas suposiciones pueden verse debilitadas, pero al hacerlo cambiarán las propiedades del modelo. En particular, un cambio a la i. i.d. Suposición haría una diferencia bastante fundamental. Especificación en términos de operador de retardo En algunos textos los modelos se especificarán en términos del operador de retardo L. En estos términos el modelo de AR (p) está dado por El modelo de MA (q) está dado por donde representa el polinomio Por último, el modelo combinado de ARMA (p. q) se da por o más concisamente, Notación alternativa Algunos autores, incluyendo Box, Jenkins amp Reinsel 1 utilizan una convención diferente para los coeficientes de autorregresión. Esto permite que todos los polinomios que implican el operador de retardo aparezcan en una forma similar a lo largo. Por lo tanto, el modelo ARMA se escribiría como modelos de ajuste. Los modelos ARMA en general pueden ajustarse mediante la regresión de mínimos cuadrados para determinar los valores de los parámetros que minimizan el término de error. Generalmente se considera una buena práctica encontrar los valores más pequeños de p y q que proporcionan un ajuste aceptable a los datos. Para un modelo AR puro, se pueden usar las ecuaciones de Yule-Walker para proporcionar un ajuste. Encontrar los valores apropiados de p y q en el modelo ARMA (p, q) puede ser facilitado por el trazado de las funciones de autocorrelación parcial para una estimación de p. Y también utilizando las funciones de autocorrelación para una estimación de q. Se puede obtener más información considerando las mismas funciones para los residuos de un modelo equipado con una selección inicial de p y q. Brockwell y Davis 2 (p.273) recomiendan usar AICc para encontrar p y q. Implementaciones en paquetes estadísticos En R. el paquete tseries incluye una función arma. La función está documentada en Fit ARMA Models to Time Series. O use stats :: arima Mathematica tiene una biblioteca completa de funciones de series temporales incluyendo ARMA 3 MATLAB incluye una función ar para estimar modelos AR, vea aquí para más detalles. Las bibliotecas numéricas de IMSL son bibliotecas de funcionalidad de análisis numérico incluyendo procedimientos ARMA y ARIMA implementados en lenguajes de programación estándar como C, Java, C. NET y Fortran. Gretl también puede estimar modelos ARMA, ver aquí donde se menciona. GNU Octave puede estimar modelos AR utilizando funciones del paquete extra octave-forge. Stata incluye la función arima que puede estimar los modelos ARMA y ARIMA. Ver aquí para más detalles SuanShu es una biblioteca de Java de métodos numéricos, incluyendo paquetes de estadísticas completas, en los cuales ARMA univariante / multivariado ARMA, ARIMA, ARMAX, etc modelos se implementan en un enfoque orientado a objetos. Estas implementaciones están documentadas en SuanShu, una biblioteca numérica y estadística de Java. SAS tiene un paquete econométrico, ETS, que estima que los modelos ARIMA se encuentran aquí para más detalles. Aplicaciones ARMA es apropiado cuando un sistema es una función de una serie de choques no observados (la parte MA) clarificación necesaria, así como su propio comportamiento. Por ejemplo, los precios de las acciones pueden verse afectados por información fundamental, así como presentar tendencias técnicas y efectos de reversión media debido a los participantes en el mercado. Generalizaciones La dependencia de X t sobre los valores pasados y los términos de error t se supone que es lineal a menos que se especifique lo contrario. Si la dependencia es no lineal, el modelo se llama específicamente un modelo de media móvil no lineal (NMA), autorregresivo no lineal (NAR) o modelo NARMA (non-linear autoregressivemoving-average). Los modelos de media-baja automática pueden generalizarse de otras maneras. Véase también modelos de heterocedasticidad condicional autorregresiva (ARCH) y modelos de media móvil integrada autorregresiva (ARIMA). Si se van a montar varias series temporales, puede instalarse un modelo vectorial ARIMA (o VARIMA). Si las series de tiempo en cuestión exhiben memoria larga, entonces puede ser apropiado el modelado fraccional de ARIMA (FARIMA, a veces llamado ARFIMA): vea Media móvil con integración fraccionada autoregresiva. Si se piensa que los datos contienen efectos estacionales, puede ser modelado por un modelo SARIMA (ARIMA estacional) o un modelo ARMA periódico. Otra generalización es el modelo autorregresivo multiescala (MAR). Un modelo MAR es indexado por los nodos de un árbol, mientras que un estándar (tiempo discreto) modelo autorregresivo es indexado por enteros. Obsérvese que el modelo ARMA es un modelo univariante. Las extensiones para el caso multivariado son la Autorregresión Vectorial (VAR) y la Media-Movimiento-Autorrealización del Vector (VARMA). Modelos de mediación con modelo de entrada exógena (modelo ARMAX) La notación ARMAX se refiere al modelo con p términos autorregresivos, términos de media móvil y términos de entradas exógenas. Este modelo contiene los modelos AR (p) y MA (q) y una combinación lineal de los últimos términos b de una serie temporal conocida y externa. Está dado por: Se han definido algunas variantes no lineales de modelos con variables exógenas: véase por ejemplo el modelo exógeno no autoregresivo no lineal. Los paquetes estadísticos implementan el modelo ARMAX mediante el uso de variables exógenas o independientes. Se debe tener cuidado al interpretar la salida de esos paquetes, ya que los parámetros estimados usualmente (por ejemplo, en R 4 y gretl) se refieren a la regresión: donde mt incorpora todas las variables exógenas (o independientes): Ver también Este artículo incluye una lista De referencias. Pero sus fuentes siguen siendo poco claras porque no tienen suficientes citas en línea. Por favor ayude a mejorar este artículo introduciendo citas más precisas. (Agosto de 2010) Referencias George Box. Gwilym M. Jenkins. Y Gregory C. Reinsel. Análisis de series temporales: Predicción y control. tercera edicion. Prentice - Hall, 1994. Brockwell, P. J. y Davis, R. A. Series temporales: Teoría y métodos. 2ª ed. Springer, 2009. Características de series temporales en Mathematica ARIMA Modelado de Series de Tiempo. R documentation Mills, Terence C. Técnicas de series de tiempo para economistas. Cambridge University Press, 1990. Percival, Donald B. y Andrew T. Walden. Análisis espectral para aplicaciones físicas. Cambridge University Press, 1993. Esta entrada es de Wikipedia, la principal enciclopedia contribuida por el usuario. Puede que no haya sido revisada por editores profesionales (ver la exención de responsabilidad completa). Un RIMA significa Autoregressive Integrated Moving Average. Univariante (vector único) ARIMA es una técnica de previsión que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su aplicación principal es en el área de pronósticos a corto plazo que requieren al menos 40 puntos de datos históricos. Funciona mejor cuando los datos muestran un patrón estable o consistente en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de los autores originales), ARIMA suele ser superior a las técnicas de suavización exponencial cuando los datos son razonablemente largos y la correlación entre las observaciones pasadas es estable. Si los datos son cortos o muy volátiles, entonces algún método de suavizado puede funcionar mejor. Si usted no tiene por lo menos 38 puntos de datos, debe considerar algún otro método que ARIMA. El primer paso para aplicar la metodología ARIMA es verificar la estacionariedad. La estacionariedad implica que la serie permanece a un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, sus datos NO son estacionarios. Los datos también deben mostrar una variación constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y que crece a un ritmo más rápido. En tal caso, los altibajos en la estacionalidad se harán más dramáticos con el tiempo. Si no se cumplen estas condiciones de estacionariedad, no se pueden calcular muchos de los cálculos asociados con el proceso. Si un gráfico gráfico de los datos indica nonstationarity, entonces usted debe diferenciar la serie. La diferenciación es una excelente forma de transformar una serie no estacionaria en una serie estacionaria. Esto se hace restando la observación en el período actual a la anterior. Si esta transformación se realiza sólo una vez en una serie, se dice que los datos se han diferenciado primero. Este proceso esencialmente elimina la tendencia si su serie está creciendo a una tasa bastante constante. Si está creciendo a un ritmo creciente, puede aplicar el mismo procedimiento y diferenciar los datos de nuevo. Sus datos entonces serían segundos diferenciados. Las autocorrelaciones son valores numéricos que indican cómo una serie de datos se relaciona a sí misma con el tiempo. Más precisamente, mide cuán fuertemente están correlacionados los valores de datos en un número específico de períodos separados entre sí a lo largo del tiempo. El número de períodos separados se llama generalmente el retraso. Por ejemplo, una autocorrelación en el retardo 1 mide cómo los valores 1 período aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso 2 mide cómo los datos dos períodos aparte están correlacionados a lo largo de la serie. Las autocorrelaciones pueden variar de 1 a -1. Un valor próximo a 1 indica una alta correlación positiva, mientras que un valor cercano a -1 implica una correlación negativa alta. Estas medidas se evalúan con mayor frecuencia a través de tramas gráficas llamadas correlagramas. Un correlagrama traza los valores de autocorrelación para una serie dada con diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. La metodología ARIMA intenta describir los movimientos en una serie temporal estacionaria como una función de lo que se llaman parámetros de media móvil y autorregresiva. Estos parámetros se denominan parámetros AR (autoregessivos) y MA (medias móviles). Un modelo de AR con un solo parámetro se puede escribir como. X (t) A (1) X (t-1) E (t) donde X (t) serie temporal bajo investigación A (1) el parámetro autorregresivo de orden 1 X (t-1) (T) el término de error del modelo Esto simplemente significa que cualquier valor dado X (t) puede explicarse por alguna función de su valor anterior, X (t-1), más algún error aleatorio inexplicable, E (t). Si el valor estimado de A (1) fue de 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionada con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), más algún error aleatorio E (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Modelos de media móvil: Un segundo tipo de modelo de Box-Jenkins se denomina modelo de media móvil. Aunque estos modelos parecen muy similares al modelo de AR, el concepto detrás de ellos es muy diferente. Los parámetros de la media móvil relacionan lo que sucede en el período t sólo con los errores aleatorios que ocurrieron en períodos de tiempo pasados, es decir, E (t-1), E (t-2), etc., en lugar de X (t-1), X T-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA puede escribirse como sigue. El término B (1) se denomina un MA de orden 1. El signo negativo delante del parámetro se utiliza para la convención solamente y se imprime generalmente La mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente al error aleatorio en el período anterior, E (t-1), y al término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil pueden extenderse a estructuras de orden superior que abarcan diferentes combinaciones y longitudes móviles. La metodología ARIMA también permite la construcción de modelos que incorporen parámetros tanto de autorregresión como de media móvil. Estos modelos se refieren a menudo como modelos mixtos. Aunque esto hace que sea una herramienta de pronóstico más complicada, la estructura puede simular mejor la serie y producir un pronóstico más preciso. Los modelos puros implican que la estructura consiste solamente en los parámetros AR o MA - no ambos. Los modelos desarrollados por este enfoque usualmente se llaman modelos ARIMA porque usan una combinación de autoregresión (AR), integración (I), que se refiere al proceso inverso de diferenciación para producir las operaciones de predicción y de media móvil (MA). Un modelo de ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (p), el número de operadores de diferenciación (d) y el orden más alto del término medio móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo autorregresivo de segundo orden con un componente de media móvil de primer orden cuya serie se ha diferenciado una vez para inducir la estacionariedad. Elegir la especificación correcta: El principal problema en el clásico Box-Jenkins es tratar de decidir qué especificación ARIMA utilizar-i. e. Cuántos AR y / o MA parámetros para incluir. Esto es lo que gran parte de Box-Jenkings 1976 se dedicó al proceso de identificación. Dependía de la eva - luación gráfica y numérica de las funciones de autocorrelación de la muestra y de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, sus datos representan sólo una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, errores de medición, etc.) pueden distorsionar el proceso teórico de identificación. Es por eso que el modelado ARIMA tradicional es un arte más que una ciencia.
Comments
Post a Comment