901 likes | 2.25k Views
INTRODUCCIÓN A LOS MODELOS ARIMA. Presentación:
E N D
INTRODUCCIÓN A LOS MODELOS ARIMA • Presentación: • Los modelos ARIMA responden al acrónimo de procesos AutoRregresivos, Integrados, y Medias móviles (Moving Average), y fueron planteados inicialmente por George Box y Gwilym Jenkins en 1970 en su obra “Time Series Analysis: Forecasting and Control (Holden Day, San Francisco, USA)” como una alternativa a la modelización y predicción tradicional mediante modelos estructurales. • La idea subyacente fundamental consiste en admitir que las series temporales son generadas mediante un Proceso Generador de Datos que puede ser identificado y cuantificado y que, por tanto, pueden ser inferidos sus valores a futuro. • En este sentido enlaza con los métodos clásicos de predicción basados en la identificación de los componentes de una serie temporal.
INTRODUCCIÓN A LOS MODELOS ARIMA • Presentación: • En efecto cuando realizamos una predicción de la evolución de una determinada serie temporal mediante la descomposición en los componentes estacional, tendencial, cíclico e irregular, el procedimiento que seguimos consiste en identificar comportamientos regulares a lo largo de la serie (movimientos estacionales, tendenciales y cíclicos ) y extrapolarlos a futuro, asumiendo que los comportamientos irregulares tendrán un efecto promedio nulo. • En el caso de los modelos ARIMA identificaremos igualmente una serie de comportamientos regulares asociados a procesos de evolución temporal conocidos (Procesos de integración, autorregresivos y de Medias móviles) que interactúan con procesos completamente aleatorios (Ruido blanco).
INTRODUCCIÓN A LOS MODELOS ARIMA • Presentación: • El proceso de predicción con modelo ARIMA puede, por tanto, resumirse en las siguientes etapas: • Identificación de los procesos subyacentes (P.G.D.): • 1.1. Orden de integración • 1.2.- Tipología de procesos AR y MA • 2º) Estimación de los coeficientes asociados a los procesos AR y MA. • 3º) Validación del modelo estimado. • 4º) Cuantificación a futuro de los valores de la serie objetivo.
INTRODUCCIÓN A LOS MODELOS ARIMA Fundamentos estadísticos: La modelización ARIMA asume que toda serie temporal está generada por un proceso estocástico (Proceso Generador de datos PGD) en la que los distintos valores observados Yt responden a realizaciones (muestras) concretas de un conjunto de N variables aleatorias Zt, que tienen unas determinadas probabilidades de ocurrencia asociadas a sus respectivas funciones de densidad f(Zt). Estas funciones de densidad serán, en general, desconocidas y no pueden ser estimadas ya que sólo disponemos de una observación de cada una de ellas, por lo que se hace necesario asumir una serie de simplificaciones para poder realizar cualquier tipo de inferencia estadística.
INTRODUCCIÓN A LOS MODELOS ARIMA Fundamentos estadísticos: La primera simplificación que debemos asumir es que el proceso es estrictamente estacionario lo que supone que la función de distribución conjunta no se ve afectada por ningún cambio de origen, es decir: f (Zt, Zt+1,…Zt+r)= f (Zt+k,Zt+1+k,…Zt+r+k). Si definimos la media y varianza del proceso como: Estaremos ante un proceso débilmente estacionario(1) si la media es constante en el tiempo y la covarianza depende únicamente de la distancia temporal entre las variables. (1) Si las variables son normales (proceso gaussiano) equivale a un proceso estrictamente estacionario.
INTRODUCCIÓN A LOS MODELOS ARIMA Fundamentos estadísticos: La segunda simplificación que debemos asumir es que el proceso es ergódico, lo que supone que los elementos suficientemente alejados en el tiempo estén prácticamente incorrelacionados de forma tal que todos los elementos de la serie temporal aporten información nueva y útil para la media. De esta forma la media temporal es un estimador insesgado y consistente de la media poblacional si su varianza tiende a cero cuando la muestra tiende a infinito: Aunque no es posible contrastar la ergodicidad de un proceso podemos asumirla si la covarianza tiende a cero cuando k tiende a infinito
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Ruido Blanco El denominado ruido blanco es un proceso estocástico que presenta media nula, varianza constante y covarianza nula para cualquier valor de k, si además la distribución es normal, se denomina Ruido Blanco Gaussiano. Este tipo de procesos es estrictamente estacionario.
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Camino aleatorio. El camino aleatorio es un proceso tal que la diferencia entre dos valores consecutivos de la variable se comporta como un ruido blanco. Si existe una tendencia sistemática en el cambio se denomina camino aleatorio con deriva. El camino aleatorio es no estacionario en varianza mientras que si tiene deriva tampoco lo es en media.
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Proceso Autorregresivo. Definimos un proceso autorregresivo de primer orden AR(1) como un proceso aleatorio que responde a una expresión del tipo Para que el proceso AR(1) sea estacionario se debe cumplir que -1<1<1, para que z2 sea finita y no negativa. Los procesos autoregresivos pueden generalizarse al orden p AR(p) sin más que añadir términos retardados en la expresión general.
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Medias móviles. Definimos una media móvil de primer orden MA(1) como un proceso aleatorio que responde a una expresión del tipo Los procesos de medias móviles son estacionarios y, al igual que los autoregresivos pueden generalizarse al orden q MA(q) sin más que añadir términos retardados en la expresión general.
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Invertibilidad. El operador retardo B aplicado sobre una serie temporal Yt la desfasa en el tiempo. Un proceso AR(1) puede expresarse como: y operando Dado que la suma de los infinitos términos de una progresión geométrica de razón 1B se define como El proceso AR(1) es equivalente a un proceso infinito de medias móviles MA(∞) Invertibilidad
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Invertibilidad. La invertibilidad de un proceso puede generalizarse a un autorregresivo de orden p AR(P) De la misma forma un proceso de medias móviles de orden q MA(q) puede transformarse en un AR(∞) La invertibilidad del proceso MA(q) exige que el proceso AR(∞) sea convergente
INTRODUCCIÓN A LOS MODELOS ARIMA Procesos estocásticos elementales: Procesos integrados. Un proceso integrado es aquel que puede convertirse en estacionario aplicando diferencias. Así, por ejemplo, un camino aleatorio sería un proceso integrado de orden 1 I(1), ya que puede convertirse en estacionario tomando primeras diferencias. Definimos el orden de integración de un proceso como el número de diferencias que debemos aplicarle para convertirlo en estacionario. En el contexto de las series económicas los órdenes de integración más frecuentes son 1 ó 2 I(1) ó I(2). En algunas ocasiones las diferencias deben aplicarse sobre el valor estacional.
INTRODUCCIÓN A LOS MODELOS ARIMA Proceso Generador de Datos. Mediante la adecuada combinación de estos procesos elementales: integración, AR(p), y MA(q) podemos representar la evolución de cualquier serie temporal. Para la series que presentan estacionalidad se pueden reproducir los mismos procesos sobre el orden estacional s (s=4 trimestrales, s=12 mensuales) SAR(p) Integración estacional SMA(q)
INTRODUCCIÓN A LOS MODELOS ARIMA Herramientas de identificación: Correlograma. Denominamos correlograma a una representación gráfica de las funciones de Autocorrelación total (FAC) y parcial (FAP). Las funciones de autocorrelación recogen los valores de los diferentes coeficientes de autocorrelación de una serie para distintos desfases k. El coeficiente de autocorrelación para un determinado desfase k se define como: Si el proceso Zt es estacionario
INTRODUCCIÓN A LOS MODELOS ARIMA Herramientas de identificación: Correlograma. Asumiendo la estacionariedad y ergoicidad del proceso los coeficientes de autocorrelación pueden aproximarse como: La función de autocorrelación parcial estaría formada por los correspondientes coeficientes de autorcorrelación parcial, que miden la relación entre los valores desfasados k periodos una vez eliminados o filtrados los efectos de la correlación entre los restantes desfases. Las bandas de confianza para la FAC y la FAP se aproximan como:
INTRODUCCIÓN A LOS MODELOS ARIMA Herramientas de identificación: Correlograma.
INTRODUCCIÓN A LOS MODELOS ARIMA Herramientas de identificación: Correlograma.
INTRODUCCIÓN A LOS MODELOS ARIMA Herramientas de identificación: Correlograma.
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Análisis gráfico de la serie. Determinación de la existencia de tendencia y/o cambios en la volatilidad de la serie. MATRI Object serie -> Open -> View -> Graph Los cambios en la volatilidad relativa se aprecian mejor sobre la serie en primeras diferencias SHOW D(MATRI) View -> Graph
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Transformación logarítmica. Si se aprecian cambios significativos en la volatilidad relativa de la variable es aconsejable realizar una transformación logarítmica para amortiguar este efecto de cambios en la varianza relativa. SHOW LOG(MATRI)-> View -> Graph SHOW DLOG(MATRI)-> View -> Graph
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. La apreciación de una evolución sistemática en la serie analizada puede venir provocada por la existencia de una componente tendencial determinista (tendencia) o estocástica (camino aleatorio). Yt= f(tiempo) Yt= a+b*t Yt=Yt-1+at En el primer caso la tendencia se eliminaría “filtrado” la serie mediante un ajuste de tendencia clásico, mientras que en el segundo se eliminaría tomando primeras diferencias. LS LOG(MATRI) C @TREND() (Object->New->Equation) Procs-> Make residual ->LMATRIFIL DLOG(MATRI)
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. En la práctica es difícil de discriminar entre ambos tipos de tendencias ya que un comportamiento determinista se puede eliminar tomando diferencias al igual que una tendencia estocástica podría corregirse mediante un ajuste de tendencia. Tendencia real: ESTOCÁSTICA Tendencia real: DETERMINISTA
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. Inicialmente podríamos contrastar estadísticamente ambos tipos de tendencias mediante una expresión del tipo: Yt=a + b*t + c*Yt-1+ut Determinando la no nulidad del coeficiente b y la igualdad a 1 del coeficiente c Ahora bien, bajo la hipótesis nula de un coeficiente unitario en c los contrastes habituales pierden potencia al alterarse la distribución de los mismos. Una alternativa válida puede resultar la utilización del Test de Raíces Unitarias de Dickey y Fuller ampliado incluyendo la contrastación de términos deterministas (esquema de Dolado y Perron). Estos autores proponen una especificación alternativa para el contraste de ese coeficiente c donde la variación en dos periodos consecutivos vendría determinada por una expresión del tipo: Yt =+β*t+γ*Yt-1+ut Yt – Yt-1 =+β*t+γ*Yt-1+ut Yt =+β*t+(γ+1)*Yt-1+ut Y donde la nulidad del coeficiente γ equivaldría a la contrastación de la unitariedad del coeficiente c
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. Este contraste DF es especialmente sensible a la presencia de autocorrelación en la perturbación aleatoria del modelo, por lo que los mismos autores proponen una versión ampliada ADF que incluye tantos retardos de la variable endógena como sean necesarios para corregir el problema de la autocorrelación. Yt =+β*t+γ*Yt-1+ Yt-1+ Yt-2 +…+ut En el esquema propuesto por Dolado y Perron, se partiría de una especificación lo menos restringida posible y se iría reduciendo, por eliminación de componentes deterministas no significativos, hasta obtener una formulación final donde se compararía el estadístico t asociado al coeficiente γ con los valores de referencia de Mackinon, rechazándose la hipótesis nula de existencia de una raíz unitaria si los valores del estadístico calculado superan los limites establecidos para cada nivel de probabilidad. Por supuesto si los coeficientes yβfueran significativos estaríamos en presencia de componentes determista en nuestro proceso (deriva o tendencia determinista).
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. Este contraste DF es especialmente sensible a la presencia de autocorrelación en la perturbación aleatoria del modelo, por lo que los mismos autores proponen una versión ampliada ADF que incluye tantos retardos de la variable endógena como sean necesarios para corregir el problema de la autocorrelación. Yt =+β*t+γ*Yt-1+ Yt-1+ Yt-2 +…+ut En el esquema propuesto por Dolado y Perron, se partiría de una especificación lo menos restringida posible y se iría reduciendo, por eliminación de componentes deterministas no significativos, hasta obtener una formulación final donde se compararía el estadístico t asociado al coeficiente γ con los valores de referencia de Mackinon, rechazándose la hipótesis nula de existencia de una raíz unitaria si los valores del estadístico calculado superan los limites establecidos para cada nivel de probabilidad. Por supuesto si los coeficientes yβfueran significativos estaríamos en presencia de componentes determista en nuestro proceso (deriva o tendencia determinista).
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. Para aplicar el contraste ADF en Eviews seleccionamos la serie a analizar y en el menú de vistas elegimos la opción test de raíces unitarias. SHOW LOG(MATRI)-> View -> Unit Root Test Seleccionamos LEVEL TREND AND INTERCEPT Criterio para determinar el número de retardos de la endógena para corregir la autocorrelación
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. TEST ADF: ANÁLSIS DE RESULTADOS Test de Raíz Unitaria: Si el estadístico calculado supera los valores críticos (en valor absoluto) rechazamos la hipótesis nula, es decir, no hay raíz unitaria. Regresión de contraste: Comprobar no existencia de autocorrelación residual Comprobar la significatividad estadística de los términos deterministas C y TREND (Hay que ser muy exigentes con los valores de contraste)
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. TEST ADF: ANÁLSIS DE RESULTADOS A partir de los resultados obtenidos en el test ADF podemos abordar diferentes acciones: 1º) Si la regresión de contraste mostrara síntomas de autocorrelación residual ejecutaríamos de nuevo el contraste ampliando el número de retardos de la variable endógena. 2º) Si el término de tendencia no resulta significativo ejecutamos de nuevo el contraste eliminado dicho término (seleccionar sólo INTERCEPT) 3º) Si el término constante, tampoco resulta significativo se ejecuta de nuevo el contraste eliminándolo (seleccionar NONE). 4º) Una vez que tenemos una regresión de contraste con los términos adecuados comparamos el valor del estadístico de contraste con los niveles tabulados.
APLICACIÓN DE MODELOS ARIMA Tratamiento previo: Componentes deterministas y Orden de integración. TEST ADF: ANÁLSIS DE RESULTADOS (1) Alternativamente se puede repetir el contraste ADF sobre la serie en primeras diferencias omitiendo el proceso previo de filtrado.
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. Una vez obtenida la transformación adecuada de la serie se iniciaría la etapa de identificación y cuantificación de los procesos estacionarios AR y MA subyacentes. Esta etapa se iniciaría con el análisis del correlograma de la serie estacionaria y la determinación del proceso o procesos subyacentes. A continuación se estimarían los coeficientes asociados a dicho proceso y se analizaría el correlograma de los residuos de la regresión efectuada, continuando el proceso hasta obtener un correlograma residual estadísticamente equivalente al Ruido Blanco (Probabilidad del estadistico Q superior a 0.05)
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. SHOW LMATRIFIL -> View -> Correlogram Seleccionamos la opción nivel y el número de retardos deseados (por defecto 3 años). Este correlograma podría responder a un camino aleatorio o un proceso autorregresivo.
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. OPCIÓN 1: Si consideramos que se trata de un camino aleatorio deberíamos repetir el correlograma seleccionando la opción primeras diferencias. OPCIÓN 2: Si consideramos que se trata de un proceso autorregresivo deberíamos estimar el coeficiente correspondiente e identificar los residuos de la regresión. Generalmente los correlogramas con poca pendiente de descenso en los coeficientes de la función de autocorrelación total suelen responder a procesos integrados, por lo que por un principio de prudencia sería aconsejable optar por la primera opción.
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. Show LMATRIFIL -> View -> Correlogram -> 1st difference Este correlograma podría responder a un proceso integrado o un autorregresivo en la parte estacional.
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. Al igual que en la parte regular, para la parte estacional optamos, inicialmente, por un proceso integrado en la parte estacional por lo que deberemos realizar el correlograma de la serie en primeras diferencias en la parte regular y primeras diferencias en la parte estacional. Show D(LMATRIFIL,1,12) -> View -> Correlogram -> Level Este correlograma se aproxima al de un proceso de media móvil de orden 1.
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. Para estimar el coeficiente asociado al proceso de medias móviles de orden 1, estimaremos un modelo de regresión en el que la variable explicativa es un proceso de medias móviles de primer orden utilizando la función MA(1). Object-> New Object-> Equation LS D(LMATRIFIL,1,12) MA(1) Comprobamos la significatividad de los coeficientes estimados y la invertivilidad y estacionariedad del proceso estimado
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. A continuación analizaríamos el correlograma de los residuos de la regresión para comprobar si existe algún otro proceso identificable. View-> Residual Test-> Correlogram Q-statistics Proceso de medias móviles en la parte estacional
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. El nuevo proceso identificado se incluiría en la especificación de la ecuación y se repetiría el proceso hasta conseguir un correlograma estadísticamente equivalente a un Ruido Blanco. Para incluir los diferentes procesos se irían incorporando nuevas variables explicativas en la especificación de la ecuación. ESTIMATE Media Móviles: Regulares MA(1), MA(2),… Estacionales SMA(12), SMA(24)… Autorregresivos: Regulares AR(1), AR(2),…. Estacionales SAR(12), SAR(24),…
APLICACIÓN DE MODELOS ARIMA Identificación y cuantificación de procesos estacionarios. El proceso se finalizaría cuando dispusiéramos de una ecuación con los coeficientes significativos, procesos estacionarios e invertibles y residuos equivalentes a un ruido blanco (Probabilidad asociada al estadístico Q mayor que 0.05.
APLICACIÓN DE MODELOS ARIMA Corrección del modelo: Análisis de intervención. Los modelos ARIMA son especialmente sensibles a la presencia de datos anómalos “outliers” por lo que, en general, es conveniente analizar y, en su caso, corregir estos puntos anómalos. Como primer paso se pueden observar los residuos del modelo prestando especial atención a aquellos puntos que sobrepasan las bandas de confianza. View-> Actual, Fitted, Residual-> -> Actual, Fitted, Residual Table -> Residual Graph
APLICACIÓN DE MODELOS ARIMA Corrección del modelo: Análisis de intervención. El procedimiento de corrección de estos valores anómalos es la incorporación de variables ficticias (valores 0,1) en la especificación de la ecuación que traten de recoger el efecto sobre la serie de estas circunstancias adicionales. En principio pueden existir distintos tipos de variables ficticias, aunque las más comunes son las siguientes: Cambio de nivel Efecto aditivo puntual Efecto transitorio amortiguado Efecto transitorio
APLICACIÓN DE MODELOS ARIMA Corrección del modelo: Análisis de intervención. Partiendo de la observación de los residuos se generaría la variable ficticia más adecuada al comportamiento anómalo observado y, posteriormente. se incorporaría a la estimación como una variable explicativa adicional.
APLICACIÓN DE MODELOS ARIMA Corrección del modelo: Análisis de intervención. En algunas ocasiones las variables ficticias deben ser transformadas en el mismo orden que la variable endógena. Object Equation Estimate El proceso de corrección de “outliers” es secuencial y se irían incorporando a la estimación a medida que se identificaran y fueran significativos.
APLICACIÓN DE MODELOS ARIMA Predicción con modelos ARIMA Una vez alcanzada y contrastada la especificación final se procedería a la realización de la predicción utilizando el procedimiento de FORECAST del objeto ecuación. Hay que tener en cuenta que, si se han incorporado variables ficticias éstas deben tener valores para todo el periodo de predicción. Hay que indicar sobre qué variable queremos la predicción (original o transformada), el nombre que le asignaremos a la serie con los valores de predicción (debe ser distinto al original) y para qué periodo queremos hacer la predicción (en principio la predicción arrancaría a partir del último dato histórico) Eviews rellena automáticamente los valores históricos de la nueva serie de predicción con los valores originales.
APLICACIÓN DE MODELOS ARIMA Predicción con modelos ARIMA Como resultado de esta operación, Eviews muestra un gráfico con los datos de predicción y, si dispusiera de datos reales para ese mismo periodo, realizaría un análisis de predicción realización.
APLICACIÓN DE MODELOS ARIMA Predicción con modelos ARIMA Como último paso y si se han realizado transformaciones previas sobre la serie original (Logartimos, o filtrado de tendencia determinista) deberán realizarse las transformaciones inversas sobre la serie de predicción para obtener los datos estimados en los mismo términos de la serie original). p.e. Si se ha filtrado de tendencia determinista, la predicción en términos de la serie original se obtendría agregando los valores de predicción del modelo ARIMA a la predicción de la tendencia determinista. Genr LMATRIP=LMATRIFILF+LMATRITEND Siendo LMTRITEND la predicción de la tendencia determinista. Si se ha realizado una transformación logarítmica, la predicción en términos de la variable original se obtendría mediante la transformación exponencial: Genr MATRIP=exp(LMATRIP).