200 likes | 398 Views
PRACTICAS SOBRE LA MODELIZACIÓN DE SERIES TEMPORALES CON LA METODOLOGÍA DE BOX-JENKINGS FICO. GR 21. Ministerio de Economía: obtención de series temporales de variables económicas largas. Producto Interior Bruto Portugal. Serie: Producto Interior Bruto de Portugal
E N D
PRACTICAS SOBRE LA MODELIZACIÓN DE SERIES TEMPORALES CON LA METODOLOGÍA DE BOX-JENKINGS FICO. GR 21
Ministerio de Economía: obtención de series temporales de variables económicas largas
Producto Interior Bruto Portugal Serie: Producto Interior Bruto de Portugal Fuente: Ministerio de Economía y Hacienda Periodicidad: Anual
Metodología Box-Jenkins • La construcción de modelos consta de tres pasos: • 1.- Identificación inicial • 2.- Estimación • 3.- Validación
Identificación • La clase general de modelos de la metodología Box-Jenkings es la familia de modelos ARIMA con elementos determinísticos (constante, tendencia determinística, estacionalidad determinística, efecto semana santa, efecto días laborables, atípicos, etc) • En la especificación de estos modelos entran distintos tipos de parámetros que capturan distintos rasgos de los datos • El primer paso es determinar si el modelo se debe formular con los datos originales o con series transformadas. En todo caso, deben recoger: • Evolutividad en varianza • Evolutividad de la tendencia • Evolutividad estacional • El modelo incorporará: • Diferencias regulares • Diferencia estacional • Constante • Factores determinísticos COMO LA SERIE ES ANUAL NO TIENE ESTACIONALIDAD, POR TANTO SE PRESCINDE DE LA EVOLUTIVIDAD ESTACIONAL
Identificación (gráficos) • En general, se trabaja con la transformación logarítmica de la serie original: • Homogeneización de la varianza. Estacionariedad en varianza. • Relación con las tasas de crecimiento • Por tanto, procederemos a trabajar con las series en logaritmos • La serie de logaritmos presenta una evolución alcista, con crecimiento sistemático, a lo largo de la muestra, por tanto, no tiene media constante y la serie no presenta un comportamiento estacionario. Para obtener estacionariedad y eliminar la tendencia, habrá que proceder a tomar diferencias. • La primera diferencia de la serie de logaritmos presenta un comportamiento estacionario en torno a un valor medio, ligeramente superior a 0.02 (no tiene porque ser cero). • Parece, por tanto, que con una primera diferencia ya se ha conseguido la estacionariedad y no habría que seguir diferenciando. Veremos también si el correlograma y el test de Dickey-Fuller son indicativos de que esta transformación es ya estacionaria. • Se observan tres valores atípicos: 1982,1991 y 2009 • En la serie original se reflejan como saltos en el nivel de la tendencia • En la serie diferenciada se muestran como un valor atípico puntual, lo que es consecuencia del proceso de diferenciación
Identificación (gráficos) Producto Interior Bruto Portugal
Identificación (correlogramas) • El correlograma de la serie original (en log) presenta un perfil en el que las correlaciones muestrales disminuyen muy ligeramente a medida que aumenta la distancia temporal entre las variables, no existe punto de corte. Es por tanto, un correlograma característico de series no estacionarias. • Véase la diferencia con la FAC de un proceso no estacionario, que por definición no está definida, al no existir una media constante y, por tanto, la varianza, las covarianzas y las correlaciones no están definidas. • El correlograma de la primera diferencia presenta un punto de corte para el primer retardo. El resto de correlaciones muestrales no son significativamente distintas de cero. Por tanto, presenta un perfil coherente con una serie estacionaria.
Identificación (correlogramas) LGDP (1-L) LGDP (1-L)2 LGDP
Identificación (test de Dickey-Fuller) • Serie original: El valor del estadístico “t” es mayor que los valores críticos en tablas para los distintos niveles de error. En concreto, toma el valor -1.56. • Por tanto, se acepta la hipótesis de que existe una raíz unitaria y es necesario diferenciar la serie para obtener la transformación estacionaria que elimine dicha raíz unitaria. • Primera diferencia: En este caso el valor del estadístico “t” es menor que los correspondientes valores críticos. • Por tanto, se rechaza la hipótesis de que existe una raíz unitaria. Lo cual es indicativo de que la correspondiente serie es estacionaria. • En definitiva, tanto gráficamente, como a partir del análisis del correlograma y del test de Dickey-Fuller, se concluye que la primera diferencia de la serie en logaritmos es estacionaria en media. • Esta será la serie a partir de la cual se estimará el modelo • Se van a estimar AR de orden 1,2,3,4 y será a partir de los criterios de información que se decidirá que modelo se elige • Se concluirá con el análisis de los residuos para validar el modelo
Identificación (test de Dickey y Fuller) LGDP (1-L) LGDP
Estimación • Las siguientes transparencias recogen los resultados de estimar sucesivamente modelos autorregresivos de distinto orden. • Se ha incluido una constante en el modelo, porque en la etapa de identificación se observó que la serie estacionaria oscilaba alrededor de un valor medio distinto de cero. • Si al estimar no fuera significativa se eliminaría del modelo (el contraste se realiza mediante el estadístico “t”) • Con los resultados obtenidos, se presenta un cuadro comparativo con los criterios de información de Akaike y Schwarz. Se incluye además el valor que toma la función de máxima verosimilitud a modo de información complementaria.
Estimación del modelo Modelo AR(4) Modelo AR(3)
Estimación del modelo Modelo AR(2) Modelo AR(1)
Validación • En el cuadro adjunto se presentan los valores de los criterios de información y el valor de la función de máxima verosimilitud en el máximo. • Se observa que a medida que se ha ido reduciendo el número de retardos del modelo autorregresivo, han ido disminuyendo los valores de los criterios de información y aumentando el valor de la función en el máximo. • Por tanto, se concluye que el modelo que mejor se ajusta a la serie estacionaria será un AR(1) con constante. • Cabe señalar que en el resto de modelos estimados los coeficientes no eran significativos. • En definitiva el modelo de la serie es: • (1-0.34L)(1-L) Log DGPt = 0.03+ at • Obsérvese que el valor del autorregresivo coindice con la correlación muestral de orden 1.
Validación • El gráfico adjunto recoge los valores que proporciona el modelo comparado con los datos reales. También se incluye la serie de residuos. • La serie de residuos presenta un comportamiento estacionario y aleatorio. • Cabe destacar la presencia de determinados valores atípicos que se producen en los años 1982, 1991 y 2009, coincidiendo con etapas de crisis económica en el entorno europeo. • Una vez llegados a este punto, habría que incluir variables dummy para recoger el impacto de dichos valores atípicos.
Validación • El gráfico adjunto el correlograma de los residuos del modelo AR(1) • Como se puede observar las correlaciones para los distintos retardos no son significativamente distintas de cero. • Además el valor del estadístico Q para los distintos retardos es menor que el valor en tablas. • Por ejemplo, para el retardo 10, el valor del estadístico Q es 3.7, mientras que el valor en tablas (chi-cuadrado con 10 grados de libertad, al 95% de confianza) es igual a 18.3 • Por tanto, se concluye que los residuos del modelo presentan estructura de ruido blanco, lo que nos permite validar el modelo.
Diagnóstico Correlograma de los residuos