360 likes | 477 Views
UN SISTEMA DINÁMICO PARA PREDECIR PASAJEROS NACIONALES DE LA RED AENA DE AEROPUERTOS ESPAÑOLES Presentación para el Laboratorio de Estadística de la Universidad del País vasco Jorge Herrera jorge.herrera@ineco.es
E N D
UN SISTEMA DINÁMICO PARA PREDECIR PASAJEROS NACIONALES DE LA RED AENA DE AEROPUERTOS ESPAÑOLES Presentación para el Laboratorio de Estadística de la Universidad del País vasco Jorge Herrera jorge.herrera@ineco.es INECO - Febrero 2.009
Introducción • El problema del Cliente • Dudas principales • Método de Estimación-Predicción • Dudas principales • Ejemplo de Estimación - Predicción • Dudas principales .
. 1 El Problema del Cliente
El Problema del Cliente • El cliente necesita predecir los pasajeros anuales de cada uno de los 43 aeropuertos españoles hasta 2025. • Hasta ahora eso se ha hecho mediante este modelo teórico: • Pasajerost=a+bPIBt+ut • Suponiendo que los aeropuertos eran independientes entre sí y que la relación era básicamente estática y dependiente del PIB español, italiano o inglés. • Este modelo incorporaba intervenciones por parte del usuario realizadas de forma deliberada en el nivel de las predicciones, en función de intuiciones o compromisos con el aeropuerto. .
El Problema del Cliente • El proyecto pretende implantar una nueva metodología. Pretendemos cambiar la forma de enfocar el problema: • Consideramos que los aeropuertos están relacionados entre sí (hay evidencias muestrales). • Consideramos que esa relación es dinámica y endógena. • Las variables económicas (PIB, etc...) serán utilizadas para modificar la senda de expansión a largo plazo. .
La Pregunta: . ¿Se pueden predecir las series de pasajeros de una manera más fiable y con la utilización de, al menos, tres variables económicas?
Sobre los Aeropuertos Españoles • 17 aeropuertos de los 43 concentran el 90% de los pasajeros españoles. • Entre estos aeropuertos hay una relación origen/destino que genera y atrae gran parte del tráfico aéreo • Esto será tenido en cuenta para simplificar la modelización y dar buena respuesta. .
Idea Básica • La idea, por lo tanto, será tratar de simular este comportamiento basándonos en matrices origen destino (proporcionadas por el cliente), que permiten ver qué aeropuertos están conectados entre sí. • Por un lado se van a crear sistemas que predigan las cuotas de mercado de cada uno de los aeropuertos...[p1] • ...Y por otro lado, se va a predecir el total de pasajeros basado en fuerzas económicas.[p2] • Aplicando la cuota [p1] en la predicción[p2], nos aseguramos: • Que el total de pasajeros esté completamente repartido (lo que hasta ahora no ocurre). • La utilización de distintas variables económicas en P2 permite eliminar problemas de grados de libertad • Que una modificación deliberada en un aeropuerto afecte al resto de los aeropuertos (tampoco ocurría, al menos, de una forma sistemática). .
Observaciones • Nos enfrentamos, a priori, a un problema de escasez muestral. Sólo hay datos fiables desde 1994. • Los sistemas, en principio, no podrán contener más de cuatro aeropuertos. .
. 2 Método de Estimación- Predicción
En este caso, L=(1,..n) Idea del Modelo Econométrico • Dividiremos los 17 aeropuertos en subsistemas • En cada subsistema tendremos dos grupos de Aeropuertos: A y B • El grupo A son aeropuertos influyentes en cuota de mercado (ej:Madrid-Barajas) y el grupo B menos influyentes (ej:Jerez) • Asumiremos que los aeropuertos del grupo A influyen contemporáneamente a los del grupo B pero no al revés. • Se asume la existencia de una relación de feedback entre ambos . L (0,…n) es el operador polinómico de retardos eites una perturbación aleatoria ruido blanco.
En este caso, L=(1,..n) Posibilidad de incluir variables macro exógenas Hipótesis de partida debido a que estimaremos explícitamente la relación estructural Modelo Teórico • Estimaremos un VAR restringido y estructural en primeras diferencias (adaptación de Treadway et al.) • Con matriz de Varianzas y Covarianzas de las perturbaciones: .
Método de Estimación • Elegimos un método sencillo de estimación (siguiendo a Zellner, A): • MCO ecuación por ecuación introduciendo las restricciones estructurales y testando posibles coeficientes no relevantes. • MCG aprovechando la correlación residual contemporánea (SURE). • Las series de cuota de mercado son, en su mayoría, no estacionarias • No encontramos evidencias de cointegración (tamaños de muestra pequeños) • Estimamos el SVAR en primeras diferencias (como modelo de partida) .
Método de Estimación [S1] Una vez estimado el VAR en cada subgrupo, se realizan las predicciones de cuota y se elige la más adecuada para cada aeropuerto. [S2] A continuación se predicen las cuotas para el resto de aeropuertos [duda: ARIMA, datos de panel, reparto proporcional al promedio...] [S3] Se predice el total de Pasajeros mediante un SVAR Se aplica [S1] y [S2] en [S3] [S4] se estiman nuevos VAR (ver en caso práctico por qué) con el objeto de derivar funciones de respuesta a impulso [S5] se intervienen los sistemas basados en [S4] en función de posibles perturbaciones futuras (AVE, nuevas compañías) .
Dudas • ¿Qué diferencia hay en la estimación por el método (SURE) y FIML? • ¿ Hasta qué punto es preocupante no tener una correlación estadísticamente nula entre residuos? • Posibles intervenciones en el modelo a posteriori modificando por el usuario las sendas de predicción de cada aeropuerto • Caso Madrid Barcelona: • Son un grupo en el que por ahora estamos considerando A= Madrid y B= Barcelona. Ambos son relevantes y no es creible al 100% la idea estructural del modelo ¿qué camino seguir? .
Dudas • ¿Qué criterio seguir para elegir los aeropuertos en el VAR? • Se busca que los subgrupos sean lo más reducidos posibles y que incorporen información válida para predecir ¿ Sería válido estimar un VAR no restringido y examinar la descomposición de varianza de predicción? .
Predicción del Total de Pasajeros . • Para ello, estimamos un SVAR en el que el PIB es exógeno y algunas variables económicas, así como el total de Pasajeros son endógenas. • El modelo teórico es similar al anterior. Supondremos que las variables económicas afectan contemporáneamente al número de pasajeros pero no al revés.
Métodos de Predicción . • Estimamos varias versiones de cada modelo (Hendry y Clements): • DV: es el modelo original en diferencias. • DV_IC : es el modelo original introduciendo intercept corrections. • DDV: es una reestimación del modelo en segundas diferencias.
Dudas • Debido a que la sobrediferenciación (DDV, y quizás el DV) induce autocorrelaciones grandes en los residuos, sugeriendo a veces DDV con varios retardos, se ha decidido probar con los valores contemporáneos (si hay motivos estructurales) o un retardo como máximo, para no obtener soluciones sobreparametrizadas. ¿ es correcto? La versión IC se obtiene estimando el modelo en t-1 y prediciendo hacia t. El error de previsión se incorpora como nuevo intercepto en la previsión hecha en t horizonte t+k. ¿Cómo saber si esa corrección es relevante o no? Hay veces que introducir sólo algunas correciones a “ojo” y no todas las que se proponen, dan mejores resultados predictivos. .
. 3 Ejemplo Práctico: Arco Mediterráneo
Análisis Previo (I) . A través de las matrices origen/destino, catalogamos los aeropuertos que comparten información útil para predecir. Hemos hecho 7 grupos que engloban a unos 17 aeropuertos. • En general, en todos los sistemas figuran los aeropuertos de Madrid y Barcelona, como nodo central de la red • Madrid y Barcelona forman un grupo único cuyas predicciones en general se usarán para el resto de sistemas Analizaremos el arco mediterráneo (IBIZA, PALMA, BARCELONA, MADRID, VALENCIA, ALICANTE)
Predeciremos esta información Análisis Previo (II) . Contamos con los datos de cuotas de mercado de cada aeropuerto desde 1994. Estimaremos el modelo desde 1994 hasta 2004 y predeciremos desde 2005 hasta 2008.
Madrid y Barcelona pueden considerarse predeterminados en otro subsistema. Serán exógenos Análisis Previo (II) • Presentamos la descomposición de Varianza del error de previsión de un DVAR(1) sin restringir y suponiendo que todos los aeropuertos son endógenos en el sistema: .
MADRID BARCELONA IBIZA ALICANTE VALENCIA PALMA Hipótesis de construcción del modelo Basándonos en las descomposiciones de varianza anteriores… • H1: Exógenos y con efecto contemporáneo • H2: Valencia tiene efecto contemporáneo (es el de mayor cuota del resto). • H3: Hay retroalimentación determinada por la descomposición de varianza (flechas verdes)
Dudas • ¿Es correcto estudiar la posible forma del sistema (descomposición de varianza del error de predicción) a través de una versión no restringida y no estructural de este? ¿cuáles son los errores más dañinos que podemos cometer? .
DUDA: El coeficiente para el IPI está estimado negativo y significativo. Un análisis de los residuos (modelo sin IPI y con IPI) parece que añade capacidad explicativa… ¿hay alguna razón económica para que esto ocurra? Modelo DVAR . Correlaciones residuales, significativas si > l 2/n1/2l=0,55
Corrigiendo este atípico la estimación de los parámetros no varía significativamente Residuos del modelo DVAR .
Modelo DDVAR . Correlaciones residuales, significativas si > l 2/n1/2l=0,55 Los indicios de autocorrelación son lógicos
Predicción en en el VAR en el que MAD y BCN son exógenos Predicción de las cuotas . • Predicción en un modelo aparte
Ejemplos de Predicción en niveles . • Predicción “sencilla” en el que el modelo multivariante de cuotas bate a modelos rivales • Predicción “complicada” en el que el modelo multivariante de cuotas bate a modelos rivales
Cambios en el Sistema • Debido a que cada aeropuerto dentro del mismo sistema requiere un VAR diferente para ser predicho... • Pero también requieren cambios futuros, debemos buscar la forma de averiguar cómo se transforma un aeropuerto ante un cambio brusco en un aeropuerto influyente. • ...surgen dudas .
Dudas • Estimamos nuevamente el VAR incluyendo todos los aeropuertos como endógenos Supondremos que para predecir puede ser interesante tener una senda clara de Madrid y Barcelona...pero no para análisis estructural. • En el ejemplo en cuestión, estimamos un VAR en niveles y las funciones de respuesta a impulso salen más coherentes que en el VAR en primeras diferencias ¿Por qué? .
Simulación • Hemos simulado un Shock en Madrid y Barcelona en el momento t=2005 de un 1% de caída conjunta. • La matriz de correlación de residuos indica que el análisis estructural fallaría en el impacto de BCN sobre PMI y en el de VLC sobre MAD • El resto de impactos estaría correctamente analizado .
Dudas • Estas simulaciones incorporan problemas. El hecho es que una caída en cuota implica también una caída en el total de pasajeros. Por lo que : • En la simulación hay que modificar el total de pasajeros • Cambiar las cuotas previstas a partir del shock debido a que esas cuotas están hechas relativas a la anterior senda total de pasajeros • Incorporar el shock en las cuotas • ¿Se puede simplificar lo anterior para poder modificar el sistema? .
GRACIAS . GRACIAS GRACIAS GRACIAS GRACIAS GRACIAS GRACIAS