290 likes | 426 Views
Uso de modelos Mixed Logit en modelación de elecciones discretas. Marcela A. Munizaga Ricardo Alvarez-Daziano Universidad de Chile Santiago, 30 November, 2014. Contenido de la Presentación. Correlación del término de error Análisis de Simulación logverosimilitud y parámetros
E N D
Uso de modelos Mixed Logit en modelación de elecciones discretas Marcela A. Munizaga Ricardo Alvarez-Daziano Universidad de Chile Santiago, 30 November, 2014
Contenido de la Presentación • Correlación del término de error • Análisis de Simulación • logverosimilitud y parámetros • iteraciones y tiempo de convergencia • diferencias en modalidad predictiva • Análisis con datos reales • equivalencia entre modelos • capacidad de recuperar efectos de correlación
Elección Discreta y Utilidad Aleatoria • Teoría de la Utilidad Aleatoria • Individuo maximiza su Utilidad, función de atributos de la alternativa y características de los individuos (Domencich y McFadden, 1975) • Modelador no posee información completa del sistema • Hay componentes y atributos que se desconocen o no se pueden medir; aleatoriedad inherente a la naturaleza humana
Elección Discreta (cont.) • No se puede asegurar con certeza qué alternativa será escogida • Supuestos sobre distribución de e Modelo de elección específico (Ortúzar y Willumsen, 1994) • Logit Multinomial MNL (McFadden, 1974) • Supone errores iid Gumbel • Expresión cerrada de la probabilidad de elección:
¿Por qué usar algo distinto del MNL? • Correlación: Dependencia • Heteroscedasticidad: Distinta varianza • Dependencia probabilidades y parámetros inconsistentes, predicciones poco confiables • Propiedad de independencia de alternativas irrelevantes (patrones de sustitución constantes) • Avances en computación y métodos numéricos permiten considerar modelos más generales
Correlación del término de error • Motivación: el estudio de correlación • Fuentes de correlación: alternativas similares, alternativas con componente común, variaciones en los gustos, agregación • Modelos adecuados: Logit Jerárquico, Probit, Mixed Logit
Logit Jerárquico • Agrupa las alternativas similares en nidos • Ui=Vi+ei+nj alt i nido j • Matriz de covarianza: • correlación, homoscedasticidad
Probit • Ui=Vi+ei ei ~ Normal • Matriz de covarianza general, sujeto a restricciones de identificabilidad • Permite modelar correlación y heteroscedasticidad
Modelo Mixed Logit • Se deriva de suponer e iid Gumbel, h término aleatorio adicional que distribuye f(h/q*) (Ben Akiva y Bolduc, 1996; McFadden y Train, 1997) • Si ees iid Gumbel probabilidad condicional enh • Por lo tanto, la probabilidad total es:
Modelo Mixed Logit (cont.) • Propiedades • ML aproxima cualquier modelo de utilidad aleatoria (McFadden y Train, 1997): ML con parámetros distribuidos normal, aproxima a un Probit. • Razón de probabilidades depende de todo el conjunto de alternativas disponibles. • Caso Particular (Modelo lineal de error compuesto): zin atributos relacionados con alternativa i e individuo n
Modelo Mixed Logit (cont.) • Estimación • Condicional en q*, se obtiene un valor h Pin(h) tiene forma Logit. Proceso se repite R veces: • Probabilidad Simulada de escoger la alternativa • Se maximiza la log verosimilitud simulada
Modelos de elección (cont.) • Nested Mixed Logit • Brownstone and Train (1999). • Ui=Vi+ei+jei ~ iid Gumbel j ~ Normal • Matriz de covarianza: • correlación, heteroscedasticidad
Análisis de Simulación • Objetivo: estudiar los modelos en un caso en que se cumplen todos los supuestos • Metodología: • atributos según base de datos real • se asume ciertos parámetros de gusto • se genera las componentes determinística y aleatoria de la función de utilidad • se calcula la elección de acuerdo a máx U • se calibra los modelos con la base generada • estímulo de políticas
Análisis de Simulación • Uso del simulador en modalidad predictiva • Predicciones con los modelos calibrados • ¿En qué nos podemos fijar? • Diferencias entre parámetros conocidos y calibrados • Diferencias entre predicciones del simulador (realidad virtual) y predicciones modeladas
Influencia del Nº Repeticiones • 4000 Observaciones • 4 alternativas • Correlación: 0,5 (Nido con dos alternativas) • Dimensión: 3 • Probit (Nº de alternativas - 1) • ML (Estructura homsc. anidada: 1 componente común + 2 términos independientes)
Influencia del Nº Repeticiones • Parámetro de Correlación : Probit
Influencia del Nº Repeticiones • Parámetro de Correlación : MLR
Influencia del Nº Repeticiones • Parámetro de Correlación : MLH
Influencia del Nº Repeticiones • log verosimilitud
Influencia del Nº Repeticiones • Diferencias en modalidad predictiva
Influencia del Nº Repeticiones • Iteraciones and tiempo de convergencia
Caso: alternativas correlacionadas • Síntesis • 8000 Observaciones / r = 0,5 / He & Ho • Mejor verosimilitud para ML • ML: recupera adecuadamente todos los parámetros • Probit: importante subestimación de la correlación • LJ: efectos de escala, al usar datos heteroscedásticos • NL – Probit – ML: buen nivel de respuesta • MNL: pobre nivel de respuesta en comparación con ML y LJ
Datos reales • Contexto: • Corredor Las Condes - Centro, RP • 9 alternativas, se incluye combinaciones • auto chofer, auto acompañante, taxi colectivo, metro, bus, auto chofer-metro, auto acompañante -metro, taxi colectivo-metro, bus-metro • 697 observaciones
Transporte Público Auto Chofer Auto Acomp Bus Taxi Metro ACh Metro AAc Metro Taxi Metro Bus Metro Datos reales • Estructura anidada 1
Transporte Público Auto Auto Chofer Auto Acomp AChMetro AAcMetro Bus Taxi Metro Taxi Metro Bus Metro Datos reales • Estructura anidada 2
Síntesis y Discusión • ML es un modelo útil, flexible y aplicable • La estructura de covarianza se deduce de la especificación y debe ser debidamente justificada • Nested Mixed Logit no es equivalente al LJ • Probit aparece como un modelo costoso y muestra dificultades para recoger correlación