380 likes | 398 Views
Modelos Avanzados de Preferencias: Aplicaciones en Estimación de Demanda y Marketing Moderno Clase 8: Diseño de Diseños. Luis Ignacio Rizzi Profesor de Economía de Transporte Pontificia Universidad Católica de Chile. Encuestas de Preferencias Declaradas.
E N D
Modelos Avanzados de Preferencias:Aplicaciones en Estimación de Demanda y Marketing ModernoClase 8: Diseño de Diseños Luis Ignacio Rizzi Profesor de Economía de Transporte Pontificia Universidad Católica de Chile
Encuestas de Preferencias Declaradas • Metodología de recolección de información aplicada a diversas áreas como investigación de mercado, transporte, ciencias sociales, salud, etc. • Permite valorar bienes no transables en los mercados • Permite considerar alternativas o factores no existentes en la realidad • Permite obtener múltiples respuestas por individuo, disminuyendo el costo de obtención de los datos
Encuestas de Preferencias Declaradas • En un experimento de PD, el encuestado típicamente evalúa un cierto número de alternativas, descritas por un conjunto de atributos, y escoge la que satisface sus preferencias en mejor forma • Esto se repite tantas veces como escenarios de elección incluya el experimento • El número de alternativas, atributos, escenarios de elección a evaluar, niveles de variación y rango de variación, se conocen como las dimensiones de diseño (DD) de un experimento de PD • La dimensionalidad del diseño es generalmente especificada a priori por el modelador • La influencia del diseño y su complejidad sobre el comportamiento no ha sido investigada en forma sistemática
Encuestas de Preferencias Declaradas • Bradley y Daly (1994) modelan la complejidad de un experimento de PD usando el enfoque de escalamiento • Swait y Adamowicz (2001) incorporan la complejidad a través de una parametrización del factor de escala en función de un índice de entropía • DeShazo y Fermo (2002) hacen una parametrización del factor de escala en función de ciertas medidas de cantidad de información y estructuras de correlación • Hensher (2003) estudia el fenómeno de complejidad a través de la especificación de modelos logit mixto con interacciones entre las dimensiones de diseño y los atributos
Encuestas de Preferencias Declaradas • La especificación de modelos tradicionales no ha incorporado la complejidad en parte por conveniencia (simplicidad) y en parte porque el enfoque simplista pareciera arrojar resultados correctos • La influencia de la complejidad del ejercicio sólo puede ser evaluada a través de un diseño que permita variaciones en las dimensiones de diseño.
Encuestas de Preferencias Declaradas Objetivo de la investigación: • Desarrollar e implementar un experimento de PD que permita variaciones sistemáticas en las dimensiones de diseño • Desarrollar una metodología que logre incorporar la influencia de la complejidad y carga cognitiva, en la especificación de modelos a formular • Determinar el impacto de esta estrategia sobre los resultados obtenidos tanto en términos de ajuste como de disposiciones al pago (VST)
Encuestas de Preferencias Declaradas • Diseño experimental secuencial en dos fases • Contexto de la encuesta: elección de ruta para un viaje interurbano reportado por el encuestado • Fase 1: Se consideró las dimensiones de diseño como variables del experimento, generando así diversos sub-diseños • Fase 2: Para cada sub-diseño se generó distintas rutas alternativas, mediante un diseño experimental basado en los atributos asociados al viaje reportado
Encuestas de Preferencias Declaradas • Atributos primera fase
Encuestas de Preferencias Declaradas • Sub-diseños primera fase
Encuestas de Preferencias Declaradas Fase 1 n sub-diseños Fase 2 m alternativas
Encuestas de Preferencias Declaradas • Atributos a considerar en la segunda fase • Tiempo de viaje sin congestión • Tiempo de viaje con congestión moderada • Tiempo de viaje con congestión alta • Incertidumbre en el tiempo de viaje • Costos de operación del vehículo • Tarifa de viaje (peaje) • La variación en el número de atributos presentes se logra mediante la agregación de éstos (no por inclusión/exclusión)
Encuestas de Preferencias Declaradas • Diversos estudios han investigado el efecto de ciertas dimensiones de diseño en forma independiente • Número de alternativas por escenario de elección: un aumento en el número de alternativas compromete la consistencia de la elección, sujeto a un valor umbral (Wildert, 1998; DeShazo y Fermo, 2002) • Número de atributos por alternativa: un aumento produce siempre un incremento en la varianza asociada al proceso de elección (Wang y Li, 2002; Arentze et al, 2003; Hensher, 2003)
Encuestas de Preferencias Declaradas • Número de niveles y rangos de variación: basándose en Dellaert et al. (1999), Ohler et al. (2000) y Wang y Li (2002), se espera que la complejidad aumente a medida que se incrementa la cantidad de niveles de variación y sus respectivos rangos • Cantidad de escenarios de elección a evaluar: se postula un efecto compuesto; un aumento inicial en el número de escenarios de elección puede disminuir la varianza (debido a un efecto aprendizaje), pero luego esta debiera empezar a aumentar debido a la mayor carga cognitiva (efecto fatiga)
Encuestas de Preferencias Declaradas Modelos Logit Mixto (Hensher, 2003) • El impacto de las dimensiones de diseño sobre los resultados se puede estimar mediante la incorporación de interacciones entre las dos fases de modelación • Como el modelo sigue siendo lineal en los parámetros, puede ser estimado mediante paquetes estadísticos comerciales como ALOGIT o LIMDEP • Este tipo de modelación es compleja y no tiene un adecuado sustento teórico
Encuestas de Preferencias Declaradas • Modelos Logit Heterocedásticos • Recordemos que en una especificación MNL y la varianza asociada al proceso de elección • Existe una relación directa entre el parámetro de escala ()
Encuestas de Preferencias Declaradas • A medida que el proceso se vuelve más complejo, la varianza aumenta. Como se tiene que si , 0, finalmente se podría llegar a que: • Esto es, la componente determinística va perdiendo peso y la elección se puede volver aleatoria (y equiprobable)
Encuestas de Preferencias Declaradas • Postular una parametrización adecuada para el factor de escala en función de las dimensiones de diseño • DeShazo y Fermo (2002) sugieren una forma funcional exponencial; esta asegura la no-negatividad de y además tiene adecuadas propiedades de convergencia
Encuestas de Preferencias Declaradas • Así, no es más un término constante: • varía entre sub-diseños por ser función de las dimensiones de diseño (DD) • varía entre respuestas de un mismo individuo, pues incorpora el número de escenarios de elección • puede variar entre las n-ésimas respuestas de individuos pertenecientes a un mismo sub-diseño, si se incorporan variables socioeconómicas (SE)
Encuestas de Preferencias Declaradas • El modelo heterocedástico resulta ser no lineal en los parámetros • No existen paquetes estadísticos comerciales que permitan estimar el modelo • Se debió programar en GAUSS la función de log-verosimilitud asociada al modelo
Encuestas de Preferencias Declaradas • Modelo MNL v/s Modelo Heterocedástico (MH) MNL GAUSS MH Atributos Parámetro Valor t Parámetro Valor t Actual 0.0066 0.17 0.0104 0.15 TVSC -0.0122 -22.56 -0.0491 -3.79 TVCM -0.0154 -9.63 -0.0581 -3.32 TVCA -0.0425 -19.81 -0.1415 -3.47 TVCC -0.0340 -14.70 -0.0869 -3.96 TVTOT -0.0199 -24.20 -0.0329 -3.92 INCERT -0.0051 -10.32 -0.0167 -3.73 COP -1.00E-05 -2.96 -1.00E-04 -2.00 TARIFA -1.00E-04 -4.85 -6.00E-04 -2.91 CTOT -2.00E-04 -22.85 -5.00E-04 -3.90 Log Verosimilitud -8131.15 -7858.51 LR = 545.28 299%,8g.l.= 20.1 Basado en 8020 observaciones
Encuestas de Preferencias Declaradas • Parámetros Asociados al Factor de Escala • Sólo fue posible estimar efectos cuadráticos para el número de escenarios de elección, debido a problemas de convergencia Atributos de MNL GAUSS MH Complejidad Parámetro Valor t Parámetro Valor t escenarios ----- ----- 0.050 2.01 alternativas ----- ----- 0.224 7.00 atributos ----- ----- -0.456 -12.09 niveles ----- ----- -0.065 -1.67 rango menor ----- ----- 0.770 10.33 rango mayor ----- ----- -0.383 -5.31 ----- ----- -0.003 -1.58 escenarios 2 ingreso ----- ----- 0.021 2.08
Encuestas de Preferencias Declaradas • Un aumento en el número de alternativas disponibles aumenta la probabilidad de encontrar una opción que represente mejor las preferencias individuales • Un aumento en el número de atributos aumenta la complejidad del proceso • Lo mismo ocurre con un aumento en los niveles de variación de los atributos: • El rango de variación que minimiza la varianza (complejidad) es el rango restringido: + - 20%
Encuestas de Preferencias Declaradas • Existe un “efecto aprendizaje”, que luego de 10 escenarios de elección evaluados se ve contrapesado por la carga cognitiva asociada al experimento • Si el ingreso se considera como un buen proxy para la educación, las personas más educadas presentarían una mayor habilidad cognitiva • Aquellos sub-diseños que presentan los menores valores de son los que muestran una mayor proporción de atributos agregados e ignorados • Los individuos efectivamente simplifican el proceso de elección cuando éste resulta muy complejo
Encuestas de Preferencias Declaradas • VST es la tasa marginal de sustitución entre tiempo y costo de viaje para un nivel de utilidad U constante • Para funciones de utilidad lineales en los parámetros, el VST corresponde simplemente a la razón entre los parámetros del tiempo y costo de viaje
Encuestas de Preferencias Declaradas • Comparación de los VST de Ambos Modelos • El MNL sobrestima sistemáticamente los valores puntuales de los distintos tipos de VST en todos los casos (Saelensminde, 2001; Hensher, 2003) • Los porcentajes de sobrestimación van desde un 50% a un 135% • Los intervalos de confianza se estimaron utilizando la expresión propuesta por Armstrong et al. (2001) VST [$/min] MNL I de Confianza MH I de Confianza VSTSC 122,2 [86,6 - 203,8] 81,8 [56,4 - 158,9] VSTCM 154,0 [103,4 - 262,8] 96,8 [59,9 - 186,2] 425,0 [299,3 - 714,2] 235,8 [154,6 - 447,0] VSTCA VSTCC 340,0 [235,5 - 576,2] 144,8 [99,5 - 290,1] VSTTOT 99,5 [89,8 - 110,3] 65,8 [58,0 - 74,8]
Conclusiones • El enfoque heterocedástico permite incorporar con éxito la complejidad asociada al experimento de PD en la especificación de los modelos a estimar • El ajuste del mejor modelo heterocedástico es muy superior al MNL promedio correspondiente y levemente inferior a la especificación de 16 MNL’s diferentes, uno para cada sub-diseño, tarea que implica la estimación de más de 70 parámetros adicionales • Un enfoque simplista de estimación (MNL) puede derivar en una grave sobre-estimación de los beneficios asociados a la implementación de proyectos viales • El no considerar dicho fenómeno en la especificación de los modelos, puede producir importantes sesgos tanto en los resultados como en la valoración de la disposición al pago
Identificando la Complejidad • Mediante el Método de Escalamiento • Herramienta que se utiliza en la modelación mixta con datos de distinta naturaleza (e.g. PD y PR) • Consiste en agrupar la información según algún criterio para luego estimar un factor de escala para cada nido ficticio • Diferencias entre dichos factores de escala revelan diferencias para las varianzas asociadas
Identificando la Complejidad • Se anidan los sub-diseños según alguna dimensión de diseño y se examinan los factores de escala • Sólo se puede identificar el efecto de cada dimensión de diseño en forma independiente (no simultáneamente) 3 1=1 2
Identificando la Complejidad • Hallazgos • Un aumento en el número de atributos considerados aumenta la varianza en forma sistemática • El número de alternativas disponibles presenta un efecto compuesto, pareciendo ser cuatro el número de alternativas que minimiza la varianza • El número de niveles de variación también presenta un efecto compuesto, siendo tres el número de niveles que maximiza el valor del factor de escala
Identificando la Complejidad • El rango óptimo de variación parece estar restringido, a variaciones de + - 20% • El número de escenarios de elección a evaluar también presenta un efecto compuesto, siendo 12 el número de escenarios que minimiza la varianza asociada • Desventaja del Enfoque • Los efectos se identifican en forma independiente, mientras que el objetivo sería lograr una evaluación conjunta
El Problema de No-Identificabilidad • En el modelo heterocedástico • El factor de escala no es un término constante, ya que depende de la complejidad del experimento • Sin embargo, el problema de no-identificabilidad persiste, por lo que se debe asumir que el término constante de la parametrización vale cero • De esta forma, si todos los = 0, entonces = 1
Modelos con Variables SE • La inclusión de interacciones entre atributos del viaje y variables SE permite tratar hasta cierto punto el problema de variaciones en los gustos • Esta es una metodología no convencional para incluir variables SE (Rizzi y Ortúzar, 2003)
Modelos con Variables SE LR = 54.32 299%,5g.l.= 15.09
Modelos con Variables SE • El ajuste del modelo heterocedástico sigue siendo superior al MNL, pero la diferencia no es tan drástica • Ciertas interacciones tienen sustento teórico, mientras otras no • Los efectos de las dimensiones de diseño sobre el factor de escala son similares al caso anterior
Modelos con Variables SE • En cuanto a los VST, para el modelo MNL • Para el modelo Heterocedástico • Las diferencias en términos de VST tienden a desaparecer