660 likes | 1k Views
Módulo 5. Análisis de Regresión y Series de Tiempo. MÓDULO. ANÁLISIS DE REGRESIÓN Y SERIES DE TIEMPO. MODELO LINEAL GENERALIZADO. SERIES DE TIEMPO. INTRODUCCIÓN. EJEMPLO.
E N D
Módulo 5 Análisis de Regresión y Series de Tiempo
MÓDULO ANÁLISIS DE REGRESIÓN Y SERIES DE TIEMPO MODELO LINEAL GENERALIZADO SERIES DE TIEMPO
EJEMPLO En cierta compañía, la prima de un seguro temporal con un plazo de 5 años y una suma asegurada de $300,000 en mujeres con edades comprendidas entre 50 y 70 años cumplidos, es la siguiente:
EJEMPLO ¿Qué efecto tiene la edad en el monto de la prima que se debe pagar? * Prima anual total Fuente: AMIS
EJEMPLO Fuente : AMIS
EJEMPLO Prima = 496.35 + 277.08* Años transcurridos a partir de 50 Por cada año de edad que una mujer supere los 50, el costo de la prima aumentará en $277.
MODELO LINEAL GENERAL Variable dependiente Parte aleatoria Parte determinística • La parte funcional es conocida pero contiene parámetros desconocidos • Es una función lineal de parámetros desconocidos • Es una variable aleatoria no observable
MODELO ESTADÍSTICO LINEAL SIMPLE Y = β0 + β1X + ε Observación Parte fija Parte aleatoria (determinista) (error)
MODELO ESTADÍSTICO LINEAL SIMPLE y Yi = β0 – ß1 xi + ei Diferencia entre observado y estimado x
MODELO ESTADÍSTICO LINEAL SIMPLE ¿Cuántas líneas se pueden trazar? y x
MODELO ESTADÍSTICO LINEAL SIMPLE • Características del Modelo Lineal: • Sean Y una variable respuesta o dependiente, • x una variable explicativa o independiente, ambas variables observables. • β0 y β1 dos parámetros desconocidos donde β0 es el punto donde la recta intercepta al eje de las y β1es la pendiente de la recta. • ε el error es una variable aleatoria.
MÍNIMOS CUADRADOS Para determinar los valores estimados de β0 y β1 utilizamos el método de mínimos cuadrados o suma de los cuadrados de los errores. (n ∑xiyi - ∑xi ∑yi ) n ∑xi2 –(∑xi)2 Λ β1 = Λ Λ β0 = y - β1 x
Ejemplos Un hotel en la periferia obtiene su ingreso bruto de la renta de sus instalaciones y de su restaurante. Los propietarios tienen interés en la relación entre el número de habitaciones ocupadas por noche y el ingreso por día en el restaurante. En la siguiente tabla se presenta una muestra de 25 días (de lunes a jueves) del año pasado que indica el ingreso del restaurante y el número de habitaciones ocupadas.
Ejemplos ¿Considera que el ingreso del restaurante se incrementa conforme aumenta el número de habitaciones ocupadas? Justifique su respuesta.
Ejemplos Ingreso = 1,381.99 + 1.48 * Habitaciones
Práctica • En el archivo que se les proporcionó contiene registros de algunos indicadores a nivel nacional, realice lo siguiente. • Determine que efecto tiene en la confianza del consumidor el precio del dólar, la inflación y el desempleo urbano. • Determine que variables tienen impacto en la cartera vencida de la banca comercial. • Exponer tus resultados al grupo.
Indicadores R2 : Coeficiente de determinación Esta medida nos indica la proporción de variación que explica el modelo lineal
Propiedades de R2 • R2 toma valores entre 0 y 1 • Conforme R2 se vaya aproximando a 1, significa que el modelo lineal explica mejor la situación. • Conforme R2 se vaya aproximando a 0 significa que el modelo lineal no es adecuado para explicar la información.
Observación Un coeficiente de determinación diferente de cero no significa que haya relación lineal entre las variables. Por ejemplo, R2 = 0.5 sólo nos dice que el 50% de la varianza de las observaciones queda explicado por el modelo lineal.
Ejemplo Calcular el coeficiente de determinación R2 .
Indicadores Aplicando la fórmula: El modelo lineal explica el 56.2% de la información
Correlación. r Dos variables X e Y tienen una relación positiva si a medida que se incrementa los valores de una de las variables se incrementa los valores de la otra. De manera análoga, se dice que X e Y tienen una relación negativa si a medida que decrecen los valores de una de las variables se incrementa los valores de la otra.
Indicadores El coeficiente de correlación se caracteriza por tomar valores entre -1 y 1, de manera que: • r = 1 o r = -1 cuando haya una asociación lineal exacta entre las variables (en el primer caso positiva y en el segundo, negativa).
Ejemplo El resultado es r = 0.7495
Relación entre r y R2 R2 = r2 En nuestro ejemplo: r*r 0.561704893 R^2 0.561704893
Práctica Enriquezca el análisis de las series proporcionadas considerando el coeficiente de correlación y de determinación. En el caso del índice de confianza del consumidor, ¿Qué variables explicativas se encuentran menos correlacionadas? En el caso de la cartera vencida ¿ Qué variables explicativas tienen mayor correlación? Exponga sus resultados al grupo
Significancia Si en el modelo de regresión lineal la pendiente es cero, entonces la variable X no tiene ningún efecto sobre la variable Y. En este caso diremos que X no es una variable explicativa del modelo. En este apartado haremos un contraste de hipótesis sobre la pendiente de la recta de regresión para saber si podemos afirmar o no que éste es igual a cero.
Significancia Se establece las hipótesis nula y alternativa y se contrasta: • Hipótesis nula: H0: b1 = 0, es decir, la variable X no es explicativa. • Hipótesis alternativa: H1: b1 <> 0, es decir, la variable X es explicativa. No rechazar la hipótesis nula significa que no se puede considerar el parámetro b1 significativamente diferente de cero. Es decir, la variable X no tiene influencia sobre la variable Y y, por tanto, no existe una relación lineal entre las dos variables.
Significancia El estimador de la pendiente tiene las siguientes características Λ E(β1) = β1σ2β1= σ2 Varianza del estimador Λ SCx Valor esperado Λ Λ Z = β1 - β1 β1 - β1 Estadístico de prueba = σβ1 σ/√SCx Λ Λ Λ β1 - β1 β1 - β1 √SCx t = = Muestral σ/√SCx s
Significancia Resultado de la prueba Si el valor de la prueba cae en la zona de rechazo se rechaza Ho, es decir β1 es significativa por lo que x si es una variable explicativa. 2.5% Zona de rechazo
Ejercicios Analizar la información
Ejercicios A continuación se proporciona información de la tasa de mortalidad por 100,000 habitantes y la temperatura media anual de 13 ciudades. Analice la información
Cálculo en Excel Variables consideradas: y =ICC ; x = INPC
Usos del modelo • Una vez que se está conforme con el modelo, se puede emplear para predecir los valores de y. • El modelo permite realizar predicciones de tipo Puntual y por Intervalos.
Predicción Puntual Se refiere a realizar una estimación de un valor específico de y dado un dato de x • Ejemplo • El precio de venta de un vehículo con respecto a su kilometraje es descrito por el siguiente modelo: • Donde y es el precio de venta y x el kilometraje
Predicción Puntual • El precio de venta de un vehículo con 40,000 Kms. es: • Se estima que un vehículo con 40.000 kms se venderá en $14,575.
Estimación por Intervalos • Se puedenusar dos intervalosparaestimar en querangocaerá el valor real. • Intervalo de Predicción: calcula un rango de valoresdondeesposibleque se encuentre y para un valor dado de x yn Rango para y, Dominio dado un valor específico de x . . . y2 y1 x