290 likes | 996 Views
REGRESION LINEAL II. Mario Briones L. MV, MSc. 2005. Correlación entre las líneas eléctricas y el cáncer . Epidemiólogos del Instituto Karolinska de Suecia investigaron durante 25 años a 500.000 personas que vivían a menos de 300 metros de una línea eléctrica de alto voltaje.
E N D
REGRESION LINEAL II Mario Briones L. MV, MSc. 2005
Correlación entre las líneas eléctricas y el cáncer • Epidemiólogos del Instituto Karolinska de Suecia investigaron durante 25 años a 500.000 personas que vivían a menos de 300 metros de una línea eléctrica de alto voltaje. • Observaron que los niños tenían mayor incidencia de leucemia.
Correlación entre las líneas eléctricas y el cáncer • Los hallazgos descritos obligaron al gobierno sueco a considerar reglamentos que reducirían la construcción de casas cercanas a las líneas eléctricas de alto voltaje.
Correlación entre las líneas eléctricas y el cáncer • En un artículo acerca del estudio, la revista Time informó que “aunque las investigaciones no demuestran una relación de causa y efecto, sí indican una inequívoca correlación entre el grado de exposición y el riesgo de leucemia infantil”.
Errores comunes respecto a la correlación • Se debe tener cuidado de evitar concluir que la correlación implica causalidad • Variables ocultas • No utilizar tasas o promedios • Pérdida de variación entre individuos • Supuesto de linearidad de la relación
Pautas para utilizar la ecuación de regresión • Si no existe una correlación lineal significativa, no utilice la ecuación de regresión para hacer predicciones • En la formulación de predicciones (valores predichos de Y), no efectuar estas predicciones fuera del ámbito de valores observados de X
Relación entre la edad en días y el peso en gramos, en perdices (Notoprocta perdicaria)
Relación entre la edad en días y el peso en gramos, en perdices (Notoprocta perdicaria)
Pautas para utilizar la ecuación de regresión • Una ecuación de regresión basada en datos viejos no necesariamente sigue siendo válida en el presente • No se deben efectuar predicciones para una población diferente de aquella desde la cual se extrajo la muestra de datos.
Desviación no explicada Y-Y ^ Desviación total Y- Y Desviación explicada Y-Y ^ Promedio de Y ^ Y= b0+b1X
Error estándar de la regresión • El error estándar de una regresión lineal es una medida de la desviación de los puntos de datos a partir de la línea de regresión
Error estándar de la regresión • Fórmula equivalente:
Error estándar de la regresión Ejemplo de cálculo
Error de los estimadores b0 y b1 • También es posible determinar un error estándar para la pendiente y para la constante, de modo que es posible construir intervalos de confianza para estos estimadores.
Error de los estimadores b0 y b1 • Al calcular el intervalo de confianza de una probabilidad dada (ej.95%) para la pendiente de la recta, es posible comprobar directamente la hipótesis nula respecto de este estimador: • H0: la pendiente es igual a cero • HA: la pendiente es distinta de cero
Error de los estimadores b0 y b1 • Si con un nivel de probabilidad predeterminado se puede decir que la pendiente de una ecuación de regresión lineal es diferente de cero, entonces la regresión puede considerarse significativa (significativamente diferente de cero)
Error de los estimadores b0 y b1 • Al ser diferente de cero, la pendiente indica una relación “real” entre la variable X y la variable Y. • Puede interpretarse como “un efecto significativo” de la varianza de X sobre la varianza de Y
Coeficiente de determinación • Al elevar al cuadrado el coeficiente de correlación lineal de Pearson se obtiene el COEFICIENTE DE DETERMINACIÓN, que indica, en proporción, la magnitud de la varianza total de Y que es explicada por la varianza de X