100 likes | 235 Views
RECTA DE REGRESIÓN DÍA 55 * 1º BAD CT. Regresión lineal. En el caso de variables bidimensionales, como la del ejemplo anterior, al representarlas gráficamente nos saldrá una nube de puntos.
E N D
Regresión lineal • En el caso de variables bidimensionales, como la del ejemplo anterior, al representarlas gráficamente nos saldrá una nube de puntos. • Cuando esa nube de puntos es aproximadamente una recta, nos interesa conocer la ecuación de la misma. Esa recta será la que más se ajuste a la nube de puntos. • Esa recta significativa es tal que la suma de distancias de todos los puntos de la nube a dicha recta es la menor posible. • Es la llamada Recta de Regresión, de ecuación y = m.x + n • Vxy • donde m = ---------- y – yo = m.( x – xo) • σ2x • Siendo (xo, yo) el centro de gravedad de la nube de puntos. • Una vez que obtengamos la ecuación de dicha recta, tendremos la función lineal: y=f (x) , pudiendo interpolar valores, es decir hallar pares de valores ( xi,yi ) que no estaban en la nube de puntos.
Recta de regresión En nuestro ejemplo (Y sobre X) m = 4,595 / (1,9)2 = 1,27 y – yo = m.(x – xo) y - 4,30 = 1,27.( x – 3,35) La ecuación será: y = 1,273.x + 0,036 Para llevarla sobre el gráfico de la Nube de Puntos tomamos dos valores: x = 1 y = 1,31 x = 5 y = 6,44 La recta de regresión o recta de ajuste deberá pasar por el centro de gravedad (3’35, 4’30) Nota = f (horas) Nota 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 Horas
Recta de regresión En nuestro ejemplo (X sobre Y) m = 4,595 / (2,57)2 = 0,70 x – xo = m.(y – yo) x – 3,35 = 0,70.( y – 4,30) La ecuación será: x = 0,70.y + 0,34 Para llevarla sobre el gráfico de la Nube de Puntos tomamos dos valores: y = 1 x = 1,04 y = 6 x = 4,54 La recta de regresión o recta de ajuste deberá pasar por el centro de gravedad (3’35, 4’30) Horas = f (notas) Nota 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 Horas
Rectas de regresión En nuestro ejemplo (Y sobre X) y = 1,273.x + 0,036 En nuestro ejemplo (X sobre Y) x = 0,70.y + 0,34 Si en lugar de una correlación estadística fuera una correlación funcional, ambas rectas serían la misma. Si el ángulo que forman ambas rectas es muy pequeño, la correlación es fuerte o muy fuerte. Por el contrario, cuando el ángulo es grande la correlación es débil o muy débil. Horas = f (notas) Nota 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 Horas
Tabla de valores en ambas rectas. No puede faltar el centro de gravedad, común a ambas. Como se aprecia el ángulo que forman las dos rectas es muy grande Correlación débil.
Interpolación • Una vez que obtengamos la ecuación de la Recta de Regresión de Y sobre X tendremos la función lineal: • y=f (x) , pudiendo interpolar valores, es decir hallar pares de valores ( xi,yi ) que no estaban en la nube de puntos. • Esto es lo que hemos hecho al hallar f(5) para trazar la recta de ajuste. Hemos visto que con 5 horas de estudio la calificación esperada es de 6,44. • Cierto que también hemos hallado f(1), cuyo valor ya sabíamos (valía 1) y nos ha dado 1,31, diferente. • Pero es que, a diferencia de la correlación funcional, ahora la Recta de Regresión no pasa por la mayoría de los puntos dados en la tabla inicialmente. Si pasa por alguno es simple casualidad. • La interpolación, en correlación estadística, sólo puede ser fiable si la correlación es fuerte o muy fuerte; y si de las dos variables, elegimos como xi la más correcta.