140 likes | 922 Views
RECTA DE REGRESIÓN. Bloque IV * Tema 160. Regresión lineal. En el caso de variables bidimensionales, como la del ejemplo anterior, al representarlas gráficamente nos saldrá una nube de puntos.
E N D
RECTA DE REGRESIÓN Bloque IV * Tema 160 Matemáticas Acceso a CFGS
Regresión lineal • En el caso de variables bidimensionales, como la del ejemplo anterior, al representarlas gráficamente nos saldrá una nube de puntos. • Cuando esa nube de puntos es aproximadamente una recta, o sus puntos no están excesivamente dispersos, nos interesa conocer la ecuación de la misma. • Esa recta será la que más se ajuste a la nube de puntos. • Esa recta significativa es tal que la suma de distancias de todos los puntos de la nube a dicha recta es la menor posible. • Es la llamada Recta de Regresión, o Recta de Ajuste. • De ecuación y = a.x + b • Una vez que obtengamos la ecuación de dicha recta, tendremos la función lineal: y=f (x) , pudiendo interpolar valores, es decir hallar pares de valores ( xi,yi ) que no estaban en la nube de puntos. Matemáticas Acceso a CFGS
La suma de los cuadrados de las distancias de todos los puntos a la recta yi = a.xi + b es : • Σdi2 = Σ[yi – (a.xi + b)]2 • Para que una recta ajuste lo máximo posible a una nube de puntos, o sea pase por la mayoría de los puntos o por su cercanía, se debe cumplir que la suma anterior sea la menor posible. • Para que dicha suma sea la menor posible, derivamos la ecuación y la igualamos a cero, pues es un problema de máximos y mínimos. • Como tenemos dos variables, a y b, derivamos dos veces, una con respecto a a y la otra con respecto a b, obteniendo dos nuevas ecuaciones igualadas a cero: • Σyi – a. Σxi – n.b = 0 • Σxi.yi – a. Σxi2 – b. Σxi = 0 • Resolviendo el sistema, queda: • Vxy • a = ---------- b = y – a.x y = a.x + b • σ2x Matemáticas Acceso a CFGS
Recta de regresión En nuestro ejemplo (Y sobre X) m = 4,595 / (1,9)2 = 1,27 y – yo = m.(x – xo) y - 4,30 = 1,27.( x – 3,35) La ecuación será: y = 1,273.x + 0,036 Para llevarla sobre el gráfico de la Nube de Puntos tomamos dos valores: x = 1 y = 1,31 x = 5 y = 6,44 La recta de regresión o recta de ajuste deberá pasar por el centro de gravedad (3’35, 4’30) Nota = f (horas) Nota 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 Horas Matemáticas Acceso a CFGS
Recta de regresión En nuestro ejemplo (X sobre Y) m = 4,595 / (2,57)2 = 0,70 x – xo = m.(y – yo) x – 3,35 = 0,70.( y – 4,30) La ecuación será: x = 0,70.y + 0,34 Para llevarla sobre el gráfico de la Nube de Puntos tomamos dos valores: y = 1 x = 1,04 y = 6 x = 4,54 La recta de regresión o recta de ajuste deberá pasar por el centro de gravedad (3’35, 4’30) Horas = f (notas) Nota 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 Horas Matemáticas Acceso a CFGS
Rectas de regresión En nuestro ejemplo (Y sobre X) y = 1,273.x + 0,036 En nuestro ejemplo (X sobre Y) x = 0,70.y + 0,34 Si en lugar de una correlación estadística fuera una correlación funcional, ambas rectas serían la misma. Si el ángulo que forman ambas rectas es muy pequeño, la correlación es fuerte o muy fuerte. Por el contrario, cuando el ángulo es grande la correlación es débil o muy débil (hasta casi 90º). Horas = f (notas) Nota 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 Horas Matemáticas Acceso a CFGS
Otro ejemplo(Evolución IPC y Tasa de Inflación) Matemáticas Acceso a CFGS
Cálculo de parámetros Matemáticas Acceso a CFGS
Rectas de regresión Matemáticas Acceso a CFGS
Tabla de valores en ambas rectas. No puede faltar el centro de gravedad, común a ambas. Como se aprecia el ángulo que forman las dos rectas es muy grande Correlación débil. Matemáticas Acceso a CFGS
Interpolación • Una vez que obtengamos la ecuación de la Recta de Regresión de Y sobre X tendremos la función lineal: • y=f (x) , pudiendo interpolar valores, es decir hallar pares de valores ( xi,yi ) que no estaban en la nube de puntos. • Esto es lo que hemos hecho al hallar f(5) para trazar la recta de ajuste. Hemos visto que con 5 horas de estudio la calificación esperada es de 6,44. • Cierto que también hemos hallado f(1), cuyo valor ya sabíamos (valía 1) y nos ha dado 1,31, diferente. • Pero es que, a diferencia de la correlación funcional, ahora la Recta de Regresión no pasa por la mayoría de los puntos dados en la tabla inicialmente. Si pasa por alguno es simple casualidad. • La interpolación, en correlación estadística, sólo puede ser fiable si la correlación es fuerte o muy fuerte; y si de las dos variables, elegimos como xi la más correcta. Matemáticas Acceso a CFGS