1 / 53

CORRELACI N Y REGRESI N

CALIFICACIONES EN MATEM?TICA. CON QU? VARIABLES SE RELACIONA. CU?L ES LA QUE M?S SE RELACIONA. . . . . . . . . . . . . ?CU?NDO HAY RELACI?N?. CAMBIOS EN UNA VARIABLE PRODUCEN CAMBIOS EN LA OTRARELACI?N POSITIVA O DIRECTACuando una aumenta, la otra aumenta.RELACI?N NEGATIVA O INVERSACuando una au

fionn
Download Presentation

CORRELACI N Y REGRESI N

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. CORRELACIÓN Y REGRESIÓN MSc. Romeo A. Ruano

    2. Preguntar ¿con qué variables se relaciona calificaciones en matemática? Y cada vez que aparece una línea poner una de las variables mencionadas por los estudiantes. Luego preguntar cuál es la que más se relaciona y encontrará muchas opiniones. Para determinar cuál se relaciona más hay que hacer un análisis de correlación y regresión.Preguntar ¿con qué variables se relaciona calificaciones en matemática? Y cada vez que aparece una línea poner una de las variables mencionadas por los estudiantes. Luego preguntar cuál es la que más se relaciona y encontrará muchas opiniones. Para determinar cuál se relaciona más hay que hacer un análisis de correlación y regresión.

    3. ¿CUÁNDO HAY RELACIÓN? CAMBIOS EN UNA VARIABLE PRODUCEN CAMBIOS EN LA OTRA RELACIÓN POSITIVA O DIRECTA Cuando una aumenta, la otra aumenta. RELACIÓN NEGATIVA O INVERSA Cuando una aumenta, la otra disminuye. Costo – Beneficio Libros leídos – Velocidad de lectura Velocidad – Gasto de gasolina Ingesta de alimento – peso Cantidad de ejercicio – peso Asistencia a clases – calificación final

    4. TIPOS DE VARIABLES DEPENDIENTE – INDEPENDIENTE Costo – Beneficio Velocidad – Gasto de gasolina Ingesta de alimento – peso Libros leídos – Velocidad de lectura Cantidad de ejercicio – peso Asistencia a clases – calificación final Preguntar cuál es la variable dependiente y cuál la independiente de cada pareja de variables. En el caso de libros leídos y velocidad de lectura unos opinarán de una manera y otros de otra. El investigador decide qué variable quiere estimar a partir de cual. Esto es, el investigador cuál es la variable dependiente y cual la independiente.Preguntar cuál es la variable dependiente y cuál la independiente de cada pareja de variables. En el caso de libros leídos y velocidad de lectura unos opinarán de una manera y otros de otra. El investigador decide qué variable quiere estimar a partir de cual. Esto es, el investigador cuál es la variable dependiente y cual la independiente.

    5. DIAGRAMA DE DISPERSIÓN “Plotear” los puntos: Muestra visualmente cuánto se asocian las variables. Variable dependiente ? eje Y Variable independiente ? eje X

    9. Modelo de Regresión Lineal simple Modelo de Regresión Lineal Simple y = ?0 + ?1x + ? (? = error o residual) Ecuación de Regresión Lineal Simple E(y) = ?0 + ?1x

    11. Ejemplo: Venta de Autos Jack’s Autos Jack’s periódicamente tiene una semana especial de venta. Como parte de la campaña de ventas, Jacks corre uno o más anuncios comerciales por televisión durante el fin de semana para predecir sus venta. Los datos de una muestra de 5 ventas previas son mostradas a continuación Núm. de anuncios Núm. de autos 1 14 3 24 2 18 1 17 3 27

    12. ¿Cómo la hago con EXCEL?

    13. ECUACIÓN DE REGRESIÓN, DIAGRAMA DE DISPERSIÓN Y RESIDUALES

    14. ECUACIÓN DE REGRESIÓN, DIAGRAMA DE DISPERSIÓN Y RESIDUALES

    15. Método de Mínimos Cuadrados

    17. Pendiente para la ecuación de Regresión estimada b = 220 - (10)(100)/5 = 5 24 - (10)2/5 y-Intercepto para la ecuación de Regresión estimada a = 20 - 5(2) = 10 Ecuación de regresión Estimada y = 10 + 5x Ejemplo: Venta de Autos Jack’s

    18. CON RESPECTO AL PROBLEMA Ecuación de regresión Estimada y = 10 + 5x Ecuación de regresión Estimada Ventas autos = 10 + 5*Cantidad de anuncios

    19. INTERPRETACIÓN DE PARÁMETROS y = 10 + 5x COORDENADA EN EL ORIGEN Cuando no se pone ningún anuncio se venden 10 autos.

    20. INTERPRETACIÓN DE PARÁMETROS V. autos = 10 + 5*cant. anuncios PENDIENTE = ? y/? x ? = cambio Pendiente = ?ventas/ ?cant. Anuncios Pendiente = 5 CV /1 C C A Por cada anuncio extra que se ponga se venderán 5 automóviles más.

    21. PARA ESTIMAR UN VALOR Ventas autos = 10 + 5*Cantidad de anuncios Si se ponen 12 anuncios ¿cuántos autos se espera vender? V.A = 10 + 5 * 12 = 70 Se espera vender 70 automóviles

    22. ERROR ESTÁNDAR DE ESTIMACIÓN Mide la variabilidad o dispersión de los valores observados alrededor de la recta de regresión.

    23. Sustituyendo los valores Se = 2.16 Interpretación: las ventas observadas se separan de las predichas en un promedio de 2.16 autos vendidos

    24. INTERVALO DE CONFIANZA PARA LA PREDICCIÓN Forma del intervalo Límite superior = Y + t * Se Límite inferior = Y - t * Se Se = error estándar de estimación Y = valor estimado para un valor de variable independiente t = Valor de t para un a con n-2 grados de libertad

    25. INTERVALOS DE CONFIANZA Límite superior = Y + t * Se 95% Confianza Y =70 Se = 2.16 gl = 5 – 2 = 3 a = 0.05 t = 3.181 Límite superior = 70 + 3.181 * 2.16 = 76.87 Límite inferior = 70 - 3.181 * 2.16 = 63.13

    26. INTERVALOS DE CONFIANZA Y = 70 a = 0.05 gl = 5 – 2 = 3 t crítica = 3.182 Error estándar = 2.16 Límite superior = 70 + 3.182 * 2.16 =76.87 Límite inferior = 70 - 3.182 * 2.16 = 63.13

    27. INTERPRETACIÓN Límite superior = 76.87 ˜ 77 Límite inferior = 63.13 ˜ 63 SI SE PONEN 12 ANUNCIOS EN UNA SEMANA, SE ESPERA, CON UN 95% DE CONFIANZA, VENDER ENTRE 77 Y 63 AUTOS

    28. VALORES EXACTOS DE ERROR ESTÁNDAR DE ESTIMACIÓN Se puede calcular el error estándar exacto multiplicando un factor de corrección al error estándar de estimación. Para el caso de un valor de X individual el Factor de Corrección es: Da lugar a Intervalo de Predicción

    29. Intervalo de Confianza Para el caso de un valor obtenido de una muestra de X, el Factor de Corrección es: Da lugar a Intervalo de Confianza La diferencia es el 1: da valores más grandes el intervalo de predicción ¿por qué?

    30. ANÁLISIS DE CORRELACIÓN Herramienta estadística Describe el grado en el que una variable está relacionada con otra en forma lineal Se utiliza conjuntamente con la regresión Mide qué tan bien la línea de regresión explica los cambios de la variable dependiente. Sola mide el grado de asociación entre dos variables Son dos: Coeficiente de Correlación y de Determinación

    31. COEFICIENTE DE CORRELACIÓN Se usa para describir qué tan bien explica una variable a otra. Indican el % de relación entre las variables. r = 0.9 indica: el 90 % de los datos se relacionan entre sí. Siempre estarán entre 1 y -1 inclusive(-1 <= r <= 1). Mientras más se acerque a 1 ó -1 más relación hay. Mientras más se acerque a 0 menos relación hay.

    32. COEFICIENTE DE CORRELACIÓN . -1 0 1 Coeficiente de 0.90 tiene la misma fuerza que -0.90 sólo difiere en el sentido de la relación

    33. RELACIÓN ENTRE COEFICIENTE DE CORRELACIÓN Y DIAGRAMA DE DISPERSIÓN r indica en qué medida los puntos se agrupan alrededor de la línea recta. www.geocities.com/romeoruano_gt No tengo acceso a internet.

    34. COEFICIENTE DE CORRELACIÓN CÁLCULO . Para el problema de Autos Jack’s r = 0.9366 INTERPRETACIÓN: Las ventas de autos y la cantidad de anuncios se relacionan en un 93.66%

    35. COEFICIENTE DE DETERMINACIÓN Se representa por r2 Se calcula elevando al cuadrado r Siempre es positivo La cantidad de la variación en Y que se explica por la recta de regresión INTERPRETACIÓN (problema Autos Jack’s) r2 = .877 Significa que el 87.7% de las ventas de automóviles se explican a partir de la cantidad de anuncios. ¿Qué % no explica la cantidad de anuncios?

    37. PENDIENTE-RELACIÓN Pendiente = 0 ? NO HAY RELACIÓN ¿Qué tan inclinada debe estar la recta para que digamos que hay relación? Prueba de hipótesis: t y F

    38. PENDIENTE-RELACIÓN HIPÓTESIS: Ho: ß1 = 0 (por ser población ß) H1: ß1 ? 0 Siempre prueba de dos colas Si se rechaza Ho ? se acepta H1 y viceversa.

    39. CÁLCULOS

    40. CÁLCULOS

    41. CÁLCULOS

    42. CÁLCULOS

    43. DECISIÓN

    44. CONCLUSIÓN Por ser t calculada mayor que t crítica rechazamos Ho. Con un nivel de confianza del 95% podemos decir que: La evidencia estadística es suficiente para concluir que tenemos una relación importante entre el número de anuncios y las ventas de autos

    45. ¿CÓMO SE HACE EN EXCEL?

    46. Para calcular r2 con Excel

    47. ¿Qué falta? Prueba de hipótesis para b y para la estimación

More Related