1 / 25

Curso de Estadística Básica

Curso de Estadística Básica. SESION 7 REGRESIÓN LINEAL. MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez. Objetivo.

Download Presentation

Curso de Estadística Básica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Curso de Estadística Básica SESION 7 REGRESIÓN LINEAL MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez

  2. Objetivo • Representar datos de dos variables de forma tabular y gráfica. Comprender la distinción entre los propósitos básicos del análisis de correlación y regresión lineal. (Sesión 6 y 7)

  3. Agenda Sesión 7 • Datos de dos variables • Correlación lineal (Sesión 6) • Regresión lineal (Sesión 7) • Evaluación (Sesión 7)

  4. Problema

  5. Tabla de extensiones

  6. Cálculos

  7. Conclusiones • No están correlacionadas las variables “incremento en horas” e “incremento en ventas” ya que el coeficiente de correlación r = -0.22, lo que indica una correlación muy débil o nula.

  8. Regresión Lineal • El análisis de regresión lineal encuentra la ecuación de la recta que describe mejor la relación entre las dos variables. Una aplicación de esta ecuación es hacer predicciones.

  9. Ejemplos • El éxito que tendrá un estudiante en la universidad con base en los resultados que obtuvo en el bachillerato. • Averiguar la distancia necesaria para detener un automóvil conociendo su velocidad. • El peso que debe tener un niño con base en la estatura. • El número de sentadillas que realizará un estudiante con base en el número de lagartijas que realizó

  10. Modelos o ecuaciones de predicción • La relación entre estas dos variables es una expresión algebraica que describe la relación matemática entre x y y. A continuación se presentan algunos ejemplos de varias relaciones posibles: Lineal: Cuadrática: Exponencial: Logarítmica:

  11. Patrones de datos de dos variables

  12. Método de mínimos cuadrados • Si un modelo de línea recta parece idóneo, la recta del mejor ajuste se encuentra aplicando el método de mínimos cuadrados. Suponga que es la ecuación de una recta, donde representa el valor estimado de que corresponde a un valor particular de • El método de mínimos cuadrados requiere encontrar las constantes y tales que la sumatoria sea lo más pequeña posible.

  13. Método de mínimos cuadrados

  14. Recta del mejor ajuste • La ecuación de la recta del mejor ajuste es determinada por su pendiente y su ordenada al origen . Los valores de las constantes, pendiente y ordenada al origen, que satisfacen el criterio de mínimos cuadrados se encuentran aplicando las siguientes fórmulas:

  15. Recta del mejor ajuste • Para encontrar la pendiente se usará una equivalencia matemática que utilice la suma de los cuadrados determinados en los cálculos preliminares de correlación:

  16. Clase de educación física del Sr. Torres • Tomando en cuenta el ejemplo de la sesión 6 sobre los 10 estudiantes que realizaron pruebas de condición física, ahora el objetivo es predecir las “sentadillas” efectuadas por un estudiante con base en el número de “lagartijas” hechas. Se quiere encontrar la recta del mejor ajuste, • De esta manera se realizan los cálculos tomando los datos correspondientes de la tabla de extensiones generada:

  17. Tabla de extensiones

  18. Cálculos • Se toman los cálculos correspondientes a SC(x) y SC(xy) y se calcula la pendiente:

  19. Cálculos • Se calcula la ordenada al origen, con los datos de la tabla de extensiones:

  20. Ecuación del mejor ajuste • Notas • Recuerde mantener por lo menos tres cifras decimales extra al efectuar los cálculos para asegurar una respuesta exacta. • Al redondear los valores calculados de bo y b1, preserve por lo menos dos cifras significativas en la respuesta final

  21. Cálculo de los puntos de la recta • Se eligen dos valores convenientes de x, cada uno cerca de cada extremo del dominio (x=10 y x=60) y se encuentran sus valores y correspondientes.

  22. Trazado de la recta

  23. Ejercicio • A ocho estudiantes universitarias, elegidas de forma aleatoria, se les preguntó su estatura (cerrada a la pulgada más próxima) y su peso (cerrado a las cinco libras más próximas). Calcule el coeficiente de correlación lineal r, y la ecuación para predecir el peso de una universitaria con base en su estatura y trácela sobre un diagrama de dispersión.

  24. Respuestas

  25. Observaciones en la elaboración de predicciones • La ecuación debe usarse para hacer predicciones sólo acerca de la población de la cuál se extrajo la muestra. Por ejemplo, sería cuestionable usar la relación entre la estatura y el peso de las estudiantes universitarias para predecir el peso de atletas profesionales, dadas sus estaturas. • La ecuación debe usarse sólo dentro del dominio muestral de la variable de entrada. Por ejemplo, la predicción de que una universitaria de estatura cero pesa -186.5 libras no tiene sentido. Tal vez, y de manera ocasional, se quiera usar la recta del mejor ajuste para estimar valores que están fuera del intervalo del dominio de la muestra. Esto es posible, pero debe hacerse con precaución y sólo para valores cercanos al intervalo del dominio. • Si la muestra fue tomada en 1994, no espere que los resultados sean válidos para 1929 o 2010. Las mujeres actuales pueden ser diferentes a las de 1929 y a las de 2010.

More Related