1 / 53

MEDIDAS DE DISPERSIÓN:

MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan distintas medidas de dispersión o de variación, las más empleadas son la desviación media absoluta, la varianza y la desviación estándar.

keene
Download Presentation

MEDIDAS DE DISPERSIÓN:

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. MEDIDAS DE DISPERSIÓN:

  2. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan distintas medidas de dispersión o de variación, las más empleadas son la desviación media absoluta, la varianza y la desviación estándar. • Desviación media absoluta o promedio de desviaciones. ( D.M.A)

  3. Definición : Dado un conjunto de observaciones Tales como X1, X2………Xn, la desviación media se define como el promedio aritmético de las respectivas Desviaciones absolutas con respecto a la media. n D.M.A. = ∑ Xi - X i=1 n 1.- Hallar la desviación media de los siguientes datos: 9, 4,7,5,3.

  4. Varianza: la varianza se denota por la letra S2 ( s al cuadrado) y se define como el cuadrado medio de las desviaciones con respecto a su media aritmética. n 2 2 = ∑ ( Xi – X) s i=1 n 2.- encuentre la varianza del Problema anterior.

  5. Desviación estándar: Dado un conjunto de observaciones x1, x2…. Xn, la desviación estandar denotada por “s” se define como la raíz cuadrada de la varianza, esto es : s = s2 n 2 = ∑ ( Xi – X) i=1 n obtenga la d. estándar del ejercicio anterior.

  6. Medidas de variación para datos agrupados: 1.- Si en una tabla de frecuencias x1, x2,… xk corresponden a los puntos medios de las clases y f1, f2,… fk, son las frecuencias respectivas, entonces la D.M.A. se define como:

  7. k • D.M .A. = ∑ Xi – X F i i=1 n 2.- Varianza y desviación standar: Si en una tabla de frecuencias los puntos medios de las clases son x1,x2….., xk y las frecuencias

  8. F1, f2…..fk, entonces la varianza se define como: k k 2= n ∑ Xi2Fi – ( ∑ XiFi )2 i =1 i=1 n2 Y la desviación estándar : 2 =

  9. La tabla muestra la distribución de la carga máxima en toneladas, que soportan ciertos cables producidos por una compañía . Determinar la D.M.A. , la varianza y desviación estándar de datos agrupados.

  10. DISTRIBUCIÓN NORMAL Características: 1.- distribución simétrica de las observaciones alrededor de un valor central (µ). 2.- Forma simétrica de campana cóncava, descendente para “x” hasta un menor de la µ y convexa ascendente para “x”mayor que la desviación estándar de la µ.

  11. 3.- El valor de la media, la moda, y la mediana coinciden 4.- La distribución esta caracterizada por dos constantes la µ media y la desviación estándar, una curva normal se representa por la expresión N ( µ, Desv.standar). 5.- El área bajo la curva y sobre el eje “x” es igual a la unidad. 6.- Si a ambos lados de µ se levantan perpendiculares a una distancia de , 2 desv. Stad., 3 desv. Stand.

  12. Las áreas bajo la curva y las perpendiculares representan Los porcentajes del área total de la curva conforme a las Expresiones siguientes: Área entre µ ± desv. Stad. = 0.6826 = 68.26% P(µ - Desv. Stad.≤ x ≤ µ+ Desv. Stad.) = 0.6826 Area entre µ ± 2 desv. Stad. = 95.45 95.45% P ( µ - 2 Desv. Stand. ≤ x ≤ µ + 2 desv.stand.) 0.9545 Área entre µ ± 3 desv.stad. = 0.9973

  13. -3 -2 -1 µ 1 2 3 68.26 %

  14. La distribución normal estandar es aquella cuya media µ = 0 y desviación estandar = 1,cualquier Variable distribuida normalmente puede transformarse En una normal estandar mediante la siguiente Expresión. Z = x - µ desviación standar

  15. Dada una distribución normal con µ = 50 y una Desviación estandar = 10, encuentre la probabilidad de que X tome un valor entre 45 y 62. Solución : P( 45≤ X≤ 62) = ?

  16. Hallar el área bajo la curva normal en cada uno de los • Siguientes casos y representarlos gráficamente : • Entre desv.stand. = 0 y desv. Stand. = 1.2 • P(0 ≤ desv.stan. ≤ 1.2) • b) Entre desv. Stan. = - 0.68 y desv.stan. = 0 • P ( - 0.68 ≤ desv.stan. ≤ 0 ) • Entre desv. Stan. = - 0.46 y desv. Stan.= 2.21 • Área pedida = ( área entre d.s. = - 0.46 y d.s.= 0) + • ( área entre d.s. = 0 y d.s. = 2.21)

  17. d) Entre d.s.= 0.81 y d.s.= 1.94 Área pedida = ( área entre d.s. = 0 y d.s. = 1.94) – ( área entre d.s. = 0 y d.s = 0.81) e) A la izquiera de d.s. = - 0.6 Área pedida = ( área a la izquierda de d.s.= 0) – ( área entre d.s.= - 0.6 y d.s. = 0

  18. F) A la derecha de d.s.= - 1.28 Área pedida = ( área entre d.s.= - 1.28 y d.s.= 0) + (área a la derecha de d.s.= 0)

  19. 2.-En un examen final de matemáticas la media es de 72 y la desviación estandar 15 , determinar las referencias tipificadas de los estudiantes que obtuvieron Puntuaciones de: a) 60 , b) 93, c) 72. 3.- Con referencia al problema anterior , hallar las puntuaciones correspondientes a las referencias tipificadas de a) -1 , b) 1.6

  20. 4.- Dos estudiantes fueron informados de que habían recibido referencias tipificadas de 0.8 y -0.4,respectivamente en un examen de ingles, si sus Puntuaciones fueron 88 y 64 respectivamente, hallar la Media y la desviación estandar de las puntuaciones del Examen.

  21. 5.- La media de los pesos de 500 estudiantes de un colegio es de 151 libras y la des. Stand. Es de 15 lb. suponiendo que los pesos se distribuyen normal- mente. Hallar cuántos estudiantes pesan, a) entre 119.5 y155.5 lb. P( 119.5 ≤ X ≤ 155.5 ) = P ( 119.5 – 151 ≤ X -151 ≤ 155.5 – 151 ) = 15 15 15

  22. = P ( -2.10 ≤ D.S ≤ 0.3) = Proporción de estudiantes pedida = ( área entre d.S = -2.1 y d.s = 0) + (área entre d.s.= 0 y d.s. =0.3) = 0.4821 + 0.1179 = 0.6 Entonces el número de estudiantes es de (500) (0.6) = 300

  23. b) Más de 185.5 lb P ( x ≥ 185.5 ) = P( x - 151 ≥ 185.5 – 151) = P ( d.s. ≥ 2.30) 15 15 Proporción estudiada pedida = ( área de la derecha De d.s. = 2.3 = (área de la derecha de d.s. = 0) – (área entre d.s.=0 y

  24. d.s. = 2.3) = 0.5 – 0.4893 = 0.0107 El número de estudiantes que pesan mas de 185.5 lb. es = (500) ( 0.0107) = 5.35 c) Menos de 127.5 lb d) 128.5 lb. O menos

  25. 6.- la población de millas recorridas por camioneros • presenta una media de 8500, con una d.s. de 1950. • si se toma una muestra de 100 conductores, cuál es la • probabilidad de la media sea : • Mayor que 8900 • Menor que 8000 • Entre 8200 y 8700 • Entre 8100y 8400 pp-157

  26. Datos bivariados: La regresión y la correlación son las dos herramientas Estadísticas mas poderosas y versátiles que se pueden Utilizar para solucionar problemas. Por ejemplo: si x es estatura y Y su peso para cada Persona pueden registrarse su estatura y su peso Correspondiente. Se denomina variable independiente o variable de entrada A x y variable dependiente o variable de salida a Y.

  27. La variable independiente x se mide o controla para Predecir la variable dependiente. Cuando ambos analisis, de correlación y regresión Sean aplicables al mismo problema se escribiran los Datos graficamente en un diagrama de dispersión. Este diagrama es una grafica en un sistema de ejes De toos los pares ordenados que forman datos Bivariados. La variable independiente x se grafica Sobre el eje horizontal, y la dependiente y aparece En el eje vertical.

  28. Las siguientes medidas fueron registradas durante un curso De educación física e indican el número de sentadillas y Lagartijas realizadas por 10 estudiantes seleccionados Aleatoriamente. (27,30), (22,26), (15,25), (35,42), (30,38), (52,40), (35,32), (55,54), (40,50), (40,43). X = sentadillas, y = lagartijas

  29. Diagramas de dispersión

  30. CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE: La correlación simple estudia la variación Simultanea de dos variables. La correlación entre dos variables es positiva, cuando el aumento de una de ellas va acompañado de un aumento en la otra. Si el aumento de una variable coincide con una disminución en la otra, Se dice que están correlacionadas negativamente.

  31. Si no hay relación entre las dos variables, Se dice que son independientes y que no Están correlacionadas. Ejemplos : temperatura y longitud de una Barra de hierro, estatura y peso de una Persona, edad y presión sanguínea, precoci- Dad y rendimiento.etc….

  32. METODO DE MINIMOS CUADRADOS( utilizando Coeficiente De correlación), la recta de mejor ajuste. El propósito del análisis de la regresión es determinar Una recta de que se ajuste a los datos muéstrales. Utilizando este método se producirá una recta que Pasa por el centro del diagrama de dispersión Aproximándose a los puntos.

  33. Coeficiente de correlación:es un valor que indica el grado de asociación entre dos variables • Valores posibles: • Si el c.c. = 0 las variables son independientes • no hay correlación. • b) Si el C.C. = +1 Hay correlación positiva y perfecta • c) Si el C.C. = -1 Hay correlación negativa y perfecta • d) 0< C.de C. < 1 Y -1< C.de C.< 0

  34. Sugiere cierto grado de asociación. Si la muestra fue Tomada al azar de una población.

  35. Formulas: r = ∑ ( X – X) ( Y – Y) = ∑ X Y  (X²) (Y²)  (X²) (Y²) r = coeficiente de correlación ( X – X) = x, desviación de la variable x ( Y – Y) = y, desviación de la variable y X Y = producto de dos desviaciones n = n° de observaciones

  36. x² = x² - (x)² n y² = y² - (y)² n xy = xy - (x) (y) n

  37. Ejemplo: En un muestreo de personas de diferentes edades Se tomaron datos de la edad “x “ en años y el Promedio de la presión sanguínea “y” en mm de Mercurio , los valores se ilustran en la siguiente tabla.

  38. XY = ( 65119) - (476) (1338) • 10 • = 65119 – 63688.8 • = 1430.2 • X²= 25792 – ( 476)² • 10 • = 3134.4

  39. Y² = 179700 - (1338)2 10 = 179700 – 179024.4 = 675.6 r = 1430.2 = 0.9828 ( 3134.4) (675.6) indica que existe Una relación positiva entre la edad y presión

  40. Ecuación de predicción: ^ Y = y + b ( x – x) Y = valor teórico ordenado de la línea de regresión. y = promedio de la variable dependiente b = pendiente de la línea de regresión de la muestra o coeficiente de regresión.

  41. X = promedio de la variable independiente X = cualquier valor de la variable independiente. El coeficiente de regresión (b) indica el incremento promedio de Y al aumentar X en una unidad.

  42. b = xy x² Y = y n x = x n

  43. x² = x² - (x)² n xy = xy - (x) (y) n

  44. b = 1430.2 = 0.45629 3134.4 Y = 133.8 = 133.8 10 X = 476 = 47.6 10

  45. ^ Y = 133.8 + 0.4563 ( X – 47.6) = 133.8 – 21.72 + 0.4563 X = 112.08 + 0.4563 X ¿ si dos personas tienen 45 y 56 años cual será su presión aproximadamente?

  46. Ejercicio : 2 Se recolectaron los datos mensuales por Gastos de publicidad y número de pasajeros Por 15 meses mas recientes los datos apare- en en la table. Desarrolle los cálculos nece- Sarios para obtener el modelo de regresión

More Related