1 / 70

XS-104 Estadística I

XS-104 Estadística I. Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 4 ta Tutoría. Capítulo 9 Medidas de variabilidad o dispersión. 1. La variabilidad y su importancia. Es casi tan importante conocer un promedio, como la variabilidad de los datos a su alrededor.

Download Presentation

XS-104 Estadística I

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. XS-104 Estadística I Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 4 ta Tutoría

  2. Capítulo 9Medidas de variabilidad o dispersión

  3. 1. La variabilidad y su importancia • Es casi tan importante conocer un promedio, como la variabilidad de los datos a su alrededor. • La validez de un promedio para resumir, depende en grado sumo, de si los datos individuales se dispersan o concentran alrededor de él. • Cuanto más se concentren los datos alrededor de la media aritmética, mucha más confianza se tendrá en este valor para caracterizarlos. • La variabilidad juega un papel clave dentro de la estadística. • Si los fenómenos no se repitieran o lo hicieran sin variaciones, la estadística casi no tendría razón de ser.

  4. 1. La variabilidad y su importancia Los tres conjuntos de datos tienen la misma media aritmética y, sin embargo, su dispersión es muy diferente.

  5. 2. La medición de la variabilidad.El recorrido y la desviación media • El recorrido • Diferencia entre el valor mayor y el valor menor. • Ej: Recorrido = 10 – 2 = 8 • No es muy usado, debido a ciertas limitaciones: • No considera todas las observaciones del grupo. • Depende sensiblemente del número de datos, ya que es posible que entre las nuevas observaciones haya alguna más pequeña o más grande a las existentes. • Se utiliza cuando: • Se desea una medida simple de variabilidad. • Por falta de tiempo no se puede emplear otra medida. • El número de casos es pequeño. • Se utiliza en aplicaciones de control estadístico de procesos.

  6. 2. La medición de la variabilidad.El recorrido y la desviación media • La desviación media • Hay que recordar que la suma de las desviaciones respecto a la media aritmética siempre es igual a cero. • Por ello se emplean valores absolutos en las diferencias.

  7. 2. La medición de la variabilidad.El recorrido y la desviación media • La desviación media Ejemplo:

  8. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • La desviación media casi no se utiliza porque: • Requiere el manejo de valores absolutos. • Existe otra medida, basada también en las desviaciones respecto a la media aritmética que: • Es mucho más cómoda y útil. • Tiene numerosas utilidades prácticas y teóricas. • La desviación estándar o típica emplea los cuadrados de las desviaciones.

  9. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • La desviación estándar indica cuánto se alejan, en promedio, las observaciones de la media aritmética. • Es la medida de dispersión más usada en estadística. • El cuadrado de ella, la variancia, también es muy importante. • Es más cómodo trabajar sin el radical, por lo que se calcula primero la variancia y luego se extrae la raíz cuadrada.

  10. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • Uso de la desviación estándar y la variancia en muestras y poblaciones: • Tienen símbolos diferentes: • En población: se usan letras latinas mayúsculas o griegas. • En muestras: se usan letras latinas minúsculas (estimadores).

  11. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • Fórmulas de la variancia en muestras:

  12. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • El cálculo de la variancia en datos sin agrupar con ambas fórmulas:

  13. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • El cálculo de la variancia en datos agrupados en una distribución de frecuencias • Donde:

  14. 3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • Ejemplo:

  15. 4. Variabilidad relativaEl coeficiente de variación • Necesidad de comparar dos o más conjuntos de datos en cuanto a su variabilidad. • Cuando las unidades de medida son diferentes (kilogramos, centímetros, minutos). • Cuando aún siendo la misma unidad de medida, sus promedios están muy alejados (peso de conejos y caballos). • Para ello se utilizan medidas de dispersión relativa. • La más importante es el Coeficiente de Variación.

  16. 4. Variabilidad relativaEl coeficiente de variación • Para la población • Para una muestra • Ejemplo: • Interpretación: • La desviación estándar representa un 14,62% de la media aritmética.

  17. 5. Estandarización de notas • Permite dar posiciones relativas dentro de un grupo. Por ejemplo: Cecilia obtuvo una nota de 85 y Efraín un 70.

  18. 6. Media y variancia de variables dicotómicas • Variable dicotómicas: sólo tienen 2 posibles resultados (sexo, ocupado-desocupado, tenencia de celular). • Valores a utilizar: • 0 = Ausencia (no tiene la característica). • 1 = Presencia (sí tiene la característica). • La sumatoria de los “1” ( N1 ) da el número de personas con la característica de interés. • N – N1 representa a quienes no la tienen. • N1 / N = P es la proporción de personas con la característica de interés. • 1 – P = Q es la proporción de personas que no tienen esa característica.

  19. 6. Media y variancia de variables dicotómicas • Para la población: • Para una muestra:

  20. 6. Media y variancia de variables dicotómicas • Ejemplo: tenencia de computadora en 8 familias. • ¿Cuál es la media y la variancia?

  21. 7. Ilustración integrada de distribuciones de frecuencias y medidas de tendencia central y variabilidad • Interpretar Me = 7,4 • La mitad de las familias de la zona central consumen menos de 7,4 Kg de mariscos al año, y la otra mitad más de esa cantidad. • ¿Dónde consumen más mariscos? • Es parecido en ambas zonas: aunque la moda es un poco mayor en la Central, las medianas son similares. • Consumo promedio para todo el país: • Consumo total de mariscos del país: N = 600 000 + 900 000

  22. 8. Medidas de posición o cuantilos • Cuantilos: describen la posición de un valor específico de la distribución, cuando todos los valores han sido ordenados. • Cuantilos más usados: • Percentiles ( P ): dividen al conjunto en 100 partes. • Deciles ( D ): dividen al conjunto en 10 partes. • Cuartiles ( Q ): dividen al conjunto en 4 partes.

  23. 8. Medidas de posición o cuantilos • Ejemplos: • Mediana = P50 = D5 = Q2 La mitad de los valores son inferiores a este valor y la otra mitad son superiores. • Cuartil 1 = P25 = Q1 Una cuarta parte de las observaciones son menores que él y ¾ partes mayores. • Cuartil 3 = P75 = Q3 ¾ partes de las observaciones son menores que él y ¼ parte es mayor. • Con la fórmula de los percentiles, se puede calcular cualquier cuantilo.

  24. 8. Medidas de posición o cuantilos • Procedimiento para calcular percentiles: • 1. Ordenar los datos de menor a mayor. • 2. Determinar la posición: • 3. Buscar el valor, de acuerdo con la posición encontrada.

  25. 8. Medidas de posición o cuantilos • Ejemplo: calcular el percentil 86 con los datos de los pesos de los 60 estudiantes. • 1. Ordenar los datos de menor a mayor.

  26. 8. Medidas de posición o cuantilos • 2. Determinar la posición del P86 n = 60 y m = 86 • 3. Buscar el valor, de acuerdo con la posición encontrada. • El término 52,46 no existe, por lo que habrá que hacer una interpolación lineal, entre los valores adyacentes.

  27. 8. Medidas de posición o cuantilos • El valor P86 = 75,92 significa que un 86% de los estudiantes tiene un peso inferior a 75,92 Kg y un 14% más de ese peso.

  28. 8. Medidas de posición o cuantilos • Recorrido intercuartil ( RIC ). • Es la diferencia entre el cuartil 3 y el 1: Q3 – Q1 • Ventajas de esta medida: • Da una idea de la dispersión del 50% central de los datos. • Excluye el efecto de los valores extremos. • Resulta muy útil cuando se tienen clases abiertas y no es posible calcular la variancia.

  29. 9. Diagrama de caja • Es un procedimiento gráfico basado en los cuartilos. • Permite visualizar en una forma organizada, un grupo de datos. • Está compuesto por la caja, dos brazos y los bigotes. • Se necesitan 5 medidas para construirla: valor mínimo, valor máximo y los cuartiles Q1 , Q2 y Q3.

  30. 9. Diagrama de caja • Diagrama de caja de la variable peso en los 60 estudiantes: • Mínimo = 45 • Q1 = 57,75 • Q2 = 63 • Q3 = 70,75 • Máximo = 88 • El 50% central de los pesos está entre los 57,75 y 70,75 kilos. • El recorrido intercuartil, distancia entre el Q1 y Q3, es igual a 70,75 – 57,75 = 13 La distribución es asimétrica, hacia la derecha, o sea tiene asimetría positiva (el bigote superior es más grande que el bigote inferior). La mediana (Q2) está más cerca de Q1.

  31. Capítulo 10Introducción a las probabilidades

  32. 1. Inferencia estadística y probabilidad • Cuando se trabaja con muestras, la información es parcial, y las decisiones se toman en condiciones de incertidumbre. • Es decir, existe el riesgo de equivocarse al hacer una inferencia (generalización de la parte al todo). • Surge la necesidad de disponer de algún procedimiento objetivo que permita tratar con la incertidumbre y los riesgos. • Esta función la cumple la teoría de las probabilidades, la cual se convierte en la base de la estadística inferencial. • Esta teoría suministra los elementos para medir, analizar y minimizar los riesgos de error presentes en el proceso de inferencia.

  33. 2. Concepto de probabilidad • Las probabilidades se refieren a acontecimientos cuya ocurrencia es incierta. • Esto es, se sabe que pueden presentarse pero no es posible conocer con certeza cuándo. • La probabilidad es, en realidad, un valor numérico que: • Debe cumplir con ciertas condiciones o propiedades matemáticas. • Se asocia a un evento o suceso determinado para expresar el grado de confianza que se tiene en su verificación futura. • Históricamente se han presentado 3 enfoques o definiciones: • La clásica. • La frecuencial. • La personalista.

  34. 3. Eventos y espacio muestral • La estadística trabaja con datos que provienen de observaciones, experimentos o procesos repetitivos, reales o imaginarios: • Anotación de pesos de niños recién nacidos. • Registro de las calificaciones de un curso. • Análisis de datos sobre consumo general de leche. • Imaginar lo que sucede si se lanza un dado “normal” 20 veces. • Eventos o sucesos: son los resultados de este tipo de experiencias reiteradas. Se representan con las letras x o E.

  35. 3. Eventos y espacio muestral • Eventos simples: se representa cada uno de los valores posibles. • Ejemplo: se tiene el peso (Kg) de 12 estudiantes: • Cada peso obtenido representa una observación o un evento simple. • Se pueden representar gráficamente como puntos sobre una línea horizontal: • Eventos compuestos: agrupación de eventos simples. • Ejemplo: número de estudiantes que pesan más de 60 Kg ( x > 60 ). Estos serían:

  36. 3. Eventos y espacio muestral • Evento simple: lanzamiento de un dado normal: • Valores posibles: • Representación gráfica: • Cada punto representa un evento simple, y el total, que son todos los posibles eventos, representan el espacio muestral de la experiencia. • Espacio muestral: conjunto de todos los posibles eventos simples. • Evento compuesto: que el resultado del lanzamiento sea número par.

  37. 3. Eventos y espacio muestral • Ejemplo: se lanzan dos dados normales, uno azul y otro rojo, pero iguales en sus otras características: • El espacio muestral está formado por 36 eventos simples. • Representación gráfica:

  38. 3. Eventos y espacio muestral • Ejemplo: se lanzan dos dados normales. • Si los eventos simples se combinan de determinadas formas, se obtienen eventos compuestos. • Evento compuesto en relación con la suma de sus caras. • x + y = 8 • Este evento compuesto lo conforman 5 eventos simples: • ( x = 2, y = 6 ) • ( x = 3, y = 5 ) • ( x = 4, y = 4 ) • ( x = 5, y = 3 ) • ( x = 6, y = 2 )

  39. 3. Eventos y espacio muestral • Evento compuesto en relación con la suma de sus caras. • x + y = número par • Este evento compuesto lo conforman 18 eventos simples.

  40. 3. Eventos y espacio muestral • Evento compuesto en relación con la suma de sus caras. • x + y < 5 • Este evento compuesto lo conforman 6 eventos simples.

  41. 3. Eventos y espacio muestral • Evento compuesto en relación con la suma de sus caras. • x + y = número par menor que 5 • Este evento compuesto lo conforman 4 eventos simples. • En teoría de conjuntos, éstos constituyen la intersección de los conjuntos definidos en los dos casos anteriores.

  42. 3. Eventos y espacio muestral • Espacio muestral bidimensional para variables continuas. • Ejemplo: un grupo de estudiantes universitarios, con: • Espacio muestral: • Rectángulo ABCD • Evento simple: • Un estudiante que pese 65 Kg y mida 170 cm (punto H) • Evento compuesto: • Estudiante que pese más de 70 Kg y mida más de 175 cm (rectángulo verde).

  43. 3. Eventos y espacio muestral • Espacios muestrales en lanzamiento de monedas:

  44. 3. Eventos y espacio muestral • Espacios muestrales en lanzamiento de dados:

  45. 3. Eventos y espacio muestral • Espacio muestral en juego de naipes (baraja inglesa): • Son 52 cartas. • Hay 4 palos con 13 cartas cada uno: • Diamantes (oros) • Corazones • Tréboles • Espadas (picas o bastos) • Hay 4 cartas de cada rango (4deK, 4deQ, 4deJ, 4de10, 4de9, 4de8, 4de7, 4de6, 4de5, 4de4, 4de3, 4de2, 4 Ases). • Hay 2 colores (26 cartas rojas y 26 cartas negras).

  46. 4. La definición de probabilidad.Enfoque clásico • ¿Cómo asignar probabilidades a los eventos de una experiencia aleatoria? • Se debe pensar en términos de un experimento ideal, que pueda repetirse un gran número de veces, en condiciones similares. • Luego se debe anticipar todos los posibles resultados (espacio muestral). • En procesos como lanzar monedas, lanzar dados, extraer cartas de un juego de naipes, girar la ruleta, se intuye que todos los resultados (eventos simples) tienen la misma oportunidad de suceder, o sea, son “igualmente posibles”.

  47. 4. La definición de probabilidad.Enfoque clásico • Definición clásica de probabilidad • Usada por Pascal, Fermat y Laplace. • Proviene de la experiencia con juegos de azar. • Supone que: • El espacio muestral es finito. • La variable es discreta. • Los resultados son: • Mutuamente excluyentes (no pueden suceder en forma simultánea), e • Igualmente posibles (misma oportunidad de suceder). • Si un suceso puede ocurrir de n maneras mutualmente excluyentes e igualmente posibles, y si n(A) de ellas posee un atributo A, la probabilidad de A es la fracción:

  48. 5. Propiedades básicas de las probabilidades • Sea Ei el evento simple o el punto muestral i. • La probabilidad es positiva o nula. • La suma de las probabilidades de los eventos simples es igual a la unidad. • Si un evento compuesto A abarca los eventos simples E1, E2, … , Ek, su probabilidad es igual a la suma de las probabilidades de los eventos simples. • El número de casos favorables no puede ser mayor a los posibles, por lo que: • Cuando el evento A es imposible, la probabilidad es cero. • Cuando el evento A es seguro o cierto, la probabilidad es uno.

  49. 6. La ley de la suma • Si se tienen dos eventos A y B, la probabilidad de que suceda por lo menos uno de ellos es: • Donde:

  50. 6. La ley de la suma • El evento contrario • El evento contrario o complemento lo conforman todos los eventos simples que no tienen el atributo que se busca ( A ). • Como la suma de las probabilidades de todos los eventos simples es la unidad, entonces:

More Related