830 likes | 1.59k Views
XS-104 Estadística I. Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 4 ta Tutoría. Capítulo 9 Medidas de variabilidad o dispersión. 1. La variabilidad y su importancia. Es casi tan importante conocer un promedio, como la variabilidad de los datos a su alrededor.
E N D
XS-104 Estadística I Yadira María Alvarado Salas I Cuatrimestre 2014 – UNED 4 ta Tutoría
1. La variabilidad y su importancia • Es casi tan importante conocer un promedio, como la variabilidad de los datos a su alrededor. • La validez de un promedio para resumir, depende en grado sumo, de si los datos individuales se dispersan o concentran alrededor de él. • Cuanto más se concentren los datos alrededor de la media aritmética, mucha más confianza se tendrá en este valor para caracterizarlos. • La variabilidad juega un papel clave dentro de la estadística. • Si los fenómenos no se repitieran o lo hicieran sin variaciones, la estadística casi no tendría razón de ser.
1. La variabilidad y su importancia Los tres conjuntos de datos tienen la misma media aritmética y, sin embargo, su dispersión es muy diferente.
2. La medición de la variabilidad.El recorrido y la desviación media • El recorrido • Diferencia entre el valor mayor y el valor menor. • Ej: Recorrido = 10 – 2 = 8 • No es muy usado, debido a ciertas limitaciones: • No considera todas las observaciones del grupo. • Depende sensiblemente del número de datos, ya que es posible que entre las nuevas observaciones haya alguna más pequeña o más grande a las existentes. • Se utiliza cuando: • Se desea una medida simple de variabilidad. • Por falta de tiempo no se puede emplear otra medida. • El número de casos es pequeño. • Se utiliza en aplicaciones de control estadístico de procesos.
2. La medición de la variabilidad.El recorrido y la desviación media • La desviación media • Hay que recordar que la suma de las desviaciones respecto a la media aritmética siempre es igual a cero. • Por ello se emplean valores absolutos en las diferencias.
2. La medición de la variabilidad.El recorrido y la desviación media • La desviación media Ejemplo:
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • La desviación media casi no se utiliza porque: • Requiere el manejo de valores absolutos. • Existe otra medida, basada también en las desviaciones respecto a la media aritmética que: • Es mucho más cómoda y útil. • Tiene numerosas utilidades prácticas y teóricas. • La desviación estándar o típica emplea los cuadrados de las desviaciones.
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • La desviación estándar indica cuánto se alejan, en promedio, las observaciones de la media aritmética. • Es la medida de dispersión más usada en estadística. • El cuadrado de ella, la variancia, también es muy importante. • Es más cómodo trabajar sin el radical, por lo que se calcula primero la variancia y luego se extrae la raíz cuadrada.
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • Uso de la desviación estándar y la variancia en muestras y poblaciones: • Tienen símbolos diferentes: • En población: se usan letras latinas mayúsculas o griegas. • En muestras: se usan letras latinas minúsculas (estimadores).
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • Fórmulas de la variancia en muestras:
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • El cálculo de la variancia en datos sin agrupar con ambas fórmulas:
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • El cálculo de la variancia en datos agrupados en una distribución de frecuencias • Donde:
3. La desviación estándar y la variancia:Concepto, definición y cálculoen datos simples y agrupados • Ejemplo:
4. Variabilidad relativaEl coeficiente de variación • Necesidad de comparar dos o más conjuntos de datos en cuanto a su variabilidad. • Cuando las unidades de medida son diferentes (kilogramos, centímetros, minutos). • Cuando aún siendo la misma unidad de medida, sus promedios están muy alejados (peso de conejos y caballos). • Para ello se utilizan medidas de dispersión relativa. • La más importante es el Coeficiente de Variación.
4. Variabilidad relativaEl coeficiente de variación • Para la población • Para una muestra • Ejemplo: • Interpretación: • La desviación estándar representa un 14,62% de la media aritmética.
5. Estandarización de notas • Permite dar posiciones relativas dentro de un grupo. Por ejemplo: Cecilia obtuvo una nota de 85 y Efraín un 70.
6. Media y variancia de variables dicotómicas • Variable dicotómicas: sólo tienen 2 posibles resultados (sexo, ocupado-desocupado, tenencia de celular). • Valores a utilizar: • 0 = Ausencia (no tiene la característica). • 1 = Presencia (sí tiene la característica). • La sumatoria de los “1” ( N1 ) da el número de personas con la característica de interés. • N – N1 representa a quienes no la tienen. • N1 / N = P es la proporción de personas con la característica de interés. • 1 – P = Q es la proporción de personas que no tienen esa característica.
6. Media y variancia de variables dicotómicas • Para la población: • Para una muestra:
6. Media y variancia de variables dicotómicas • Ejemplo: tenencia de computadora en 8 familias. • ¿Cuál es la media y la variancia?
7. Ilustración integrada de distribuciones de frecuencias y medidas de tendencia central y variabilidad • Interpretar Me = 7,4 • La mitad de las familias de la zona central consumen menos de 7,4 Kg de mariscos al año, y la otra mitad más de esa cantidad. • ¿Dónde consumen más mariscos? • Es parecido en ambas zonas: aunque la moda es un poco mayor en la Central, las medianas son similares. • Consumo promedio para todo el país: • Consumo total de mariscos del país: N = 600 000 + 900 000
8. Medidas de posición o cuantilos • Cuantilos: describen la posición de un valor específico de la distribución, cuando todos los valores han sido ordenados. • Cuantilos más usados: • Percentiles ( P ): dividen al conjunto en 100 partes. • Deciles ( D ): dividen al conjunto en 10 partes. • Cuartiles ( Q ): dividen al conjunto en 4 partes.
8. Medidas de posición o cuantilos • Ejemplos: • Mediana = P50 = D5 = Q2 La mitad de los valores son inferiores a este valor y la otra mitad son superiores. • Cuartil 1 = P25 = Q1 Una cuarta parte de las observaciones son menores que él y ¾ partes mayores. • Cuartil 3 = P75 = Q3 ¾ partes de las observaciones son menores que él y ¼ parte es mayor. • Con la fórmula de los percentiles, se puede calcular cualquier cuantilo.
8. Medidas de posición o cuantilos • Procedimiento para calcular percentiles: • 1. Ordenar los datos de menor a mayor. • 2. Determinar la posición: • 3. Buscar el valor, de acuerdo con la posición encontrada.
8. Medidas de posición o cuantilos • Ejemplo: calcular el percentil 86 con los datos de los pesos de los 60 estudiantes. • 1. Ordenar los datos de menor a mayor.
8. Medidas de posición o cuantilos • 2. Determinar la posición del P86 n = 60 y m = 86 • 3. Buscar el valor, de acuerdo con la posición encontrada. • El término 52,46 no existe, por lo que habrá que hacer una interpolación lineal, entre los valores adyacentes.
8. Medidas de posición o cuantilos • El valor P86 = 75,92 significa que un 86% de los estudiantes tiene un peso inferior a 75,92 Kg y un 14% más de ese peso.
8. Medidas de posición o cuantilos • Recorrido intercuartil ( RIC ). • Es la diferencia entre el cuartil 3 y el 1: Q3 – Q1 • Ventajas de esta medida: • Da una idea de la dispersión del 50% central de los datos. • Excluye el efecto de los valores extremos. • Resulta muy útil cuando se tienen clases abiertas y no es posible calcular la variancia.
9. Diagrama de caja • Es un procedimiento gráfico basado en los cuartilos. • Permite visualizar en una forma organizada, un grupo de datos. • Está compuesto por la caja, dos brazos y los bigotes. • Se necesitan 5 medidas para construirla: valor mínimo, valor máximo y los cuartiles Q1 , Q2 y Q3.
9. Diagrama de caja • Diagrama de caja de la variable peso en los 60 estudiantes: • Mínimo = 45 • Q1 = 57,75 • Q2 = 63 • Q3 = 70,75 • Máximo = 88 • El 50% central de los pesos está entre los 57,75 y 70,75 kilos. • El recorrido intercuartil, distancia entre el Q1 y Q3, es igual a 70,75 – 57,75 = 13 La distribución es asimétrica, hacia la derecha, o sea tiene asimetría positiva (el bigote superior es más grande que el bigote inferior). La mediana (Q2) está más cerca de Q1.
1. Inferencia estadística y probabilidad • Cuando se trabaja con muestras, la información es parcial, y las decisiones se toman en condiciones de incertidumbre. • Es decir, existe el riesgo de equivocarse al hacer una inferencia (generalización de la parte al todo). • Surge la necesidad de disponer de algún procedimiento objetivo que permita tratar con la incertidumbre y los riesgos. • Esta función la cumple la teoría de las probabilidades, la cual se convierte en la base de la estadística inferencial. • Esta teoría suministra los elementos para medir, analizar y minimizar los riesgos de error presentes en el proceso de inferencia.
2. Concepto de probabilidad • Las probabilidades se refieren a acontecimientos cuya ocurrencia es incierta. • Esto es, se sabe que pueden presentarse pero no es posible conocer con certeza cuándo. • La probabilidad es, en realidad, un valor numérico que: • Debe cumplir con ciertas condiciones o propiedades matemáticas. • Se asocia a un evento o suceso determinado para expresar el grado de confianza que se tiene en su verificación futura. • Históricamente se han presentado 3 enfoques o definiciones: • La clásica. • La frecuencial. • La personalista.
3. Eventos y espacio muestral • La estadística trabaja con datos que provienen de observaciones, experimentos o procesos repetitivos, reales o imaginarios: • Anotación de pesos de niños recién nacidos. • Registro de las calificaciones de un curso. • Análisis de datos sobre consumo general de leche. • Imaginar lo que sucede si se lanza un dado “normal” 20 veces. • Eventos o sucesos: son los resultados de este tipo de experiencias reiteradas. Se representan con las letras x o E.
3. Eventos y espacio muestral • Eventos simples: se representa cada uno de los valores posibles. • Ejemplo: se tiene el peso (Kg) de 12 estudiantes: • Cada peso obtenido representa una observación o un evento simple. • Se pueden representar gráficamente como puntos sobre una línea horizontal: • Eventos compuestos: agrupación de eventos simples. • Ejemplo: número de estudiantes que pesan más de 60 Kg ( x > 60 ). Estos serían:
3. Eventos y espacio muestral • Evento simple: lanzamiento de un dado normal: • Valores posibles: • Representación gráfica: • Cada punto representa un evento simple, y el total, que son todos los posibles eventos, representan el espacio muestral de la experiencia. • Espacio muestral: conjunto de todos los posibles eventos simples. • Evento compuesto: que el resultado del lanzamiento sea número par.
3. Eventos y espacio muestral • Ejemplo: se lanzan dos dados normales, uno azul y otro rojo, pero iguales en sus otras características: • El espacio muestral está formado por 36 eventos simples. • Representación gráfica:
3. Eventos y espacio muestral • Ejemplo: se lanzan dos dados normales. • Si los eventos simples se combinan de determinadas formas, se obtienen eventos compuestos. • Evento compuesto en relación con la suma de sus caras. • x + y = 8 • Este evento compuesto lo conforman 5 eventos simples: • ( x = 2, y = 6 ) • ( x = 3, y = 5 ) • ( x = 4, y = 4 ) • ( x = 5, y = 3 ) • ( x = 6, y = 2 )
3. Eventos y espacio muestral • Evento compuesto en relación con la suma de sus caras. • x + y = número par • Este evento compuesto lo conforman 18 eventos simples.
3. Eventos y espacio muestral • Evento compuesto en relación con la suma de sus caras. • x + y < 5 • Este evento compuesto lo conforman 6 eventos simples.
3. Eventos y espacio muestral • Evento compuesto en relación con la suma de sus caras. • x + y = número par menor que 5 • Este evento compuesto lo conforman 4 eventos simples. • En teoría de conjuntos, éstos constituyen la intersección de los conjuntos definidos en los dos casos anteriores.
3. Eventos y espacio muestral • Espacio muestral bidimensional para variables continuas. • Ejemplo: un grupo de estudiantes universitarios, con: • Espacio muestral: • Rectángulo ABCD • Evento simple: • Un estudiante que pese 65 Kg y mida 170 cm (punto H) • Evento compuesto: • Estudiante que pese más de 70 Kg y mida más de 175 cm (rectángulo verde).
3. Eventos y espacio muestral • Espacios muestrales en lanzamiento de monedas:
3. Eventos y espacio muestral • Espacios muestrales en lanzamiento de dados:
3. Eventos y espacio muestral • Espacio muestral en juego de naipes (baraja inglesa): • Son 52 cartas. • Hay 4 palos con 13 cartas cada uno: • Diamantes (oros) • Corazones • Tréboles • Espadas (picas o bastos) • Hay 4 cartas de cada rango (4deK, 4deQ, 4deJ, 4de10, 4de9, 4de8, 4de7, 4de6, 4de5, 4de4, 4de3, 4de2, 4 Ases). • Hay 2 colores (26 cartas rojas y 26 cartas negras).
4. La definición de probabilidad.Enfoque clásico • ¿Cómo asignar probabilidades a los eventos de una experiencia aleatoria? • Se debe pensar en términos de un experimento ideal, que pueda repetirse un gran número de veces, en condiciones similares. • Luego se debe anticipar todos los posibles resultados (espacio muestral). • En procesos como lanzar monedas, lanzar dados, extraer cartas de un juego de naipes, girar la ruleta, se intuye que todos los resultados (eventos simples) tienen la misma oportunidad de suceder, o sea, son “igualmente posibles”.
4. La definición de probabilidad.Enfoque clásico • Definición clásica de probabilidad • Usada por Pascal, Fermat y Laplace. • Proviene de la experiencia con juegos de azar. • Supone que: • El espacio muestral es finito. • La variable es discreta. • Los resultados son: • Mutuamente excluyentes (no pueden suceder en forma simultánea), e • Igualmente posibles (misma oportunidad de suceder). • Si un suceso puede ocurrir de n maneras mutualmente excluyentes e igualmente posibles, y si n(A) de ellas posee un atributo A, la probabilidad de A es la fracción:
5. Propiedades básicas de las probabilidades • Sea Ei el evento simple o el punto muestral i. • La probabilidad es positiva o nula. • La suma de las probabilidades de los eventos simples es igual a la unidad. • Si un evento compuesto A abarca los eventos simples E1, E2, … , Ek, su probabilidad es igual a la suma de las probabilidades de los eventos simples. • El número de casos favorables no puede ser mayor a los posibles, por lo que: • Cuando el evento A es imposible, la probabilidad es cero. • Cuando el evento A es seguro o cierto, la probabilidad es uno.
6. La ley de la suma • Si se tienen dos eventos A y B, la probabilidad de que suceda por lo menos uno de ellos es: • Donde:
6. La ley de la suma • El evento contrario • El evento contrario o complemento lo conforman todos los eventos simples que no tienen el atributo que se busca ( A ). • Como la suma de las probabilidades de todos los eventos simples es la unidad, entonces: