180 likes | 373 Views
Análisis de Datos I. Medidas de Posición u Orden. Semestre Otoño 2009. Los Puntajes Z y los Percentiles son ejemplos de medidas que se usan para comparar valores en función de su posición relativa respecto al resto de los datos ordenados de su distribución
E N D
Análisis de DatosI Medidas de Posición u Orden Semestre Otoño 2009
Los Puntajes Z y los Percentiles son ejemplos de medidas que se usan para comparar valores en función de su posición relativa respecto al resto de los datos ordenados de su distribución Las Puntuaciones Z se usan para comparar valores dentro de distintos conjuntos de datos Los Percentiles se ocupan para representar valores dentro del mismo conjunto de datos
1. Puntuaciones Z Una puntuación Z o puntuación estándar se calcula convirtiendo un valor a una escala estandarizada La Puntuación estándar o Puntuación Z corresponde a: “Número de desviaciones estándar que un valor x se encuentra por arriba o por debajo de la media” Se calcula con la siguiente fórmula:
Ejemplo: Comparación de estatura La superestrella de la NBA Michael Jordan mide 198cm, en tanto que una famosa mujer basketbolista Rebecca Lobo mide 1,95. En efecto Michael es más alto por 3 cm pero ¿Cuál de los dos jugadores es relativamente más alto? Dicho de otra forma: ¿La estatura de Michael Jordan, entre los hombres excede a la estatura de Lobo entre las mujeres?
Solución Para comparar las estaturas de Jordan y Lobo, en relación con las poblaciones de hombres y mujeres, necesitamos estandarizar dichas estaturas convirtiendolas en puntuaciones z Jordan Lobo
Interpretación: La estatura de Jordan está a 0,6 desviaciones estandar por arriba de la media de la estatura de los hombres de 1,95, pero la estatura de Lobo está a 1,5 desviaciones estándar por arriba de la media. La estatura de Lobo entre las mujeres es relativamente mayor que la estatura de Jordan entre los hombres
Puntuaciones Z y valores infrecuentes Se calificará a un valor como “infrecuente” o poco común si está a más de dos (2) desviaciones estándar de la media. Por lo tanto los valores infrecuentes tienen valores menores a -2 y mayores a 2 Si aplicamos este criterio ¿Cómo son las estaturas de Jordan y Lobo?
Considere este último ejemplo e interprete si el puntaje es frecuente o infrecuente: • Un Jugador famoso de la NBA Yao Ming mide 216cm y otro, Nate Robinson mide 178cm • Calcule las puntuaciones estándar, considerando la estatura promedio de 195cm y una desviación estándar de 5cm
Solución: En el caso de Ming su puntuación estándar está 4,2 desviaciones estándar sobre la media de 195cm Por lo que es una estatura infrecuente en la NBA, en términos de ser mucho más alto de lo esperado En el caso de Robinson su puntuación estándar está 3,4 desviaciones estándar bajo la estatura promedio de la NBA También es una estatura infrecuente pero en términos de baja estatura
Considere: Valores Infrecuentes Valores Comunes Valores Infrecuentes -3 -2 -1 0 1 2 3 z
2. Percentiles En una distribución de frecuencias usted podrá ordenar los datos en 99 percentiles que se denotan P(1); P(2); P(3)…P(99). Estos percentiles separan a los datos en 100 grupos, con aproximadamente el 1% de los valores en cada grupo También se conocen la División llamada Cuartiles que divide a la distribución en cuatro partes iguales a través de tres cuartiles Q1, Q2 y Q3 Q1 (Primer Cuartil): Separa el 25% inferior de los valores ordenados, de manera que al menos el 25% de los valores ordenados son menores o iguales que Q1 y que al menos el 75% de los valores son mayores o iguales que Q1
Q2 (Segundo Cuartil): Igual a la Mediana, separa el 50% inferior de los valores ordenados del 50% superior Q3 (Tercer Cuartil): Separa el 75% inferior de los valores ordenados, de manera que al menos el 75% de los valores ordenados son menores o iguales que Q3 y que al menos el 25% de los valores son mayores o iguales que Q3
El cálculo del Percentil está dado por la siguiente fórmula:
Ejemplo Niveles de Nicotina en Fumadores La siguiente tabla lista los 40 niveles ordenados de nicotina de ciertos fumadores A partir de la Tabla calcule el percentil correspondiente al nivel de Nicotina 112 0 1 1 3 17 32 35 44 48 86 87 103 112 121 123 130 131 149 164 167 173 173 198 208 210 222 227 234 245 250 253 265 277 284 289 290 313 477 491 498
Solución: • Interpretación: el Nivel de Nicotina de 112 es el percentil 30
En el caso anterior hemos calculado como obtener un valor percentil según un valor muestral En ocasiones queremos obtener el valor muestral en función de un Percentil determinado Ejemplo: ¿Cuál es el valor muestral de nicotina correspondiente al Percentil 68?
Para este calculo considere el siguiente procedimiento: 1. Ordenar los datos de menor a mayor 2. Calcular un valor localizador L según la siguiente fórmula: 3. Si L no es entero redondear al Número entero siguiente. Ej. Si L=7,1 redondear a 8 y ese es nuestro localizador 4. Si L es entero ese es nuestro valor Localizador 5. En la serie ordenada de datos cuente desde el menor hasta llegar al L-ésimo valor En el caso de 8, contar desde el primer valor hasta llegar al octavo valor y ese será nuestro percentil buscado n = Número total de datos K = percentil buscado
Ejemplo: Calcule el valor del P(68) en función de la serie ordenada de datos respecto al nivel de Nicotina Redondear a 28 pues el valor no es entero Luego ir a la serie ordenada de casos y contar hasta 28 desde el primer valor En este caso el nivel de nicotina correspondiente al L=28 es 234 P(68) = 234