200 likes | 656 Views
Tema.4. Medidas de posición. Medidas de posición individual, centiles. Medidas de posición grupal. Concepto de tendencia central. Media, mediana y moda. Propiedades. Resistencia y robustez. Medidas robustas de la tendencia central. . Medidas de posición individual: centiles.
E N D
Tema.4. Medidas de posición. Medidas de posición individual, centiles. Medidas de posición grupal. Concepto de tendencia central. Media, mediana y moda. Propiedades. Resistencia y robustez. Medidas robustas de la tendencia central.
Medidas de posición individual: centiles Los centiles dividen la distribución (ordenada) de datos en 100 partes. Cada parte contiene 1/100 de las puntuaciones. El Centil 60, por ejemplo, es aquella puntuación que deja por debajo de sí el 60% de los datos. El Centil 15 es aquella puntuación que deja por debajo de sí el 15% de los datos. Los centiles son cuantiles que dividen la distribución en 100 partes. Hay otros cuantiles. Uno de ellos es la mediana, que divide la distribución en dos partes (Mediana=Centil 50) Otros cuantiles son los deciles (Decil 1=Centil 10) y los cuartiles (Cuartil 1=Centil 25, Cuartil 2= Mediana, Cuartil 3=Centil 75)
Medidas de posición individual: centiles Cálculo de centiles Centil k: Posición de Orden = Mediana (Centil 50): Posición de Orden = NOTA: el cálculo lo veremos con datos individuales, y no con datos agrupados
Medidas de posición grupal. Concepto de tendencia central. Nos indican un valor representativo del grueso de los datos, de la referencia de los mismos –un valor central. Ejemplo: con las calificaciones 4,7,5,6,5,4,5,5,5,6,5,4,4, es claro que (a ojo) están en torno a cinco, que podría ser tomado como índice de tendencia central. Veremos primero los 3 índices de tendencia central más comunes (moda, media y mediana). Después veremos otros índices que han sido propuestos.
Media aritmética Fórmula: Simplemente se trata de sumar todos los valores y dicha cantidad se divide por el número de valores que tengamos. Si tenemos los datos: 4,6,5,3,7 La media será (4+6+5+3+7)/5=4 Nota: se pueden emplear medias aritméticas ponderadas. Pensemos que hay 2 datos, uno (5) pesa 0’6 y el otro (6) pesa 0’4. Entonces, la media será (5*0’6+6*0’4)/(0’6+0’4)=5’4
Propiedades de la Media aritmética -La suma de diferencias (de todos los valores) respecto a la media es siempre 0 -Si sumamos una constante a cada uno de los valores, la nueva media aritmética resultante será la original más la constante. -Si multiplicamos cada uno de los valores por una constante, la nueva media aritmética será la original por la constante. • Minimiza la suma de diferencias en términos cuadráticos.
Mediana La Mediana (Mdn o Md) se define como el valor que tiene la propiedad de que el número de observaciones menores que él es igual al número de observaciones mayores que él. Por ejemplo, en la secuencia (ordenada) 3,4,5,6,7,8,9 la mediana será 6 En la secuencia (ordenada) 2,3,4,6,7,9 la mediana será 5 (la media aritmética entre los dos valores centrales; observad que n es par; en el ejemplo de arriba era impar)
Propiedades de la mediana • No utiliza todos los elementos • Se puede calcular con datos ordinales • Se ve menos afectada por datos atípicos que la media aritmética. • Minimiza la suma de diferencias en valor absoluto (recordad que la media aritmética minimizaba la suma de diferencias en términos cuadráticos)
Ejemplo uso de la mediana Los 9 empleados de una nueva empresa viven al lado de la Nacional 340 en diferentes kilómetros: 3 2 1 2 1 Núm. Emp. Km 1 4 5 6 26 Dado que todos viajan en coche, y sabiendo que quieres minimizar el coste en gasolina, ¿en qué lugar pondrías la empresa para minimizar tal coste?
La moda Se define como Moda (Mo) aquel valor de la variable al que corresponde mayor frecuencia. En el conjunto de datos: 4,5,6,6,3,6,4,5 la Mo=6 Propiedades: -No es necesariamente única (puede haber varias modas) -Se puede calcular con datos en escala nominal -En su cálculo no intervienen todos los elementos
¿Cuál elegir? Media Moda Mediana
Resistencia y robustez Estadísticos resistentes: Son aquellos que no se ven influidos (o solo ligeramente) por pequeños cambios en los datos. Evidentemente, la media es un estadístico muy poco resistente a cambios en los datos, dado que se ve influida por todos y cada uno de ellos. La mediana, en cambio, es un estadístico altamente resistente.
Estadísticos (Estimadores) robustos (ESTADÍSTICA INFERENCIAL): Son aquellos estadísticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución. Es decir, son el “mejor compromiso”. La media no es un estimador robusto. La mediana es un estimador más robusto que la media, si bien hay otros estimadores más robustos que veremos en el punto siguiente del temario.
Medidas robustas de tendencia central 1. Medias Recortadas Consiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje). Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores. Observar que la media recortada al 0% es la media aritmética. A la media recortada al 25% se la denomina centrimedia.
Medidas robustas de tendencia central 1. Medias Recortadas (cont) Calcula la media recortada al 5% de los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 El valor debe ser 6.11 Calcula la media recortada al 10% de los datos anteriores (da 6) Calcula la centrimedia (da 5.8)
Medidas robustas de tendencia central 2. Media Winsorizada Es análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media winsorizada. Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2 menores: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir, 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que será la media winsorizada a nivel 2 (debe de dar 5.9)
Medidas robustas de tendencia central 3. Otros tipos de media en la que se recortan datos En muchas ocasiones lo que se hace es emplear un valor mínimo y uno máximo más allá del cual se eliminan los datos que sobrepasen tales valores. Por ejemplo, en experimentos de tiempo de reacción para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rápido; más de 1500 ms es demasiado lento.) De esta manera, si todos los datos están en el rango 200-1500 ms no se elimina ningún dato
Medidas robustas de tendencia central 4. Trimedia Es un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil. Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es:
Medidas robustas de tendencia central 5. Otras medidas robustas El estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre sí por el tipo de ponderación aplicada sobre los datos. Por ejemplo, en el Estimador-M de Huber (Estimador M de posición): Las puntuaciones típicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto más pequeños cuanto mayor es su distancia respecto a cero. La constante es 1.339. Cálculo: lo da el SPSS.