230 likes | 401 Views
ESTADISTICA PARA RELACIONES LABORALES. CURSO 2009 TURNO NOCTURNO CLASE 9 MODULO 6 – MEDIDAS DE CONCENTRACION. Presentación gráfica: Curva de Lorenz Estadístico: Indice Gini (cálculo simplificado, para entenderlo conceptualmente)
E N D
ESTADISTICA PARA RELACIONES LABORALES CURSO 2009 TURNO NOCTURNO CLASE 9 MODULO 6 – MEDIDAS DE CONCENTRACION
Presentación gráfica: Curva de Lorenz • Estadístico: Indice Gini (cálculo simplificado, para entenderlo conceptualmente) • Existen otros estadísticos para medir concentración, incluso más precisos o que dan mejor cuenta de esta característica.
¿Para qué me sirven? • Hay algunas características de una población en las que el grado de heterogeneidad y sobre todo el tipo de asimetríaen su distribución pueden revestir un especial interés. Por ejemplo: • ¿qué grado de concentración tiene la distribución del ingreso de una población? • ¿los beneficios de un sistema de seguridad social se reparten equitativamente? • ¿las horas extra de una empresa están concentradas en algunos individuos?
Se trata de variables en las cuales sus valores (categorías) significan cantidadesde algún elemento para los individuos (o unidades) e interesa ver que tan equitativo o desigual es el reparto de estos elementos entre los integrantes de la población.
EJEMPLO • En una empresa trabajan 20 personas. • La empresa destina mensualmente $200 mil al rubro salarios (MASA SALARIAL) • Cada trabajador es remunerado de acuerdo al puesto que ocupa, en un escalafón donde –para simplificar el planteo- supondremos que a igual puesto, igual paga. • Por tanto, esta MASA SALARIAL no se distribuye equitativamente entre los 20 empleados. • Dependiendo del lugar que ocupen en el escalafón, recibirán una mayor o menor proporción de la misma.
Con las herramientas que ya estudiamos para caracterizar DISTRIBUCIONES UNIVARIADAS podemos decir algunas cosas de la distribución de la variable Salarios: • Características de la tendencia central de la distribución: MEDIA, MEDIANA • Podemos dar cuenta de algunas otras “posiciones”, por ejemplo: CUARTIL 1 y 3, que nos ayudan a evaluar la heterogeneidad • Y también para ver esta dispersión en relación a la media, podemos usar la VARIANZA y el DESVÍO
Salarios (valores de la variable salarios) Trabajadores que ganan ese salario (frecuencia simple absoluta) Columnas que construimos para estudiar la distribución de la variable Salarios
Observando la tabla: • distribución poco homogénea: • algunos valores muy altos • concentración de los individuos en los valores más bajos de la variable • Frecuencias relativas acumuladas: el 60% (Fi=0,60) de los empleados ganan como máximo $ 6 mil.
Calculamos los estadísticos 50% de los empleados gana como máximo $6 mil y 75% $8 mil (cuando hay salarios de hasta $ 46 mil). Dejando de lado a los que menos ganan y más ganan, el 50% central gana entre $4 y $8 mil. Si comparamos estos estadísticos con la media, tenemos nuevamente indicaciones de la asimetría de la distribución: La Media es $4 mil mayor que la Mediana, y se ubica fuera del intervalo que creamos entre el Primer y el Tercer Cuartil, o sea me está sirviendo poco como medida de tendencia central. Fuerte asimetría hacia la derecha (porque algunos individuos presentan valores muy altos de la variable y se distancian del resto de la población) • Obtenemos:
Un enfoque alternativo a este camino que estudia la FORMA de la distribución es analizar la CONCENTRACIÓN
Reescribimos la tabla de frecuencias, con las columnas que nos sean útiles y observando el cambio de nomenclatura. • Trataremos de llegar a dos datos, pi y qi que son los que necesitamos para construir los indicadores de CONCENTRACION.
Nuevos conceptos usando viejos conocidos… • MASA PARCIAL: indica la cantidad total de elementos que obtienen entre todos los que reciben una cantidad xi. Masa parcial = xi*fi • MASA PARCIAL ACUMULADA: • Ui= (hasta i) xi*fi o • (vamos sumando en cada renglón la masa parcial acumulada hasta esa categoría) • MASA TOTAL: indica la cantidad total de elementos que obtiene el conjunto de la población. MTV= (todas las categorías) xi*fi • suma de todas las masas parciales de las variables pi = Fi*100/N (antes Frecuencia relativa acumulada como %) qi=Ui*100/MTV
Al 15% de los empleados con menor salario les corresponde el 3% de la masa salarial. Al 95% de los empleados con menor salario les asignan el 77% de la masa salarial
Entonces: • pi es el porcentaje acumulado de trabajadores para cada categoría de Xi • qi es el porcentaje acumulado de masa de la variable para cada categoría de Xi
CURVA DE LORENZ • Con pi y q1 es posible construir una gráfica:CURVA DE CONCENTRACIÓN o CURVA DE LORENZ • eje horizontal: pi eje vertical: qi
Esta curva nos permite ver en forma gráfica lo expresado en la tabla. • Además podemos ver que sucedería en el caso de una - equidistribución: que todos los empleados ganaran el mismo sueldo. • El sueldo sería MTV/N, o sea, 200000/20=$10000, que equivale a la MEDIA de la variable. • Las diferencias entre el valor pi y qi sería cero. Es decir, cualquier porcentaje de trabajadores recibiría ese mismo porcentaje de masa salarial. • máxima concentración: que un solo empleado obtuviera toda la masa salarial, y los otros 19 no recibieran ningún salario. Es decir, cualquiera sea el porcentaje de trabajadores a considerar no se llevan ninguna masa salarial. • Las diferencias entre pi y qi son máximas, por tanto = a pi. Sólo el estrato superior se llevaría el 100% de la masa salarial.
INDICE DE GINI • Agregamos ahora un resumen numérico, un indicador que permita sintetizar esta información y darnos una medida del grado de concentración. • Existen diversos indicadores que cumplen con ese objetivo. Nosotros vamos a estudiar en particular uno que se utiliza frecuentemente: el INDICE DE GINI.
El fundamento de este índice es que pueden establecerse n-1 desigualdades entre pi y qi (en la fila “n” sabemos que pi=qi=100). De la amplitud de estas desigualdades dependerá el mayor o menor nivel de desigualdad de la masa total de la variable. • Introducimos la función: • (i=1 hasta i=n-1)(pi-qi) • A su vez, sabemos que si hay una equidistribución todos los pi=qi.
Para que la fórmula anterior sea aplicable a esta situación extrema, (si los datos están presentados en una tabla de frecuencia, hay un sola fila, ya que todos los individuos presentan el mismo valor, y por tanto es p1=q1).En ese casi la sumatoria anterior es=0. • Ese es el límite inferior de nuestra función. Sin embargo el límite superior no es fijo, ya que dependerá de las magnitudes de las diferencias encontradas y del número de “filas” a sumar. • Por tanto, es necesario calcular este límite en cada caso, para ver qué tan cerca o lejos está nuestra distribución de esa situación de máxima concentración. • Para facilitar la interpretación entonces, haremos que nuestra función tome como límite superior el valor 1. • Esto se logra dividiendo la sumatoria entre (i=1 hasta i=n-1)pi • (Recuérdese que la máxima concentración se tiene cuando todas las filas hasta n-1 tienen qi=0).
Por tanto obtenemos el INDICE DE GINI: • Indice de Gini = (i=1 hasta i=n-1)(pi-qi) / (i=1 hasta i=n-1)pi • O simplificando, si descomponemos el numerador y el denominador nos queda • = 1 - (i=1 hasta i=n-1)qi • (i=1 hasta i=n-1)pi • INTERPRETACIÓN: • Si hay equidistribución, todos los pi =qi y por tanto el IC=0. • En caso de máxima concentración, todos los qi=0 (menos el último) y por tanto IC=1 • Cuanto mayor sea la concentración, mayores serán las diferencias entre los n-1 primeros pi y qi, y por tanto el índice se acercará más a 1. • Si comparamos diferentes indices de Gini este criterio va a ser útil para saber cual es la población más equitativa o más concentrada.