510 likes | 1.44k Views
Universidad Nacional de Itapúa. Facultad de Humanidades, Ciencias Sociales y Cultura Guaraní. Clase 9: Medidas de Centralización para datos agrupados. CARRERA: Lic. En Psicología CURSO: 2do ASIGNATURA: Estadística Aplicada a la Psicología. Dr. Félix Enrique Ayala Lic. Mariela Raiz.
E N D
Universidad Nacional de Itapúa Facultad de Humanidades, Ciencias Sociales y Cultura Guaraní Clase 9: Medidas de Centralización para datos agrupados CARRERA: Lic. En Psicología CURSO: 2do ASIGNATURA: Estadística Aplicada a la Psicología Dr. Félix Enrique Ayala Lic. Mariela Raiz Mayo, 2014
Recordar: Hasta la clase pasada se ha estudiado las medidas de centralización para datos no agrupados, es decir para los que no están organizados en tablas de frecuencias.
Los datos no agrupados son por ejemplo, los puntajes de 15 estudiantes en una prueba de actitudes hacia un reactivo determinados, que podría calificarse en valores que van del 1 al 7. Al ser aplicado dicho reactivo o escala de actitud a los 15 estudiantes se podría obtener los siguientes valores: Para los valores anteriores se podría calcular las medidas de centralización como: La Media Aritmética, la Mediana y la Moda.
En el caso de la media aritmética solo se deben sumar todos los valores y luego dividir la suma por el total, es decir se debe aplicar la siguiente formula:
En el caso de la mediana, se debe buscar el valor central, como la cantidad de datos es 15, (un número impar) entonces se tendrá un solo valor central que se buscará una vez ordenado los datos de menor a mayor. Dichos datos ordenados se presenta de la siguiente manera: Valor que se encuentra en el centro de los datos agrupados, que es la MEDIANA
Para calcular la moda en de un conjunto de datos no agrupados se debe buscar el valor que más veces se repite en el conjunto de datos. En el caso del ejemplo encontramos que hay dos valores que se repita con mayor frecuencia que son el 1 y el 2; por lo tanto la moda del conjunto de dato son el 1 y el 2, y se dice en este caso que el conjunto de bimodal. Los valor que más se repiten son el 1 y el 2, por lo tanto la moda del conjunto son esto dos valores.
Tal como se explicó hasta aquí, es la forma como se calculan la Media Aritmética, la Mediana y la Moda de un conjunto de datos no agrupados. Seguidamente se mostraremos como se calculan las mismas tres medidas de centralización, pero para datos agrupados.
En el caso de datos agrupados se presenta dos situaciones: Que el conjunto de datos esté agrupados pero no contengan intervalos, como podría ser el caso de la distribución de frecuencia de las calificaciones de un grupo de 40 alumnos en una asignatura determinada, los resultados se podría expresar de la siguiente manera: La tabla es un ejemplo de datos agrupados pero sin intervalos
Otra situación de datos agrupados se podría presentar en los casos de variables continuas o cuando el rango de variación es muy grande y se tiene una gran cantidad de datos. Como ejemplo se podría mencionar las puntuaciones de 200 estudiantes en un test motivacional, los resultados se podría expresar de la siguiente manera:
En este caso se tiene un rango de variación de los puntajes que va desde el valor menor: 106 hasta el valor mayor: 138 y un total de 200 observaciones distribuidas tal como se muestra en las frecuencias absolutas de la segunda columna. Frecuencia absoluta correspondiente a cada uno de los intervalos de clase
Los puntajes se representan en intervalos de ancho de clase c = 4; esto significa que en cada intervalo se cuentan o consideran 4 valores. Por ejemplo en el primer intervalos que se representa por: 135 – 138, se consideran los siguientes valores: 135, 136, 137 y 138. De la misma manera los demás intervalos que están por debajo del primero, tienen un ancho c = 4.
Calculo de la Media Aritmética para datos agrupados en intervalos. En el caso del cálculo de la Media Aritmética para datos agrupados, será necesario realizar las siguientes tareas: • En primer lugar se debe calcular la Marca de Clasede los datos. La Marca de Clase es el valor central de cada uno de los intervalos de clase y se calcula sumando los límites inferior y superior de cada intervalo y luego se divide la suma por 2. • Este cálculo se realiza para todos los intervalos, puede que salga un valor decimal en ese caso se escribe con un decimal el valor obtenido.
Como ejemplo utilizaremos los siguientes datos: La marca de clase del primer intervalo se calcula sumando los límites: inferior y superior: 135 + 138, que da la suma 273; esta suma se divide por 2; lo cual arroja como cociente: 136,5 que es la marca de clase del primer intervalo.
Calculo de la Media Aritmética para datos agrupados en intervalos. • Luego de calcular la marca de clase para cada uno de los intervalos se procede a multiplicar la frecuencia absoluta (f) por la marca de clase de cada intervalo, este producto parcial se ubica en una columna siguiente, tal como se ilustra en la tabla siguiente: 409,5 = 3 * 136,5
Calculo de la Media Aritmética para datos agrupados en intervalos. • Luego de calcular los productos parciales de cada frecuencia absoluta (f) por la marca de clase (X) de cada intervalo, se debe hallar la suma de todos estos productos: en el caso del ejemplo la suma se representa por:
Calculo de la Media Aritmética para datos agrupados en intervalos. • Luego de hallar la suma de los productos parciales: se divide esta suma por N, para obtener la media aritmética, cuya fórmula para datos agrupados está dada por:
Calculo de la Mediana para datos agrupados en intervalos. En el caso del cálculo de la Mediana para datos agrupados, será necesario realizar la siguiente fórmula: • Dónde: Li = Limite real inferior del intervalo donde se encuentra la mediana fmed = Frecuencia absoluta del intervalo donde se encuentra la mediana • = Suma de todas las frecuencias absolutas de los intervalos inferiores al intervalo donde se encuentra la mediana • c = Ancho del intervalo donde se encuentra la mediana Como ejemplo de aplicación calcularemos la mediana para el siguiente conjunto de datos agrupados en intervalos
Calculo de la Mediana para datos agrupados en intervalos. Intervalos mayores están arriba de la tabla Intervalos menores están abajo de la tabla Como se podrá observar en la tabla de frecuencia los intervalos menores están en la parte inferior de la distribución. Intervalos menores están abajo de la tabla
Calculo de la Mediana para datos agrupados en intervalos. Como en el caso del cálculo de la media aritmética indicaremos las tareas que se deben realizar para calcular la mediana. En primer lugar es necesario calcular la frecuencia acumulada menor de la distribución. Para ello es necesario identificar la ubicación de los intervalos de clases menores donde están, como en este caso los valores menores de los intervalos están debajo de la tabla, se inicia desde abajo hacia arriba el cálculo de la frecuencia acumulada menor. Valores de la frecuencia acumulada menor.
Calculo de la Mediana para datos agrupados en intervalos. Luego de calcular la frecuencia acumulada menor, se determina cual es el valor de , que en el caso del ejemplo es: Posteriormente se busca en la columna correspondiente a la frecuencia acumulada menor un valor igual a , en caso de que no se encuentra un valor idéntico, se busca un valor mayor a pero el más próximo a dicho valor. Como en el caso del ejemplo no existe un valor igual a , entonces identificamos uno que sea mayor pero más próximo, que en el caso del ejemplo es 101. Este valor encontrado nos indica el intervalo en la que se encuentra la mediana.
Calculo de la Mediana para datos agrupados en intervalos. Intervalo donde está la MEDIANA
Calculo de la Mediana para datos agrupados en intervalos. Una vez identificado el intervalo donde se encuentra la mediana se podrá obtener los datos necesarios para la fórmula que se mencionó anteriormente y que nos permitirá calcular la mediana. Dichos datos son los siguientes: • Li = Limite inferior del intervalo donde se encuentra la mediana, en este caso el valor de Li = 115 • fmed = Frecuencia absoluta del intervalo donde se encuentra la mediana, en este caso el valor de fmed= 49 • = Suma de todas las frecuencias absolutas de los intervalos inferiores al intervalo donde se encuentra la mediana, En este caso = 52 • c = Ancho del intervalo donde se encuentra la mediana, en este caso c = 4
Calculo de la Mediana para datos agrupados en intervalos. Con estos datos se puede aplicar la formula mencionada: Este resultado final es el valor de la Mediana para el conjunto de datos agrupados en intervalos. Recordemos que la mediana es el valor central del conjunto de datos ordenados, lo cual se podrá interpretar que el 50% de todos los valores del conjunto son menores a 118,918 y el otro 50% son mayores a este valor.
Calculo de la Moda para datos agrupados en intervalos. En el caso del cálculo de la Moda para datos agrupados, será necesario realizar la siguiente fórmula: • Dónde: Li = Limite real inferior del intervalo donde se encuentra la moda • D1 = Es la diferencia entre la frecuencias más alta y la frecuencia del intervalo inferior al intervalo donde está la moda. • D2 = Es la diferencia entre la frecuencias más alta y la frecuencia del intervalo siguiente o mayor al intervalo donde está la moda. • c = Ancho del intervalo donde se encuentra la moda
Calculo de la Moda para datos agrupados en intervalos. Como ejemplo de aplicación utilizaremos los datos correspondientes a los puntajes de 200 estudiantes para aplicar al cálculo de la moda de datos agrupados en intervalos La frecuencia mas alta, en este caso corresponde al intervalo de la Moda Intervalo de frecuencia más alta
Calculo de la Moda para datos agrupados en intervalos. Para proceder al cálculo de la moda se debe seguir los siguientes pasos: Intervalo con la frecuencia mas alta, en este caso corresponde al intervalo de la Moda En primer lugar es necesario identificar cual es el intervalo que tiene la frecuencia más alta, en este caso corresponde al intervalo 119 – 122, cuya frecuencia es 52. Intervalo de frecuencia más alta
Calculo de la Moda para datos agrupados en intervalos. Una vez ubicado en la tabla de frecuencia cual es el intervalo con mayor frecuencia se debe calcular los siguientes datos: Límite inferior del intervalo donde está la moda Li = 119 Intervalo de frecuencia más alta
Calculo de la Moda para datos agrupados en intervalos. D1: Que es la diferencia entre la frecuencia más alta y la frecuencia absoluta del intervalo menor o anterior, en este caso es: D1 = 52 – 49 = 3 D1 = 52 – 49 = 3 Intervalo de frecuencia más alta
Calculo de la Moda para datos agrupados en intervalos. D2: Que es la diferencia entre la frecuencia más alta y la frecuencia absoluta del intervalo mayor o siguiente, en este caso es: D2 = 52 – 23 = 29 D2 = 52 – 23 = 29 Intervalo de frecuencia más alta
Calculo de la Moda para datos agrupados en intervalos. El ancho del intervalo donde está la moda, en este caso es: c = 4 c = 4 Intervalo de frecuencia más alta
Calculo de la Moda para datos agrupados en intervalos. Una vez que se cuenta con todos los datos necesarios para la fórmula se los reemplaza en de la siguiente manera: Este resultado final es el valor de la Moda para el conjunto de datos agrupados en intervalos. Recordemos que la Moda es el valor con mayor frecuencia del conjunto de datos, lo cual se podrá interpretar que el 119,375 es el que más veces se repite en la distribución.
MUCHAS GRACIAS POR SU ATENCIÓN Y A PRACTICAR Dr. Félix Enrique Ayala Lic. Mariela Raiz Mayo, 2014