310 likes | 749 Views
Medidas de resumen. Medidas de resumen. Se utilizan para describir información Medidas de posición Medidas de dispersión Medidas de forma. Medidas d eposición. Se utilizan para describir información y se dividen en: Medidas de tendencia central Medidas no centrales.
E N D
Medidas de resumen • Se utilizan para describir información • Medidas de posición • Medidas de dispersión • Medidas de forma
Medidas d eposición • Se utilizan para describir información y se dividen en: • Medidas de tendencia central • Medidas no centrales
Medidas de tendencia central • Son medidas que tienden a ubicarse en el centro de los datos cuando estan ordenados por magnitud. • Son medidas de tendencia central: el promedio, la mediana y la moda
Promedio • Es una medida de tendencia central que se utiliza para describir información. • El promedio se define como la suma de los datos dividido por el número total de datos.
Ejemplo • Calificación de 5 alumnos. • 1,5-3,4-5-6,1-7,2
El promedio es sensible a los valores extremos • El promedio es un buen valor cuando no hay valores extremos. • El promedio representa el centro de gravedad de los datos.
Ejemplo • Calcule el promedio par el puntaje de una prueba. Interprete
La mediana • Es una medida de tendencia central que se usa para describir información. • La mediana es el valor de la variable que supera a lo mas al 50% de las observaciones y es superada a lo mas por el otro 50% de las observaciones, cuando los datos están agrupados por magnitud.
Ejemplo1 • X= edad en años. • 4-6-8-10-12 • Med= 8 años • El 50% de los alumnos tiene menos de 8 años
Ejemplo 2 • X= Edad • 4-6-10-8-14-12 • Med= 9 años • El 50% de los alumnos tiene menos de 9 años.
Lirj = Limite inferior real del intervalo j que contiene a la mediana. • Fj-1= frecuencia acumulada del intervalo mediano • Fj= frecuiencia absoluta del intervalo que contiene a la mediana • C= amplitud del intervalo
¿Cómo se determina el intervalo j que contiene a la mediana? • Calculando el 50% de los datos, este número se busca en la columna de las frecuencias absolutas acumuladas. • El primero que lo contenga es el intervalo
La moda • Es una medida de tendencia central para describir información. • Es el valor de la variable que mas se repite. • Cuando los datos estan tabulados se va a aproximar por la marca de clase con mayor frecuencia absoluta. • Puede existir mas de una moda. • La moda es la única medida de tendencia centra que se puede utilizar para variable cualitativas.
X= edad • 6-7-5-5-4-3-4-5 • Mod = 5 años • La edad mas frecuente es 5 años. • X= Color favorito • Azul-azul- rojo-negro- azul • Mod = azul • El color que mas prefieren es el azul
Medidas de dispersión • SE utiliza para describir la homogeneidad de los datos. • Grupo 1 : Edad en años • 20-21-22-23-24 • Grupo 2 • 18-20-22-24-26 • En ambos grupos las personas tienen en promedio 22 años. • ¿Significa que los grupos son iguales en edades?
Rango • Es una medida de dispersión que se utiliza para describir información. • Se define como la diferencia entre la mayor observación y la menos. • R1= 4 años • R2=8 años • R2/R1= 2 el grupo2 tiene el doble de dispersión que el grupo q
Desviación estandar media • DM1=1,2 años • DM2=2,4 años • Dm2/DM1= 2 El grupo 2 tiene el doble d dispersión que el grupo1
La desviación media es una buena medida de dispersión • La dificultad de tratamiento algebraico del valor absoluto hace difícil su uso
Varianza y desviación estandar • En general la varianza no se utiliza ya que amplifica la dispersión de los datos • Var 1= 2 años² • Var 2= 8 años ² • La unidad al cuadrado no tiene sentido estadistico
DE1= 1,41 cada dato se desvía del promedio 1,41 años DE2= 2,82 Cada dato se desvía 2,82 años del promedio DE2/DE1= 2 El grupo2 tiene el doble d desviación estandar que el grupo 1
Coeficiente de variación • Es una medida de dispersión relativa ( no tiene unidad) indica que porcentaje es la desviación estandar de la media
Ejemplo • La siguiente información representa los pesos de las mamas y la de sus bebes recién nacidos
Cv mama= 8,68% • CV bebe= 21,48% • Por lo tanto el peso de los bebes es mas disperso que el de las mamas. • El CV es útil para comparar la dispersión de 2 grupos cuando los promedios son muy diferentes.