1 / 32

Medidas de la tendencia central y de la dispersión

Medidas de la tendencia central y de la dispersión. Tendencia central. Dispersión. Datos no agrupados. Datos no agrupados . Recorrido. Media aritmética. Desviación media absoluta. Mediana . Varianza y desviación típica . Moda. Media aritmética ponderada . Percentiles.

hosanna
Download Presentation

Medidas de la tendencia central y de la dispersión

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Medidas de la tendenciacentral y de la dispersión Tendencia central Dispersión Datos no agrupados Datos no agrupados Recorrido Media aritmética Desviación media absoluta Mediana Varianza y desviacióntípica Moda Media aritmética ponderada Percentiles Media geométrica Datos agrupados Datos agrupados Percentiles Varianza y desviación típica Media aritmética Mediana Moda Conceptos relacionados Coeficiente de variación Teorema de Chebyshev Regla empírica Sesgo

  2. Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

  3. MEDIDAS DE DISPERSIÓN Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. Ya que existen problemascaracterísticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

  4. Desviación media absoluta La desviación media es la media de las diferencias en valor absoluto de los valores a la media. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable. Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética por la medianaM. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.

  5. Ejemplo: Desviación media para datos no agrupados Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional. El número de preguntas buenas por materia se muestra a continuación: SOLUCIÓN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?. Complementemos el análisis anterior calculando la desviación media: Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6).

  6. PERCENTILES: Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Para datos agrupados los deciles se calculan mediante la fórmula. k= 1,2,3,... 9 Donde: Lk = Límite real inferior de la clase del decilk n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decilk. fk = Frecuencia de la clase del decilk c = Longitud del intervalo de la clase del decilk

  7. EJEMPLO.- Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla: Como son datos agrupados, se utiliza la fórmula Como son datos agrupados, se utiliza la fórmula Siendo

  8. Varianza El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. El coeficiente de variación: Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.

  9. Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 - 1/k2, donde k es una constante mayor que 1.

  10. Regla empírica: Para una distribución de frecuencias simétrica de campana, aproximadamente 68% de las observaciones estará a más y menos una desviación estándar desde la media, aproximadamente 95% de tales observaciones se encontrará a más y menos dos desviaciones estándares de la misma; y prácticamente todas las observaciones (99,7%) se hallarán a más y menos tres desviaciones con respecto a la media.

  11. SESGO No todas las distribuciones son normales, algunas están sesgadas a la izquierda o a la derecha, en ambos casos la moda es, por definición aquella observación que ocurre con más frecuencia .por consiguiente esta en el pico de la distribución ,por su propia naturaleza la media aritmética resulta afectada, sobre todo, por observaciones extremas, así pues, está desviada a la dirección del sesgo más que la mediana, que queda situada en algún punto entre la media aritmética y moda.

  12. El coeficiente de variación Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación (las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea.

  13. Ejemplo: Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?

More Related