170 likes | 456 Views
Estadística Descriptiva continuación. Medidas de Dispersión . Concepto . Las medidas de dispersión son un conjunto de valores que tienen por objeto proporcionar, en un valor único información sobre la variabilidad que presenta la población o la muestra con respecto a la variable de interés.
E N D
Estadística Descriptiva continuación Medidas de Dispersión
Concepto • Las medidas de dispersión son un conjunto de valores que tienen por objeto proporcionar, en un valor único información sobre la variabilidad que presenta la población o la muestra con respecto a la variable de interés.
Rango • Es la variabilidad total de la variable expresada como la diferencia entre el valor máximo encontrado en la población o muestra menos el valor mínimo encontrado en la misma colección de datos. R = Vmax - Vmin
Desviación • Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di . • No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.
Desviación (cont.) • La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solución es mala pues como veremos siempre va a ser 0.
Desviación Media: • Es la media de los valores absolutos de las desviaciones, y se puede denotar como por dm.
Varianza • Es la media de los cuadrados de las desviaciones, y la denotaremos por S2 o también por σ2. O más sencillamente
Varianza (cont.) • La varianza es un parámetro de la distribución normal que evalúa la diferencia absoluta de cada valor con respecto a la media aritmética. • La varianza hace uso de la propiedad de todos los cuadrados de ser positivos para establecer una medida unidireccional. • Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendrá en cm2.
Desviación Estándar • Es la raíz cuadrada de la varianza, se denota por Sx o σx. • Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. • Es un derivado de la varianza, gráficamente representa la distancia desde la media de la distribución normal hasta el punto de inflexión de la curva que representa la distribución.
Coeficiente de Variación • Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.
σx E.S. = √ n-1 Error estándar • A veces llamado también desviación estándar del estimador se define como la desviación estándar divida entre n-1
Medidas de Localización • Las medidas de localización dividen la distribución en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra..
Cuartiles • Medida de localización que divide la población o muestra en cuatro partes iguales. • Q1= Valor de la variable que deja a la izquierda el 25% de la distribución. • Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = mediana. • Q3= Valor de la variable que deja a la izquierda el 75% de la distribución. • Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de variable. • Caso I: Variable cuantitativa discreta: • En este caso tendremos que observar el tamaño de la muestra: N y para calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana de la correspondiente mitad de la muestra. • Caso II: Variable cuantitativa continua: • En este caso el cálculo es más simple:, sea la distribución que sigue: • [Li-2 -- Li-1) ni-1 Ni-1 • [Li-1 -- Li) ni Ni • Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:
Cuartil y
Deciles • Medida de localización que divide la población o muestra en 10 partes iguales • No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables continuas. • dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la distribución. • [Li-2 -- Li-1)ni-1Ni-1 • [Li-1 -- Li) ni Ni Intervalo donde se encuentra el Decil correspondiente: k = 1 .. 9
Percentiles: • Medida de localización que divide la población o muestra en 100 partes iguales • No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables continuas. • pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribución. Intervalo donde se encuentra el percentil corespondiente: k=1 .. 99
Algunas medidas de Dispersión asociadas • Una vez estudiadas las medidas de localización surgen dos nuevas medidas de dispersión, que son: • Recorrido intercuartílico: • Semirecorrido intercuartílico: • Recorrido interdecílico: • Recorrido intercentilico: Medidas asociadas a las medidas de localización.