250 likes | 664 Views
Estadística Descriptiva. TEMA 3: MEDIDAS ESTADÍSTICAS. 3.0-PROPIEDADES DE YULE. Propiedades de Yule : Propiedades deseables de una medida de tendencia central. 1) Definida objetivamente a partir de los datos de la serie. 2) Que dependa de todas las observaciones.
E N D
Estadística Descriptiva TEMA 3: MEDIDAS ESTADÍSTICAS
3.0-PROPIEDADES DE YULE Propiedades de Yule: Propiedades deseables de una medida de tendencia central. 1) Definida objetivamente a partir de los datos de la serie. 2) Que dependa de todas las observaciones. 3) De significado sencillo y fácil de entender. 4) De cálculo rápido y fácil. 5) Poco sensible a las fluctuaciones del muestreo(valor parecido al de la población) 6) Adecuado a cálculos algebraicos posteriores.
Mediana: La Mediana de la variable estadística X se define como el valor que verifica: Me = Xi Fi = 0,5 • Si n (número de observaciones) es impar: • Me = • Si n es par: • Me = • Ejemplo: • 2, 4, 6, 7, 8, 10, 10, 11 n = 8 (par) • Me = (7+8)/2 = 7,5 Observación Posición 3.1-MEDIDAS DE TENDENCIA CENTRAL Importante: Las observaciones deben estar ordenadas cuantitativamente.
Intervalo mediano La Mediana cuando X viene en una tabla de frecuencias agrupadas en intervalos: Ii = (ei-1, ei] Fi-1 < 0,5 < Fi ó Ejemplo: n/2 15 n/2 = 30/2 = 15 30 Intervalo Mediano: (5,10] Me = 5 + ((15 - 15)/15) * 5 = 5 n = Número total de observaciones 3.1-MEDIDAS DE TENDENCIA CENTRAL
Propiedades de la Mediana: (1) Cumple las condiciones 1, 3, 4, 5 de Yule. (2) Distancia absoluta o media al valor a. dabsoluta (a) = dabs (Me) dabs (a) , a R 3.1-MEDIDAS DE TENDENCIA CENTRAL
Moda: La Moda de la variable estadística X se define como aquel/llos valores más frecuentes. • Mo = xi / ni = max nj ó fi = max fjj=1-->k • En Tabla de Frecuencias sin agrupar: Comparar las frecuencias de cada modalidad , la que tenga mayor frecuencia será la Moda de nuestra variable estadística. • En Tabla de Frecuencias agrupadas en Intervalos: • Intervalo Modal--> Ii = (ei-1, ei] hi = max hjj = 1,…,k • 1 = hi-hi-1 • 2 = hi-hi+1 Propiedades de la Moda: (1) Cumple las propiedades 1, 3 y 4 de Yule. (2) Si hay dos modas = Bimodal Si hay tres modas = Trimodal ... 3.1-MEDIDAS DE TENDENCIA CENTRAL
Media Aritmética: La media aritmética o media de la variable estadística X es: • x = (x1 + … + xn) / n • x = (x1* n1 +…+ xk* nk) / n • x = x1* f1 +…+ xk* fk • Propiedades de la Media Aritmética: • (1) Cumple las Propiedades 1, 2, 3, 4, 6 de Yule. • (2) • (3) Distancia Cuadrática(a) = • (4) y = a*x + b a, b R x : x1,…, xky : y1= a*x1 + b ,..., yk = a*xk + b • (5) Z = a*X + b*Yz = a*x + b*y X, Y, a, b R Relación entre Media Aritmética, Mediana y Moda: 3 ( x - Me ) ( x - Mo ) k = modalidades diferentes 3.1-MEDIDAS DE TENDENCIA CENTRAL
Media Geométrica: La Media Geométrica (G) de una variable estadística X, positiva, se define como: • Media Armónica: La Media Armónica (H) de una variable estadística X, positiva, se define como: • Media Cuadrática: La Media Cuadrática (Q) de una variable estadística X, positiva, se define como: Comparación de las diversas Medias: H G X Q 3.1-MEDIDAS DE TENDENCIA CENTRAL
Desviación Absoluta Media La desviación absoluta media con respecto a la Mediana (Me), se define como: La desviación absoluta media con respecto a la Media(x), se define como: DMe Dx 3.2-CARACTERÍSTICAS DE DISPERSIÓN
Varianza: La Varianza de X, se define como: • S2 = 2 = var(X) = • Desviación Típica: La desviación Típica de X, se define como: • S = = + s2 0 • Se vuelve a la misma unidad de la variable original. • Cuasivarianza: La Cuasivarianza de X, se define como: • Cuasivarianza Típica: Sc = +S2c Relación entre estas Dispersiones: n*S2 = (n-1)*S2c 3.2-CARACTERÍSTICAS DE DISPERSIÓN
Coeficiente de Variación de Pearson • El Coeficiente de Variación de Pearson de la variable estadística X, se define como: • |x| es muy pequeña • Si x = 0 no se usaría el CVx • CVx no cambia si utilizamos escalas distintas. • Para averiguar o comparar donde hay más o menos variación de varias variables estadísticas podemos utilizar cual es su CVx,ya que las escalas pueden ser diferentes( no tiene unidad de Medida, es adimensional). 3.2-CARACTERÍSTICAS DE DISPERSIÓN
Cuantiles Se define el Cuantil de orden (0 < < 1), como la proporción igual o mayor de observaciones que . Casos Particulares: Cuartiles:Q1 = X0,25 , Q2 = X0,50 , Q3 = X0,75 Deciles:D1 = X0,1 , D2 = X0,2 ,…, D9 = X0,9 Percentiles:P1 = X0,01 , P2 = X0,02 ,…, D99 = X0,99 3.2-CARACTERÍSTICAS DE DISPERSIÓN
Cálculo de los cuantiles X • X no agrupada en Intervalos: • 1) = Fi X = ( xi + xi+1 ) / 2 • 2) Fi-1 < < Fi x = xi • X agrupada en Intervalos: • Fi-1 Fi (ei-1 , ei] Xa 3.2-CARACTERÍSTICAS DE DISPERSIÓN
3.2-CARACTERÍSTICAS DE DISPERSIÓN • Recorrido Intercuartílico • El Intervalo Intercuartílico de X, se define como: • [ Q1 , Q3] • ( 50 % de las observaciones más centradas) • El rango Intercuartílico de X, se define como: • IQR = Q3 - Q1 • El rango o recorrido de X, se define como: • Rg(X) = Max xi - Min xi
Momentos El Momento de Orden r respecto a c se define como: Momentos no Centrales(c=0): Momentos Centrales de orden r (c=x): Propiedades (1) (2) (3) 3.2-CARACTERÍSTICAS DE DISPERSIÓN
Propiedades (1) (2) (3) (4) (5) (6) Teoría de la Información (SHANNON-1948) n = Número total de observaciones 3.2-CARACTERÍSTICAS DE DISPERSIÓN Indice de Diversidad El Indice de Diversidad de X trata la dispersión en variables nominales y se define como: Donde H es:
Coeficientes de Asimetría • Coeficiente de Simetría de PEARSON de X: • Si: As = 0 Situación de Simetría • As > 0 Situación de Simetría a la Derecha • AS < 0 Situación de Asimetría a la Izquierda • Medida Adimensional(Sin Medida) 3.3-CARACTERÍSTICAS DE FORMA
Coeficiente de Simetría de FISHER de X: • Si: = 0 Situación de Simetría • > 0 Situación de Simetría a la Derecha • < 0 Situación de Asimetría a la Izquierda • Medida Adimensional(Sin Medida) 3.3-CARACTERÍSTICAS DE FORMA
Coeficiente de Curtosis El Coeficiente de Curtosis de Fisher de la Variable Estadística X se define como: Interpretación: = 0 > 0 < 0 Mesocúrtica Leptocúrtica Platicúrtica 3.3-CARACTERÍSTICAS DE FORMA
3.4-CARACTERÍSTICAS DE CONCENTRACIÓN Medidas de Concentración Las Medidas de Concentración ponen de relieve el mayor o menor grado de igualdad en el reparto de la suma total de los valores de la variable. Suelen ser variables de tipo económico: Producción, Salarios, Ventas, ...
Curva de Lorentz La Curva de Lorentz es la poligonal que une los puntos (qi,Pi), i = 0, … , k , donde P0 = 0 , q0 = 0 si : Es la suma de todas las observaciones que caen en el intervalo i-ésimo. si = xi * ni para (ei-1,ei] Si : Acumulación del número de observaciones entre intervalos. Si = s1 + … + si Pi : Porcentaje Pi = Fi * 100 qi : Porcentaje de la suma total que hay menores o iguales que el extremo superior del intervalo. 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN
Ejemplo(Curva de Lorentz): X = “Salario en miles de pesetas” Concentración Máxima(debido a que la curva de Lorentz esta bastante alejada de la recta que une los puntos extremos) Pi (100,100) (0,80) qi (0,0) 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN
Indice de GINI El Indice de Gini se define como el área encerrada entre la bisectriz y la Curva de Lorentz, dividida por la mitad del área del cuadrado [0,100] x [0,100]: • Interpretación • Concentración Máxima • Concentración Mínima 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN
Mediala La Mediala de una variable estadística positiva es el valor: Ml = xi / qi = 50 La Mediala sólo se puede utilizar en variables acumuladas en intervalos, ya que para las no acumuladas utilizamos la Mediana. 3.4-CARACTERÍSTICAS DE CONCENTRACIÓN
FIN José Antonio Cortegana Camúñez 2001-2002