50 likes | 199 Views
1.1 Contraste de Bondad de Ajuste para Datos Categóricos.
E N D
1.1 Contraste de Bondad de Ajuste para Datos Categóricos Universo clasificado respecto a k alternativas o categorías: A1,A2,…Ai,…,Ak . La Población representaría la categoría en que estaría clasificada una unidad del universo. Su distribución de probabilidad sería una Multinomial. Es decir: Estas probabilidades de estar clasificado en cada una de las k categorías son desconocidas y por tanto, se pueden formular hipótesis acerca de los valores que pueden tomar: Para resolver el contraste de hipótesis: muestra: m.a.s. de tamaño n clasificada según las k categorías:
Test de la Chi-Cuadrado: Si la Ho fuera cierta, las frecuencias que se esperaría que estuvieran en cada una de las k categorías serían: Este test se basa en un estadístico que calcula, para cada categoría, las diferencias entre ambos tipos de frecuencias (observadas y esperadas): • Interpretación valor del estadístico Q: • Q valor pequeño → diferencias pequeñas → Aceptar Ho • Q valor grande → diferencias grandes → Rechazar Ho Condición que establece el Test: Rechazar H0 si: Q > c Para determinar el valor c: Se fija nivel de significación P (rechazar H0 / Ho cierta) = Para resolver esta ecuación es necesario conocer la distribución del estadístico Q cuando Ho es cierta:
Bajo Ho cierta, Pearson demostró que cuando n es grande la distribución de Q se aproxima a una con k-1 grados de libertad. Luego: Rechazar H0 si: Aceptar H0 si: Para poder aplicar este test se exige: - Tamaño de la muestra grande - Todas las frecuencias esperadas (si alguna no lo cumple hay que agrupar categorías).
1.2 Contraste de Bondad de Ajuste para Datos No Categóricos Ahora el universo no está clasificado respecto a k categorías. La Población está representada por una variable aleatoria X que puede ser discreta o continua. Disponemos de una muestra: (x1, x2, …,xn) m.a.s. de tamaño n grande El objetivo es contrastar si los datos de la muestra proceden de una distribución particular (Poisson, Normal). Es un contraste para la distribución de probabilidad de la población. Las hipótesis a contrastar son: Para resolver el contraste de hipótesis, el procedimiento a seguir consiste en: 1) Se divide el conjunto de todos los posibles valores que puede tomar la v.a. poblacional X en k intervalos numéricos: I1, I2, …,Ik 2) Se calcula el nº de observaciones de la muestra que estarían dentro de cada intervalo → se obtienen las frecuencias observadas ni .
3) Se calculan las probabilidades que la distribución propuesta en la Ho asignaría a la probabilidad de que X pertenezca a cada uno de los k intervalos creados. En el caso de que la Ho fuera compuesta, previamente se estimarían los parámetros desconocidos de la distribución de la Ho. 4) Se calculan las frecuencias esperadas para los k intervalos: 5) Como tenemos las frecuencias observadas y las frecuencias esperadas, se puede aplicar el test de la Chi-cuadrado y calcular el estadístico Q. El contraste se resolvería como en el caso anterior 1.1. Rechazar H0 si: Aceptar H0 si: La única diferencia: grados de libertad se calculan como k-m-1, donde m es el nº de parámetros estimados.