190 likes | 383 Views
Prof. Rosario Martínez Verdú. TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS. 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste de Homogeneidad de Poblaciones. Bibliografía específica Tema 5:
E N D
TEMA 5: CONTRASTES DE HIPÓTESIS NO PARAMÉTRICAS 1. Contrastes de Bondad de Ajuste 2. Contraste de Independencia 3. Contraste de Homogeneidad de Poblaciones Bibliografía específica Tema 5: - NEWBOLD, P. (1997). Estadística para los Negocios y la Economía. Madrid: Prentice Hall. 4ª Edición. Capítulo 11. - NEWBOLD, P. y otros (2008). Estadística para Administración y Economía. Madrid: Pearson-Prentice Hall. 6ª Edición. Capítulo 16. - ESTEBAN GARCÍA, J. y otros: Curso Básico de Inferencia Estadística. Reproexpres Ediciones, Valencia, 2008. Tema 7 apartados 1 a 4. - LIND D.A y otros. Estadística Aplicada a los Negocios y la Economía. Ed. McGraw Hill, México, (13ª Edición). Capítulo 17. MURGUI, J.S. y otros (2002). Ejercicios de Estadística. Economía y Ciencias Sociales. Valencia: Tirant lo Blanch. Capítulo 9 apartados 1 a 3.
1.- CONTRASTES DE BONDAD DE AJUSTE Ho simple 1) Con Datos Categóricos (Multinomial) a) Ho simple 2) Con Datos No Categóricos b) Ho compuesta (Poisson, Normal, Exponencial)
1.1 Contraste de Bondad de Ajuste para Datos Categóricos Universo clasificado respecto a k alternativas o categorías: A1,A2,…Ai,…,Ak . La Población representaría la categoría en que estaría clasificada una unidad del universo. Su distribución de probabilidad sería una Multinomial. Es decir: Estas probabilidades de estar clasificado en cada una de las k categorías son desconocidas y por tanto, se pueden formular hipótesis acerca de los valores que pueden tomar: Para resolver el contraste de hipótesis: muestra: m.a.s. de tamaño n clasificada según las k categorías:
Test de la Chi-Cuadrado: Si la Ho fuera cierta, las frecuencias que se esperaría que estuvieran en cada una de las k categorías serían: Este test se basa en un estadístico que calcula, para cada categoría, las diferencias entre ambos tipos de frecuencias (observadas y esperadas): • Interpretación valor del estadístico Q: • Q valor pequeño → diferencias pequeñas → Aceptar Ho • Q valor grande → diferencias grandes → Rechazar Ho Condición que establece el Test: Rechazar H0 si: Q > c Para determinar el valor c: Se fija nivel de significación P (rechazar H0 / Ho cierta) = Para resolver esta ecuación es necesario conocer la distribución del estadístico Q cuando Ho es cierta:
Bajo Ho cierta, Pearson demostró que cuando n es grande la distribución de Q se aproxima a una con k-1 grados de libertad. Luego: Rechazar H0 si: Aceptar H0 si: Para poder aplicar este test se exige: - Tamaño de la muestra grande - Todas las frecuencias esperadas (si alguna no lo cumple hay que agrupar categorías).
EJEMPLO 1 En un municipio hay 3 partidos políticos mayoritarios. De cara a las próximas elecciones, el periódico local ha efectuado una encuesta sobre las preferencias por los 3 partidos políticos: A, B y C entre 80 votantes seleccionados al azar. Los resultados han sido: ¿Se puede considerar que las preferencias electorales de los votantes por los 3 partidos políticos son las mismas para un nivel de significación del 5%?
1.2 Contraste de Bondad de Ajuste para Datos No Categóricos Ahora el universo no está clasificado respecto a k categorías. La Población está representada por una variable aleatoria X que puede ser discreta o continua. Disponemos de una muestra: (x1, x2, …,xn) m.a.s. de tamaño n grande El objetivo es contrastar si los datos de la muestra proceden de una distribución particular (Poisson, Normal). Es un contraste para la distribución de probabilidad de la población. Las hipótesis a contrastar son: Para resolver el contraste de hipótesis, el procedimiento a seguir consiste en: 1) Se divide el conjunto de todos los posibles valores que puede tomar la v.a. poblacional X en k intervalos numéricos: I1, I2, …,Ik 2) Se calcula el nº de observaciones de la muestra que estarían dentro de cada intervalo → se obtienen las frecuencias observadas ni .
3) Se calculan las probabilidades que la distribución propuesta en la Ho asignaría a la probabilidad de que X pertenezca a cada uno de los k intervalos creados. En el caso de que la Ho fuera compuesta, previamente se estimarían los parámetros desconocidos de la distribución de la Ho. 4) Se calculan las frecuencias esperadas para los k intervalos: 5) Como tenemos las frecuencias observadas y las frecuencias esperadas, se puede aplicar el test de la Chi-cuadrado y calcular el estadístico Q. El contraste se resolvería como en el caso anterior 1.1. Rechazar H0 si: Aceptar H0 si: La única diferencia: grados de libertad se calculan como k-m-1, donde m es el nº de parámetros estimados.
EJEMPLO 2 En una encuesta a una muestra aleatoria de 90 fumadores que manifestaron su intención de dejar de fumar, se les preguntó por el número de veces que hasta el momento lo habían intentado. Los resultados fueron los siguientes: ¿Se puede aceptar un modelo Poisson de media igual a 2 para la variable aleatoria “número de intentos para dejar de fumar”?
2. CONTRASTE DE INDEPENDENCIA Sea 1 muestra grande de n individuos clasificados respecto a las categorías de 2 variables categóricas o criterios de clasificación: A y B. Tabla de Contingencia nijfrecuencia observada conjunta. Nº de individuos de la muestra que están clasificados simultáneamente en las categorías Ai y Bj. ni. y n.jfrecuencias marginales observadas. ni.: nº total de individuos clasificados en la categoría Ai n.j: nº total de individuos clasificados en la categoría Bj
Podemos suponer que la muestra proviene de una población con la siguiente distribución conjunta de probabilidad: pijprobabilidad conjunta de estar clasificado simultáneamente en las categorías Ai y Bj de la tabla de contingencia. pi. y p.jprobabilidades marginales pi.: probabilidad de estar clasificado en la categoría Ai p.j: probabilidad de estar clasificado en la categoría Bj Todas estas probabilidades son desconocidas y se pueden formular hipótesis acerca de los valores que pueden tomar.
Contraste de Independencia (continuación) Las hipótesis a contrastar sobre estas probabilidades son: Independencia (no hay relación) No independencia (hay relación) Test de la Chi-Cuadrado: Bajo Ho cierta, Para un nivel de significación fijado: Rechazar H0 si: Aceptar H0 si: Todas las frec. esperadas:
EJEMPLO 3 Una encuesta efectuada a 120 consumidores de un producto, seleccionados al azar, ha permitido clasificarlos respecto a la marca que prefieren y respecto a la región en la que residen, obteniéndose la siguiente tabla: A partir de esta información, ¿se puede admitir, para un nivel de significación del 5%, que la preferencia por una determinada marca está influida por la región de residencia?
EJEMPLO 1 Una encuesta efectuada a 120 consumidores de un producto, seleccionados al azar, ha permitido clasificarlos respecto a la marca que prefieren y respecto a la región en la que residen, obteniéndose la siguiente tabla: A partir de esta información, ¿se puede admitir, para un nivel de significación del 5%, que la preferencia por una determinada marca está influida por la región de residencia?
3. CONTRASTE DE HOMOGENEIDAD DE POBLACIONES Sean I muestras grandes independientes de individuos clasificados respecto a las J categorías de 1 variable categórica: A. nijfrecuencia observada. Nº de individuos de la muestra i que están clasificados en la categoría Aj. ni.: tamaño muestra i n.j: nº total de individuos del conjunto de todas las muestras clasificados en la categoría Aj n: suma de todos los tamaños muestrales.
Podemos suponer que cada muestra proviene de una población con la siguiente distribución de probabilidad: pij probabilidad en la población ide estar clasificado en la categoría Aj Todas estas probabilidades son desconocidas y se pueden formular hipótesis acerca de los valores que pueden tomar.
Contraste de Homogeneidad de Poblaciones (continuación) La Ho a contrastar es que todas las poblaciones tienen la misma distribución de probabilidad (son homogéneas): Poblaciones Homogéneas Poblaciones no Homogéneas Test de la Chi-Cuadrado: Bajo Ho cierta, Para un nivel de significación fijado: Rechazar H0 si: Aceptar H0 si: Todas las frec. esperadas:
EJEMPLO 4 La Comisión Europea está interesada en conocer el grado de apoyo de los ciudadanos a la Constitución Europea. Para ello, ha realizado encuestas en cada uno de los países miembros. En la siguiente tabla se muestran los resultados de las encuestas de España y de Reino Unido: A partir de la tabla anterior, ¿puede decirse que la opinión de los ciudadanos respecto a la Constitución Europea es homogénea en los dos países o bien cabe hablar de diferencias significativas? /