60 likes | 254 Views
Tablas de Contingencia. CO2124. En las Tablas de Contingencia cada observación se clasifica de dos o más maneras. En este tipo de problemas generalmente se quiere probar la hipótesis de independencia de los factores.
E N D
Tablas de Contingencia CO2124 En las Tablas de Contingencia cada observación se clasifica de dos o más maneras. En este tipo de problemas generalmente se quiere probar la hipótesis de independencia de los factores. Por ejemplo: Se quiere verificar si el hábito de fumar es independiente del sexo en los estudiantes universitarios, se clasificaron según el sexo y la preferencia en el consumo de cigarrillos. La independencia de los factores en este caso implicaría que la probabilidad de ser del sexo i y con hábito de fumar j (Pij) es igual al producto de la probabilidad de ser del sexo i (pi.) y la probabilidad de tener el hábito de fumar j (p.j) Práctica 7 1
Prueba Chi-cuadrado de independencia CO2124 Se quiere probar independencia lo que equivale a verificar: Ho: pij = pi. * p.j Con H1: Ho no es cierta El estadístico de prueba es: Q= (Nij – Eij)2 Eij Si Ho es cierta, Q tiene distribución chi-cuadrado con (R-1)(C-1) grados de libertad. Donde R: número de filas C: número de columnas Práctica 7 2
CO2124 Se considera el consumo de café según el estado civil. caff.marital->matrix (c(652,1537,598,242,36,46,38,21, 218,327,106,67) nrow=3, byrow=T) rownames (caff.marital) ->c(“casado”, “divor”, “solt”) colnames (caff.marital)->c(“0”, “1-150”, “151-300”, “301-mas”) caff.marital Práctica 7 3
CO2124 chisq.test (caff.marital) Pearson´s Chi-squared test Data: caff.marital X-squared = 51.6556, df = 6, p-value= 2. 187 e-09. Considerando un nivel de significancia de 0.1 se rechazamos Ho. El conjunto de datos analizados sugiere que existe una dependencia entre el consumo de café y el estado civil. Veamos los valores esperados E->chisq.test (caff.marital)$expected Práctica 7 4
CO2124 Los valores observados son los siguientes O->chisq.test (caff.marital)$observed Se pueden comparar ambas tablas para ver la contribución de cada celda al estadistico Q a fin de identificar aquellas celdas “influyentes” En R: Xcua -> (O-E)^2/E Xcua Práctica 7 5
CO2124 Se observa entonces que las celdas de soltero-”0”, soltero-”151-300” y divor-”1-150” contribuyen de gran manera al valor del estadístico Q. Se observa un alto número de solteros que se abstienen del consumo de café al contrario de lo que se esperaría bajo el supuesto de independencia. Práctica 7 6