380 likes | 1.13k Views
Tema 4. Medidas de asociación. 1.- LEO A. GOODMAN 2.- WILLIAM HENRY KRUSKAL. El estadístico Chi-cuadrado. SIRVE : Ver si dos variables están o no asociadas. NO SIRVE: no nos dice si es alta o baja la asociadas. Veamos coeficientes para medir la intensidad en tablas 2x2.
E N D
Tema 4. Medidas de asociación 1.- LEO A. GOODMAN2.- WILLIAM HENRY KRUSKAL
El estadístico Chi-cuadrado SIRVE: Ver si dos variables están o no asociadas NO SIRVE: no nos dice si es alta o baja la asociadas
Veamos coeficientes para medir la intensidad en tablas 2x2 • Coeficiente Phi de Pearson2) Riesgo relativo3) Razón de productos cruzados TABLAS 2x2
1) Coeficiente Phi de Pearson Se define el coeficiente Phi, de la forma siguiente: TABLAS 2x2
1) Coeficiente Phi de Pearson Toma valores en el intervalo: Interpretación: Valor 1: se obtiene cuando la dependencia es directa y perfecta, Valor -1: se obtiene cuando la dependencia es inversa y perfecta, Valor 0: se obtiene cuando hay independencia. TABLAS 2x2
1) Coeficiente Phi de Pearson EJEMPLO Para realizar un estudio de observación de conductas de interacción en niños en situación de juego se ha entrenado a dos observadores en la utilización de un sistema de registro de conductas. Los dos observadores codifican con el mismo sistema de categorías, requiriéndose que lo utilicen con un mismo criterio. Para evaluar el nivel de acuerdo entre los observadores y constatar si el entrenamiento recibido ha sido adecuado, se pide a ambos observadores que clasifiquen las conductas observadas en un vídeo de prueba. Los resultados fueron los siguientes: TABLAS 2x2
1) Coeficiente Phi de Pearson EJEMPLO Frecuencias esperadas TABLAS 2x2
1) Coeficiente Phi de Pearson EJEMPLO Calculamos el coeficiente Phi de Pearson: TABLAS 2x2
1) Coeficiente Phi de Pearson EJEMPLO Interpretación Signo positivo Dependencia directa Vemos que el valor es moderado-alto La mayoría de los que tienen un resultado A por el observador A, también obtienen un resultado A por el observador B TABLAS 2x2
2) Riesgo relativo Se define el riesgo relativo por columnas, de la forma siguiente: Se define el riesgo relativo por filas, de la forma siguiente: TABLAS 2x2
2) Riesgo relativo Toma valores en el intervalo: Interpretación: El RR = 1, informa que no hay asociación entre las variables. El RR > 1, nos dice que existe asociación positiva. El 0 < RR < 1, indica que existe una asociación negativa. TABLAS 2x2
2) Riesgo relativo EJEMPLO (Continuación) Calculamos el riesgo relativo por columnas: Calculamos el riesgo relativo por filas: TABLAS 2x2
2) Riesgo relativo EJEMPLO (Continuación) Interpretación El RR > 1, nos dice que existe asociación positiva Es 5,8333 veces más fácil tener un valor A por el observador A cuando se tiene un valor A por el observador B que si se tiene un valor B por el observador B. Es 3,6364 veces más fácil tener un valor A por el observador B cuando se tiene un valor A por el observador A que si se tiene un valor B por el observador A. TABLAS 2x2
3) Razón de productos cruzados Se define la razón de productos cruzados, de la forma siguiente: Toma valores en el intervalo: TABLAS 2x2
3) Razón de productos cruzados Interpretación: La RC = 1, hay la misma razón de casos que aparece A y no A, cuando está B, que cuando no está presente B. La RC < 1, la razón entre los casos que aparecen A y no A es menor cuando está presente B. La RC > 1, la razón entre los casos que aparecen A y no A es mayor cuando está presente B. TABLAS 2x2
3) Razón de productos cruzados EJEMPLO (Continuación) Calculamos la razón de productos cruzados: TABLAS 2x2
3) Razón de productos cruzados EJEMPLO (Continuación) Interpretación RC>1, la razón entre los resultados A y B del observador A es superior cuando el sujeto tiene un valor A por el observador B que cuando tiene un valor B. Es decir, hay una dependencia directa TABLAS 2x2
Veamos coeficientes para medir la intensidad en tablas rxc Tablas con mayor número de columnas y/ó filas. • Coeficiente de contingencia de Pearson2) V de Cramer3) Lambda de Goodman y Kruskal TABLAS rxc
1) Coeficiente de contingencia de Pearson Se define el coeficiente de contingencia de Pearson, de la forma siguiente: El valor máximo es: TABLAS rxc
1) Coeficiente de contingencia de Pearson Toma valores en el intervalo: Interpretación: C=0, indica independencia absoluta C=Max(C), indica dependencia perfecta TABLAS rxc
1) Coeficiente de contingencia de Pearson EJEMPLO Para analizar si el estado civil no era una variable relevante a la hora de explicar las actitudes abortistas, se ha encuestado a 500 sujetos obteniendo los resultados que aparecen en la tabla siguiente. TABLAS rxc
1) Coeficiente de contingencia de Pearson EJEMPLO Calculamos las frecuencias esperadas Calculamos el valor Chi-cuadrado: Calculamos el valor C: Calculamos el valor máximo de C: TABLAS rxc
2) V de Cramer Se define el valor V de Cramer, de la forma siguiente: El valor p es: p = Min {número de filas, número de columnas} TABLAS rxc
2) V de Cramer Toma valores en el intervalo: Interpretación: V=0, indica independencia absoluta V=1, indica dependencia perfecta TABLAS rxc
2) V de Cramer EJEMPLO (Continuación) Calculamos el valor V de Cramer: TABLAS rxc
2) V de Cramer EJEMPLO (Continuación) Interpretación Es decir, hay una dependencia directa no muy alta TABLAS rxc
3) Lambda de Goodman y Kruskal Se define el valor Lambda, de la forma siguiente: Toma valores en el intervalo: ¡¡¡ LOCURA MATEMÁTICA!!! TABLAS rxc
3) Lambda de Goodman y Kruskal EJEMPLO (Continuación) máximo 120 200 250 TABLAS rxc
3) Lambda de Goodman y Kruskal EJEMPLO (Continuación) Interpretación Es el 28% de error que se ve reducido al predecir el valor de la variable dependiente X, conocido el valor de la variable independiente Y TABLAS rxc
RESUMEN • Medidas para tablas 2x2 - Coeficiente Phi de Pearson - Riesgo Relativo - por filas - por columnas - Razón de productos cruzados
RESUMEN • Medidas para tablas rxc - Coeficiente de contingencia de Pearson - V de Cramer - Lambda de Goodman y Kruskal