580 likes | 776 Views
ESTADÍSTICA NO PARAMÉTRICA Proporciones Chi-Cuadrado ( c 2 ) Mann-Whitney Kruskal-Wallis Correlación de Spearman. Tipo de Variables y test a utilizar. Variable Grupos Test Intervalar 2 - ind dif. Student no pareado Intervalar 2 - mismos ind. Student pareado
E N D
ESTADÍSTICA NO PARAMÉTRICAProporcionesChi-Cuadrado (c2)Mann-WhitneyKruskal-WallisCorrelación de Spearman
Tipo de Variables y test a utilizar Variable Grupos Test Intervalar 2 - ind dif. Student no pareado Intervalar 2 - mismos ind. Student pareado Intervalar 3 ó más grupos ANOVA/Scheffé/... Dep/Ind Análisis de Reg. / r Nominal 2 grupos Chi cuadrado Ordinal 2 grupos Chi cuadrado Ordinal 2 grupos Mann-Whitney Ordinal 3 grupos Kruskal-Wallis Ordinal 2 g /mismos ind Wilcoxon Ordinal dep/ind Spearman
Ya vistos Test estadísticos no paramétricos * Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales
Proporción • Resumen de variables binarias: • Síntoma: Presente / Ausente • Tratamiento: Efectivo / Fracaso • Si r, número de sujetos observados con la característica, en la muestra n la proporción será: • Con la característica p = r / n • Sin la característica q = 1- p
No confía 30.8% Si confía 69.2% En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC, 81 dicen que la privacidad se pierde, el IC 95% es:
Tests de proporciones • Si existe diferencia con una proporción conocida • Comparar si existen diferencias significativas entre dos proporciones no pareadas • Comparar si existen diferencias significativas entre dos proporciones pareadas
Si existe diferencia con una proporción conocida • Similar a lo visto en test t (comparar con promedio conocido), o sea:
En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se sabe que el asma se presenta en 15%. ¿Existen diferencias significativas, entre 15% y 18%?
A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos (Lewith y Machin, 1981): • 12 fueron tratados con estimulación infra roja (IR). • 13 recibieron placebo. 9/12 con IR mejoró o desapareció el dolor = 0,75 4/13 en el grupo placebo mejoró =0,31 ¿Existen diferencias significativas?
MEJORA SINTOMAS DEL RESFRIO NO SI 34 75 VITAMINA C PLACEBO c2= 31,793, gl = 1, p<0,0001 63 25
Cálculo del test – chi-cuadrado = 100*109/197 = 100*88/197
Cálculo de valores esperados A B D C
ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-CÁLCULO PD Bajo E Moderado E Alto E TOTAL A 49 (55) 30 (26) 21 (19) 100 B 67 (55) 21 (26) 12 (19) 100 C 49 (55) 27 (26) 24(19) 100 TOTAL165 78 57 300 E = 100 E = 55 165 300 c2 = å(49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65 gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4 Crítico: c20.05 = 9,49. SE RECHAZA HO
Chi - cuadrado (c2) c2 = å(O - E)2/E (Chi cuadrado de Pearson) c2 = å(|O - E|2 - 1/2) / E Corrección de Yates Corrección de Yates: para tablas 2x2, con muestras pequeñas (en una celda existen menos de 5 observaciones). Tamaño de muestra: n de celdas x 10. Ej: 2 x 2 = 4 x 10 = 40 Ej. Ant: 3x3 = 9 x 10 = 90
Distribución de Chi-Cuadrado • Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores. • Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula. • Eje Y es el número de veces que se obtiene el valor de chi-cuadrado.
ODDS RATIO • Proporciona: • Estimado de la relación entre dos variables binarias (si / no) • Permite examinar los efectos de otras variables en dicha relación • Forma especial y conveniente de interpretación en estudios caso-control
“The odds that a single throw of a die will produce a six are 1 to 5, or 1/5”. • “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”. Bland y Altman. The odds ratio, BMJ 320;1468, 2000
Razón de desigualdad (Odd ratio) OR = 5,559 IC 95% : 3,00 a 10,29 Si No 75 (a) 34 (b) Si No 63 (d) 25 (c)
Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns) si no Total Si 75.000 34.000 109.000 No 25.000 63.000 88.000 Total 100.000 97.000 197.000 Test statistic Value df Prob Pearson Chi-square 31.793 1.000 0.000 Yates corrected Chi-square 30.197 1.000 0.000 Coefficient Value Asymptotic Std Error Odds Ratio 5.559 Ln(Odds) 1.715 0.314 OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314
Riesgo Relativo • Relación de frecuencias de dos categorías. O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2. • OR = (A/C) / (B/D) • >1: personas con factor de riesgo tienen más probabilidad que presenten el evento. • <1: personas con factor de riesgo son menos probable que experimenten el evento.
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 10 40 50 > 20 a. 15 135 150 Total 25 175 200 Existe asociación entre niños de bajo peso al nacer y edad de la madre?
Odds ratio (es solamente para estudios caso-control, variables nominales, tablas 2x2)(similar a riesgo relativo) • Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento. • Si OR <1: hay una asociación negativa, (presencia del factor disminuye la probabilidad de encontrar el evento.
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 10 40 50 > 20 a. 15 135 150 Total 25 175 200 n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2 c2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. n11 n12 n1. > 20 a. n21 n22 n2. Total n.1 n.2 n.. n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2 c2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175
Proporciones(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 0,050 0,200 0,25 > 20 a. 0,075 0,675 0,75 Total 0,125 0,875 1,00
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 20 80 100 > 20 a. 30 270 300 Total 50 350 400 Existe asociación entre niños de bajo peso al nacer y edad de la madre?
Sensibilidad: proporción de positivos que son correctamente identificados por el test. • Especificidad: proporción de negativos que son correctamente identificados por el test
Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnóstico ENFERMEDAD SI NO (a) Verdad + 45 (b) Falso + 10 SI TEST (c) Falso – 5 (d) Verdad - 40 NO N = 100 Sensibilidad = a / a + c = 45 / 50 = 0,90 Especificidad = d / b + d = 40 / 50 = 0,80 VPP = a / a + b = 45 / 55 = 0,82 VPN = d / c + d = 40 / 45 = 0,89
Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnósticoTomado de Kramer, 1988 ENFERMEDAD SI NO (a) Verdad + 9 (b) Falso + 18 SI TEST (c) Falso – 1 (d) Verdad - 72 NO N = 100 Sensibilidad = a / a + c = 9 / 10 = 0,90 Especificidad = d / b + d = 72 / 90 = 0,80 VPP = a / a + b = 9 / 27 = 0,33 VPN = d / c + d = 72 / 73 = 0,99
Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados. • Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados.
Tests no paramétricos para dos o más muestras Equivalente a test t pareado: Wilcoxon Equivalente a test t no pareado: Mann-Whitney Equivalente a ANOVA: Kruskal Wallis Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal
Test U de Mann-Whitney • Colocar rangos a las observaciones en orden de menor a mayor
Test de Mann-Whitney Producción de orina diaria mL/día. Placebo Rango Droga Rango ------------------------------------------------------------------------ 1000 1 1400 6 1380 5 1600 7 1200 3 1180 2 1220 4 T= 9 19 -------------------------------------------------------------------------- Mann-Whitney U= 3, p = 0.289
Test de Tukey-Duckworth • Cálculos se pueden hacer en la cabeza • Existe solamente un requisito que cumplir: 4 ≤ n1 ≤ n2 ≤ 30 • Ho: Las muestras son idénticas • Ha: Las muestras son diferentes • El test estadístico a calcular es C
Test de Tukey-Duckworth • Existen solamente dos valores críticos: C0,05 = 7 C0,01 = 10
Test de Tukey-DuckworthProcedimiento 1. Determine medición más grande y más pequeña en cada muestra ranqueada. 2. En la muestra que contiene el valor más grande de todos los valores combinados, cuente todos los valores que son mayores que la medición más grande en el otro grupo.
3. En la otra muestra, cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición. 4. Sume ambas cantidades (= C).
Valores de exclusión Ccalc = 4 + 3 = 7 C0,05 = 7 Ccalc ≥ C0,05 por lo tanto se rechaza Ho. Conclusión: las muestras son diferentes
Kruskal-Wallis • Equivalente a Anova • Extensión del test de Mann-Whitney a más de dos grupos • Al conjunto de observaciones (N) se les da rango (1 a N), indiferente de qué grupo estén, y para cada grupo se calcula la suma de rangos, y posteriormente se calcula H, definido por
Donde R es el promedio de todos los rangos, y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones. Para calcular es más fácil:
% de reducción de cefalea en tres grupos (Fentress et al, 1986)(Rangos en paréntesis) Relajación y biofeedback Relajación No tratados 62 (11) 69 (10) 50 (12) 74 ( 8,5) 43 (13) -120 (17) 86 ( 7) 100 ( 2) 100 ( 2) 74 ( 8,5) 94 ( 5) -288 (18) 91 ( 6) 100 ( 2) 4 (15) 37 (14) 98 ( 4) -76 (16) • rango 55 36 80 Rango medio 9,17 6,00 13,33