1 / 57

Tipo de Variables y test a utilizar

ESTADÍSTICA NO PARAMÉTRICA Proporciones Chi-Cuadrado ( c 2 ) Mann-Whitney Kruskal-Wallis Correlación de Spearman. Tipo de Variables y test a utilizar. Variable Grupos Test Intervalar 2 - ind dif. Student no pareado Intervalar 2 - mismos ind. Student pareado

wade-hooper
Download Presentation

Tipo de Variables y test a utilizar

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ESTADÍSTICA NO PARAMÉTRICAProporcionesChi-Cuadrado (c2)Mann-WhitneyKruskal-WallisCorrelación de Spearman

  2. Tipo de Variables y test a utilizar Variable Grupos Test Intervalar 2 - ind dif. Student no pareado Intervalar 2 - mismos ind. Student pareado Intervalar 3 ó más grupos ANOVA/Scheffé/... Dep/Ind Análisis de Reg. / r Nominal 2 grupos Chi cuadrado Ordinal 2 grupos Chi cuadrado Ordinal 2 grupos Mann-Whitney Ordinal 3 grupos Kruskal-Wallis Ordinal 2 g /mismos ind Wilcoxon Ordinal dep/ind Spearman

  3. Ya vistos Test estadísticos no paramétricos * Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales

  4. Proporción • Resumen de variables binarias: • Síntoma: Presente / Ausente • Tratamiento: Efectivo / Fracaso • Si r, número de sujetos observados con la característica, en la muestra n la proporción será: • Con la característica p = r / n • Sin la característica q = 1- p

  5. Intervalo de confianza de una proporción

  6. No confía 30.8% Si confía 69.2% En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC, 81 dicen que la privacidad se pierde, el IC 95% es:

  7. Tests de proporciones • Si existe diferencia con una proporción conocida • Comparar si existen diferencias significativas entre dos proporciones no pareadas • Comparar si existen diferencias significativas entre dos proporciones pareadas

  8. Si existe diferencia con una proporción conocida • Similar a lo visto en test t (comparar con promedio conocido), o sea:

  9. En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se sabe que el asma se presenta en 15%. ¿Existen diferencias significativas, entre 15% y 18%?

  10. A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos (Lewith y Machin, 1981): • 12 fueron tratados con estimulación infra roja (IR). • 13 recibieron placebo. 9/12 con IR mejoró o desapareció el dolor = 0,75 4/13 en el grupo placebo mejoró =0,31 ¿Existen diferencias significativas?

  11. Chi cuadrado

  12. MEJORA SINTOMAS DEL RESFRIO NO SI 34 75 VITAMINA C PLACEBO c2= 31,793, gl = 1, p<0,0001 63 25

  13. Cálculo del test – chi-cuadrado = 100*109/197 = 100*88/197

  14. Cálculo de valores esperados A B D C

  15. Cálculo de valores esperados

  16. Chi-Square Table

  17. ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-CÁLCULO PD Bajo E Moderado E Alto E TOTAL A 49 (55) 30 (26) 21 (19) 100 B 67 (55) 21 (26) 12 (19) 100 C 49 (55) 27 (26) 24(19) 100 TOTAL165 78 57 300 E = 100 E = 55 165 300 c2 = å(49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65 gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4 Crítico: c20.05 = 9,49. SE RECHAZA HO

  18. Chi-Square Table

  19. Chi - cuadrado (c2) c2 = å(O - E)2/E (Chi cuadrado de Pearson) c2 = å(|O - E|2 - 1/2) / E Corrección de Yates Corrección de Yates: para tablas 2x2, con muestras pequeñas (en una celda existen menos de 5 observaciones). Tamaño de muestra: n de celdas x 10. Ej: 2 x 2 = 4 x 10 = 40 Ej. Ant: 3x3 = 9 x 10 = 90

  20. Áreas bajo la curva

  21. Distribución de Chi-Cuadrado • Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores. • Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula. • Eje Y es el número de veces que se obtiene el valor de chi-cuadrado.

  22. ODDS RATIO • Proporciona: • Estimado de la relación entre dos variables binarias (si / no) • Permite examinar los efectos de otras variables en dicha relación • Forma especial y conveniente de interpretación en estudios caso-control

  23. “The odds that a single throw of a die will produce a six are 1 to 5, or 1/5”. • “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”. Bland y Altman. The odds ratio, BMJ 320;1468, 2000

  24. Razón de desigualdad (Odd ratio) OR = 5,559 IC 95% : 3,00 a 10,29 Si No 75 (a) 34 (b) Si No 63 (d) 25 (c)

  25. Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns) si no Total Si 75.000 34.000 109.000 No 25.000 63.000 88.000 Total 100.000 97.000 197.000 Test statistic Value df Prob Pearson Chi-square 31.793 1.000 0.000 Yates corrected Chi-square 30.197 1.000 0.000 Coefficient Value Asymptotic Std Error Odds Ratio 5.559 Ln(Odds) 1.715 0.314 OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314

  26. Riesgo Relativo • Relación de frecuencias de dos categorías. O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2. • OR = (A/C) / (B/D) • >1: personas con factor de riesgo tienen más probabilidad que presenten el evento. • <1: personas con factor de riesgo son menos probable que experimenten el evento.

  27. Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 10 40 50 > 20 a. 15 135 150 Total 25 175 200 Existe asociación entre niños de bajo peso al nacer y edad de la madre?

  28. Odds ratio (es solamente para estudios caso-control, variables nominales, tablas 2x2)(similar a riesgo relativo) • Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento. • Si OR <1: hay una asociación negativa, (presencia del factor disminuye la probabilidad de encontrar el evento.

  29. Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 10 40 50 > 20 a. 15 135 150 Total 25 175 200 n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2 c2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175

  30. Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. n11 n12 n1. > 20 a. n21 n22 n2. Total n.1 n.2 n.. n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2 c2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175

  31. Proporciones(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 0,050 0,200 0,25 > 20 a. 0,075 0,675 0,75 Total 0,125 0,875 1,00

  32. Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. 20 80 100 > 20 a. 30 270 300 Total 50 350 400 Existe asociación entre niños de bajo peso al nacer y edad de la madre?

  33. Sensibilidad: proporción de positivos que son correctamente identificados por el test. • Especificidad: proporción de negativos que son correctamente identificados por el test

  34. Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnóstico ENFERMEDAD SI NO (a) Verdad + 45 (b) Falso + 10 SI TEST (c) Falso – 5 (d) Verdad - 40 NO N = 100 Sensibilidad = a / a + c = 45 / 50 = 0,90 Especificidad = d / b + d = 40 / 50 = 0,80 VPP = a / a + b = 45 / 55 = 0,82 VPN = d / c + d = 40 / 45 = 0,89

  35. Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnósticoTomado de Kramer, 1988 ENFERMEDAD SI NO (a) Verdad + 9 (b) Falso + 18 SI TEST (c) Falso – 1 (d) Verdad - 72 NO N = 100 Sensibilidad = a / a + c = 9 / 10 = 0,90 Especificidad = d / b + d = 72 / 90 = 0,80 VPP = a / a + b = 9 / 27 = 0,33 VPN = d / c + d = 72 / 73 = 0,99

  36. Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados. • Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados.

  37. Tests no paramétricos para dos o más muestras Equivalente a test t pareado: Wilcoxon Equivalente a test t no pareado: Mann-Whitney Equivalente a ANOVA: Kruskal Wallis Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal

  38. Test U de Mann-Whitney • Colocar rangos a las observaciones en orden de menor a mayor

  39. Test de Mann-Whitney Producción de orina diaria mL/día. Placebo Rango Droga Rango ------------------------------------------------------------------------ 1000 1 1400 6 1380 5 1600 7 1200 3 1180 2 1220 4 T= 9 19 -------------------------------------------------------------------------- Mann-Whitney U= 3, p = 0.289

  40. Test de Tukey-Duckworth • Cálculos se pueden hacer en la cabeza • Existe solamente un requisito que cumplir: 4 ≤ n1 ≤ n2 ≤ 30 • Ho: Las muestras son idénticas • Ha: Las muestras son diferentes • El test estadístico a calcular es C

  41. Test de Tukey-Duckworth • Existen solamente dos valores críticos: C0,05 = 7 C0,01 = 10

  42. Test de Tukey-DuckworthProcedimiento 1. Determine medición más grande y más pequeña en cada muestra ranqueada. 2. En la muestra que contiene el valor más grande de todos los valores combinados, cuente todos los valores que son mayores que la medición más grande en el otro grupo.

  43. 3. En la otra muestra, cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición. 4. Sume ambas cantidades (= C).

  44. Valores de exclusión Ccalc = 4 + 3 = 7 C0,05 = 7 Ccalc ≥ C0,05 por lo tanto se rechaza Ho. Conclusión: las muestras son diferentes

  45. Kruskal-Wallis • Equivalente a Anova • Extensión del test de Mann-Whitney a más de dos grupos • Al conjunto de observaciones (N) se les da rango (1 a N), indiferente de qué grupo estén, y para cada grupo se calcula la suma de rangos, y posteriormente se calcula H, definido por

  46. Donde R es el promedio de todos los rangos, y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones. Para calcular es más fácil:

  47. % de reducción de cefalea en tres grupos (Fentress et al, 1986)(Rangos en paréntesis) Relajación y biofeedback Relajación No tratados 62 (11) 69 (10) 50 (12) 74 ( 8,5) 43 (13) -120 (17) 86 ( 7) 100 ( 2) 100 ( 2) 74 ( 8,5) 94 ( 5) -288 (18) 91 ( 6) 100 ( 2) 4 (15) 37 (14) 98 ( 4) -76 (16) • rango 55 36 80 Rango medio 9,17 6,00 13,33

More Related