250 likes | 469 Views
Curso de Bioestadística Parte 14 Análisis de datos binarios pareados. Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México. Presentación.
E N D
Curso de BioestadísticaParte 14Análisis de datos binarios pareados Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México
Presentación • Médico Cirujano por la Universidad Autónoma de Guadalajara. • Pediatra por el Consejo Mexicano de Certificación en Pediatría. • Diplomado en Epidemiología, Escuela de Higiene y Medicina Tropical de Londres, Universidad de Londres. • Master en Ciencias con enfoque en Epidemiología, Atlantic International University. • Doctorado en Ciencias con enfoque en Epidemiología, Atlantic International University. • Profesor Asociado B, Facultad de Enfermería y Obstetricia de Celaya, Universidad de Guanajuato. • padillawarm@gmail.com
Competencias • Conocerá como mostrar datos binarios pareados. • Aplicará prueba de hipótesis para datos binarios pareados – Chi cuadrada de McNemar. • Calculará el intervalo de confianza para datos binarios pareados. • Obtendrá Razón de Momios e intervalos de confianza para estudios de casos y controles pareados.
Introducción • En las partes 12 y 13 conocimos los métodos para comparar dos proporciones estimadas de muestras independientes. • Si las observaciones en un estudio no son independientes, necesitamos usar métodos diferentes. • Con frecuencia usamos dos tipos de estudios que dan lugar a observaciones que no son independientes: • Observaciones repetidas en el mismo individuo • Estudios casos y controles pareados
Ejemplo • Tuberculosis puede ser diagnosticada por sembrar medios de cultivo y observando si Mycobacterium tuberculosis crece. • En un experimento para comparar dos medios de cultivo para el diagnóstico de tuberculosis, muestras de esputo de 100 pacientes con tuberculosis fueron sembrados en los dos medios. • La mitad de la muestra fue sembrada en el medio A y la otra mitad en el medio B.
Ejemplo • En un estudio en Nueva Zelanda, para examinar la relación entre cáncer de mama y el uso de anticonceptivos orales, mujeres con cáncer de mama fueron pareadas a mujeres de edad similar quienes no tenían cáncer de mama, seleccionadas de los registros electorales. • Esto es un ejemplo de un estudio de casos-controles donde cada individuo con cáncer de mama es pareado con un individuo sin la enfermedad pero de edad similar, para controlar el efecto potencial confusor de edad.
Mostrando datos categóricos pareados • Usar las pruebas de z o de Chi cuadrada para datos pareados sería algo erróneo, ya que no tomaríamos en cuenta la naturaleza pareada de los datos.
Mostrando datos categóricos pareados • El experimento comparó la capacidad de cada medio de cultivo para detectar Mycobacterium tuberculosis. • Los resultados fueron positivos (+) o negativos (-). • Estamos interesados en comparar los especimenes encontrados positivos por los dos medios de cultivo. • La tabla resume los resultados.
Mostrando datos categóricos pareados • De esto, ¿piensas que el medio A es mejor que el B para detectar el bacilo tuberculoso? • Para hacer un análisis adecuado, necesitamos comparar los resultados con los dos medios en cada sujeto. • Hay cuatro combinaciones de resultados que podrían ocurrir en cada sujeto.
Mostrando datos categóricos pareados • Para comparar los resultados en cada sujeto, necesitamos contar cuantas veces ocurre cada combinación. • Una forma fácil de mostrar los valores es tabular los resultados de una muestra contra la otra.
Mostrando datos categóricos pareados • Los pares que son del mismo resultado son pares concordantes, y estos no dan información acerca de cual medio es mejor en detectar el bacilo tuberculoso. • De los restantes los resultados fueron diferentes entre los dos medios: • 24 fueron positivos para el medio A y negativos para el B. • 4 fueron negativos para el A y positivos para el B. • Las pares cuyos resultados fueron diferentes entre ambos medios, se llaman pares discordantes.
Prueba de hipótesis para datos binarios pareados • Si no hubiera diferencia entre los medios, deberíamos esperar número similares de r y s, o sea r ≈ s • Podemos usar una prueba llamada McNemar para evaluar si la diferencia entre los números de los pares discordantes es mayor de lo que esperaríamos por azar. • Para probar la hipótesis nula de que no hay diferencia entre las dos proporciones , usamos la prueba de McNemar: (|r-s|-1)2 X2pareada= --------------- r + s • Restando 1 nos permite una corrección continua.
Prueba de hipótesis para datos binarios pareados • Para el estudio de los medios de cultivo del bacilo tuberculoso: • 24 fueron positivos para el medio A y negativos para el medio B • 4 fueron negativos para el medio A y positivos para el medio B (|r-s|-1)2 (|24-4|-1)2 361 X2pareada= -------------= --------------- = -------- = 12.81 p<0.05 r + s 24 + 4 28 • Rechazamos la hipótesis nula de no diferencia entre los medios de cultivo.
Intervalos de confianza para la diferencia de dos proporciones pareadas • Sabemos que la diferencia entre proporciones de datos pareados puede ser calculada por: r – s / N Donde: • r y s son los números de pares discordantes • N es el total de pares • El error estándar de la diferencia entre proporciones pareadas es: √r +s ES(p1-p2) = ----------- N
Intervalos de confianza para la diferencia de dos proporciones pareadas • La fórmula general para calcular los intervalos de confianza al 95% es: • Estimado ± 1.96 x ES • De la tabla de las pruebas de esputo con dos medios de cultivo, A y B. Usando los valores de r y s, podemos calcular el intervalo de confianza al 95% para la diferencia en proporciones pareadas: • r-s / N ± √r +s/N = 24-4/100±1.96 √24+4/100 = 0.2±0.10 = 0.1 a 0.3 = 10% a 30%- • El intervalo de confianza de 0.1 a 0.3 significa que el porcentaje de cultivos positivos al bacilo de la tuberculosis podría estar entre 10% y 30% más alto con el medio A que con el medio B.
Razón de momios para datos pareados • En estudios de casos y controles, usualmente queremos evaluar el riesgo asociado con la exposición a un factor de riesgo; para estos estudios necesitamos una medida de efecto en lugar de una medida de cambio. • En estudios de casos y controles usamos la RM, que es la razón de las probabilidades de la exposición entre los casos entre la probabilidad de exposición en los controles. • El cálculo de la RM con datos pareados está basado en los pares discordantes, igual que la diferencia entre proporciones de datos pareados.
Razón de momios para datos pareados • Tabla de exposición en casos contra exposición en controles Controles Casos Expuestos No expuestos Expuestos k r No expuestos s m • k = número de parejas donde el caso y el control estuvieron expuestos • r = número de parejas donde el caso estuvo expuesto y el control no • s = número de parejas donde el caso no estuvo expuesto y el control si. • m = número de parejas donde los casos y controles no estuvieron expuestos.
Razón de momios para datos pareados • La razón de momios (RM) es calculada como la razón de los dos grupos de pares discordantes. r casos expuestos controles no expuestos RM = ---- = ------------------------------------------------- s casos no expuestos controles expuestos
Razón de momios para datos pareados • La tabla muestra los resultados de un estudio de casos-controles pareados, diseñado para investigar la asociación entre el uso de anticonceptivos orales (ACO) y tromboembolismo. Controles Casos Uso ACO No uso ACO Uso ACO 10 57 NO uso ACO 13 95
Intervalo de confianza para RM pareada • El cálculo del intervalo de confianza es un poco más complicado. • Se calcula usando la raíz cuadrada del valor de X2 de la prueba de McNemar, en lugar del error estándar. • Intervalo de confianza al 95% para RM de datos pareados es: • RM1±1.96/ X
Razón de momios para datos pareados • RM = 4.4 • X²pareada = 26.41 • Xpareada = 5.14 • Entonces el intervalo de confianza al 95% es: • De 4.41-1.96/ 5.14 a 4.41+1.96/ 5.14 • 4.40.62 a 4.41.38 • 2.5 a 7.7
Bibliografía • 1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173. • 2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4. • 3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.