1.06k likes | 1.89k Views
ANALISIS DE REGRESION. MAESTRIA EN CIENCIAS MEDICAS Alumna: Laura Laue Noguera. SINERGISMO. Interacción positiva en donde la combinación de los efectos de 2 ó más variables es mayor que los efectos separados de cada variable. Existen 2 modelos: Modelo aditivo
E N D
ANALISIS DE REGRESION MAESTRIA EN CIENCIAS MEDICAS Alumna: Laura Laue Noguera
SINERGISMO Interacción positiva en donde la combinación de los efectos de 2 ó más variables es mayor que los efectos separados de cada variable. Existen 2 modelos: • Modelo aditivo • Modelo multiplicativo
Modelo Aditivo Efectos medidos como suma de tasas. Si hay sinergismo Significativo para: • magnitud absoluta de un problema de salud pública • riesgo individual - Riesgo en hombres = 9.3 por 100,000 - Riesgo en raza blanca = 2.5 por 100,000 - Sinergismo: 9.3 + 2.5 = 11.8
Modelo Multiplicativo Efectos medidos como multiplicación de razones. Tiene implicaciones etiológicas. No hay sinergismo. • Riesgo en hombres = 5.9 • Riesgo en raza blanca = 2.3 • Sinergismo: 5.9 x 2.3 = 13.6
Pregunta ¿La asociación entre uso de anticonceptivos orales e infarto del miocardio, es confundida por la edad? RO = 1.7 IC 95% = 1.1 – 2.8 P = 0.011
Respuesta La diferencia entre los hallazgos basados en los datos crudos y los estratificados por edad, son evidencia de que la edad es un confusor.
Pregunta ¿La asociación anticonceptivos orales-infarto es modificada por la edad?
Respuesta Si, la asociación es modificada por la edad dado que los odds son distintos en los diferentes grupos de edad. Variaciones de la muestra ??? Prueba de heterogeneidad: P = 0.17 No hay heterogeneidad significativa.
Pregunta ¿Puedes sugerir alguna prueba para obtener una razón de odds que anule la confusión por la edad?
Respuesta Combinar los odds de estratos específicos para obtener un promedio 4 (2.4 – 6.7) que no se ve afectado por la confusión de la edad. • Mantel – Haenszel
Estratificación • La estratificación de variables también se usa para controlar el efecto confusor. • Los datos pueden ser estratificados por 2 o más variables.
TIPOS DE REGRESION El entendimiento de los procesos multivariados es esencial para su uso inteligente. Existen 3 tipos: • Análisis de Regresión Lineal • Análisis de Regresión Logística • Análisis de Regresión del Riesgo Proporcional
ANALISIS MULTIVARIADOS Evalúa un set de variables en relación con una variable dependiente, utilizando un modelo matemático (aditivo o multiplicativo) que representa el proceso en estudio. Tiene 2 propósitos: • Evaluar la fuerza y significancia de la relación entre un set de variables y la variable dependiente • Hacer predicciones de riesgo
ECUACION DE REGRESION Y = a + b1X1 + b2X2 + …… + bkXk X1 = primer variable independiente b1 = primer coeficiente de regresión k = número de variables independientes
INTERPRETACION DE LA ECUACION Los autores estudian la forma en que el género, la edad y el grupo étnico afectan la relación entre el IMC y el porcentaje de grasa corporal (variable dependiente) .
REGRESION MULTIPLE Método ideal para controlar diferencias basales y variables de confusión. Similar a la regresión simple pero con 2 o más variables independientes bajo estudio. Las variables dependientes e independientes deben ser numéricas. Las variables nominales deben ser convertidas mediante un código.
REGRESIÓN LINEAL Y = variable ……………. Y* = valor de predicción X = variable ……………. X* = valor dado de X a = punto de …………. b = ……….. de la línea e = error
REGRESION LINEAL MÚLTIPLE Método de elección cuando la pregunta de investigación predice el valor de una variable de respuesta. Y = a + b1X1 + …… bkXk Y = variable dependiente Y’ = valor predicho X = variable independiente a = punto de intersección b = coeficiente de regresión
Regresión lineal múltiple Se basa en el modelo aditivo. La variable dependiente tiene escala métrica. Mide el cambio promedio en Y por unidad de cambio en X. Calcula Y.
REGRESIÓN LOGÍSTICA MÚLTIPLE Modelo multiplicativo respecto al odds, aditivo respecto a log odds. Suma de logaritmos de números = multiplicación de los números. Log odds de enfermedad = a + b1X1 + ….. bkXk Pr enf. = 1/{1 + exp[-(log odds de la enf.)]}
Regresión logística múltiple • La variable de interés es dicotómica • Los valores de X pueden ser categóricos o métricos • Si la variable tiene más de 2 categorías: una es la categoría de referencia y las otras son variables fantasmas
Regresión logística múltiple • Cambio de odds de la enfermedad cuando hay un cambio de una unidad en la variable independiente • Calcula el log de odds y la probabilidad de la enfermedad
REGRESION DEL RIESGO PROPORCIONAL: COX Modelo aditivo respecto al log del riesgo y multiplicativo respecto al riesgo. Relacionada con sobrevida. Utiliza datos evento-tiempo. Sobrevida se mantiene constante en el tiempo. Log riesgo = log(a) + b1X1 + …… bkXk Pr sobrevida = exp {- exp[log (Ht) + biXi + bkXk
Regresión del riesgo proporcional • Ht = riesgo acumulado en función del tiempo • Cambio en el riesgo de un evento cuando hay un cambio de una unidad en la variable independiente • Calcula el log del riesgo y la probabilidad de sobrevida • Similar a Kaplan-Meier, excepto por el ajuste de efecto de otras variables
Regresión de riesgo proporcional Para evaluar la conveniencia del modelo: • Graficar • Comparar las curvas log-menos-log • La conveniencia del modelo es cuestionada si las curvas no son paralelas
VALIDEZ DE MODELOS • Probándolo en varias muestras • Coeficiente de correlación múltiple al cuadrado (R2) • Goodness-of-fit-test • Razón de probabilidad de Chi cuadrada
Análisis de regresión logística:anticonceptivos orales e infarto
Pregunta Explique el resultado de 8.47 de la tabla. ¿Sabes como se obtuvo?
Respuesta 8.47 es el OR de las mujeres que fuman 25 cigarrillos/día, comparado con las que no fuman, manteniendo constantes las otras variables. Se obtiene por el exponencial del coeficiente 2.137, e 2.137 = 8.47
Pregunta ¿Qué asociación con infarto es más fuerte, edad o anticonceptivos orales?
Respuesta El coeficiente y OR para edad expresa el efecto de 1 año de diferencia en la edad, cuando las otras variables permanecen sin cambio. Para una diferencia de 20 años: 0.152 X 20 = 3.04 (ln de 20.9) El valor P no es para medir fuerza de asociación.
Pregunta Los resultados de la tabla ¿señalan que la asociación anticonceptivos – infarto es confundida por el tabaquismo? ¿Qué información necesitas?
Respuesta Para saber si la asociación anticonceptivos infarto está confundida por el tabaquismo, comparar los hallazgos con los de otro análisis en el que el tabaquismo no esté controlado o sea excluido.
Pregunta Los resultados ¿señalan que la asociación anticonceptivos-infarto está modificada por el tabaquismo? La tabla no dice nada sobre modificación de efecto.
Pregunta Acorde a los resultados de la tabla, ¿cuál es el OR a favor de infarto, cuando las mujeres usan anticonceptivos orales y fuman 25 cigarros al día, en relación con las que no fuman?
Respuesta El modelo logístico múltiple es multiplicativo: OR para uso de anticonceptivos = 3.28 OR para tabaquismo = 8.47 3.28 X 8.47 = 27.8
OR de la asociación anticonceptivos orales – infarto: 3 modelos de regresión logística
Pregunta ¿Qué procedimiento se utiliza para obtener estos datos? Compare esta tabla con la de Mantel-Haenszel
Respuesta • Diferentes modelos logísticos pueden proveer diferentes razones de odds; OR expresa la fuerza de asociación después de controlar los efectos de las otras variables del modelo. • La adición de nuevas variables puede cambiar los resultados. • Los OR de la tabla anterior son similares a los de M-H: 4 controlado solo por edad, 3.3 controlado por edad y tabaquismo.
OR ajustados por edad. Asociación anticonceptivos – infarto por uso de anticonceptivos y tabaquismo: modelo de no interacción y de interacción
Conclusión de Autores • El efecto combinado de anticonceptivos y tabaquismo fue mayor que el encontrado por los efectos separados de estos factores. • Importante incremento de casos de infarto por el efecto del tabaquismo sobre el uso de anticonceptivos.
Pregunta ¿Los resultados del análisis logístico múltiple, corroboran esta conclusión?
Respuesta • El modelo y las interacciones muestran un efecto sinergista, sin embargo, los términos de interacción no son estadísticamente significativos. • Se sugiere que la interpretación se base en el modelo de no interacción, dado que el de interacción indica que los anticonceptivos incrementan el riesgo de infarto en no y grandes fumadores, pero no en moderados. Esto es imposible.
OR relación baja clase social y bajo nivel educativo con obesidad: 4 modelos de regresión logística
Pregunta Relación clase social y educación (dicotómicas: alta y baja) con obesidad. El 90 % de gente con baja categoría en una variable, tuvo también baja en la otra. Lo mismo ocurrió en 90% de los de categoría alta. ¿Cómo pueden explicarse las diferencias?
Respuesta • La fuerza de asociación de un modelo de regresión logística puede variar cuando el modelo es cambiado • La asociación con clase social y educación es débil (OR cercana a 1) cuando las variables fueron incluidas
Análisis de regresión logística: anticonceptivos orales e infarto miocárdico
Pregunta ¿Sabes como calcularon el riesgo de tener infarto en los siguientes 10 años, para una mujer de 30 años que usa anticonceptivos y fuma 30 cigarros al día? ¿Cómo evalúa la validez del modelo como predictor de riesgo?
Respuesta • Log odds a favor de infarto: - 9.283 + (1.188 x 1) + (0.152 x 30) + (1.125 x 0) + 2.137 x 1) = 1.398 • Riesgo de la enfermedad: 1/[1 + exp(1.398) = 1/(1 + 4.047) = 0.198 ó 19.8% • La validez del modelo se obtiene aplicándolo a otras muestras. También podemos utilizar chi cuadrada.
Riesgo logístico múltiple: datos predichos y observados. Incidencia de diabetes