1.01k likes | 2.36k Views
Análisis de supervivencia. Albert Sorribas Grup de Bioestadística I Biomatemàtica Departament de Ciències Mèdiques Bàsiques Universitat de Lleida. Esquema general. Introducción al análisis de supervivencia Tipos de estudios El concepto de censura La curva de supervivencia
E N D
Análisis de supervivencia Albert SorribasGrup de Bioestadística I Biomatemàtica Departament de Ciències Mèdiques Bàsiques Universitat de Lleida
Esquema general • Introducción al análisis de supervivencia • Tipos de estudios • El concepto de censura • La curva de supervivencia • Concepto y modelos paramétricos • Concepto de función de riesgo (hazard function) • Estimación (Kaplan-Meier) • Comparación de curvas de supervivencia • Interpretación de resultados • Ejemplos de análisis utilizando el SPSS
Datos de supervivencia • Tiempo hasta que se presenta un determinado suceso (muerte, recidiva, etc.) • En muchos casos, no disponemos de información completa (pérdida de seguimientos, el suceso no se ha presentado en algunos pacientes al final del estudio). • En casos extremos, no disponemos de un tiempo de inicio claro.
Caso especial de controles en determinados instantes de tiempo
Algo de terminología • Dato censurado (censored): • Siguen sin presentar el suceso al final del estudio • La causa es previa (en el tiempo) al tiempo de inicio del estudio (p.e.contagio con HIV) • Perdida de seguimiento (lost to follow-up) • No se dispone de datos más allá de un determinado tiempo. • Han muerto antes de presentar el suceso de interés.
¿Cómo podemos estudiar este tipo de problemas? • Estimar una función que permita establecer la probabilidad del suceso en función del tiempo • Establecer factores de riesgo respecto a un mejor o peor pronóstico de supervivencia • Comparar la supervivencia de distintos grupos
La función de supervivencia • La función de supervivencia es la probabilidad de que el suceso de interés se presente después de un cierto tiempo. Es decir:
Propiedades de la función de supervivencia • La función de supervivencia es complementaria con la función de distribución • Cumple:
Ejemplos sencillos de función de supervivencia • Exponencial • Weibull • En general, esta función se desconoce y debe estimarse a partir de los datos
Función de riesgo(Hazard function) • La función de riesgo se define como: • En el caso continuo, se cumple:
Función de riesgo(Hazard function) • La función de riesgo puede interpretarse como la probabilidad de que se presente el suceso el siguiente instante de tiempo • Si la función de riesgo es constante (caso del modelo exponencial) la probabilidad es independiente del tiempo • En muchos problemas reales, esta probabilidad varía con el tiempo
Riesgo acumulado • El riesgo acumulado hasta un instante determinado se calcula como:
Ejemplo: función de supervivencia exponencial • En la función de supervivencia exponencial, se cumple:
Estimación de la función de supervivencia (Caso paramétrico) • Conocemos la función de supervivencia • Expresar la función de verosimilitud • Obtener los estimadores máximo-verosímiles • Calcular sus varianzas
Ejemplo: el modelo exponencial(datos no censurados) Matriz de información (estimación de la varianza de los parámetros)
Ejemplo: el modelo exponencial(censura tipo I) Matriz de información (estimación de la varianza de los parámetros)
Estimación no-paramétrica(Método de Kaplan-Meier) • Desconocemos la función de supervivencia • Realizamos una estimación a partir de los datos • Algunas definiciones:
Estimación no-paramétrica(Método de Kaplan-Meier) • El estimador de Kaplan-Meier se define como:
El método de Kaplan-Meier en SPSS Survival Analysis for TIEMPO Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1 Suceso ,9000 ,0949 1 9 2 Suceso 2 8 2 Suceso ,7000 ,1449 3 7 5 Censurado o perdido 3 6 7 Censurado o perdido 3 5 8 Suceso ,5600 ,1706 4 4 9 Censurado o perdido 4 3 11 Suceso ,3733 ,1902 5 2 12 Suceso ,1867 ,1627 6 1 14 Censurado o perdido 6 0 Number of Cases: 10 Censored: 4 ( 40,00%) Events: 6 Survival Time Standard Error 95% Confidence Interval Mean: 9 2 ( 5; 12 ) (Limited to 14 ) Median: 11 3 ( 5; 17 )
Comparación de curvas de supervivencia • Evaluar si la supervivencia observada permite concluir que los dos grupos tienen la misma curva de supervivencia • Ejemplo: • Grupo 1: 1 2 4+ 7 10+ 11+ • Grupo 2: 1 3+ 5 7 8 10+
Comparación de curvas de supervivencia Survival Analysis for TIEMPO Factor GRUPO = 1 Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1 Suceso ,8333 ,1521 1 5 2 Suceso ,6667 ,1925 2 4 4 Censurado o perdido 2 3 7 Suceso ,4444 ,2222 3 2 10 Censurado o perdido 3 1 11 Censurado o perdido 3 0 Number of Cases: 6 Censored: 3 ( 50,00%) Events: 3 Survival Time Standard Error 95% Confidence Interval Mean: 7 2 ( 4; 10 ) (Limited to 11 ) Median: 7 5 ( 0; 17 ) Survival Analysis for TIEMPO Factor GRUPO = 2 Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 1 Suceso ,8333 ,1521 1 5 3 Censurado o perdido 1 4 5 Suceso ,6250 ,2135 2 3 7 Suceso ,4167 ,2218 3 2 8 Suceso ,2083 ,1844 4 1 10 Censurado o perdido 4 0 Number of Cases: 6 Censored: 2 ( 33,33%) Events: 4 Survival Time Standard Error 95% Confidence Interval Mean: 6 1 ( 4; 9 ) (Limited to 10 ) Median: 7 2 ( 3; 11 )
Comparación de curvas de supervivencia Survival Analysis for TIEMPO Total Number Number Percent Events Censored Censored GRUPO 1 6 3 3 50,00 GRUPO 2 6 4 2 33,33 Overall 12 7 5 41,67 Test Statistics for Equality of Survival Distributions for GRUPO Statistic df Significance Log Rank ,11 1 ,7347 Breslow ,00 1 1,0000 Tarone-Ware ,02 1 ,8785
Procedimiento multivariantes • Regresión de Cox • Considerar el efecto de otras variables en la supervivencia • Seleccionar las variables más importantes • Comparar grupos • Interpretar factores de riesgo
Fundamentos de la regresión de Cox (modelo de riesgos proporcionales)
Selección de variables • El único factor significativo es el GRUPO
Estimación de curvas de supervivencia para determinados valores de las covariantes Supervivencia en los valoresmedios de las variables
Ejemplo • Hosmer & Lemeshow (1999) Applied survival analysis.Wiley Series in Probability and Statistics
Objetivos (1) • Usando el método de Kaplan-Meier • Estudiar la supervivencia en función de la historia previa de uso de drogas IV. • Estudiar la supervivencia en función de la edad en el momento del inicio del estudio • Evaluar si existe una tendencia en la supervivencia en función de la edad
Drug=0 Drug=1 Supervivencia en función de la historia previa de uso de drogas IV Test Statistics for Equality of Survival Distributions for DRUG Statistic df Significance Log Rank 11,86 1 ,0006 Breslow 10,91 1 ,0010 Tarone-Ware 12,34 1 ,0004
Supervivencia en función del grupo de edad 20-29 años 40-54 años Test Statistics for Equality of Survival Distributions for GAGE Statistic df Significance Log Rank 19,91 3 ,0002 Breslow 14,14 3 ,0027 Tarone-Ware 16,96 3 ,0007
Supervivencia en función del grupo de edadTest de tendencia Tendencia enfunción de los puntos medios de los grupos de edad
Supervivencia en función del grupo de edadTest de tendencia Tendencia enfunción de los puntos medios de los grupos de edad Test Statistics for Equality of Survival Distributions for GAGE with Trend, metric = ( 25, 32,50, 37,50, 47,50 ) Statistic df Significance Log Rank 19,07 1 ,0000 Breslow 14,08 1 ,0002 Tarone-Ware 16,67 1 ,0000 Podemos concluir queexiste una tendencia enla supervivencia en funciónde la edad. Esta tendencia es inversamente proporcionala la edad.
Objetivos (2) • Utilizando la regresión de Cox • Evaluar el efecto de la edad en la supervivencia • Evaluar el efecto conjunto de la edad, el uso de drogas IV y su posible interacción • Selecionar qué modelo es más adecuado
Efecto de la edad La edad puede considerarsecomo un factor de riesgo
Efecto conjunto de la edad y del uso de drogas IV Tanto la edad como el uso de drogas IV son factores de riesgo