1 / 25

Courbes de survie

Courbes de survie. C1 Statistiques. Définitions. Pour chaque sujet il faut connaître : La date de début d’observation (c’est la date d’origine), la date des dernières nouvelles et l’état aux dernières nouvelles. A partir de ces éléments on calcule :

val
Download Presentation

Courbes de survie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Courbes de survie C1 Statistiques

  2. Définitions • Pour chaque sujet il faut connaître : • La date de début d’observation (c’est la date d’origine), la date des dernières nouvelles et l’état aux dernières nouvelles. • A partir de ces éléments on calcule : • Le temps de participation, le recul et la durée de surveillance. • Date d’origine : • Date qui définit pour chaque sujet le temps 0. Exple : Date d’inclusion dans un essai, date de diagnostic de la première métastase. • Date de dernière nouvelles : • Au moment de l’analyse, il faut disposer pour chaque sujet de la date des dernières nouvelles. Si le sujet est décédé la date des dernière nouvelles est le décès • Durée de surveillance : • Date des dernière nouvelle – Date d’origine • Date de Point • Date au delà de laquelle on ne tiendra pas compte des informations et pour laquelle on cherchera à connaître l’état de chaque sujet.

  3. Définitions • Temps de participation : • Si les dernière nouvelles sont antérieures à la date de point ti = D. Dernière nouvelle – D. Origine. Si le sujet n’est pas décédé, il sera considéré comme perdu de vue à la date de point. • Si les dernières nouvelles sont postérieures à la date de point, ti = D. de Point – D. Origine. • Si la date de point est la date de l’analyse, le temps de participation est égal à la durée de surveillance

  4. Définitions • Perdu de vue • Sujet dont on ne connaît pas l’état à la date de point (sujet 4) • Attention c’est une source de biais importants • Exclu-vivant : • Un sujet vivant à la date de point (sujet 1 et 2) • Les perdus de vue et les exclus vivants correspondent à des données censurées • Recul : • D. de Point – D. Origine : c’est le délai maximum potentiel d’observation du sujet

  5. Distributions de survie • Fonction de survie : • La variable durée de vie T (D. du Décès – D. Origine) est une variable aléatoire non négative. • C’est une variable aléatoire continue : la probabilité de décès à chaque instant t est infiniment petite. Cette hypothèse n’est pas toujours vérifiée : par exemple dans une étude mettant en œuvre une intervention chirurgicale, il y a risque de décès opératoire, dans ce cas d’autre modèle peuvent être utilisé. • Densité de probabilité de durée de survie: f(t) =lim [ prob (t < T< (t+dt) ] / dt dt ->0 • Fonction de répartition : • S(t) • On s’intéresse à la probabilité de survie ad delà de t: c’est la fonction de survie • S(t) = Prob( T> t) = 1 –F(t) • Fonction monotone décroissante continue telle que S(0) =1 Lim (S(t) = 0 quand t-> infini

  6. Risque instantané de décès • Cette fonction s’appelle aussi force de mortalité ou fonction de risque • Propriétés • On a donc • Fonction de risque cumulée • Et

  7. Risque instantané de décès • La fonction de risque h(t) fournit la description la plus concrète d’une distribution de survie. • Courbe a : risque instantané constant, il n’y a pas de vieillissement (plage 10 à 15 ans) • Courbe b : le risque instantané augmente avec l’âge, il y a vieillissement • Courbe c : diminution du risque instantané avec l’âge (plage de 0 à 1 an)

  8. Comparaison de courbes de survies • Probabilités conditionnelles et indépendance • L'événement A est dit indépendant de B si la probabilité de voir se réaliser A ne dépend pas de la réalisation ou de la non réalisation de B. • P(A/B) = P(A/non B) = P(A) • Si, et seulement si, A et B sont indépendants, on a : • P(A et B) = P(A) * P(B) • Application à la survie Kaplan -Meier • Soit les événements Morts-Vivants • P(Vivant) = 1 - P(Mort) • Être vivant au jour J+1 c’est ne pas être mort au jour 0, 1,…J, J+1. Donc la probabilité d'être vivant au jour J et au jour J+1 est égale au produit des probabilités d'être vivant au jour 0 et jour 1 et… et au jour J+1.

  9. Courbe de survie • Tableau des valeurs Jour Exposés DCD PDV P(DCD) P(Viv.) Pcum(Viv) 0 100 0 0 0 1 1 1 100 3 0 0,03 0,97 1*0,97 6 97 2 0 2/97 =0,0206 0,9794 0,97* 0,9794 = 0,95002 7 95 0 3 0 1 0,95002 10 92 … … … … … • Jour = délai en jours entre l'entrée dans l'étude et la survenue de l'événement. • Exposés = nombre de personnes exposées au risque au jour j • DCD = Nombre de décès (événements) constatés au jour J • PDV = Nombre de perdus de vue au jour J • P(DCD) = probabilité de mourir au jour J (Nombre de décès parmi les exposés au jour j) • P(Viv) = Probabilité au jour j d'être en vie = 1-P(DCD) • Pcum(Viv) = Probabilité cumulée de survie au jour J = Probabilité d'être en vie au jour J0 et J1 … et Jn.

  10. Estimation de l’intervalle de confiance de la survie • Méthode de Greenwood • Faire le calcul pour J6 avec alpha = 0,05 • Epsilon 5% = 1,96

  11. Comparaison de courbes de survies • Position du problème • On désire comparer l'évolution de 2 groupes de sujets. • Pour cela, on pourrait comparer les pourcentages de décès survenant dans chacun de ces groupes; ou encore comparer les taux de survie à un instant donné. Ces solutions ne permettent pas de tenir compte des moments auxquels les décès se produisent. • Le test qui permet de tenir compte du nombre de décès et de leur délais est le test du Logrank.

  12. Comparaison de courbes de survies • Éléments nécessaires à la comparaison : • Deux tableaux de survie • Jour, • Nombre de sujets soumis au risque juste avant ce jour, • Nombre d'événement ce jour, • Perdus de vue, • Probabilité élémentaire, • Probabilité globale • Principe du test • Si les deux courbes de survie sont identiques, les risques à un moment donné sont les mêmes dans les deux groupes. Ainsi, si au jour 97, 176 sujets sont soumis au risque dans le groupe 1 et 162 dans le groupe 2, le nombre total d'exposés est de 176+162 = 338. Si au jour 97, on a deux décès en tout, le risque élémentaire est de 2/338 soit 0,0059. Sous cette hypothèse, on aurait du obtenir dans le premier groupe 176*0,0059 = 1,04 décès et 2-1,04 = 0,96 dans le second groupe.

  13. Comparaison de courbes de survies • Hypothèses • Hypothèse nulle • Les événements surviennent avec la même fréquence dans les deux groupes et au même moment. • Hypothèses alternatives • Les événements ne surviennent pas avec la même fréquence ou pas au même moment dans les deux groupes • Statistique : Khi 2 • Calcul du total des événements attendus dans un des groupes EA • Par différence EB = Total des événements - Ea • Khi 2 avec DDL = 1 2 • Khi 2 =

  14. Exemple • Groupe 1 • Groupe 2

  15. Exemple • Attendus 2 2 (13 - 8,036) = • Khi 2 = 8,036 * 12,964 21 = 4,97 DDL = 1 Khi 2 > 3,84 Il existe une différence significative entre les 2 groupes au seuil de risque 5%

  16. Méthode actuarielle • Semblable à la méthode Kaplan-Meier mais les intervalles de temps ne sont plus déterminés par la survenue des événements. • La taille des intervalles de temps est fixée a priori : 1 semaine, 1 mois,1 an… • On calcule la probabilité de survie dans chaque intervalle => moins exacte que Kaplan-Meieir. • Le nombre d’exposés dans l’intervalle est le nombre de personne exposée en début d’intervalle moins la moitiés des perdus de vue dans l’intervalle. • Puis les calculs sont identiques.

  17. Modèle de Cox : Approche semi-paramétrique • Modèle multi-variées • Permet la prise en compte simultanée de plusieurs variables pour expliquer la survie sans donner aux fonctions de survie des formes paramétriques précises • Utilité de ce modèle • Ajustement sur des variables pronostiques dans un essai thérapeutique • Identification des associations de variables pertinentes à des fins pronostiques • …. • La variable à expliquer est dichotomique, les variables explicatives peuvent être qualitatives ou quantitatives • Permet d’exprimer le risque instantané de survenue de l’événement en fonction des facteurs explicatifs.

  18. Données • Données usuelles de survie, pour chaque sujet • Date d’origine, Date des dernières nouvelles et État • Les sujets pour lesquels on ne connaît pas l’état à la date de point ou ceux qui ne sont pas « mort » à cette date constituent des données censurées • Les variables explicatives Xj • Sont qualitatives ou quantitatives • La variable T est le délai entre la date d’origine et la date de survenue de l’événement • Le modèle de Cox permet d’exprimer le risque instantané de survenue de l’événement en fonction de l’instant t et des variables Xj

  19. Risque instantané • C’est le produit d’une fonction h0(t) qui ne dépend que du temps et d’une fonction c(b,X) qui n’en dépend pas. • La dépendance est mesurée par le vecteur des coefficients de régression b. • Finalement, le risque instantané s’écrit : l =(t, X1,X2,..) = l0(t) exp(åbjXj) • La relation entre le risque instantané et les covariables est log-linéaire : Lob(l )=log[(t, X1,X2,..)] =log(l0(t) + åbjXj)

  20. Risque instantané • Si par exemple, les variables Xj représentent des facteurs de risqueet si elles sont toutes égales à 0, l 0 (t) est le risque instantané de sujets ne présentant aucun facteur de risque. • La forme del 0 (t) n’étant pas précisée, c’est plutôt l’association entre les variables Xj et la sur venue de l’événement considéré qui est l’intérêt central du modèle. Cela revient à déterminer les coefficientsbj. • Le rapport des risques instantanés de 2 individus dont les caractéristiques respectives sont (X 1 , X2 , ..., Xp ) et (X’ 1 , X’2 , ..., X’p ) est : Ce rapport ne dépend pas du temps. Le modèle est dit à risques proportionnel. C’est un hypothèse importante du modèle de Cox l =(t, X1,X2,..) = exp(åbjXj) l =(t, X’1,X’2,..) = exp(åbjX’j)

  21. Variable X dichotomique b l =(t, 1) = e l =(t, 1) • X prend les valeurs 1 ou 0 selon la présence ou l’absence d’une caractéristique donnée. Le rapport des risques instantané des sujets de la classe 1 par rapport à la classe 0 est : Le coefficient b est le logarithme du risque instantané de la classe 1 par rapport à la classe 0 • De façon générale, les coefficients bj représentent l’effet de la caractéristique Xj et la survenue de l’événement. Si bj =0 la jième caractéristique n’a pas d’influence sur la caractéristique. Si bj est positif et si 2sujets ne différent que par leur jième caractéristique, des valeurs élevée de la jième caractéristique sont associées à un risque instantané plus élevé. Inversement si bj est négatif.

  22. Estimation et test • Le principe pour le modèle de Cox est de n’estimer que les coefficients bj . On ne cherche pas à estimer l0(t). • Les estimateurs des bj sont obtenus par la méthode du maximum de vraisemblance. Plus exactement, seule la partie de la vraisemblance comportant de l’information sur les coefficients bj est retenue pour les calculs. On parle de vraisemblance de Cox. • On teste l’hypothèse H0 que le vecteur des effets (b1, b2,, b3...) est nul grâce à 3 tests : • Le test du score • Le test de Wald • Le test du rapport de vraissemblance

  23. Conclusions • Les modèles multivariés permettent de représenter la variable étudiée en fonction de plusieurs autres variables. • Le modèle de COX : • La variable à expliquer est dichotomique, les variables explicatives peuvent être qualitatives ou quantitatives. • Il permet d’exprimer le risque instantané de survenue de l’événement en fonction des facteurs explicatifs • La régression linéaire multiple • La variable a expliquer est quantitative, sa distribution est normale. • La régression logistique • La variable à expliquer est dichotomique, les variables explicatives peuvent être qualitatives ou quantitatives. • Ce modèle permet de déterminer la probabilité de survenue de l’événement étudié en fonction des facteurs explicatifs

  24. Conclusions • Le modèle de Cox • Est adapté aux données dont le délai de suivi est variable selon les sujets et aux données censurées • Si la période de suivi est fixe et si il n’y a pas de données censurée le modèle de régression logistique convient aussi bien que le modèle de Cox. • Le modèle de Cox • permet de tenir compte de l’interaction des variables explicatives • Le risque instantané est le produit d’une fonction qui dépend du temps et d’une fonction qui ne dépend que des variables explicatives (caractéristiques du sujet). C’est l’hypothèse du risque proportionnel. • Le modèle est multiplicatif : le risque instantané de survenue de l’événement est multiplié par une constante quand on change la valeur d’une variable explicative

  25. SAS et la survie • Analyse exploratoire : • LIFEREG : modèles paramétriques • LIFETEST pour • calculer les fonctions risque et de survie, • tests de différence entre plusieurs fonctions de survie. • Modèle Cox à risque proportionnel • PHREG pour construire un modèle Cox à risqueproportionnel, • validation des hypothèses, • construction de modèles Cox à risque non proportionnels.

More Related