480 likes | 893 Views
Intérêt et principes des analyses multivariées. FRT C7. Analyse multivariée par opposition à univariée en complément d’une analyse univariée. Rappel sur l’analyse univariée. Analyse univariée : relation entre 2 variables Principe : Hypothèse nulle d ’indépendance (H0)
E N D
Analyse multivariée • par opposition à univariée • en complément d’une analyse univariée
Rappel sur l’analyse univariée Analyse univariée : relation entre 2 variables • Principe : • Hypothèse nulle d ’indépendance (H0) • Hypothèse alternative de relation (H1) • entre une variable dépendante, à expliquer et une variable expliquante • Quantification de la différence entre l’observation et la théorie sous l’hypothèse nulle • test statistique dépend du type de variable
Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher
Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher • 1 variable qualitative et 1 variable quantitative • récidive oui/non vs taille initiale de la tumeur • Tests de comparaisons de moyenne : • distribution normale de la variable quantitative • 2 groupes : test t • > 2 groupes : analyse de variance (ANOVA) • petits effectifs ou distributions non normales • 2 groupes : test de Mann Whitney • > 2 groupes test de Kruskall Wallis
Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher • 1 variables qualitative et 1 variable quantitative • récidive oui/non vs taille initiale de la tumeur • test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs • 2 variables quantitatives • production d ’une protéine vs dose d’une substance • test du coefficient de régression r
Principaux tests d ’analyse univariée • 2 variables qualitatives (catégorielles) • guérison oui/nonvs traitement A/B • test du chi² ou test exact de Fisher • 1 variables qualitative et 1 variable quantitative • récidive oui/non vs taille initiale de la tumeur • test t (distrib. normale de la var quantitative) ou test de Mann Whitney (Kruskall Wallis) pour petits effectifs • 2 variables quantitatives • production d ’une protéine vs dose d’une substance • test du coefficient de régression • 1 variable qualitative et 1 variable censurée • traitement A/B vs délai de récidive tumorale • test du log rank
Estimation de courbes de survie par la méthode de Kaplan Meïer Taux de survie 100 % Traitement A Traitement B 50 % 3 9 12 6 Temps (mois)
Principe de l ’analyseunidimensionnelle Sexe Age ? ? Réponse au traitement (Evènement à expliquer) ? Génotype viral Stade histologique ? ? ? ? Charge virale Ancienneté de l ’infection Mode de contamination
Principe de l ’analyseunidimensionnelle Sexe Age S S Réponse au traitement (Evènement à expliquer) S Génotype viral Stade histologique S S NS S Charge virale Ancienneté de l ’infection Mode de contamination
Intérêt de l ’analysemultidimensionnelle Sexe Age Réponse au traitement (Evènement à expliquer) Génotype viral Stade histologique S S S S Ancienneté de l ’infection S Mode de contamination S Charge virale
Intérêt de l’analysemultivariée Sexe Age Réponse au traitement (Evènement à expliquer) Génotype viral Stade histologique Ancienneté de l ’infection Charge virale Mode de contamination Quels sont les facteurs indépendamment liés à l’événement ? Qui apportent chacun une part d’explication complémentaire ? Stratégies thérapeutiques différentes en fonction de ces facteurs
Types d’analyses multivariées • Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) • Test de Mantel-Haenszel • Analyse de variance à 2 facteurs • Test du Log rank ajusté
Types d’analyses multivariées • Analyses bivariées : relation entre 2 facteurs en prenant en compte un 3ème : (2 variables explicatives potentielles) • Test de Mantel-Haenszel • Analyse de variance à 2 facteurs • Test du Log rank ajusté • analyses multidimensionnelles : font appel à des modèles mathématiques • Régression logistique • Modèle de Cox • Régression multiple • (analyse discriminante, analyse factorielle ….)
Analyse bivariée : test de Mantel-Haenszel Question : en univariée traitt A > traitt B ; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ? Réponse: on étudie la relation réponse/traitt à chaque niveau du facteur : Strate Génotype 1 Strate génotype non 1 réponse réponse oui non oui non A pA1 A pAnon1 traitt traitt B pB1 B pBnon1 pA1 > pB1 pAnon1 > pBnon1 Conclusion : A > B indépendamment du génotype (à niveau égal de génotype)
Figure 1 Non & occasional cannabis smokers Daily cannabis smokers 80 p=0.03 (Mantel-Haenszel statistics) 57.9% 60 Fibrosis > F2 (%) 44.4% 42.9% 40 22.6% 20 0 Age at biopsy (yrs) 40 > 40
Exemple numérique Rep + Rep- TtA 70(60)(40)30 100 Tx rép 70 % vs 50 % TtB 50(60)(40)50 100 ² = 8,33 p < 0,001 120 80 200
Exemple numérique Rep + Rep- Rep + Rep - TtA 70 30 100 Geno 1 60 60 120 TtB 50 50 100 Geno non1 60 20 80 120 80 200 120 80 200 Tx rep : 50 % vs 75 %, p< 0,001
Exemple numérique Rep + Rep- Rep + Rep - TtA 70 30 100 Geno 1 60 60 120 TtB 50 50 100 Geno non1 60 20 80 120 80 200 120 80 200 Geno 1 Gnon 1 TtA 40 60 100 33 % vs 75 % de TtA TtB 80 20 100 p < 0,0001 120 80 200
Exemple numérique Test de Mantel Haenszel Geno 1 Geno non1 Rep + Rep- Rep + Rep- TtA 20(20)20 40 TtA 50(45)(15)10 60 TtB 40(40)40 80 TtB 10(15) (5) 10 20 60 60 120 60 20 80 Rep+ Rep- TtA 70(65)(35)30 100 TtB 50(55)(45) 50 100 ² = 2,11 NS 120 80 200
Analyse bivariée : ANOVA à 2 facteurs • Question :en univariée traitt A > traitt B sur la taille tumorale; Vrai ou liée à une mauvaise répartition d’un facteur lié à la réponse au traitt ? • Réponse :l ’ANOVA permet de tester : • l ’effet du traitement« à niveau égal » de l ’autre facteur • l ’effet de ce facteur, indépendamment du traitement • l ’interaction traitement x facteur : l ’effet du traitement est-il différent selon le niveau de l ’autre facteur ?
Exemple d’ANOVA à 2 facteurs • Variable à expliquer : vitesse de progression de la fibrose après TH pour cirrhose C • 2 variables explicatives : • Le génotype viral VF gén1 > VF gén non1 • L’immunosuppresseur : VF ss tacrolimus > VF ss ciclosp • Résultats: ciclo tacro Vit Fibrosegéno non1 0.316 0.207 0.280 effet génotype géno 1 0.606 0.837 0.659 p = 0.008 0.540 0.627 0.562 interaction : p = 0.315 effet immunosup : p = 0.718
Analyse bivariée : test du Log rank ajusté Taux de survie 100 % Traitement A sans métastase 50 % Traitement B sans métastase Traitement A avec métastases Traitement B avec métastases 0 % 1 3 2 4 5 Temps (ans) Permet de conclure A > B, qu’il y ait ou non des métastases initiales
Stratification vs ajustement Stratification = prendre en compte un facteur lié au critère de jugement dans la méthodologie de l’étude Ajustement = technique prendre en compte dans un test unique un facteur qui la variabilité du critère, pallier la répartition inégale d’un facteur pronostique StratificationAjustement randomisation randomisation parmi chaque strate sur l’ensemble Ttt A Ttt B Ttt A Ttt B immunocompétent immunodéprimé
Analyse multidimensionnelle : la régression logistique • Permet de prédire la probabilité d’un événement à l’aide de divers facteurs : quantitatifsou qualitatifs • Principe : à partir d’une série d’observations, on cherche à estimer les paramètres d’un modèle mathématique, prédisant au mieux la probabilité d’un événement : Proba (événement) = exp(u) / 1 + exp(u) u = fonction linéaire de la forme : + i xi x = 0 ou 1 si qualitative, et valeur mesurée xi si quantitative i = coefficient associé au facteur : « poids du facteur » exp = Odds ratio (OR) associé à une variable et ajusté sur les autres variables du modèle
Régression logistique : exemple Facteur coef DS p exp (OR) IC 95% OR Traitement (A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47 Génotype (1 0 1 ) non 1 1,335 0,54 0,002 3,8 2,21 – 6,52 Histologie (F0F1 0 1 ) F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7 Charge virale (>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65 4 facteurs indépendamment liés à l’obtention d’une réponse
Régression logistique : exemple Facteur coef DS p exp (OR) IC 95% OR Traitement (A 0 1 ) B - 1,204 0,45 0,001 0,3 0,19 – 0,47 Génotype (1 0 1 ) non 1 1,335 0,54 0,002 3,8 2,21 – 6,52 Histologie (F0F1 0 1 ) F2F3F4 - 0,615 0,30 0,03 0,54 0,40 – 0,7 Charge virale (>6 logUI 0 1 ) <6 logUI 1,172 0,44 0,01 3,2 1,36 – 7,65 4 facteurs indépendamment liés à l’obtention d’une réponse : - A > B; geno non1 > geno 1; F0F1 > F2F3F4; faible CV > forte CV
Analyse multidimensionnelle : le modèle de Cox (modèle des risques instantanés proportionnels de Cox) • Objectif : évaluer les facteurs pronostiques de mortalité ou tout autre événement lié au temps • Principe : • On considère le risque instantané de décès (force de mortalité, hazard) = probabilité de mourir à l’instant t pour un sujet qui a survécu jusque là : (t) • Fonction du temps passé et de covariables (facteurs de risque x1, x2, …. xk) recueillis en début d’étude ou en cours d’étude • Hypothèse de proportionnalité des risques instantanés constante au cours du temps (ex : risque H = toujours 1,5 fois risque F) (t; x1,x2, … xk) = 0(t).f(x1,x2, … xk) où f(x1,x2, … xk) = exp(1x1+2x2+, …+ kxk)
Analyse multidimensionnelle : le modèle de Cox (t) Placebo Traitement B Traitement A temps Le risque instantané de décès est proportionnel selon que les patients reçoivent A ou B : il est décroissant au cours du temps il n’est pas proportionnel sous placebo : le modèle de Cox n’est pas applicable
En conclusion Dans toutes études : recueil de données pertinentes (essai thérapeutique, étude pronostique, étude explicative) • 1ére étape : analyse univariée • Permet de déterminer les variables qui semblent liées à l’événement • Étudie les relations entre les variables explicatives • 2ème étape : analyse multivariée • Permet de mettre en évidence les variables indépendamment liées à l’événement étudié et leur poids (coefficient , OR) • ATTENTION : le modèle déterminé à partir d’une série d’observations doit être validé sur d’autres séries indépendantes de données