520 likes | 936 Views
Questions à poser avant de choisir une analyse. Quel est l’objectif principal de la recherche? Combien de variables indépendantes et dépendantes? Quels types d ’échelles de mesure? Postulats rencontrés ou non?. A - Établir des relations entre des variables?
E N D
Questions à poser avant de choisir une analyse • Quel est l’objectif principal de la recherche? • Combien de variables indépendantes et dépendantes? • Quels types d ’échelles de mesure? • Postulats rencontrés ou non?
A - Établir des relations entre des variables? B - Rechercher des différences entre des groupes? C - Prédire l’appartenance à des groupes? D- Identifier des structures? E- Évolution temporelle des événements I- QUEL EST L’OBJECTIF PRINCIPAL DE LA RECHERCHE?
A- Degré de relation entre des variables • Tout ce qui touche l’association entre des variables. • Vise à établir si une variable est associée à une autre (corrélation) • Vise à établir si plusieurs variables «indépendantes» sont associées à une variable «dépendante» continue (régression multiple).
B- Rechercher des différences entre des groupes • Tout ce qui touche la comparaison de groupes établis aléatoirement ou non. • Anova simple, factorielle, et mesures répétées • Ancova simple, factorielle, et mesures répétées, • Manova et Mancova
C- Prédire l’appartenance à des groupes • Prédiction, à partir d ’un ensemble de variables «indépendantes», l’appartenance à un groupe, définie par une variable catégorielle naturelle. • Fonction discriminante et régression logistique.
D- Identification de structures • Sert à dégager des structures ou des groupements de variables, ou de sujets. • Analyse en composantes principales: pour items d’un questionnaire ou multiples variables pour réduction. Absence de modèle initial. Base empirique sur les données recueillies • Analyse factorielle: semblable à précédente mais se base sur un modèle initial proposant une structure. L’analyse tente de valider le modèle. (ex: structure de la dépression: cognitif, affectif et somatique) • Modèle d’équation structurelle. • Analyse de groupements (cluster) pour déterminer l ’existence de groupes dans un échantillon.
Réduction du nombre de variables Socio démo Âge Sexe Revenu Éducation Dlr angine Capacité à l’effort # artères obstruées % d’obstruction Dépression Anxiété Estime de soi Support social Dépression post pontage médicales Psycholo- giques
Confirmation d’une structure factorielle affectif Triste Pleure Découragé Perte de confiance Culpabilité Auto critique Fatigué Agité Manque d’énergie Sommeil perturbé Dépression cognitif Physiolo- gique
Style éducationnel Types de jeux Âge des parents Comportements parentaux alimentation Sexe du bébé Revenu éducation Exemple de modèle structurel: développement de l’enfant Variables indépendantes Variable latente VD Développe- ment de l’enfant Relation Parent enfant
Identification de groupes naturels Bon profil: Jeune, peu déprimé, Peu d’artères obstruées, Etc. Âge Sexe Revenu Éducation Dlr angine Capacité à l’effort # artères obstruées % d’obstruction Dépression Anxiété Estime de soi Support social Dépression post pontage Profil moyen Profil lourd
E- Évolution temporelle des événements • Analyse de survie • A) évolution de la survie: dans une cohorte post infarctus, quel est la survie des patients au fil des mois. • B) facteurs prédisposant à l’apparition de l’infarctus au fil des mois • Séries temporelles • Évaluation des effets d’une intervention au fil du temps: pratique de la relaxation quotidienne sur le stress
Diminution du stress en fonction de la pratique de la relaxation
plusieurs VD Une Variable Dépendante Une VI Une VI +d’une VI +d’une VI multivarié multivarié Univarié Univarié ou 2- Combien de variables indépendantes et dépendantes
Univarié vs multi varié (Huberty et Morris, 1989, cf. références) • UNIVARIÉ: • étudier les effets d ’un traitement sur plusieurs VD non reliées au niveau conceptuel • nature exploratoire • VD ont déjà été étudiées en univarié • évaluation de devis, 2 groupes ou +, équivalence initiale des groupes sur plusieurs variables.
Effets d’un traitement Traitement Cognitif- behavioral pour dépression Douleur d’angine Capacité à l’effort Qualité de vie Dépression Anxiété Estime de soi Support social
Univarié vs multivarié • MULTIVARIÉ • IDENTIFICATION DES EFFETS • Effet d’un traitement sur plusieurs VD (ex: manova) • SÉLECTION: • sous ensemble de variables qui séparent des groupes ou prédisent un score sur la VD. (ex: régression multiple pas à pas, analyse composante principales suivi de manova) • MIS EN ORDRE: • contribution relative des variables à la séparation des groupes ou prédisent un score sur la VD. (fonction discriminante, régression multiple, manova, avec utilisation d’un critère d’importance (r, f, p, etc.) • SYSTÈME DE VARIABLES DÉPENDANTES: • identification d ’un construit sous-jacent associé à l ’analyse. (Analyse factorielle, équation structurelle, etc.)
Intervalle ou rapport Ordinal ou nominale Non paramétriques. Paramétriques si les postulats sont rencontrés. Danger: rang ex aequo Transformation Normalité Homogénéité des variances Homoscédasticité 3-Quels types d ’échelles de mesure? non oui
Types d’échelles • Rapport: poids. Il existe un rapport entre les points de l’échelle. 100kg est 2 fois plus lourd que 50kg. Existence d’un point 0. • Intervalle: la relation entre les points de l’échelle est quantifiable mais pas de 0. • échelle de dépression: écart entre 7 et 8 et 14 et 15 est pareil. Cependant 14 ne signifie pas 2 X + de dépression que 7. • température: écart entre 15 et 16ºC = écart entre 30 et 31. 30 ºC n’est pas 2 X plus chaud que 15 et 30 ºC n’est pas plus chaud que 86º F
Type d’échelles • Ordinale: • Échelle de rang: continuum sous jacent mais pas quantifiable. Rang dans une classe • Nominale: • Pas de continuum: race, sexe, type de pathologie, etc.) • Rapport, intervalle et ordinale suppose un continuum sous jacent mais pas nominale.
Biais - Aplat. - Aplat. + Biais + NORMALITÉ Vérifier le degré d’asymétrie (Skewness) Vérifier le degré d’aplatissement (Kurtosis) Normale = 0 Tolérance: rapport coeff./erreur type du coeff. = ± 2 i.e. près de 1.96. seuil à 0.05
Non normalité • La non normalité est donnée par les bornes -2/+2 ou par des tests dans les logiciels (Kolmogorov-Smirnov ou Shapiro-Wilks) • Si biais + les transformations à faire: log, 1/x ou V . • Si biais - : mettre au carré ou autre puissance ou prendre la réciproque et faire les transformations pour biais +. • Lors des transformations, faire en sorte qu’avant transformation, le point minimal des scores est 1*. • Aussi, usage des analyses non paramétriques. *Osborne, Jason (2002). Notes on the use of data transformations. Practical Assessment, Research & Evaluation, 8(6). Retrieved April 14, 2008 from http://PAREonline.net/getvn.asp?v=8&n=6 . This paper has been viewed 34,452 times since 5/30/2002.
Test de normalité: Handle with care! • Pour petits échantillons, tests manquent de puissance. • Pour grands échantillons, tests sont trop sensibles et une petite déviation de la normale peut devenir significative. • Donc REGARDEZ la distribution et utilisez le rapport des indices d’applatissement et d’assymétrie sur leur erreur-type respective.
Homogénéité des variances • Examen du rapport de la plus grande variance sur la plus petite. S2 / S2. Rapport < 4. • La transformation des données peut aider à homogénéiser les variances. • Tests avec correction ou élimination des déviants.(tronquage, winsor vs dl, livre p371) 2
PARAMÉTRIQUE Postulats: Échelle rapport ou intervalle Normalité Symétrie des distrib. Indépendance des mesures Homogénéité des variances Étudier des différences entre des groupes Univarié Multivarié T2 Hotelling Manova, Mancova Manova, Mancova factorielle Régression (MLG: modèle linéaire général). Test T, test T répété, Anova, Anova répétée, Anova factorielle, Anova factorielle répétée Ancova.
PARAMÉTRIQUE Postulats: Échelle rapport ou intervalle Normalité Homoscédasticité Indépendance des mesures Linéarité des relations Étudier des relations entre des variables Multivarié Univarié Corrélation Régression simple Régression multiple Corrélation canonique
Scores de la VD Niveaux de VI Homoscédasticité
Relation linéaire ou non Tirée de : http://biblioxtrn.uqar.qc.ca/stat/Fichesstat/multivariable/multivariable.htm
PARAMÉTRIQUE Postulats: Échelle rapport ou intervalle Normalité multivariée Indépendance des mesures Homogénéité des variances Prédire l'appartenance à des groupes Univarié Multivarié Fonction discriminante Régression logistique (non paramétrique) NIL
PARAMÉTRIQUE Postulats: Échelle rapport ou intervalle Normalité Linéarité Indépendance des mesures Homogénéité des variances Étudier des structures Univarié Multivarié Analyse factorielle Analyse composantes principales Cluster Équation structurelle NIL
Paramétrique et non paramétrique c2 (2X2) Man Whitney Test T Wilcoxon et test du signe Test T répété Mc Nemar Kruskall- Wallis c2 (AXB) Anova simple Anova répété Friedman Cocrhan Q Corrélation r Spearman Phi rang nominal paramétrique
Situation 1 : problème d’anxiété phobique • J’ai trois groupes recevant trois interventions différentes: immersion, désensibilisation systématique et contrôle. J’évalue l’efficacité de mon traitement avec un questionnaire: l’inventaire des peurs, qui donne un score de 0 à 50. Je mesure mes sujets avant traitement, après, et lors d’un suivi, 3 mois plus tard. • Quelle analyse devrais-je choisir?
Comparer trois groupes avec traitement de l ’anxiété phobique • VD: inventaire des peurs: continue • VI: groupes de traitement: 3 niveaux catégorielle(contrôle, immersion, dés. syst.) moments de mesures: 3 niveaux catégorielle • Devis: expérimental factoriel 3 X 3 • Analyse: Anova factorielle univariée pour mesures répétées ou Ancova répétée(post relance) avec pré test en covariable, ou 2 ancova (post, relance) avec pré test en covariable • Si anova ou ancova significative (interaction grpxtemps), comparaisons a posteriori (post hoc) des groupes à chaque moment ou des moments dans les groupes • Contrastes a priori
22 20 18 16 14 12 10 pré post relance contrôle immersion dés. Syst. Comparer trois groupes avec traitement de l ’anxiété phobique Effet groupe Effet temps Interaction groupextemps Effets groupe, temps et interaction significatifs
22 20 18 16 14 12 10 pré post relance contrôle immersion dés. Syst. Comparer trois groupes avec traitement de l ’anxiété phobique Effet groupe Effet temps Interaction groupextemps Effet groupe (NS) mais temps et interaction significatifs
22 20 18 16 14 12 10 pré post relance contrôle immersion dés. Syst. Comparer trois groupes avec traitement de l ’anxiété phobique Effet temps Effet groupe Interaction groupextemps Effet groupe (NS), temps (NS) mais interaction significative
Situation 2 : problème d’anxiété phobique • Même situation que la précédente, mais je voudrait contrôler les effets possibles de l’âge et du soutien social mesuré par l’inventaire du soutien social dont les scores varient de 0-25.
Comparer trois groupes avec traitement de l ’anxiété phobique et contrôle de âge et soutien social • VD: inventaire des peurs: continue • VI: groupes de traitement: 3 niveaux catégorielle moments de mesures: 3 niveaux catégorielle • Covariables: âge, soutien social: continues • Devis: expérimental factoriel 3 X 3 • Analyse: Ancova factorielle univariée pour mesures répétées, puis comparaisons a posteriori sur temps, groupe ou interaction • Contrastes a priori
Situation 3 : problème d’anxiété phobique • Même situation que la précédente, où je veux contrôler les effets possibles de l’âge et du soutien social, et de plus, je mesure l’efficacité de mon traitement avec l’inventaire des peurs, la fréquence des comportements phobiques et l’intensité de l’anxiété.
Comparer trois groupes avec traitement de l ’anxiété phobique: contrôle de l ’âge et soutien social • VD: inventaire des peurs: continue fréquence des comportements phobiques et niveau d ’anxiété : continues • VI: groupes de traitement: 3 niveaux catégorielle moments de mesures: 3 niveaux catégorielle • Covariables: âge, soutien social: continues • Devis: expérimental factoriel 3(grp) X 3(moments) X3(mesures) • Analyse: Ancova factorielle multivariée (Mancova) pour mesures répétées, ou trois Ancova factorielles pour mesures répétées, puis comparaisons a posteriori : groupes sur chaque mesure significative selon les moments. • Matrice des intercorrélations entre mes VD.
Situation 4 : problème d’anxiété phobique et décrochage du traitement • Dans la situation précédente, je voulais regarder l’efficacité de mon traitement. Ici, je suis intéressé de connaître quels seraient les facteurs qui pourraient prédire les participants qui ont décroché du traitement avant la fin. J’ai toujours mes trois conditions de traitements que j’ai croisé avec un médicament (actif vs placebo). Je veux aussi tenir compte de variables socio démographiques telles que: âge, sexe et niveau de scolarité (primaire, secondaire, collégial, universitaire) de même que du soutien social.
Trois groupes avec traitement de l ’anxiété phobique: prédire le décrochage du traitement • VD: décrochage: catégorielle dichotomique • VI: traitement: catég. 3 niveaux médication: catég. 2 niveaux ou continue (dosage) revenu: continue âge: continue, soutien social: continue Sexe:catég. 2 niveaux scolarité: catég. 4 niveaux • Devis: corrélationnel prospectif • ANALYSE:régression logistique
Situation 5: prédiction de la dépression post partum • Je suis intéressé à trouver un modèle statistique qui me permettrait de prédire la dépression post partum, à partir de variables psychologiques et socio démographiques mesurées en début de grossesse. Je mesure la dépression post partum avec un questionnaire, de même que le niveau de dépression en début de grossesse, avec le même questionnaire. Je veux inclure dans mon modèle: l’âge de la mère, le nombre de grossesses antérieures, le nombre d’enfants, le revenu et le type d’activité de la mère, i.e. travail à l’extérieur ou demeure à la maison. Je dois tenir compte aussi de l’origine ethnique (blanc, noir, asiatique) et du statut civil: mariée, marié divorcée remariée, mariée divorcée seule, célibataire vivant chez ses parents, célibataire seule.
Prédiction de la dépression post partum VD: niveau de dépression: continue VI(prédicteurs): Âge de première grossesse: continue Nombre de grossesses passées: continue Revenu: continue, nbr d ’enfants: continue, Statut civil: catég. 5 niveaux: mariée, marié divorcée remariée, mariée divorcée seule, célibataire vivant chez parents, célibataire seule. Ethnie : catég. 3 niveaux: blanc, noir, asiatique Type d ’activité de la mère:catég. dichotomique Dépression pré accouchement: continue • Devis: corrélationnel prospectif Analyse: Régression multiple avec variables bidons pour les catégorielles
Variables bidons (factices ou dummy variables) Races V1 V2 V3 variables factices Blancs 1 0 0 Noirs 0 1 0 Asiatique 0 0 1
Situation 6: prédiction de la réussite d’une greffe cardiaque • Je dois élaborer un modèle de qui me permettrait de prédire, avant une greffe cardiaque, quel serait le succès de cette dernière, i.e. retour à la vie normale, incapacité partielle, décès. Je dois tenir compte de l’âge, du sexe, de la scolarité (primaire, secondaire, collégial, universitaire) et du revenu. J’évalue aussi la charge physique de l’emploi, l’anxiété, le stress au travail et la dépression à l’aide de questionnaires. Enfin, je tiens compte du % de gras saturé et du degré d’athérosclérose mesuré par le diamètre des artères.
VD: catégorielle 3 niveaux: DCD, incapacité, normal. VI: âge: continue Revenu: continue Sexe: catég. dichotomique Scolarité: catég. 4 niveaux Charge physique de l ’emploi: continue Stress au travail: continue Anxiété: continue Dépression: continue % de gras saturé: continue °d ’athérosclérose: continue Prédire l’issue de la greffe chez des patients à risque • Devis: corrélationnel prospectif ANALYSE: Fonction discriminante avec variables bidonspour les VI catégorielles
Intervention précoce et accident du travail: comparer 2 traitements, au post test, physio ou physio + psycho avec groupes aléatoires • VD1: délai de retour au travail: continue • VD2: qualité de vie : continue • VD3: perception de la douleur: continue • VD4: dépression: continue • VI: 2 groupes(aléatoires) traitement: catég. • Cov: score pré test sur chacune des VD • Devis: expérimental à 2 groupes indépendants • ANALYSE: 4 analyses de covariance simples avec ajustement seuil + matrice d’intercorrélations entre les VD
Intervention précoce et accident du travail: comparer 2 traitements, au post test, physio ou physio + psycho avec sujets appariés • VD1: délai de retour au travail: continue • VD2: qualité de vie : continue • VD3: perception de la douleur: continue • VD4: dépression: continue • VI: 2 groupes(appariés) de traitement:catég. • Cov: score pré test sur chacune des VD • Devis: expérimental à 2 groupes avec sujets appariés • ANALYSE: 4 analyses de covariance mesures répétées ajustement seuil + matrice d’intercorrélations entre les VD
Intervention précoce et accident du travail: comparer 2 traitements, physio ou physio + psycho avec groupes aléatoires et 2 moments de mesures • VD1: délai de retour au travail: continue • VD2: qualité de vie : continue • VD3: perception de la douleur: continue • VD4: dépression: continue • VI: 2groupes de traitement:catég. 2 moments de mesures:catég. • Devis factoriel 2X2 avec mesures répétées • ANALYSE: 4 analyses de variance factorielles,mesures répétées avec ajustement seuil + matrice d’inter corrélations entre les VD