350 likes | 830 Views
POL1803: Analyse des techniques quantitatives. Cours 8. L ’ analyse bivariée. L ’ analyse de variance (ANOVA). Outil pour certaines questions. Les électeurs de chacun des partis politiques fédéraux ont-ils le même niveau d ’ information politique?
E N D
L’analyse bivariée L’analyse de variance (ANOVA)
Outil pour certaines questions • Les électeurs de chacun des partis politiques fédéraux ont-ils le même niveau d’information politique? • Les quatre principaux journaux montréalais sont-ils autant biaisés les uns que les autres?
Outil pour certaines questions • Pour déterminer si les moyennes de deux groupes sont significativement différentes, on fait un testt. • Pour déterminer si les moyennes de plus de deux groupes sont significativement différentes, on fait une analyse de variance.
Test t et analyse de variance • Deux moyens d’évaluer la signification statistique de différence(s) entre moyennes d’échantillons. • Est-ce que la ou les différences existe(nt) aussi dans la population? • La ou les différences est(sont)-elle(s) assez improbable(s) compte tenu de l’hypothèse nulle?
Multiples tests t? • Ex.: 3 groupes, 3 comparaisons (A-B, B-C, A-C), 3 tests t • Il y a rapidement trop de comparaisons à faire. • Il y a cumul des risques d’erreur de type 1.
Erreurs d’inférence • Erreur de type 1: • rejeter une hypothèse nulle qui est vraie • Erreur de type 2: • ne pas rejeter une hypothèse nulle qui est fausse
Analyse de variance (ANOVA) • Un seul test qui évalue la signification statistique de différences entre plusieurs moyennes d’échantillons. • Un seul test, donc alpha toujours = 0,05
Analyse de variance (ANOVA) • Évalue la probabilité que toutes les moyennes de groupes de l’échantillon proviennent d’une population où les moyennes de groupes sont identiques. • Hypothèse nulle: μ1 = μ2= ... = μg
Quelle variance? • Les valeurs des observations peuvent être comparées à la moyenne totale. • Les valeurs des observations peuvent être comparées à la moyenne de leur groupe respectif. • Les moyennes de groupes peuvent être comparées entre elles et à la moyenne totale.
La solution ANOVA • Analyser toute la variance. • Classer la variance en catégories et comparer les catégories. • Deux catégories principales: • 1) la variance entre les groupes (variance intergroupe) • 2) la variance à l’intérieur des groupes (variance intra-groupe)
La variance intergroupe • Mesure de la variance entre les moyennes de groupes et entre celles-ci et la moyenne totale.
La variance intra-groupe • Mesure de la variance entre les observations et leur moyenne de groupe.
Le ratio F • Formule: Variance intergroupe Variance intra-groupe où ... Var. intergroupe = S NG( G - T )2 k - 1 Var. intra-groupe = S ( Xi - G )2 N - k
L’interprétation du F • Normalement (voir Fox et Imbeau), il faut ensuite prendre le F, le nombre de degrés de liberté du numérateur, le nombre de degrés de liberté du dénominateur et aller consulter une table pour savoir si le F est plus grand qu’une valeur donnée qui varie selon les deux degrés de liberté et le seuil souhaité. • Malheureusement, il n’y a pas de valeur raccourci que l’on peut retenir pour se simplifier la vie. • Toutefois ...
La table ANOVA • Si le F est assez grand, la signification sera inférieure au seuil 0,05. Donc, la probabilité de trouver un tel lien en assumant que les moyennes sont identiques dans la population est suffisamment petite. • On peut alors rejeter l’hypothèse nulle. • On peut conclure que les moyennes de l’échantillon sont significativement différentes. • On peut conclure que les moyennes dans la population sont probablement différentes. • On peut conclure qu’il y a probablement une association statistique entre les deux variables dans la population.
La table ANOVA • Si le F est trop petit, la signification sera supérieure au seuil 0,05. La probabilité de trouver un tel lien en assumant que les moyennes sont identiques dans la population n’est pas suffisamment petite. • On ne peut pas rejeter l’hypothèse nulle. • On ne peut pas conclure que les moyennes de l’échantillon sont significativement différ. • On ne peut pas conclure que les moyennes dans la pop. sont probablement différentes. • On ne peut pas conclure qu’il y a probablement une association statistique entre les deux variables dans la population.
L’analyse de variance et le test t • Avec deux groupes, la signification statistique d’un test t et celle d’un F seront identiques: F = t2 t = F • Comme le test t, le F est affecté par la taille de l’échantillon.
L’analyse de variance • Avantages: • Une seule estimation. • Pas de cumul des erreurs de type 1. • Limites: • Manque de spécificité analytique. • Restriction des postulats.
Remarque finale • Il ne faut jamais confondre association statistique et relation causale. Le fait de trouver que deux variables varient ensemble n’implique pas automatiquement que l’une est la cause de l’autre. Patientez quelques semaines. Pour le moment limiter votre discours à l’usage du terme association statistique.
Un autre exemple Les quatre journaux montréalais sont-ils autant biaisés les uns que les autres?
Un autre exemple • 91% des journalistes croient que les propriétaires de leur journal ont des points de vue qu'ils aimeraient voir exprimés dans le journal. • 83% pensent que les points de vue des propriétaires sont régulièrement reflétés dans le contenu du journal. • 34% disent que les points de vue des propriétaires devraient régulièrement être reflétés dans le contenu du journal.
Un autre exemple • 34% affirment que les points de vue des propriétaires devraient régulièrement être reflétés dans les éditoriaux. • 76% soutiennent que les points de vue des propriétaires sont régulièrement reflétés dans les éditoriaux.
Un autre exemple • 4% considèrent que les points de vue des propriétaires devraient régulièrement être reflétés dans le contenu des nouvelles. • 47% estiment que les points de vue des propriétaires sont régulièrement reflétés dans le contenu des nouvelles.