550 likes | 814 Views
POL1803: Analyse des techniques quantitatives. Cours 9. L ’ analyse bivariée. Variables d ’ intervalles / ratio. Satisfaction et réélection. Année Satisfaction % Vote % 1973 56 55 1976 28 34 1981 60 49 1985 39 39 1989 47 50 1994 40 44
E N D
L’analyse bivariée Variables d’intervalles / ratio
Satisfaction et réélection • Année Satisfaction % Vote % • 1973 56 55 • 1976 28 34 • 1981 60 49 • 1985 39 39 • 1989 47 50 • 1994 40 44 • 1998 52 43 • 2003 40 33 • 2007 39 33 • 2008 54 42 • 2012 31 31 • 2013 35 ?
Réélection: 1973 56% 1981 60% 1989 47% 1998 52% 2007 39% 2008 39% Satisfaction et réélection • Défaite: • 1976 28% • 1985 39% • 1994 40% • 2003 40% • 2012 31%
Diagramme de dispersion • Définition: • Outil pour représenter graphiquement la relation entre deux variables d’intervalles / ratio. • Permet de caractériser la direction, la force et la forme de la relation.
Coefficient de corrélation • Définition: • Outil pour synthétiser en une seule valeur la relation entre deux variables d’intervalles / ratio. • Permet de caractériser la direction et la force de la relation, mais pas la forme de la relation.
Coefficient de corrélation • Formule: r = S Zx Zy N où Zx = x – mx et Zy = y – my sxsy
Coefficient de corrélation r = S Zx Zy où Zx = x – mx et Zy = y – my N sxsy
Interprétation du coefficient de corrélation • L’échelle s’étend de –1 à +1. • 0 signifie une association nulle. • Signe négatif signifie une ass. négative. • -1 signifie une ass. négative parfaite. • Signe positif signifie une ass. positive. • +1 signifie une ass. positive parfaite.
Interprétation du coefficient de corrélation • ± ] 0 - 0,25 [ : Faible • ± [ 0,25 - 0,50 [ : Moyenne • ± [ 0,50 - 0,75 [ : Forte • ± [ 0,75 - 1 [ : Très forte
Coefficient de corrélation • Problèmes: • Le coefficient de corrélation saisit seulement la linéarité d’une relation entre deux variables.
Coefficient de corrélation • Problèmes: • Le coefficient de corrélation saisit seulement la linéarité d’une relation entre deux variables. • Le coefficient de corrélation est sensible aux cas extrêmes.
Test F • Définition: • Mesure de la signification statistique du coefficient de corrélation. • Révèle si une association statistique existe probablement entre ces deux variables dans l’ensemble de la population.
Test F • Formule: r2 (n - 2) 1 – r2 où r = Coefficient de corrélation N = Nombre d’observations
Test F • Formule: r2 (n - 2) 1 – r2 • Exemple: 0,82 (11 - 2) = 0,64 * 9 = 5,76 = 1 -0,82 1 - 0,64 0,36 F = 16,0
Test F • Critère: Normalement, pour que le coefficient de corrélation soit statistiquement significatif, le F doit dépasser une valeur dans la table F. Raccourci: la valeur du F doit dépasser 3,84
Test F • Si le F est supérieur à 3,84 : • on peut rejeter l’hypothèse nulle (pas d’association dans la population) • on peut conclure qu’une relation existe probablement dans la population (95%) • Si le F est inférieur à 3,84 : • on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population) • on ne peut pas conclure qu’une relation existe probablement dans la population
Signification statistique • Si la signification est inférieure à 0,05 : • on peut rejeter l’hypothèse nulle (pas d’association dans la population) • on peut conclure qu’une relation existe probablement dans la population (95%) • Si la signification est supérieure à 0,05 : • on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population) • on ne peut pas conclure qu’une relation existe probablement dans la population
Équation de régression • Définition: • Outil pour résumer, avec plus de détails, la relation entre deux variables d’intervalles / ratio. • Permet de prédire (estimer) des valeurs inconnues de la variable dépendante.
Équation de régression • Formule: Y = a + bX où Y = Valeur de la variable dépendante a = Intersection ou constante b = Pente ou coefficient de régression X = Valeur de la variable indépendante
Équation de régression Y = a + bX • Constante: • Point sur l’axe des Y où passe la droite de régression. • Valeur de la variable dépendante lorsque la variable indépendante a la valeur de 0.
Équation de régression Y = a + bX • Coefficient de régression: • Le signe du coefficient reflète la direction de la relation. • La valeur du coefficient indique l’effet sur la variable dépendante d’un mouvement d’une unité sur la variable indépendante.
Statistique t pour lecoefficient de régression • Définition: • Mesure de la signification statistique du coefficient de régression (pente). • Critère: • Pour que le coefficient de régression soit statistiquement significatif à 95%, la valeur absolue du t doit dépasser 1,96.
Coefficient de détermination • Définition: • Mesure de la proportion de variation chez la variable dépendante qui est expliquée par l’équation de régression. • Formule: r2 où r = Coefficient de corrélation
Interprétation du coefficient de détermination • ] 0 - 0,25 [ : Faible • [ 0,25 - 0,50 [ : Moyenne • [ 0,50 - 0,75 [ : Forte • [ 0,75 - 1 [ : Très forte
Révision r2 = 1 r2 = 1 r = +1 r = -1 b = + b = -
Révision r2 = 0,64 r2 = 0,04 r = +0,8 r = +0,2 b = + b = +
Révision r2 = 0 r = 0 b = 0
Réélection du PQ? • Année Satisfaction % Vote % • 1973 56 55 • 1976 28 34 • 1981 60 49 • 1985 39 39 • 1989 47 50 • 1994 40 44 • 1998 52 43 • 2003 40 33 • 2007 39 33 • 2008 54 42 • 2012 31 31 • 2013 35 ?
Estimation à partir del’équation de régression Y = a + bX Y = 14,15 + 0,61X
Estimation à partir del’équation de régression Y = 14,15 + 0,61X Y = 14,15 + 0,61 * 35 Y = 14,15 + 21,35 Y = 35,5
Estimation à partir del’équation de régression X = 35 ; Y = 35,5 X = 30 ; Y = 32,5 X = 40 ; Y = 38,6 X = 45 ; Y = 41,6 X = 50 ; Y = 44,7 X = 60 ; Y = 50,8
Intervalle de confianced’une estimation Éventail de valeurs autour de l’estimation ponctuelle (À 95%) : Estimation 1,96 * Erreur standard de l’estimation L’erreur standard de l’estimation est l’équivalent de l’écart-type de l’équation de régression. L’erreur standard de l’estimation est calculée par SPSS.