1 / 53

POL1803: Analyse des techniques quantitatives

POL1803: Analyse des techniques quantitatives. Cours 9. L ’ analyse bivariée. Variables d ’ intervalles / ratio. Satisfaction et réélection. Année Satisfaction % Vote % 1973 56 55 1976 28 34 1981 60 49 1985 39 39 1989 47 50 1994 40 44

uriel
Download Presentation

POL1803: Analyse des techniques quantitatives

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. POL1803: Analyse destechniques quantitatives Cours 9

  2. L’analyse bivariée Variables d’intervalles / ratio

  3. Satisfaction et réélection • Année Satisfaction % Vote % • 1973 56 55 • 1976 28 34 • 1981 60 49 • 1985 39 39 • 1989 47 50 • 1994 40 44 • 1998 52 43 • 2003 40 33 • 2007 39 33 • 2008 54 42 • 2012 31 31 • 2013 35 ?

  4. Réélection: 1973 56% 1981 60% 1989 47% 1998 52% 2007 39% 2008 39% Satisfaction et réélection • Défaite: • 1976 28% • 1985 39% • 1994 40% • 2003 40% • 2012 31%

  5. Diagramme de dispersion • Définition: • Outil pour représenter graphiquement la relation entre deux variables d’intervalles / ratio. • Permet de caractériser la direction, la force et la forme de la relation.

  6. Diagramme de dispersion

  7. Direction de la relation

  8. Force de la relation

  9. Force de la relation

  10. Force de la relation

  11. Forme de la relation

  12. Diagramme de dispersion

  13. Coefficient de corrélation • Définition: • Outil pour synthétiser en une seule valeur la relation entre deux variables d’intervalles / ratio. • Permet de caractériser la direction et la force de la relation, mais pas la forme de la relation.

  14. Coefficient de corrélation • Formule: r = S Zx Zy N où Zx = x – mx et Zy = y – my sxsy

  15. Coefficient de corrélation r = S Zx Zy où Zx = x – mx et Zy = y – my N sxsy

  16. Coefficient de corrélation

  17. Interprétation du coefficient de corrélation • L’échelle s’étend de –1 à +1. • 0 signifie une association nulle. • Signe négatif signifie une ass. négative. • -1 signifie une ass. négative parfaite. • Signe positif signifie une ass. positive. • +1 signifie une ass. positive parfaite.

  18. Interprétation du coefficient de corrélation • ± ] 0 - 0,25 [ : Faible • ± [ 0,25 - 0,50 [ : Moyenne • ± [ 0,50 - 0,75 [ : Forte • ± [ 0,75 - 1 [ : Très forte

  19. Coefficient de corrélation • Problèmes: • Le coefficient de corrélation saisit seulement la linéarité d’une relation entre deux variables.

  20. Coefficient de corrélation

  21. Coefficient de corrélation • Problèmes: • Le coefficient de corrélation saisit seulement la linéarité d’une relation entre deux variables. • Le coefficient de corrélation est sensible aux cas extrêmes.

  22. Coefficient de corrélation

  23. Coefficient de corrélation

  24. Test F • Définition: • Mesure de la signification statistique du coefficient de corrélation. • Révèle si une association statistique existe probablement entre ces deux variables dans l’ensemble de la population.

  25. Test F • Formule: r2 (n - 2) 1 – r2 où r = Coefficient de corrélation N = Nombre d’observations

  26. Test F • Formule: r2 (n - 2) 1 – r2 • Exemple: 0,82 (11 - 2) = 0,64 * 9 = 5,76 = 1 -0,82 1 - 0,64 0,36 F = 16,0

  27. Test F • Critère: Normalement, pour que le coefficient de corrélation soit statistiquement significatif, le F doit dépasser une valeur dans la table F. Raccourci: la valeur du F doit dépasser 3,84

  28. Test F • Si le F est supérieur à 3,84 : • on peut rejeter l’hypothèse nulle (pas d’association dans la population) • on peut conclure qu’une relation existe probablement dans la population (95%) • Si le F est inférieur à 3,84 : • on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population) • on ne peut pas conclure qu’une relation existe probablement dans la population

  29. Signification statistique du coefficient de corrélation

  30. Signification statistique • Si la signification est inférieure à 0,05 : • on peut rejeter l’hypothèse nulle (pas d’association dans la population) • on peut conclure qu’une relation existe probablement dans la population (95%) • Si la signification est supérieure à 0,05 : • on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population) • on ne peut pas conclure qu’une relation existe probablement dans la population

  31. Équation de régression • Définition: • Outil pour résumer, avec plus de détails, la relation entre deux variables d’intervalles / ratio. • Permet de prédire (estimer) des valeurs inconnues de la variable dépendante.

  32. Équation de régression

  33. Équation de régression • Formule: Y = a + bX où Y = Valeur de la variable dépendante a = Intersection ou constante b = Pente ou coefficient de régression X = Valeur de la variable indépendante

  34. Équation de régression Y = a + bX • Constante: • Point sur l’axe des Y où passe la droite de régression. • Valeur de la variable dépendante lorsque la variable indépendante a la valeur de 0.

  35. Équation de régression

  36. Équation de régression

  37. Équation de régression Y = a + bX • Coefficient de régression: • Le signe du coefficient reflète la direction de la relation. • La valeur du coefficient indique l’effet sur la variable dépendante d’un mouvement d’une unité sur la variable indépendante.

  38. Statistique t pour lecoefficient de régression • Définition: • Mesure de la signification statistique du coefficient de régression (pente). • Critère: • Pour que le coefficient de régression soit statistiquement significatif à 95%, la valeur absolue du t doit dépasser 1,96.

  39. Statistique t pour lecoefficient de régression

  40. Coefficient de détermination • Définition: • Mesure de la proportion de variation chez la variable dépendante qui est expliquée par l’équation de régression. • Formule: r2 où r = Coefficient de corrélation

  41. Coefficient de détermination

  42. Interprétation du coefficient de détermination • ] 0 - 0,25 [ : Faible • [ 0,25 - 0,50 [ : Moyenne • [ 0,50 - 0,75 [ : Forte • [ 0,75 - 1 [ : Très forte

  43. Révision r2 = 1 r2 = 1 r = +1 r = -1 b = + b = -

  44. Révision r2 = 0,64 r2 = 0,04 r = +0,8 r = +0,2 b = + b = +

  45. Révision r2 = 0 r = 0 b = 0

  46. Réélection du PQ? • Année Satisfaction % Vote % • 1973 56 55 • 1976 28 34 • 1981 60 49 • 1985 39 39 • 1989 47 50 • 1994 40 44 • 1998 52 43 • 2003 40 33 • 2007 39 33 • 2008 54 42 • 2012 31 31 • 2013 35 ?

  47. Estimation à partir del’équation de régression Y = a + bX Y = 14,15 + 0,61X

  48. Estimation à partir del’équation de régression Y = 14,15 + 0,61X Y = 14,15 + 0,61 * 35 Y = 14,15 + 21,35 Y = 35,5

  49. Estimation à partir del’équation de régression X = 35 ; Y = 35,5 X = 30 ; Y = 32,5 X = 40 ; Y = 38,6 X = 45 ; Y = 41,6 X = 50 ; Y = 44,7 X = 60 ; Y = 50,8

  50. Intervalle de confianced’une estimation Éventail de valeurs autour de l’estimation ponctuelle (À 95%) : Estimation  1,96 * Erreur standard de l’estimation L’erreur standard de l’estimation est l’équivalent de l’écart-type de l’équation de régression. L’erreur standard de l’estimation est calculée par SPSS.

More Related