430 likes | 765 Views
POL1803: Analyse des techniques quantitatives. Cours 3 Analyse univariée, 2è partie. Question à résoudre. Quel parti politique remportera la prochaine élection provinciale au Québec?. Qui gagnera la prochaine élection?. Sondage Léger Marketing 2000 répondants, 13-14 sept. 2013
E N D
POL1803: Analyse destechniques quantitatives Cours 3 Analyse univariée, 2è partie
Question à résoudre • Quel parti politique remportera la prochaine élection provinciale au Québec?
Qui gagnera la prochaine élection? • Sondage Léger Marketing • 2000 répondants, 13-14 sept. 2013 • PLQ 36 % • PQ 33 % • CAQ 18 % • QS 9 % • PV 2 % • Autre 2 %
Programme • Quelques notions d’inférence statistique • Estimation d’une moyenne • Estimation d’un pourcentage • Problèmes d’interprétation des sondages
Quelques notionsd’inférence statistique • Définition: L’ensemble des méthodes permettant de tirer des conclusions sur un groupe déterminé - la population - à partir des données provenant d’un échantillon choisi dans cette population.
Population Échantillon Définition L’ensemble des unités considérées Un sous-ensemble choisi pour étude Symbole Lettres grecques ou majuscules lettres minuscules Caractéristique paramètre statistique Taille N n Moyenne m Écart-type s s Pourcentage p p Quelques notionsd’inférence statistique
Symboles interchangeables • Écart type d’une population (s): racine carrée de S (x - m)2 N • Écart type d’un échantillon (s): racine carrée de S (x -)2 n - 1
Les trois distributions • Distribution de la population • Un recensement (N) • m , s • Distribution d’un échantillon • Un sondage (n) • , s • Distribution d’échantillonnage • Tous les sondages possibles (Ncn) • m, s
Tous les échantillons possibles • Population: N = 5 A, B, C, D, E • Échantillon: n = 2 • Tous les échantillons différents: AB, AC, AD, AE, BC, BD, BE, CD, CE, DE • Ncn = N! . = 5! . = n! (N-n)! 2! (5-2)! • 5*4*3*2*1 . = 120 . = 10 2*1 * 3*2*1 12
Tous les échantillons possibles • Ncn (1000, 5000000) = • Ncn = N! . n! (N-n)! • Ncn = 5000000! . 1000! (5000000-1000)! • Ncn (1000, 5000000) = ... • Ncn (10, 50000) = 27 000 000 000 000 000 000 000 000 000 000 000 000 000
La distribution d’échantillonnage • Si la taille de l’échantillon est de 30 ou plus: • la moyenne de la distribution d’échantillonnage est identique à la moyenne de la population (m = m). - la distribution d’échantillonnage suit une distribution normale.
La distribution normale • Définition: Distribution lisse, symétrique et unimodale d’une variable d’intervalles / ratio.
La distribution normale • Propriété fondamentale: Pour toute combinaison de moyenne et d’écart-type, il y aura toujours une proportion constante de cas entre la moyenne et un point quelconque situé à une certaine distance de la moyenne exprimée en termes d’unité(s) d’écart-type.
Une application concrète L’estimation de la moyenne d’une population à partir de la moyenne d’un échantillon
Intervalles de confiance • À 95% : m = 1,96 s où s = s ¯ n • À 99% : m = 2,58 s où s = s ¯ n
Un exemple • À 95% : = 2,15 n = 30 s = 1,29 m = 1,96 s où s = s ¯ n 2,15 1,96 soù s = 1,29 ¯ 30 2,15 1,96 * 1,29/5,48 = 2,15 1,96 * 0,24 2,15 0,47 = 1,68 < m < 2,62
Un exemple • À 99% : = 2,15 n = 30 s = 1,29 m = 2,58 s où s = s ¯ n 2,15 2,58 soù s = 1,29 ¯ 30 2,15 2,58 * 1,29/5,48 = 2,15 2,58 * 0,24 2,15 0,62 = 1,53 < m < 2,77
L’ampleur des intervallesvarie selon … • Le niveau de confiance • Un exemple: • À 95%: 1,68 < m < 2,62 • À 99%: 1,53 < m < 2,77
L’ampleur des intervallesvarie selon … • L’écart-type de l’échantillon • Deux cas de figures (à 95%): • s (2): 1,42 < m < 2,88 • s (0,82): 1,86 < m < 2,44
L’ampleur des intervallesvarie selon … • La taille de l’échantillon • Un exemple (à 95%): • n = 30: 1,68 < m < 2,62 • n = 1000: 2,07 < m < 2,23 • n = 10000: 2,12 < m < 2,18
De la moyenne au pourcentage • À 95% : m = 1,96 s où s = s ¯ n • À 95% : = p 1,96 sp où sp = s ¯ n
De la moyenne au pourcentage • À 95% : p = 45% n = 1001 s = 49,7 = p 1,96 spoù sp = s ¯ n 45 1,96 spoù sp = 49,7 ¯1001 45 1,96 * 49,7/31,6 = 45 1,96 * 1,57 45 3,1 = 41,9 < < 48,1
De la moyenne au pourcentage • À 99% : m = 2,58 s où s = s ¯ n • À 99% : = p 2,58 sp où sp = s ¯ n
De la moyenne au pourcentage • À 99% : p = 45% n = 1001 s = 49,7 = p 2,58 spoù sp = s ¯ n 45 2,58 spoù sp = 49,7 ¯1001 45 2,58 * 49,7/31,6 = 45 2,58 * 1,57 45 4,1 = 40,9 < < 49,1
L’ampleur des intervallesvarie selon … • Le niveau de confiance • L’écart-type de l’échantillon • La taille de l’échantillon
Qui gagnera la prochaine élection? • Sondage Léger Marketing • 2000 répondants, 13-14 sept. 2013 • PLQ 36 % 34-38 % • PQ 33 % 31-35 % • CAQ 18 % 16-20 % • QS 9 % 7-11 % • PV 2 % 0-4 % • Autre 2 % 0-4 %
Problèmes d’interprétation des sondages Cours 3 Analyse univariée, 2è partie
« Les Libéraux en avance » ? • Sondage CROP • 1000 pers., 10 - 18 décembre 2002 • ADQ 31 % 28 - 34% • PLQ 34 % 31 - 37% • PQ 33 % 30 - 36% • Marge d’erreur: 3%, 19 fois sur 20
« Le PLQ serait relégué au troisième rang » ? (TVA) • Sondage Léger Marketing • 30 mars - 3 avril 2005 • PQ 47 % 44 - 50% • ADQ 25 % 22 - 28% • PLQ 21 % 18 - 24% • Marge d’erreur: 3%, 19 fois sur 20
«Sondages contradictoires»? • «Deux sondages effectués par des maisons différentes donnent des résultats contradictoires sur la position des libéraux au Québec.» (SRC, 24 avril 2004) • Sondage CROP Léger • Avril 15-25 20-24 • BQ 41% 46% • PLC 39% 34% • NDP 10% 8% • PC 10% 8% • Marge 3% 3%
«Sondages contradictoires»? • «Deux sondages effectués par des maisons différentes donnent des résultats contradictoires sur la position des libéraux au Québec.» (SRC, 24 avril 2004) • Sondage CROP Léger • Avril 15-25 20-24 • BQ 38-44% 43-49% • PLC 36-42% 31-37% • NDP 7-13% 5-11% • PC 7-13% 5-11% • Marge 3% 3%
«Le PQ creuse l’écart»? • La Presse, 16 août 2012 • Sondage CROP CROP • Dates 4-8 août 12-14 août • PQ 32% 34% • PLQ 29% 27% • CAQ 21% 25% • Marge 3% 3%
«Le PQ creuse l’écart»? • La Presse, 16 août 2012 • Sondage CROP CROP • Dates 4-8 août 12-14 août • PQ 29-35% 31-37% • PLQ 26-32% 24-30% • CAQ 18-24% 22-28% • Marge 3% 3%
«La charte relance le PQ»? • Le Devoir, 31 août 2013 • Sondage Léger Léger • Dates 17-19 juin 29-30 août • PLQ 38% 36% • PQ 27% 32% • CAQ 19% 18% • Marge 3% 3%
«La charte relance le PQ»? • Le Devoir, 31 août 2013 • Sondage Léger Léger • Dates 17-19 juin 29-30 août • PLQ 35-41% 33-39% • PQ 24-30% 29-35% • CAQ 16-22% 15-21% • Marge 3% 3%
«Les Libéraux regagnent du terrain»? • La Presse, 28 avril 2004 • Sondage CROP CROP • Mois Mars Avril • BQ 45% 41% • PLC 35% 39% • Marge 3% 3%
«Les Libéraux regagnent du terrain»? • La Presse, 28 avril 2004 • Sondage CROP CROP • Mois Mars Avril • BQ 42-48% 38-44% • PLC 32-38% 36-42% • Marge 3% 3%
«Les Libéraux sonten chute libre»? • Journal de Montréal, 2 juin 2004 • Sondage Léger Léger • Mois Avril Mai • PLC 38% 35% • PC 26% 30% • Marge 2% 2%
«Les Libéraux sonten chute libre»? • Journal de Montréal, 2 juin 2004 • Sondage Léger Léger • Mois Avril Mai • PLC 36-40% 33-37% • PC 24-28% 28-32% • Marge 2% 2%