600 likes | 1.31k Views
Plan la séance 5 Procédures d’échantillonnage. Terminologie Étapes du processus d’échantillonnage Méthodes d’échantillonnage Échantillonnage sur internet Quel type d’échantillonnage utiliser ? Taille de l’échantillon Atelier : Planification du processus d’échantillonnage. Terminologie.
E N D
Plan la séance 5Procédures d’échantillonnage • Terminologie • Étapes du processus d’échantillonnage • Méthodes d’échantillonnage • Échantillonnage sur internet • Quel type d’échantillonnage utiliser ? • Taille de l’échantillon • Atelier : • Planification du processus d’échantillonnage
Terminologie • Univers • Échantillon • Recensement Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
Univers • Population ou groupe à l’étude • Différentes entités : • Citoyens • Employés • Clients • Partenaires • Fournisseurs • Élément de l’univers ou de la population : • Entité individuelle d’un groupe particulier • Unité d’étude
Échantillon • Sous-ensemble d’un groupe plus large • Doit être représentatif du groupe plus large Source : http://courses.tlt.psu.edu/course/bio12/module03/2009/10/lesson-02-samples-and-populations.html
Recensement • Enquête auprès de tous les éléments d’une population • En France, dans les communes de 10 000 habitants ou plus : • Un échantillon probabiliste représentant environ 8 % de la population est recensé chaque année • Au bout de 5 ans, l'ensemble du territoire de chaque commune est pris en compte, et 40 % environ des habitants de ces communes sont recensés • http://www.insee.fr/fr/publics/default.asp?page=communication/recensement/particuliers/organisation.htm#complus
Définir l’univers Cadre d’échantillonnage Méthodes d’échantillonnage Procédure de sélection Taille de l’échantillon Sélection des éléments Travail de terrain Étapes du processus d’échantillonnage Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
Définir l’univers • À qui voulons-nous parler ? • Bien définir l’unité d’étude, c’est-à-dire l’élément que nous voulons étudier dans l’univers
Cadre d’échantillonnage • Liste des éléments composant l’univers, p. ex. : • Liste de clients • Annuaire de téléphone • Attention à l’erreur d’exclusion
Méthodes d’échantillonnage Méthodes Non probabilistes Probabilistes De convenance Aléatoire simple De jugement Systématique Boule de neige Stratifié Par quota Grappes Volontaire Phases multiples Structuré aléatoire
Échantillonnage de convenance • Échantillon que le chercheur a sous la main, p. ex. : • Une classe d’étudiants ou une cafétéria pour un sondage dans le cadre d’un travail de session • Représentativité limitée de l’échantillon
Échantillonnage de jugement • Échantillon sélectionné selon le jugement d’une personne d’expérience, p. ex. : • Les sous-groupes de la population utilisés par les médias pour prédire les résultats le soir d’une élection • Marchés témoins pour évaluer un nouveau produit Source : http://www.ourbigearth.com/2011/05/02/get-out-the-vote-federal-election-is-today/
Échantillonnage boule de neige • Construction graduelle d’un échantillon en utilisant des références obtenues des premiers répondants • Les premiers répondants peuvent être sélectionnés de façon aléatoire ou non • Méthode utilisée lorsque les répondants sont difficiles à identifier
Échantillonnage par quota • Échantillon dont les sous-groupes respectent les proportions de chacun de ces groupes au sein de l’univers étudié en fonction de caractéristiques précises, p. ex. l’âge et le sexe • À ne pas confondre avec l’échantillon stratifié (probabiliste)
Échantillonnage volontaire • Échantillon composé de personnes auto sélectionnées • Par exemple : les lecteurs d’un journal ayant accepté de participer à un sondage réalisé par ce journal auprès de tous ses lecteurs
Échantillonnage structuré aléatoire1 de 3 • Ce type d’échantillon n’est pas considéré comme étant probabiliste, mais il est quand même considéré comme étant scientifique • Seule alternative pratique en l’absence d’un cadre d’échantillonnage • Il s’agit de structurer la population en fonction de plusieurs critères bien définis tels le jour, l’heure et la localisation géographique Source : http://zoom-travels.blogspot.ca/2012/08/fantasy-fridays-samba-at-carnival-rio.html
Échantillonnage structuré aléatoire2 de 3 • Pour un festival par exemple, on répartira la cueillette de données sur toute la durée de l’événement (p. ex. : 3 jours) • On sélectionnera les répondants à différentes heures, les mêmes chaque jour (p. ex : 10h, 14h, 18h et 22h) Source : http://zoom-travels.blogspot.ca/2012/08/fantasy-fridays-samba-at-carnival-rio.html
Échantillonnage structuré aléatoire3 de 3 • On sélectionnera les répondants de façon systématique pour introduire un effet aléatoire (p. ex. : un visiteur sur trois ou sur quatre) • Cette méthode est utilisée par des chercheurs et des étudiants de cycles supérieurs et acceptée par certaines instances gouvernementales pour justifier des demandes de subvention Source : http://zoom-travels.blogspot.ca/2012/08/fantasy-fridays-samba-at-carnival-rio.html
Échantillonnage aléatoire simple • Échantillon construit à partir d’une liste de l’univers, dans laquelle chaque élément a une chance égale d’être choisi • Il peut être difficile d’obtenir une liste de l’univers • On utilise des tables de hasard ou des numéros générés au hasard par un ordinateur pour sélectionner les répondants • Pour les petits échantillons, on peut sélectionner les répondants avec une roulette, un boulier, des papiers dans un chapeau… • L’échantillon peut ne pas être représentatif de la population Source : http://ccelearn.csus.edu/wasteclass/mod9/mod9_05.html
Échantillonnage systématique • Échantillon construit à partir d’une liste complète de l’univers à l’étude, comme l’échantillon simple au hasard • Les répondants sont sélectionnés à intervalle fixe, le premier devant être sélectionné au hasard comme pour l’échantillonnage aléatoire simple Source : http://rchsbowman.wordpress.com/2009/08/16/statistics-notes-sampling-techniques-2/
Échantillonnage stratifié • Échantillon dont les sous-groupes respectent les proportions de chacun de ces groupes au sein de l’univers étudié en fonction de caractéristiques précises, p. ex. l’âge et le sexe • On utilise des tables de hasard ou des numéros générés au hasard par un ordinateur pour sélectionner les répondants dans chacune des strates • À ne pas confondre avec l’échantillonnage par quota (non probabiliste)
Échantillonnage par grappes • Échantillon dont l’unité n’est plus l’élément de l’univers qui est à l’étude mais un sous-groupe (grappe) réunissant plusieurs de ces éléments • Ces grappes sont composées d’éléments dont un des points communs est la proximité géographique • Cette méthode vise à produire un échantillon d’une façon économique tout en retenant les caractéristiques d’un échantillon probabiliste • Considéré comme échantillonnage probabiliste si la sélection des grappes est aléatoire
Exemples de grappes Grappes possibles : Vols Montréal-Toronto Population à l’étude : Voyageur d’affaires Montréal-Toronto
Échantillonnage en phases multiples • Échantillon sélectionné en utilisant une combinaison de plusieurs méthodes probabilistes, p. ex. l’échantillonnage aréolaire (area sampling) : • Diviser le Canada en provinces/villes/arrondissements/blocs (échantillonnage stratifié) • Sélectionner un certain nombre de blocs • Recueillir les réponses de tous les répondants au sein des blocs sélectionnés (échantillonnage par grappes)
Échantillonnage sur internet(1 de 3) • Échantillons non probabilistes de convenance pour les sondages éclair • Pour les sondages éclair, la construction d’un gros échantillon peut être très rapide pour les sites populaires • Les méthodes probabilistes les plus utilisées en ligne sont : • Échantillonnage aléatoire simple • Échantillonnage systématique
Échantillonnage sur internet(2 de 3) • Problème de surreprésentation des visiteurs fréquents • Sélection aléatoire en utilisant une fenêtre intempestive « Pop-Up »… • … mais les fureteurs évolués bloquent les fenêtres intempestives • Utilisations de panels… • … mais un panel n’est pas toujours représentatif de la population à l’étude
Échantillonnage sur internet(3 de 3) • Pour les sondages auprès de la clientèle, utilisation de numéros d’accès pour empêcher les réponses multiples du même répondant • Invitations à participer en personne, par courrier, par courriel ou sur un reçu de caisse • Certaines personnes ne disposent pas d’un ordinateur ou d’un accès internet rapide
Quelle méthode d’échantillonnage utiliser? • Marge d’erreur et niveau de confiance désirés • Ressources humaines et financières disponibles • Contraintes de temps • Disponibilité d’une liste de l’univers • Dispersion géographique des répondants • Nécessité d’effectuer des projections à une population plus large
Taille de l’échantillon • N’est pas fonction de la taille de l’univers • Représentativité • Marge d’erreur et niveau de confiance E = échantillon A & B = partage des répondants (0,5 par défaut) ER = erreur permise (3%, 4%, 5%,...) Z = # d’écarts type vs niveau de confiance (3 = 99%, 2 = 95%, 1 = 68%) Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 143 165
Intervalle de confiance MOYENNE Écart type = -1 Écart type = +1 -2 +2 -3 +3 99% 68% 68% 99% 95% 95% Tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
Taille de l’échantillon • Pour le pire des scénarios, un partage 50/50 des répondants • Une marge d’erreur de 5% • Un niveau de confiance de 95% (usuel) • Taille de l’échantillon = 400 répondants
Taille de l’échantillon • Supposons un partage 20/80 des répondants • Une marge d’erreur de 5% • Un niveau de confiance de 95% (usuel) • Taille de l’échantillon = 256 répondants
Taille de l’échantillon • Pour le pire des scénarios, un partage 50/50 des répondants • Une marge d’erreur de 5% • On augmente le niveau de confiance à 99% • Taille de l’échantillon = 900 répondants
Taille de l’échantillon • Pour le pire des scénarios, un partage 50/50 des répondants • On diminue la marge d’erreur à 3% • Un niveau de confiance de 95% • Taille de l’échantillon = 1 111 répondants
Taille de l’échantillon • Pour le pire des scénarios, un partage 50/50 des répondants • On diminue la marge d’erreur à 3% • Un niveau de confiance de 99% • Taille de l’échantillon = 2 500 répondants
Atelier • Planification du processus d’échantillonnage