260 likes | 403 Views
Les distributions de fr équences et de pourcentages. Plan de la s éance. 1 – Les distributions 1.1 – de fréquences 1.2 – de pourcentages 1.3 – de pourcentages cumulatifs 2 – Présentation des tableaux de résultats 3 – Les graphiques 3.1 – les diagrammes circulaires
E N D
Plan de la séance 1 – Les distributions 1.1 – de fréquences 1.2 – de pourcentages 1.3 – de pourcentages cumulatifs 2 – Présentation des tableaux de résultats 3 – Les graphiques 3.1 – les diagrammes circulaires 3.2 – les diagrammes en bâtons 3.3 – l’histogramme 3.5 – faire mentir les graphiques... 4 - Exemple
1.1 – Les distributions de fréquences Une distribution de fréquences (ou d’effectifs) nous montre le nombre de cas correspondant à chaque valeur d’une variable Notation: f = fréquence Donne une meilleure idée de la façon dont sont distribué les scores
1.1 – Les distributions de pourcentages Une distribution de pourcentages nous montre ce que serait la distribution de fréquence si le nombre total de cas était exactement 100 Pourcentage = f / N * 100 où f = fréquence N = Nombre total de cas • Plus facilement interprétable qu’une distribution de fréquences
1.1 – Les distributions de pourcentages f / N * 100 = (719 / 2143) * 100 = 0.336 * 100 = 33.6
1.1 – Les distributions de pourcentages ATTENTION : pour que les pourcentages soient ‘fiables’, le nombre de cas doit être élevé Règle d’usage : minimum50 cas idéalement plus de 100 cas
1.1 – Les distributions de pourcentages Nombre d’enfants des répondants (avec des enfants)
Un pourcentage cumulatif est le pourcentage de toutes les observations égales ou inférieurs à une valeur donnée pourcentage cumulatif = F / N * 100 où F = fréquence cumulative pertinent pour les distributions ordinales ou d’intervalles/ratio 1.2 – Les distributions de pourcentages cumulatifs
1.2 – Les distributions de pourcentages cumulatifs F F / N * 100 = (80 + 47 + 11) / 148 * 100 = (138 / 148) * 100 = 0.932 * 100 = 93.2
2 – Présentation des tableaux de résultats • Quelques règles générales : • Un titre clair et complet : phénomène étudié, le lieu, la date, la population de référence • Intitulés des lignes et des colonnes :noms clairs pour décrire les variables et leurs valeurs, mentionner s’il s’agit de fréquences, de taux ou de pourcentages • Le nombre total de cas (N) doit être inscrit • La source des données doit être mentionnée
2 – Présentation des tableaux de résultats Tableau 1 : Répartition de la population selon l’état matrimonial, Canada, 2007 * Inclus les personnes légalement mariées et séparées et les personnes vivant en union libre Source : Statistique Canada (http://www40.statcan.gc.ca/l02/cst01/famil01-fra.htm)
2 – Présentation des tableaux de résultats Pour commenter les tableaux de résultats, il suffit de traduire en mots simples ce que les chiffres suggèrent Ex. : La tableau 1 montre qu’en 2007, près de la moitié de la population canadienne était légalement mariée, séparée ou vivait en union libre
2 – Présentation des tableaux de résultats Attention au traitement des données manquantes (ne sais pas, sans réponse, refus, ne s’applique pas) généralement ces valeurs sont exclues mais la décision d’exclure ces observations dépend de la question de recherche Exclure les données manquantes change le N
2 – Présentation des tableaux de résultats Tableau 2 : Répartition des répondants selon l’état matrimonial, 18 ans et plus, Canda, 2004 Source : GENACIS (GENder Alcohol and Culture: an International Study)
2 – Présentation des tableaux de résultats Tableau 3 : Satisfaction du travail pour les travailleurs, 18 ans et plus, Canada, 2004 Source : GENACIS (GENder Alcohol and Culture: an International Study)
3.1 – Les diagrammes circulaires Le diagramme circulaire est un cercle dont la surface est divisée en tranches représentant les catégories de la variable et ou chaque tranche est proportionnelle à l’effectifde la catégorie qu’elle représente • Principalement utilisé pour les variables nominales avec un petit nombre de catégories
Le diagramme en bâton est constitué de bandesreprésentant les catégories de la variable et ou chaque bande est proportionnelle à l’effectif de la catégorie qu’elle représente Généralement utilisé pour représenter la répartition des variables discrètes avec de nombreuses catégories 3.2 – Les diagrammes en bâtons
3.3 – L’histogramme L’histogramme est utilisé pour représenter graphiquement la distribution d’une variable continue en ses différentes classes de données Même principe que pour le diagramme en bâton, mais les bandes sont collées Le choix de la largueur des bandes influence l’aspect visuel
3.3 – L’histogramme Données extrêmes
3.4 – Faire mentir les graphiques... “La représentation des nombres par des grandeurs physiques mesurées sur la surface de l’illustration elle-même devrait être directement proportionnelle aux quantités représentée.” Source: Tufte (2001) The Visual Display of Quantitative Information p. 70
4 – Exemple : Activité et chômage au Canada en 2008 Répartiton de la population canadienne âgée de 15 ans et plus selon le statut d’activité, 2008 Source: Statistique Canada (http://www40.statcan.gc.ca/l02/cst01/econ10-fra.htm) Calculer le taux d’activité et le taux de chômage