940 likes | 1.46k Views
Statistique Descriptive Chapitre 1 : Les tableaux et représentations graphiques. Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc. Statistiques descriptives à une variable : représentations. Objectifs de ce module.
E N D
Statistique DescriptiveChapitre 1 : Les tableaux et représentations graphiques Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc Tifawt.com
Statistiques descriptives à une variable : représentations Objectifs de ce module • Savoir décrire et représenter une série statistique par un tableau et un ou plusieurs graphiques adaptés. • On fera des choix des représentations différents selon la nature du caractère. Tifawt.com
Introduction • La représentation tabulaire est préalable à toute analyse statistique. • Elle fait suite au travail préliminaire de collecte des données. • La représentation graphique d’un seul caractère repose sur une règle de proportionnalité des hauteurs ou aires des graphiques aux effectifs (ou fréquences). • Le choix d’un type de graphique dépendra de la nature du caractère étudié. Tifawt.com
Plan du chapitre 1 Voici les parties que nous allons aborder : • Caractères qualitatifs. • Caractères quantitatifs discrets. • Caractères quantitatifs continus. Tifawt.com
Ⅰ. Caractères qualitatifs Plan de la partie Voici les chapitres que nous allons aborder : • Représentation tabulaire. • Diagramme à bande. • Diagramme circulaire. Tifawt.com
Ⅰ. Caractères qualitatifs 1. Représentation tabulaire • Tableau à simple entrée, sans hiérarchie (sauf si le caractère est ordinal). • La première colonne renseigne les modalités et les deux suivantes les effectifs et fréquences. • Si le caractère est ordinal, on pourra rajouter une dernière colonne avec les fréquences cumulées. Tifawt.com
Ⅰ. Caractères qualitatifs 1. Représentation tabulaire • Exemple: On a noté la situation familiale des 150 employés d'une entreprise. Tifawt.com
On ne s'intéresse pas à la situation personnelle de M. Azim ou de M. Farid, mais à la répartition du caractère "situation familiale" dans la population des 150 employés. • Pour cela il faut, pour chacune des modalités de la variable, déterminer l'effectif correspondant, c'est-à-dire le nombre de personnes ayant cette modalité : il faut dénombrer le nombre de célibataires, le nombre de mariés, etc.. Tifawt.com
Cela peut se résumer par : Tifawt.com
On notera x1, x2, ..., xk les différentes modalités, et n1, n2, ... , nk les effectifs associés. Dans le tableau ci-dessus, x1 = "marié", n1 = k = La somme des effectifs vaut : La variable que nous venons de voir est… Tifawt.com
On aurait pu tout aussi bien présenter les résultats sous la forme ci-dessus, par exemple. Tifawt.com
Par contre, s'il s'agit d'une variable ordinale, les modalités sont toujours présentées dans l'ordre : x1< x2< .... < xk , comme dans l'exemple ci-dessous. Tifawt.com
L'ensemble des couples { (xi , ni ), i = 1, ... , k } est une série statistique (ordonnée), ou distribution observée de la variable. La somme de tous les ni est-elle toujours égale à n, nombre des observations ? On notera ceci : effectif total Tifawt.com
On appellera fréquencerelative la valeur que l'on peut aussi exprimer en pourcentage par fi x 100, c'est le pourcentage d'individus pour lesquels la variable a pris la valeur xi. Tifawt.com
Complétez le tableau : A quoi est égal ici le total de la colonne fréquence ? Et celui de la colonne "pourcentage" ? Il y a, parmi les 150 employés, …….% qui sont mariés. Tifawt.com
Ⅰ. Caractères qualitatifs 2. Diagramme à bandes Aussi appelé représentation par « tuyaux d’orgue ». • Les modalités sont placées sur un axe horizontal. • Les effectifs (ou fréquences) sont placés sur un axe vertical. • La hauteur de chaque tuyau est proportionnelle à l’effectif correspondant. • Permet de comparer d’un « coup d’œil » les différentes modalités. Tifawt.com
Ⅰ. Caractères qualitatifs 3. Diagramme circulaire • L’aire, et donc l’angle au centre d’un secteur, est proportionnelle à la fréquence (ou l’effectif) de la modalité considérée (d’où un angle de fi x 360° pour la modalité i). • Permet de bien visualiser la part relative de chaque modalité. Tifawt.com
Statistiques descriptives à une variable : représentations Ⅱ. Caractères quantitatifs discrets Tifawt.com
Ⅱ. Caractères quantitatifs discrets Plan de la partie Voici les chapitres que nous allons aborder : • Représentation tabulaire. • Diagramme bâton. • Courbe des fréquences cumulées. Tifawt.com
Ⅱ. Caractères quantitatifs discrets 1. Représentation tabulaire • Tableau à simple entrée, où les données sont classées par ordre croissant. • La première colonne renseigne les différentes valeurs du caractère, et les trois suivantes les effectifs, fréquences et fréquences cumulées. Tifawt.com
De même, pour une variable discrète, on notera x1 , x2 , ... , xk les valeurs rangées par ordre croissant, et n1 , n2 , ... , nk les effectifs correspondants. Tifawt.com
Ainsi, à partir de la série brute ci-dessus, construisez le tableau : Tifawt.com
Voyons un autre exemple : Pour étudier les appels téléphoniques arrivant à un central, on a noté, sur 96 jours comparables, le nombre d'appels reçus entre 9 h et 9 h 10. Les résultats sont consignés dans ce tableau : Tifawt.com
Quelle est la proportion de jours où le nombre d'appels a été de 2 ? Tifawt.com
Quelle est la proportion de jours où le nombre d'appels a été supérieur ou égale à 3? Tifawt.com
Combien y-a-t-il eu de jours où le nombre d'appels a été inférieur ou égal à 2 ? Tifawt.com
Plus généralement, si { (xi , ni ), i = 1, ..., K } est la distribution observée d'une variable discrète, n1 + n2 + ... + ni = Ni est le nombre d'individus pour lesquels la variable a été inférieure ou égale à xi.. On peut calculer Ni de proche en proche : N1 = n1, N2 = N1 + n2, N3 = N2 + n3, etc ... Les Ni sont les effectifs cumulés croissants. Tifawt.com
De même ni + ni+1 + ... + nk = N'i est le nombre d'individus pour lesquels la variable a été supérieure ou égale à xi. • Il peut se calculer de proche en proche : N'k = nk , N'k-1 = nk + nk-1 , • Les N'i sont les effectifs cumulés décroissants. Tifawt.com
On peut définir de même : • Fi = f1 + f2 + ... + fi , fréquences relative cumulées croissantes obtenues de proche en proche par Fi+1 = fi+1 + Fi • F'i = fi + fi+1 + ... + fk , fréquences relative cumulées décroissantes obtenues de proche en proche par F'i = F'i+1 + fi • Fi et F'i peuvent s'exprimer aussi en pourcentage (en multipliant tout par 100). Tifawt.com
Complétez le tableau : Tifawt.com
Ⅱ. Caractères quantitatifs discrets 2. Diagramme bâton Diagramme bâton des effectifs • A chaque valeur du caractère portée en abscisse, on associe un « bâton » vertical dont la hauteur est proportionnelle à l’effectif. • Cette représentation permet de comparer les effectifs de chaque valeur du caractère. Tifawt.com
Ⅱ. Caractères quantitatifs discrets 3. Courbe des fréquences cumulées • Représente l’évolution des fréquences cumulées. • Le caractère étant discret, la courbe est en « escalier ». • En effet, les valeurs étant séparées, entre chacune d’elle la fréquence cumulée est inchangée, d’où ces paliers. Tifawt.com
Ⅱ. Caractères quantitatifs discrets 3. Courbe des fréquences cumulées Tifawt.com
Statistiques descriptives à une variable : représentations Ⅲ. Caractères quantitatifs continus Tifawt.com
Ⅲ. Caractères quantitatifs continus Plan de la partie Voici les chapitres que nous allons aborder : • Représentation tabulaire. • Histogramme des densités de fréquence. • Polygone de fréquences • Courbe des fréquences cumulées. Tifawt.com
Ⅲ. Caractères quantitatifs continus 1. Représentation tabulaire • Tableau à simple entrée, où les classes de données sont triées par ordre croissant. • La première colonne renseigne les différentes classes de valeurs du caractère, et les trois suivantes les effectifs, fréquences relatifs et fréquences cumulées. • Si les classes ne sont pas toutes de même amplitude, on rajoute une colonne contenant les densités de fréquence, i.e. la fréquence de la classe divisée par son amplitude. Tifawt.com
1. Représentation tabulaire • Lorsque la variable est continue, ou que la variable peut prendre un grand nombre de valeurs différentes, même si celle-ci est une variable discrète, il convient de regrouper ces valeurs en classes. • À chaque classe on fait correspondre une fréquence ou une fréquence relative, et l’on obtient alors une distribution de fréquence ou de fréquence relative pour valeurs groupées. • Pour construire une distribution de fréquence, de fréquence relative ou de fréquence relative cumulée pour valeurs groupées on doit procéder de la manière suivante : • Déterminer le nombre de classes • Déterminer l’amplitude des classes • Déterminer les différentes classes Tifawt.com
1. Représentation tabulaire • Déterminer le nombre de classes : 1) (règle de Sturges) 2) Nombre d’observations dans la série statistique Tifawt.com
1. Représentation tabulaire • Calculer l’amplitude des classes : • D’une façon plus ou moins arbitraire • En utilisant l’étendue (Plus grande valeur de la série statistique – Plus petite valeur de la série statistique) Des classes d’amplitudes égales Tifawt.com
1. Représentation tabulaire • Déterminer les différentes classes : Tifawt.com
Représentation tabulaireExemple 1 Voyons l'exemple d'une série brute de 60 valeurs du CA mensuelle d’une entreprise (en 1000dh), et le tableau des effectifs obtenus. L'inconvénient est que, comme on aura toujours un grand nombre de valeurs différentes, on obtiendra un grand nombre de petits effectifs, ne résumant finalement pas grande chose ! Tifawt.com
Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes. Tifawt.com
Afin de simplifier la présentation on peut, quitte à perdre un peu d'information, regrouper les effectifs proches, par exemple 175 d’ effectif 1 176 d’ effectif 2 177 d’ effectif 1 peut être remplacé par [ 175 ; 178 [ d’ effectif 4. Tifawt.com