240 likes | 475 Views
Dénombrement et représentations graphiques d’un caractère continu. TD Statistique 2 - Ludovic Méasson 3 novembre 2004. Rappel TD précédent Exemple d’un caractère continu : les altitudes d ’une chaîne de montagne. 2312, 1985, 1642, 1340, 1854, 1789, 1891, 2210, 2425, 1956,
E N D
Dénombrement et représentations graphiques d’un caractère continu TD Statistique 2 - Ludovic Méasson 3 novembre 2004
Rappel TD précédent • Exemple d’un caractère continu : les altitudes d ’une chaîne de montagne. • 2312, 1985, 1642, 1340, 1854, 1789, 1891, 2210, 2425, 1956, • 1970, 2003, 1515, 2102, 2010, 2412 • Produire un tableau de dénombrement avec la même méthode que pour les • caractères discrets aurait peu de sens : • nombre important de modalités • effectifs très faibles (en général, comme ici, 1 seul individu par valeur) • Ainsi, pour les caractères continus, le dénombrement passe soit par : • une analyse élémentaire • une analyse par classes
1 - L ’analyse élémentaire Lorsque la population n’est pas trop nombreuse, on ordonne les valeurs du caractère X. Dans ce nouveau tableau élémentaire , on peut associer à chaque modalité xi un rang, qui est sa position dans le classement des valeurs de la plus petite à la plus grande Ex : rendement en blé de différentes parcelles agricoles Parcelle Rdt (q/ha) A 25 B 22 C 51 D 62 E 75 F 20 G 49 H 78 I 68 J 50 Rang X (q/ha) 1 20 2 22 3 25 4 49 5 50 6 51 7 62 8 68 9 75 10 78
Une fois ce tableau réalisé, on réalise un diagramme de distribution : X (q/h) 20 50 80 Rang X (q/ha) 1 20 2 22 3 25 4 49 5 50 6 51 7 62 8 68 9 75 10 78 Rmq : chaque individu est représenté par sa modalité sur un axe gradué. Si deux individus ont des modalités identiques ou très proches, on procède à un empilement des points
Réalisez ce même travail avec les tailles des étudiants d’IUP. • (Tableau élémentaire élèves IUP + Exo 1) • Le tableau • Le diagramme de distribution (sur papier)
2 - La partition en classes Ex : Tailles des IUP en cours de stat. Ce mode de traitement est le plus fréquent. Inconvénient par rapport à l’analyse élémentaire : on perd de l’information puisque chaque valeur n’est pas représentée. Toutes les valeurs tombant dans une même classe sont considérées comme identiques. Avantage : on gagne en lisibilité Condition : chaque individu doit appartenir à une classe et une seule.
Modalités du caractère X Centre de la classe Effectif [eo, e1[ [e1, e2[ … [ei-1, ei[ … [ek-1, ek[ X1 X2 … Xi … Xk n1 n2 … ni … nk Rappel : Où xi = (ei-1 + ei) / 2 Amplitude d’une classe : Ai = ei - ei-1 Etendue de la distribution : Valeur max - valeur mini Fréquence simple des classes : fi = ni / n Fréquence moyenne ou densité d ’effectif : fmi = fi / Ai => cet indicateur sert à comparer deux classes qui n’ont pas la même amplitude.
A - Les méthodes de « discrétisation » (création des classes) : • Le nombre de classes • Il n’y a pas réellement de règles si ce n’est qu’il ne doit pas être trop important. • Trop de classes réduit la lisibilité du graphique. Le nombre de classes doit • être définit en fonction du message recherché. • Le type de classes : • Méthodes des seuils naturels : consiste à placer les limites de classes dans • les zones de discontinuités (milieux des « marches d’escalier » des courbes • de fréquences cumulées). • Méthode des amplitudes égales : consiste à diviser l’étendue en classes de • même amplitude • Méthode des effectifs égaux : consiste à placer les bornes de façon à avoir • approximativement le même effectif dans chacune des classes.
B - Les enseignements des courbes de fréquences cumulées pour la • construction des classes avec la méthode des « seuils naturels ». • Rappel : • Fréquence cumulée ascendante (% des individus ayant des modalités • de valeur inférieure ou égale) • Fréquence cumulée descendante (% des individus ayant des modalités de • valeur supérieure ou égale).
Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ? 4 3 2 1
Que nous disent ces phénomènes sur la courbe au niveau de la distribution des individus ? Zones de concentration : Une pente forte indique qu’il y a beaucoup d’individus sur un intervalle donné. 4 3 Les zones de dispersion : Inversement, une pente faible indique qu’il y a peu d’individus sur l’intervalle 2 1 Les discontinuités : Zones de dispersion séparant deux zones de concentration : milieu des « marches d’escalier ».
3 – Les représentations graphiques des variables quantitatives A - Le cas des séries chronologiques est particulier : l'ordre des individus étant primordial, on n'effectue pas de tri à plat, et on représente directement les données brutes en ordonnée, l'échelle du temps étant placée en abscisse. Le temps étant continu, on relie par des segments de droite les points obtenus. Si un phénomène saisonnier apparaît (même type de variations d'année en année par exemple), il est possible de superposer plusieurs graphiques, ou de les remplacer par des moyennes.
Nombre d'enfants xi Effectifs ni Fréquences fi 0 6 0.33 1 4 0.22 2 5 0.28 3 2 0.11 4 1 0.06 Total : 18 1 B - Pour une variable discrète (valable également pour les variables qualitatives), après un tri à plat conduisant à la distribution observée, on représente celle-ci par un diagramme en bâtons les xi sont placés suivant une échelle sur l'axe des abscisses, et les effectifs ni sont matérialisés par un "bâton" de longueur ni(axe des ordonnées). Ex : nombre d’enfants par famille. Le fait d'avoir des "bâtons" séparés les uns des autres permet de voir l'aspect ponctuel et discontinu des valeurs de la variable sur lesquelles l'effectif total est réparti.
Nombre d'enfants xi Effectifs ni Effectifs cumulés croissants Ni Effectifs cumulés décroissants N'i 0 6 6 18 1 4 10 12 2 5 15 8 3 2 17 3 4 1 18 1 On peut aussi tracer la courbe cumulative croissante, appelé également fonction de répartition. On utilise alors les effectifs cumulés. Elle se présente généralement comme une courbe « en escalier » (pour bien montrer le caractère discret de la variable). Par convention, le segment de droite se place à gauche de la valeur xi. Ce segment est fermé à gauche et ouvert à droite. • Cette représentation offre un moyen pratique de savoir par exemple : • Combien de familles ont deux enfants maximum ? • Combien de familles ont 3 enfants maximum ?
De même, on peut réaliser une courbe cumulative décroissante (ci-dessous) et les courbes des fréquences cumulées. • Ici, on saura par exemple : • Combien de familles ont au moins 1 enfants ? • Combien de familles on au moins 2 enfants ?
Exercice : • A partir du tableau élémentaire de l’âge des étudiants d’IUP, représenter graphiquement les effectifs, les effectifs cumulés croissants et décroissants et les fréquences cumulées croissantes et décroissantes. • Et répondez aux deux questions : • Quel pourcentage des élèves a 21 ans ou moins ? • Quel pourcentage des élèves a 21 ans ou plus ? • Enregistrer votre travail sous votre nom dans : • Z:/Public/Measson/Exercices en classe
C – Représentation graphique d'une variable continue, On a vu que si l'on compte les effectifs par valeur on risque souvent d'avoir un trop grand nombre de valeurs différentes, avec de trop faibles effectifs, et qu'il convient de regrouper les données en classes. Il existe souvent un moyen simple d'effectuer simultanément un tri à plat des données et un graphique : c'est le diagramme tige-feuilles. Ex : les tailles ci-dessous se situent entre 159 et 177. Les deux premiers chiffres sont 15, 16, ou 17 (la tige) et les suivants différencient les valeurs (ce sont les feuilles).
On peut diviser de 5 en 5 pour avoir plus de classes : On peut ordonner ensuite les valeurs pour mieux voir la répartition des feuilles sur chaque tige.
Classes de tailles (en cm) Effectifs [ 155 - 160 [ 1 [ 160 - 165 [ 5 [ 165 - 170[ [ 170 - 175 [ [ 175 - 180 [ 4 Si le nombre de données est trop important ou que l’on veut un autre type de représentation graphique, il fait organiser les données en classes. Avec l’exemple précédent, on peut avoir : 21 29
A partir de la distribution précédente, on peut construire un histogramme des effectifs : les classes étant de même amplitude, en plaçant en ordonnée les effectifs on obtient des rectangles dont la surface est proportionnelle à l'effectif associé.
Mais supposons qu'on veuille détailler davantage : L'effectif 21 entre 1.65 m et 1.70 m se répartit en 8 dans [1.65 ; 1.675 [ et 13 dans [1.675 ; 1.70 [. Quel graphique est exacte ?
Quand on représente une variable continue sous forme d’histogramme, c’est la surface du rectangle qui représente la valeur de l’effectif. La surface (l’effectif ni en fait) dépend de l’amplitude de la classe (ai ou largeur) et de la hauteur (y). Or, pour ni = 1 ; y = 1 quand ai = 5 cm (ex. entre 155 et 160). Quel doit être y pour ai = 2,5 ?
Exercice : • A partir du tableau élémentaire de la taille des étudiants d’IUP : • Construisez la courbe des fréquences cumulées • Opérez la discrétisation des données et argumentez votre choix • Représentez graphiquement les effectifs, les effectifs cumulés croissants, et les fréquences cumulées croissantes. • Enregistrer votre travail sous votre nom dans : • Z:/Public/Measson/Exercices en classe