1 / 39

Introduction

Introduction. Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à l’aide de mesures, de tableaux et de graphiques.

Download Presentation

Introduction

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Introduction Les statistiques, pour quoi faire ? - Le recours à la statistique permet de décrire des phénomènes à l’aide de mesures, de tableaux et de graphiques. Elle permet d’établir l’existence de lien entre certains phénomènes, d’expliquer des relations entre des indicateurs par un modèle mathématique. - Et enfin de généraliser des résultats obtenus sur un petits groupes à l’ensemble d’une population. Statistiques

  2. Introduction Il y a trois types d’analyse statistique : - Résumé des données : c’est la plus commune, celle qu’on trouve dans nos journaux. Elle décrit simplement les données. Le calcul de moyenne, d’écart type, de pourcentage et leur représentation graphique entrent dans cette catégorie. Test statistique : un test permettra de répondre à une question : « y a-t-il plus de cancer chez ceux qui fument ? » Les tests statistiques tranchent…avec une fiabilité variable, mais que l’on peut connaître. Modélisation : enfin, les statistiques permettent de décrire le monde de manière raisonnablement précise et de jouer aux devinettes. Sur les trois dernières années, aucun des étudiants qui ont entre 10 et 11 en licence n’ont eu le CAPEPS. On peut donc « parier » raisonnablement que cette années, il en sera de même et donc déconseiller cette voie à ceux qui n’ont pas eu de mention du tout. Naturellement, rien n’est sûr et l’on peut se tromper, mais statistiquement, c’est rare. Statistiques

  3. Définitions Un Individu : (ou Sujet, ou Unité statistique) est l’objet étudié. La Population : est l’ensemble de tous les individus (effectif = N). Un Echantillon : est une fraction de la population (effectif = n). Une Variable (ou Caractère) est-ce qui est étudié chez les individus (et qui a priori varie d’un individu à l’autre). Les Modalités (ou Ensemble fondamental) d’une variable sont toutes les valeurs que cette variable peut prendre. Statistiques

  4. La statistique descriptive Les renseignements que l’on détient sur une population sont généralement inutilisables sous leur forme brute. Il convient de procéder à des regroupements, à des classements et à l’établissement de tableaux statistiques en distinguant les séries selon la nature du caractère : qualitatif, quantitatif discontinu ou continu. Une mise en ordre des résultats obtenus qui se traduit par des tableaux ; Visualisation des regroupements opérés sous forme de figure ; Analyse numérique aboutissant à des indices. Statistiques

  5. Les variables Les caractéristiques des individus portent le nom de variables parce qu’elles peuvent varier d’un individu à l’autre. Le sexe, la profession, l’âge, le revenu, la situation matrimoniale, le niveau de diplôme la consommation d’un biceps en oxygène, l’opinion politique sont des exemples de variables connues. Statistiques

  6. Nature d’une variable En pratique, toutes les variables n’ont pas les mêmes propriétés. Par exemple, on peut faire la moyenne des températures mais pas la moyenne des Oui/Non. Trois propriétés intéressent particulièrement les statisticiens : 1. Arithmétique : peut-on additionner les observations entre elles ? 2a. Comparaison : cela a-t-il du sens de dire q’une observation est plus grande qu’une autre ? 2b. Continuité : le nombre de modalités est-il petit ou grand ? Statistiques

  7. Nature d’une variable Statistiques

  8. Variables qualitatives Les variables qualitatives contiennent des données qui s’évaluent avec des mots et non avec des nombres. Elles mesurent une qualité de l’individu et non une quantité : le métier, le sexe, le groupe sanguin, la mention au bac… Les différentes formes que peut prendre une variable qualitative sont appelées modalités. La variable « sexe » possède deux modalités : sexe masculin et sexe féminin, et l’on ne peut appartenir qu’à une seule des modalités de cette variable. Ces variables qualitatives peuvent être nominales ou ordinales. Statistiques

  9. Variables qualitatives Une Variable nominale est une variable dont on ne peut additionner, ni les ordonner les modalités. Une Variable ordonnée est une variable dont on ne peut pas additionner les modalités, mais dont on peut les ordonner. Alors qu’une variable nominale répond à une classification, une variable ordinale correspond à un classement. Statistiques

  10. Présentation des données(variable qualitative) Liste brute liste triée Statistiques

  11. Présentation des données(variables qualitatives) Représentation graphique : Diagramme en bandeaux Statistiques

  12. Présentation des données(variable qualitative) Représentations graphiques possibles : Le graphe en bandeaux Le graphe en points Le camembert Statistiques

  13. Variables quantitatives (ou numérique) Une variable est quantitative lorsque ses modalités sont de nature numérique, elles prennent donc la forme de nombres réels. Le terme « valeur » remplace ici celui de « modalités ». C’est la variable la plus utilisé. Elle comprend toutes les mesures sur lesquelles il est possible de faire des opérations et des comparaisons : performances sportives, notes, nombre de membre de clubs, l’âge, la taille d’un individu, … Les variables numériques peuvent être continues ou discrètes et peuvent utiliser des échelles d’intervalles ou de rapports. Statistiques

  14. Variables quantitatives (ou numérique) On dit qu’une variable est continue si elle peut supposer un nombre infini de valeurs réelles. L’âge , la taille d’une personne, la température. Ainsi une personne peut être âgée de 25 ans, 2 mois, 24 jours, 11 heures, 15 minutes, 20 secondes…elle peut mesurer 1,958186…mètre. Les variables continues sont donc le plus souvent arrondies, et regroupé en « intervalles en classes », les 25-30 ans. Contrairement aux variables continues, une variables discrète ne peut revêtir qu’un nombre défini de valeurs réelles. Le revenu, le score obtenu à un test, le nombre d’enfants. Un étudiant peut obtenir une note qui varie entre 0 et 20. Statistiques

  15. L’échelle d’intervalles Cette échelle de mesure quantitative utilise une unité de mesure normalisée et un zéro relatif qui permettent d'évaluer des écarts à l'aide de deux opérations simples : l'addition et la soustraction. Le zéro est dit « relatif » car il fixe, par convention, l'origine de l'échelle. Statistiques

  16. L’échelle de rapport Cette échelle de mesure est considérée comme la plus précise car elle autorise tous les calculs arithmétiques: addition, soustraction, multiplication et division. Elle se distingue de l'échelle d'intervalles par le fait qu'elle utilise un « zéro absolu » qui renvoie à l'absence de la caractéristique mesurée. Statistiques

  17. Présentation des données(variables quantitatives) Fréquence relative : « n/N » Variables quantitatives discontinues (ou discrètes) Exemple : Au cours d’une journée de championnat de France de football de première division, la distribution des 20 clubs selon le nombre de buts marqués est la suivante : Statistiques

  18. Présentation des données(variables quantitatives) Variables quantitatives discontinues (ou discrètes) Représentation graphique : Diagramme en Bâtons Statistiques

  19. Présentation des données(variables quantitatives) Variables quantitatives continues : Exemple : On a mesuré la taille au centimètre près de chacun des concurrents de l’épreuve du marathon des jeux Olympiques d’Athènes en 2004. On dispose de 73 résultats. Statistiques

  20. Présentation des données(variables quantitatives) Valeurs limites de l’intervalle : Min : 156 Max : 201 Découpage en 12 classes de 4 cm Statistiques

  21. Présentation des données(variables quantitatives) Variables quantitatives continues : Statistiques

  22. Présentation des données(variables quantitatives) Variables quantitatives continues : Représentation graphique : Histogramme Statistiques

  23. Analyse numérique Cette partie de la statistique descriptive consiste notamment à calculer quelques valeurs caractéristiques qui synthétisent l’ensemble des données. Ces valeurs typiques sont appelées indices ou paramètres. On distingue les paramètres de tendance centrale et les paramètres de dispersion. Statistiques

  24. Analyse numérique Statistiques

  25. Analyse numériqueLe Mode C’est la valeur du caractère qui correspond à l’effectif le plus grand ou la fréquence la plus importante. C’est le caractère le plus dominant. Statistiques

  26. Analyse numériqueLa Médiane Cas des séries à caractères discontinus ou données non regroupées : Si le nombre d’éléments est impair : (2 n + 1) ; la Médiane est le rang (n + 1) Si le nombre d’éléments est pair : (2 n) ; la Médiane est déterminée dans l’intervalle séparant le terme de rang (n) et le terme de rang (n + 1) Statistiques

  27. Analyse numériqueLa Médiane Cas des séries à caractères continus ou données regroupées : Il faut d’abord calculer les effectifs cumulés, Statistiques

  28. Analyse numériqueLa Médiane Cas des séries à caractères continus ou données regroupées : L’effectif total étant de n = 73, il faut rechercher la taille du sujet n / 2, soit 36,5. En consultant la colonne des effectifs cumulés on voit que la position 36,5 se trouve dans la classe 168 – 171 (dont les bornes exactes sont 167,5 – 171,5). 18 sujets mesurent moins de 167,5 cm (effectifs cumulés de la classe 164 – 167). Il nous manque donc pour atteindre la position 36,5 la différence entre 36,5 et 18, soit 18,5 sujets. On cherche donc dans la classe 168 – 171, qui comprend 20 sujets, La taille du 18,5ème. Si les sujets sont répartis uniformément sa distance à la borne inférieure de la classe est de 18,5 / 20 * 4 cm, l’intervalle de classe étant de 4 cm. La valeur de la médiane est de ce fait égale à : 167,5 + 18,5 / 20 * 4 = 171,2 cm. Statistiques

  29. Analyse numériqueLa Moyenne Lorsque les données sont regroupées en classes on considère que chaque valeur de la classe est représentée par le centre de la classe. M = ni xi / ni M = 12553,5 / 73 =171,97 Statistiques

  30. Analyse numériqueL’étendue On appelle ’’étendue’’ d’une distribution la mesure de l’intervalle séparant les deux valeurs extrêmes de cette distribution. E = Xmax – Xmin E = 201 – 156 = 45 Statistiques

  31. Analyse numériqueLa Variance (ni xi²) - (ni xi)² / N S² = —————————————— N - 1 Statistiques

  32. Analyse numériqueL’Ecart-type S = racine de S² Statistiques

  33. Analyse numériqueCoefficient de Variation Coefficient de variation CV = S / M * 100, M ≠ 0 Statistiques

  34. Analyse numériqueLes quantiles Statistiques

  35. Caractéristiques de formes :Asymétrie Statistiques

  36. Caractéristiques de formes :Asymétrie M = Me = Mo Statistiques

  37. Caractéristiques de formes :Asymétrie M > Me > Mo Les observations présentent un étalement plus important sur le côté supérieur de la distribution Statistiques

  38. Caractéristiques de formes :Asymétrie M < Me < Mo Les observations présentent un étalement plus important sur le côté inférieur de la distribution Statistiques

  39. Caractéristiques de formes :Aplatissement d’une distribution Statistiques

More Related