240 likes | 382 Views
INF L14 Initiation aux statistiques. 2 – Concepts généraux. Plan. Qu’est-ce que la statistique ? Quelques éléments de terminologie. Première partie Qu’est-ce que la statistique ?. Statistique. Latin status = « état » Définition
E N D
INF L14Initiation aux statistiques 2 – Concepts généraux
Plan • Qu’est-ce que la statistique ? • Quelques éléments de terminologie
Statistique • Latin status = « état » • Définition • Une étude statistique consiste à observer et à étudier une particularité commune chez un groupe de personnes ou de choses. • Exemples • Les notes d’un groupe d’élèves • Le taux de mortalité par cancer des fumeurs • La fréquence des mots d’un texte • etc.
Deux domaines • Statistique descriptive • exploration des données • mesures et indices • représentations graphiques • Statistique inférentielle • tester des hypothèses • faire des prédictions à partir d’échantillons Dans ce cours : statistique descriptive Inférence. Opération par laquelle on passe d'une vérité à une autre vérité, jugée telle en fonction de son lien avec la première. (Petit Larousse)
Lorsque je calcule la moyenne d’une classe je trace la courbe d’évolution du chômage en 2004 je fais de la statistique descriptive Lorsque je me demande si l’effet d’un médicament est réel ou s’il est imputable au hasard j’essaie de prédire des intentions de vote à partir d’un échantillon de 1000 personnes je fais de la statistique inférentielle Exemples (1)
Statistique descriptive La longueur des phrases dans le Petit Prince est de 9,8 mots. Statistique inférentielle La longueur des phrases dans le Petit Prince est significativement plus courte que dans le journal Le Monde (25 mots) On exclut l’effet du hasard Exemples (2)
Exemples (3) • Statistique descriptive • Jésus est le mot (plein) le plus fréquent dans chacun des 4 évangiles
Question... • Statistique descriptive : • Le mot Jésus est-il plus fréquent dans certains évangiles que dans d’autres ? Attention, avant de conclure! les textes n’ont pas la même longueur...
+ Jean Marc Luc Matthieu - Réponse... • Oui • les fréquences diffèrent significativement Cohérent avec les données historiques C’est-à-dire différences pas imputables au hasard
+ Jean Marc Luc Matthieu - Réponse... • Oui • les fréquences diffèrent significativement Cohérent avec les données historiques C’est-à-dire différences pas imputables au hasard
Terminologie • Rappel : • Une étude statistique consiste à observer et à étudier une particularité commune chez un groupe de personnes ou de choses. population individus variable (ou attribut, caractère)
Population • Définition • On appelle population l’ensemble de tous les objets que l’on étudie. • Exemples • Des personnes : • Un groupe d’élèves, un groupe de malade, la population française • Mais aussi : • Les mots d’un texte, un ensemble de documents, etc.
Individus • Définition : • Les individus sont les éléments de la population étudiée. • Exemples : • chacune des personnes interrogées pour une enquête • chaque jour de l'année pour lequel on dispose de données météorologiques • chaque mot d’un texte • chaque texte d’un corpus • etc.
Variables • Définition • Une variable est une propriété commune aux individus de la population que l'on souhaite étudier. • On dit aussi • Attribut, caractère • Exemples • La taille de personnes, la couleur de leurs yeux, leur sexe • Le nombre de lettres des mots, la durée des pauses dans un discours, le genre d'un texte (roman, poésie, etc.)
Types de variables • Les variables étudiées peuvent être : • Qualitatives • sexe, profession • genre des textes (roman, poésie, etc. ), catégories grammaticales des mots (nom, verbe, etc.) • Quantitatives • taille, poids, âge, taux de cholestérol • longueur, catégorie grammaticale des mots • durée des pauses dans un discours
Modalités • Définition • Les modalités d'une variable qualitative sont les différentes valeurs que celle-ci peut prendrei. • Exemple • variable situation familiale : célibataire, marié, veuf, divorcé. • variable sexe : homme, femme. • variable prénom : Alice, Bernard, Charles, ... (modalités très nombreuses!)
Variables quantitatives • Les variables quantitatives sont de deux types : • Discrètes = valeurs dénombrables (ex.: nombres entiers) • Exemples • nombre d'enfants par famille, nombre de pièces d'un appartement • nombre de mots d’un texte, nombre de lettres d’un mot • Continues = infinité de valeurs, aussi proches qu’on veut (ex.: nombres réels) • Exemples • taille, poids, des personnes • durée des pauses d’un discours, fréquence fondamentale de la voix
Mesure ou dénombrement ? • On dénombre les individus dans telle ou telle modalité d’une variable qualitative • 65 personnes aux yeux bleus • 44 personnes aux yeux marron • etc. • On mesure les variables quantitatives : • taille de l’individu X = 1,75 m
Statistique descriptive Statistique inférentielle Population Individu Variable Variable qualitative Variable quantitative Modalité Termes à retenir