340 likes | 540 Views
UE 45.2 CHII. Analyse Descriptive. Pierre MORETTO, Université Paul Sabatier, Toulouse III. Recueil de données. 205 athlètes passent un test de détente verticale Tableau récapitulatif des données expérimentales recueillies Analyse descriptive a pour objet de « décrire »
E N D
UE 45.2 CHII Analyse Descriptive Pierre MORETTO, Université Paul Sabatier, Toulouse III.
Recueil de données • 205 athlètes passent un test de détente verticale • Tableau récapitulatif des données expérimentales recueillies • Analyse descriptive a pour objet de « décrire » • Donner un sens, permettre la lecture des données
Le tableau récapitulatif …. Recueil de données Ici ….. 205 valeurs de détentes verticales 8-[ Analyse : Donner un sens
Analyse descriptive Les étapes • Le tri • Le recensement • Le regroupement par classes • Représentations graphiques • Histogramme • Diagramme cumulatif • Détermination d’indices • Centraux • Dispersion
Analyse descriptive …… Le Tri Déterminer Min Déterminer Max Min : 32 Max : 86
Analyse descriptive …… Le recensement Identifier les valeurs mini et maxi Classer les performances dans l’ordre croissant A chaque performance, compter le nombre de sujets concernés : Effectif Vérification: « le compte est bon » N=205
Regroupement par classes • Calculer l’Etendue E=Max – Min • Déterminer le nombre de classes (k) • Généralement entre 10 et 14. • Vérification à postériori (Eff de 20% ds classe modale) • Calculer l’Amplitude A=Arrondi(E/k) • Déterminer les Linf et Lsup de chaque classe • Lsup-Linf=A et une classe [Linf, Lsup[ • S’assurer que Lsup de la dernière classe est > au Max • Déterminer les centres de classe xi=(Linf+Lsup)/2 • Déterminer l’effectif (ni) puis la fréquence (fi=ni/N)
Analyse descriptive …… Regroupement Min : 32 Max : 86 Calculez l’étendue: E=86-32=54 * 54 cm séparent la meilleure performance de la moins bonne
Analyse descriptive …… Les classes Déterminer le nombre de classe: k=14 Déterminer l’amplitude A=Arrondi(E/k)= A=54/14 A = 3.86 4 Déterminer les limites de classes Linf1 arbitrairement mais < Min Lsup1 = Linf1 + A etc. Vérification : Linf1 Amplitude Lsup1 Lsup14>Max
Analyse descriptive …… Recensement Les valeurs observées entre 2 limites Déterminer les centres de classes xi xi = (Lsupi+Linfi)/2 Recenser les valeurs observées au sein de chaque classe … soit l’effectif ni Vérification : L’effectif total N= (ni)
Analyse descriptive …… Recensement L’effectif peut être exprimé en terme de nombre de sujets : Le regroupement par classe résume la situation et établit un lien entre centre de classes et effectif Ex: La classe 1 comprend 4 sujets Cad : 4 sujets ont une détente verticale de 33.5 cm L’effectif ni peut être rapporté à l’effectif total N pour définir la fréquence (fi en %) Ex: 4 sujets soit 1.9% de l’effectif Vérification : L’effectif total 100%
Analyse descriptive Premières lectures L’effectif le plus important 34 sujets soit 16.8% La performance correspondante Centre de la classe 8 : 61.5 cm A l’inverse 1.9% sautent moins de 33.5 cm 1% sautent plus de 85.5 cm
Analyse descriptive • Les lectures graphiques de ce tableau • L’histogramme • Le diagramme cumulatif
Histogramme • Les centres de classes • Performances dans l’unité du relevé de données • En Abscisses (axe horizontal ) • Les effectifs de chaque classe • Nombre de personnes • En ordonnées (axe vertical)
Diagramme cumulatif • Effectifs cumulés • A la classe suivante correspond la somme des effectifs des classes précédentes • Ex: • L’effectif cumulé en classe 3 correspond à la somme des effectifs des 3 premières classes (soit 5+10+11=26)
Diagramme cumulatif • Fréquences cumulées • A la classe suivante correspond la somme des fréquences des classes précédentes • Ex: • La fréquence cumulée en classe 3 correspond à la somme des fréquences des 3 premières classes • (soit 2.4%+4.9%+5.4%=13%)
Diagramme des fréquences cumulées • Les centres de classes • En Abscisses • Performances dans l’unité du relevé de données • Les fréquences cumulées de chaque classe • En ordonnées • Cumul des fréquences
Détermination Graphiques • Ces graphiques permettent de déterminer • Des indices centraux • Mode et médiane • Des indices de dispersion • Quartiles • Intervalle interquartile
Détermination du mode Histogramme - Repérer le plus grand effectif - Le mode est la performance (61.5 cm) la plus représentée (33%) (cad pour laquelle la fréquence est la plus importante)
50% Détermination de la médiane Fréq cumulées - Repérer 50% sur l’effectif cumulé (ordonnées) - Projeter sur l’axe des performances - La médiane est la performance (57.5 cm) qui coupe l’effectif en deux parties égales (cad 50% font plus mais 50% font moins de 57.5 cm de détente verticale)
Yi+1 50% Yi Xi Xi+1 Détermination de la médiane par interpolation - Entre 2 centres de classe, l’évolution de la Fréquence cumulée est linéaire - Interpolation linéaire :
Les indices centraux • Mode: la performance la plus représentée • Médiane : la performance qui scinde l’effectif en 2 parties égales (graphique ou interpolée) • La moyenne: • À partir de l’ensemble des valeurs (N<30) • A partir de données regroupées (N>30)
Détermination Graphiques • Ces graphiques permettent de déterminer • Des indices centraux • Mode et médiane • Des indices de dispersion • Quartiles • Intervalle interquartile
25% 75% Détermination des quartiles Fréq cumulées - Repérer 25%, 75% sur l’effectif cumulé (ordonnées) - Le 1er quartile (Q1) est la performance (49.5 cm) qui correspond à un effectif cumulé de 25%, - Le 3ème quartile (Q3) est la performance (61.5 cm) qui correspond à un effectif cumulé de 75%, NB: le 2nd quartile (Q2) correspond à la Médiane.
Les quartiles et l’intervalle • Les quartiles peuvent être déterminés précisément par interpolation linéaire. • L’intervalle interquartile IQ est la différence de Q3 et Q1 (IQ=Q3-Q1) • IQ représente une étendue sur laquelle 50% de la population est distribuée. • Si IQ est grand, 50% des sujets sont dispersés sur grande étendue (hétérogénéité du groupe).
L’intervalle et l’hétérogénéité Dans les 2 cas 50% de la population distribué sur IQ IQ1 IQ2
Les indices de dispersions • L’intervalle interquartile: 50% de la population distribuée sur cet intervalle • La variance : • À partir de l’ensemble des valeurs (N<30) • A partir de données regroupées (N>30) La moyenne du carré des écarts à la moyenne NB: unité de la performance au carré
Les indices de dispersion • L’écart-type : • À partir de l’ensemble des valeurs (N<30) • A partir de données regroupées (N>30) A certaines conditions (de normalité), 68.5% de la population sont distribués sur une étendue de 1
Distribution et hétérogénéité 68.5% de la population distribués sur 1 l’écart-type autour de la moyenne - 1 1