630 likes | 793 Views
DONNEES CENTREES et NORMALITE. UE 45.2 CHIII. Pierre MORETTO, Université Paul Sabatier, Toulouse III. Données centrées et normalité. Les étapes. Indices centraux Dispersion Loi Normale (Equiprobabilité) Variables centrées réduites Normalité d’une distribution Détermination graphique
E N D
DONNEES CENTREESet NORMALITE UE 45.2 CHIII Pierre MORETTO, Université Paul Sabatier, Toulouse III.
Données centrées et normalité Les étapes • Indices centraux • Dispersion • Loi Normale (Equiprobabilité) • Variables centrées réduites • Normalité d’une distribution • Détermination graphique • Détermination / indices • Test du ²
Indices centraux et de dispersion Mode, Médiane, Moyenne Quartile, variance et écart-type
Indices centraux et de dispersion Centraux • Mode: valeur la plus représentée • Médiane : valeur correspondant à un effectif cumulé de 50% • Moyenne: Effectif (« verre plein ») Centre de classe (« Position du verre sur le plateau »)
Indices centraux et de dispersion Equilibre du plateau Mode Médiane Moyenne
Indices centraux et de dispersion Mode Médiane Moyenne
Indices centraux et de dispersion Dispersion • Intervalle interquartile • Ecart-type
Indices centraux et de dispersion 50% de la population sur IQ 68.25% de la population sur 1 IQ IQ
Loi Normale Equiprobabilité
Equiprobabilité • Modèle mathématique • Equiprobabilité : Pr(A)=Pr(B) • Un exemple : Somme sur jets de 2 dés • Considérer la probabilité que la somme des 2 dés fasse : 0, 1, 2, … jusqu’à 14 • Cad un % de chance .. Une fréquence probable • Tracer le diagramme en fréquence de ces lancers de dés. • Rappel: Pr(A et B) = Pr(A) x Pr(A/B)
Equiprobabilité • Sur somme de 2 dés: Pr(A et B) = Pr(A) x Pr(A/B) • Pr(0)=0 • Pr(1)=0 • Pr(2)=Pr(1et1)=Pr(1) x Pr(1/1)=2/6 x 1/6=2/36 • Pr(3)=Pr(1et2)=2/36 • Pr(4)=Pr(1et3)+Pr(2et2)=2/36+2/36=4/36 • Pr(5)=Pr(1et4)+Pr(2et3)= 2/36+2/36=4/36 • Pr(6)=Pr(1et5)+Pr(2et4)+Pr(3et3)=1/6 • Pr(7)=Pr(1et6)+Pr(2et5)+Pr(3et4)=1/6
Equiprobabilité • Sur somme de 2 dés: Pr(A et B) = Pr(A) x Pr(A/B) • Pr(8)= Pr(2et6)+Pr(3et5)+Pr(4et4)=1/6 • Pr(9)= Pr(3et6)+Pr(4et5)=4/36 • Pr(10)=Pr(4et6 )+Pr(5et5)=4/36 • Pr(11)=Pr(5et6)=2/36 • Pr(12)=Pr(6et6)=2/36 • Pr(13)=0 • Pr(14)=0
Graphiquement Probabilités Sommes possibles « Courbe en cloche » …… Loi de Gauss
Loi Normale (Laplace-Gauss) • - Mode, Médiane et Moyenne sont confondus • - Symétrie / indices centraux • 1 ; 68.25% de la population • 2 ; 95.50% de la population
Loi de Gauss • Cette courbe en cloche illustre très fréquemment les comportements humains (neurosciences, physiologie, biomécanique, sociologie etc.) Parlebas & Cyffers, (1992)
Variables Centrées Réduites VCR Intérêts • L’écart centré réduit est défini pour pouvoir utiliser la Loi Normale • Situer un individu / groupe et selon différentes variables • Pouvoir donner le nombre d’individus dans un intervalle de performance
Table de la loi normale Loi Normale VCR -2 -1 + 1 +2
Table de la loi normale Variables normales centrées réduites -2 -1 0 +1 +2
Table de la Loi normale centrée réduite Lecture: Valeur d’ en additionnant colonne de gauche (dixième) et ligne du haut (centième) Ex: Soit z =0.5 une valeur de A l’intersection de 0.5 (première colonne) et 0 (1ère ligne) : La valeur est 0.1915 …. Soit 19.15% de la population entre 0 et z.
Utilisation de l’écart centré réduit • Situation d’un sujet / groupe selon différentes variables • Dénombrement dans un intervalle donné
Situation d’un sujet / groupe selon différentes variables Performance centrée réduites du sujet S1 Détente verticale Squat Saut en longueur -2 -1 0 +1 +2 Profile des performances de l’athlète
Dénombrement dans un intervalle donné Table des valeurs normales centrées réduites • La taille d’un groupe d’enfants suit une distribution normale. • Indiquez la probabilité pour que :
Dénombrement dans un intervalle donné Table des valeurs normales centrées réduites • La taille d’un groupe d’enfants suit une distribution normale. • Indiquez la probabilité pour que :
Normalité d’une distribution • Il s’agit de comparer la distribution expérimentale à la loi normale. • Si la distribution expérimentale est normale, les tests statistiques dits paramétriques peuvent être appliqués … • sinon transformation des données (log, racine etc) • Sinon tests non paramétriques.
Normalité d’une distribution Cette distribution peut-elle être assimilée à celle de Gauss ?
Normalité d’une distribution • Normalité d’une distribution • Détermination graphique • Détermination / indices • Test du ²
Normalité de la distribution • Détermination graphique • Test de la droite de Henry • Principe: • Vérifier que le graphique des fréquences cumulées est linéaire après changement d’échelle. • La transformation est appelée « Anamorphose »
Détermination graphique Anamorphose Diagramme fréquences cumulées Droite de Henry Echelle d’anamorphose
Détermination graphique Anamorphose Droite de Henry Calcul de la pente • Si la distribution est normale à ±2 correspond 95.5% de la population. • Intervalle entre 2.28% et 95.5% correspond à 4. • Pente=(Q95-Q2.28)/ 4 • PThéo=(95.5-2.28)%/4=0.23
Normalité d’une distribution • Normalité d’une distribution • Détermination graphique • Détermination / indices • Test du ²
Normalité d’une distribution /Indices • Une distribution est normale si: • Les indices centraux sont confondus • Mode=Médiane=Moyenne • 68.25% de la population à ± 1 • 95.5% de la population à ± 2 • Si ces faits sont retrouvés à partir des données expérimentales alors, la distribution peut être considérée comme « Normale »
Normalité d’une distribution • Normalité d’une distribution • Détermination graphique • Détermination / indices • Test du ²
Test du ² • Le test du ² permet de comparer 2 distributions. • Si il est appliqué à la comparaison de la distribution de la donnée expérimentale et d’une distribution normale (au sens Gaussien), il permet de vérifier très précisément la normalité de la distribution expérimentale.
Test du ² Principe • Comparer 2 fréquences • Expérimentale (rouge) • Normale (Bleu) • Quantifier la somme des différences/classes • Règle de décision / valeur théorique
Test du ² Quantifier la différence • Calculer l’écart centré réduit pour chaque centre de classe Xi • Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite
Test du ² Quantifier la différence • Calculer l’écart centré réduit pour chaque centre de classe Xi • Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite
Test du ² Quantifier la différence • Pour chaque classe, une fth et une fobs(ni/N) • Calculer la différence de ces fréquences pour chaque classe
Test du ² Calcul de l’indice Carré des différences Rapportée à Fth Somme « Surface entre les 2 courbes »
Test du ² Règle de décision • Une table des valeurs de ² • La valeur est lue pour un Degrès De Liberté (ddl=N-1) • A un risque choisi (10%, 5%, 1%)
Test du ² Règle de décision Si ²Calculé> ²Théorique au risque choisi les distributions diffèrent significativement. Sinon elles sont statistiquement semblables.
Test du ² Exemple Table du ² • Le ² calculé sur un échantillon de 19 sujets est de 32.5. • La distribution est-elle normale au risque 5% ? • La distribution est-elle normale au risque 1% ?
Test du ² Correction Table du ² • Le ²théorique à P=0.05 pour un ddl=18 est de 28.87 • 32.5 > 28.87 donc ²calculé >²théorique • Les distributions observée (expérimentale) et théorique (Loi Normale) sont semblables à P<0.05 • La distribution est normale au risque P<5%
Test du ² Correction Table du ² • Le ²théorique à P=0.01 pour un ddl=18 est de 34.80 • 32.5 < 34.8 donc ²calculé <²théorique • Les distributions observée (expérimentale) et théorique (Loi Normale) sont différentes à P<0.01 • La distribution n’est pas normale au risque P<1% • Risque inférieur entraîne une décision plus sévère
Comparaison d’échantillons paramétriques UE 45.2 CHIV Pierre MORETTO, Université Paul Sabatier, Toulouse III.
Comparaison d’échantillons • Règles de décisions et orientations • Les distributions des échantillons A et B sont-elles normales (Gaussiennes) ? • Si OUI, tests paramétriques • Si NON, • Transformation (racine, log ..) et retour à • Tests Non paramétriques (Ch V)
Comparaison d’échantillons paramétriques • Méthodologie générale: Distributions normales