60 likes | 217 Views
Comparaison d'une distribution observée à une distribution théorique. Situation du problème : Les éléments : Généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique
E N D
Comparaison d'une distribution observée à une distribution théorique • Situation du problème : • Les éléments : • Généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique • 1 variable qualitative définissant des classes (ou quantitative mise en classes). On a la fréquence (nombre) de sujets appartenant à chaque classe. • 1 distribution théorique soit empirique soit suivant une loi de probabilité théorique concernant les mêmes classes. • On aboutit à une table dans laquelle pour chaque classe, on a l’effectif observé et l’effectif théorique correspondant à ce que l’on aurait observé si le caractère étudié suivait la distribution théorique. • La question : • La distribution observée peut-elle être considérée comme conforme à la distribution théorique ? • Les écarts constatés entre valeurs observées et théoriques peuvent - ils être attribués au hasard ?
Comparaison d'une distribution observée à une distribution théorique Classe A B C D Effectif O1 O2 O3 O4 Observé Effectif Théorique T1 T2 T3 T4 • Hypothèses : • Hypothèse nulle : • Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. La distribution observée suit la loi de probabilité théorique. • Hypothèse alternative • La distribution observée ne suit pas la loi de probabilité théorique considérée. • Eléments nécessaires au calcul • Table de contingence
Comparaison d'une distribution observée à une distribution théorique • Statistique : • Khi 2 “d’adéquation” • Degré de liberté : • Nombre de classes - 1 - Nombre de paramètres estimés de la loi théorique (si nécessaire). • Conditions d’application • Tous les effectifs théoriques doivent être supérieurs à 5. • Si les conditions ne sont pas remplies, il faut, quand cela est possible, regrouper logiquement des classes ou prendre d’autres méthodes. • Sous H0, on estime les effectifs théoriques de chaque case de la table de contingence • Pour chaque case on utilise la probabilité théorique s'y rattachant multipliée par l'effectif observé total. • Par exemple en cas de loi de distribution (loi normale par exemple) on calcule d'abord la probabilité d'être dans l'intervalle (Bi-Bs) de chaque classe puis l'effectif théorique. Ainsi, la probabilité d'être dans l'intervalle [ -infini; moyenne] est de 0,5. Celle d'être dans l'intervalle [-infini; moyenne - 1,96* écart type] est de 0,025... • On calcule ainsi les différents effectifs théoriques en fonction de la loi de probabilité utilisée.
Comparaison d'une distribution observée à une distribution théorique 2 p (0-T) Khi2 = S 1 T • Khi 2 “d’adéquation” • Calcul pour chaque case des effectifs théoriques • Condition d'application : tous les effectifs théoriques doivent être supérieurs à 5 sinon regroupement • Calcul du Khi 2 p = Nombre de classes après regroupement DDL = p -1 - Nombre de paramètres estimés • Décision : • Si Khi2 > Khi2 alpha => rejet de HO : la distribution n'est pas conforme à la distribution théorique. Recherche du degré de signification p. • Sinon rien ne permet de dire que la distribution observée n'est pas conforme à la distribution théorique => H0 acceptée mais attention au risque ß
Comparaison d'une distribution observée à une distribution théorique 2 2 2 (30-44) (80 - 6) (90-150) = 941,12 + Khi2= + 150 6 30 2 • Exemple 1 : • Dans un essai thérapeutique, on a testé un médicament sur 200 patients. Les résultats ont été notés en bons, moyens et mauvais. On a obtenu les pourcentages de bons résultats suivants : 45% de bons résultats, 15% de résultats moyens et 40% de mauvais résultats Dans la littérature ce traitement donne 75% de bons résultats, 22% de résultats moyens et 3% de résultats mauvais. Les résultats observés sont-ils conformes à ceux de la littérature? • H0 : Les résultats sont conformes • H1 : Les résultats ne sont pas conformes • Table de contingence Bons Moyens Mauvais Total Obs. 90 (0,45*200) 30 80 200 Théo 150 44 6 200 DDL = 2; Khi20,001 =13,82 => p<0,001 La distribution n'est pas conforme à la distribution observée dans la littérature. Les résultats obtenus sont statistiquement moins bons que ceux de la littérature. Remarque : le calcul d'un seul des termes du khi 2 (le dernier par exemple) permet de rejeter H0.
Comparaison d'une distribution observée à une distribution théorique < 1,55 1,55 - 1,65 1,65 - 1,175 > 1,75 TotalObservé 8 40 102 150 300Probabilité 0,025 0,135 0,34 0,5si Loi NormaleEffectif Théo 7,5 40,5 102 150 300Terme du Khi 2 0,033 0,006 0,000 0,000 Khi 2 = 0,040DDL = 4 - 1 - 2 = 1Khi2 < 3,84 P > 0,05 La distribution observée ne diffère pas de manière statistiquement significative d'une loi normale de paramètre 1,75; 0,1 • Exemple 2 : Sur 300 étudiants en médecine, la moyenne de la taille est de 1,75m avec un écart type estimé de 0,1m. Ces deux paramètres sont estimés à partir des données de cet échantillon. Vous avez observé 8 étudiants avec une taille inférieure à 1,55m; 40 avec une taille entre 1,55 et 1,65; 102 avec une taille entre 1,65 et 1,75 et 150 avec une taille supérieure à 1,75m La distribution de la taille des étudiants en médecine peut elle être considérée comme suivant une loi normale ? Moyenne estimée = 1,75 - Écart type estimé = 0,1