1 / 27

Test Chi Deux c 2 ---- Comparaison de 2 ou Plusieurs fréquences

Test Chi Deux c 2 ---- Comparaison de 2 ou Plusieurs fréquences. I- Comparaison d'une distribution observée à une distribution théorique. ♣ Il s’agit d’une généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique.

gaetana
Download Presentation

Test Chi Deux c 2 ---- Comparaison de 2 ou Plusieurs fréquences

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Test Chi Deux c2----Comparaison de 2 ou Plusieurs fréquences

  2. I- Comparaison d'une distribution observée à une distribution théorique

  3. ♣ Il s’agit d’une généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique. ♣1 variable qualitative définissant des classes (ou quantitative mise en classes). On a la fréquence (nombre) de sujets appartenant à chaque classe. • ♣l’effectif théorique correspondant à ce que l’on aurait observé si le caractère étudié suivait la distribution théorique.

  4. 1-Variable qualitative à deux classes (k=2) Exemple : Dans une population de souris, la fréquence théorique des leucémiques est pth.=0.80. Sur un échantillon analysé de 96 souriceaux, nous avons observé 68 (n1obs) leucémiques contre 28 non leucémiques (n2obs.). • ♣La distribution observée peut-elle être considérée comme conforme à la distribution théorique ? • ♣Les écarts constatés entre valeurs observées et théoriques peuvent - ils être attribués au hasard ?

  5. Hypothèses • Hypothèse nulle : Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. La distribution observée suit la loi de probabilité théorique. Hypothèse alternative: La distribution observée ne suit pas la loi de probabilité théorique considérée.

  6. Si H0 est vraisemblable, la distribution observée au niveau de l’échantillon ne doit pas s’écarter de manière significative de la distribution théorique au niveau de la population. Le test c2 permet de mesurer et d’interpréter la distance entre ce qui est observé et ce qui est théorique.

  7. Principe du test On calcul d’abord les effectifs théoriques tel que : ni théorique = N x pi théorique Fréquence théorique de la modalité ou de la classe d’ordre i Effectif total de l’échantillon; dans l’ex. N= 96 Effectif théorique de la modalité ou de la classe d’ordre i n1théorique = 96 x 0.80 = 76.8 Dans l’Exemple: n2théorique = 96 x 0.20 = 19.2

  8. On calcul pour chacune des modalités la différence entre les effectifs observés et les effectifs théoriques : n 1 observé – n 1 théorique = 68 – 76.8 = - 8.8 n 2 observé – n 2 théorique = 28 – 19.2 = + 8.8 La somme des deux différence étant nulle !!!!

  9. En effet; quelque soit le nombre de classes (n1obs–n1th) + (n2obs– n2th) = (n1obs+n2obs) - (n1th.– n2th) = N – N = 0. Pour éviter cette compensation des différences, nous allons considéré la somme des carrés de ces différences, ce qui donne : (n1obs – n1th)2 + (n2obs – n2th)2 = (+8.8)2 + (-8.8)2 = 154,88

  10. Cette méthode de mesurer la distance entre les effectifs observés et les effectifs théoriques n’est pas tout à fait satisfaisante du fait qu’on aura le même poids pour des différences non comparables. Exemple : Si n 1observé (= 105) – n 1théorique (=100) donne une différence de 5 identique à celle entre 05 et 10). Dans les deux cas le carré est de 25, mais la distance relative est beaucoup plus importante dans le 2ème cas.

  11. Finalement, il a été convenu de considérer pour chaque classe la quantité du c2 qui tiendra compte de son effectif théorique. Soit donc :

  12. Cette quantité mesure donc la distance entre les effectifs observés et les effectifs théoriques. La quantité ainsi calculée, est-elle suffisamment petite pour accepter l’hypothèse nulle? Ou, est-elle suffisamment grande pour rejeter l’hypothèse nulle et la remplacer par l’hypothèse alternative? Afin d’interpréter la signification de cette distance, on se réfère à la table théorique du c2.

  13. Table c2 Risque a Degré de liberté Valeurs théorique du c2

  14. Nombre de degré de liberté Le nombre de degré de liberté est par définition le nombre de classes réellement indépendantes. Le nombre de degré est calculé par le nombre de classes moins le nombre de relations. D’une manière générale, si les données concernent une seule variable le nombre de degré de liberté est égal au nombre de classe – 1 ; ddl = (k-1). Dans l’Ex., le nombre de classes est de 2, et on a une seule relation: n1obs + n2 obs = n1 th + n2 th=N. Donc le degré de liberté recherché est ddl = 2 – 1 = 1.

  15. Pour l’exemple: Au seuil choisi (5%) et au nombre de degré de liberté calculé (2-1), le c2 théorique est de 3,84. A 1 d.d.l et au risque de 5%, on a un c2th. = 3.84. Le c2 observé étant supérieur au c2 théorique, on peut conclure que la différence est significative. On rejette alors l’hypothèse nulle H0 et on la remplace par l’hypothèse alternative H1 selon laquelle on peut conclure que l’échantillon est soit biaisé, soit il provient d’une autre population. c2théorique = 3.84 c2observé = 5,04

  16. De manière générale, on test la signification à 5, à1% et à 1‰. Ce qui donne au niveau de la table les valeurs respectives de 3.84, 6.64 et 10.83. Si le c2obs≤c2th(à 5% et à 1ddl); on retient H0. La différence n’est pas significative.  Si le c2th(à 5% et à 1ddl) <c2obs≤c2th(à 1% et à 1ddl); on rejette H0. La différence est dite significative à 5%. Si le c2th(à 1% et à 1ddl) <c2obs≤c2th(à 1‰ et à 1ddl); on rejette H0. La différence est dite très significative ou significative au seuil de 1%.  Si le c2obs>c2th(à 1‰ et à 1ddl); on rejette H0. La différence est dite hautement significative ou significative au seuil de 1‰. 

  17. 2-Variable qualitative à k classes (k>2) On dispose d’un échantillon E d’effectif N réparti en plusieurs classes (k) de sorte que chacune des classes est représentée par son effectif observé et son effectif théorique calculée à partir de la fréquence dans la population théorique (Ti = ni th. = N. pi th.): Effectif

  18. Calcul de l’écart: La distance ou l’écart entre le tableau des effectifs théoriques et celui des effectifs observés est donné par la quantité : Ce c2observé est comparé au c2théorique comme précédemment, mais à k-1 degré de liberté.

  19. II- Test d’indépendancede deux variables qualitativesc2 de contingence

  20. 1- Cas de deux variables qualitatives présentant deux modalités Exemple : Pronostic vital dans le cas d’une intoxication oxycarbonée selon le sexe : Sexe Est-ce que les deux variables sont indépendantes? Autrement dit l’évolution est elle indépendante du sexe ? Pronostic

  21. Hypothèses • Hypothèse nulle : Les deux variables sexe et Pronostic vital sont indépendantes. Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. La distribution observée suit la loi de probabilité théorique. Hypothèse alternative: Les deux variables sexe et Pronostic vital sont Liés.La distribution observée ne suit pas la loi de probabilité théorique considérée.

  22. Si H0 est vraisemblable, les effectifs observés ne doivent pas s’éloigner des effectifs théoriques. L’effectif théorique pour chacune des classes est calculé de la manière suivante : la fréquence des décès indépendamment du sexe est de 122/357 soit 34.17% de décès(c’est la fréquence de décès dans l’ensemble de la population = pth.). Chez le sexe masculin d’effectif 136 on doit donc s’attendre à 0.3417 x 136 = 46.48. De manière générale, cette espérance peut être calculée par :

  23. On obtient ainsi deux tableaux de contingences : Un Tableau Observé & Un Tableau théorique Le calcul du c2 donne donc :

  24. Si tous les effectifs théoriques sont supérieurs ou égaux à 5 ; on peut confronter la valeur du c2obs. à celle donnée par la table théorique.  Mais il reste à définir le nombre de degré de liberté. Celui-ci est calculé dans le cas des tableaux de contingences par le produit du nombre de ligne -1 par le nombre de colonne –1. Dans l’ex. le nombre de degré de liberté est de (2-1)(2-1) = 1.

  25. Signification: lecture sur la table : Au seuil de 5% et à 1d.d.l, le c2théorique.=3.84.Cette valeur étant supérieure au c2obs. = 2.25, on peut accepter l’hypothèse nulle et conclure que les deux variables sont indépendantes. 3,84

  26. Mod.1 Mod.2 …… Mod.i ….. Mod.(k-1) Mod.k S Mod.1 n11 n12 n1i n1(k-1) n1k n1. Mod.2 n21 n22 n2i n2(k-1) n2k n.2 S n.1 n.2 n.i n.(k-1) n.k n.. 2- Cas de deux variables qualitatives présentant Chacune plus de deux modalités Ex: un tableau 2xk modalités Comme précédemment, on calcul les différents effectifs théoriques Ti, le c2 observé et on test la signification.

More Related