550 likes | 736 Views
TESTS RELATIFS AUX CARACTERES QUANTITATIFS. I- Position du Problème. Généralités. Supposons une population infiniment grande pour laquelle la moyenne d’un caractère quantitatif X est m = m 0 . On dispose d’un ou de plusieurs échantillons de moyennes m1, m2,….mi… ;mk. m k. m= m 0. m 1.
E N D
Généralités Supposons une population infiniment grande pour laquelle la moyenne d’un caractère quantitatif X est m = m0. On dispose d’un ou de plusieurs échantillons de moyennes m1, m2,….mi… ;mk. mk m= m0 m1 m2 mi Les observations mi sont elles compatibles avec l’hypothèse que dans la population m = m0? Population
Trois problèmes peuvent être posés dans ces conditions : • La comparaison d’une moyenne observée à une moyenne théorique, • L’estimation d’une moyenne théorique à partir d’une moyenne observée et • La comparaison des moyennes observées deux à deux.
Soit X, une variable aléatoire quantitative de moyenne m et de variance s2. Ces paramètres sont ceux d’une population de taille infini et peuvent être indéterminés. m = m0 Tirage parfaitement au hasard d’un échantillon de taille N m
La moyenne de la variable aléatoire X de cet échantillon est m de sorte que: La quantité S2 est un bon estimateur de s2 au niveau de l’échantillon; telle que:
En tirant plusieurs échantillon de la population, les moyennes observées sont m1, m2,….mk. mk m= m0 m1 m2 …… Population La distribution de ces différentes moyennes est appelée distribution d’échantillonnage de la moyenne.
Il est évident, et l’expérience le montre que ces différentes moyennes ne sont pas identiques. Les observations mi varient, et ses variations expriment les fluctuations de l’échantillonnage. Autrement dit, la distribution des moyennes des différents échantillons constitue une nouvelle variable aléatoire, sur laquelle on peut appliquer les règles de calcul des variables aléatoires.. m = {m1, m2,……..m3,……….mk}
Les Différents paramètres de cette nouvelle distribution m = {m1, m2,……..m3,……….mk}sont: • La moyenne théorique de la distribution des moyennes est égale à E(m) = m . Les différentes moyennes observées m1, m2…mi…mk sont regroupées autour de cette moyenne théorique m. • La variance de la moyenne s2m et son écart type sm de la nouvelle distribution sont:
Il est clair que plus la taille N des échantillons est grande, plus les différentes moyennes observées m1, m2…mi…mk sont regroupées de manière très proche autour de la moyenne théorique m. Plus la variance diminue Plus N augmente
La Loi de probabilité de la distribution des moyennes La forme de la distribution des moyennes ne peut être connue que si l’on connaît la distribution de la variable aléatoire X dans la population. D’une manière générale, si le caractère étudié (V.A X) obéit à une loi de Laplace Gauss dans la population, alors la distribution des moyennes mi suit également une loi normale η(m,sm) ou encore une Loi normale centrée réduite e(0,1).
Toutefois, on peut admettre que lorsque l’effectif N tend vers l’infini, la loi de probabilité de la distribution de m suit une loi normale quelque soit la distribution de X dans la population. En pratique, on considère une distribution des moyennes normale à partir de N>=30 mk m1 mi -sm m +sm
Intervention de la loi de student: Sx est l’écart - type Estimé de la Variable aléatoire X Lorsque la taille de l’échantillon est petite, N<30; la loi de probabilité de la distribution des moyennes mi pour une variable aléatoire X distribuée normalement, ne suit pas une loi normale, mais une loi de student t à (N-1) degré de liberté, centrée réduite, de sorte que:
Le remplacement de s par son estimateur S a pour effet de modifier les calculs et les rendres sans biais. La forme de la loi montre que dès que l’effectif augment, la loi de student tend vers une loi normale centrée réduite e (0,1). En pratique, on considère que la loi de Student tend vers une loi Normale centrée réduite si N>=30
En résumé, on distingue 4 situations selon la distribution de X:
III- Comparaison d’une moyenne observée m à une moyenne théorique m
Soit un échantillon E de N individus sur lequel on mesure la valeur d’une variable aléatoire continue X. Tirage parfaitement au hasard Population de taille infini De moyenne m Échantillon (N) m On cherche à savoir si la moyenne de x au niveau de l’échantillon est compatible à celle de la population?.
En d’autre termes, le problème peut être posé de 3 manières: • Sur le critère de la VA X, l’échantillon E est-il issu de la population P? (Situation bilatérale) • L’échantillon E provient-il d’une population P’ dont la moyenne de la VA X est supérieure à celle de la population P? (Situation unilatérale) • L’échantillon E provient-il d’une population P’’ dont la moyenne de la VA X est inférieure à celle de la population P? (Situation unilatérale)
En situation bilatérale; la signification est testée à 5% m ≠ m Situation bilatérale m > m Situation unilatérale m < m Situation unilatérale En situation Unilatérale; la signification est testée à 10% m
Dans la suite du résonnement, on pose les notations suivantes: • m : moyenne de X observée ou calculée sur l’échantillon. • m: moyenne théorique de X au niveau de la population de référence P. • s2: Variance théorique de X dans la population. • s2: Estimateur sans biais de la variance de X dans la population.
III-1. Cas de petits échantillons: (N<30) III-1-1. Si la distribution de la VA X suit une loi normale et la variance est inconnue: Dans ce cas, on utilise une loi de student t à N-1 ddl de sorte que:
1 2 3 4 5 6 7 8 t suit une loi de student à N-1 ddl La valeur de t calculé est confrontée à celle de t lue sur la table théorique à (N-1) ddl et au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).
Exemple: On sait que la concentration plasmatique du calcium du sujet sain est m=2,5 mmol/mt Sur un échantillon de 18 personnes, on a trouvé une moyenne m de 3,2 mmole/ml et un écart type estimé Sx = 1,1 mmole/ml. • Peut-on conclure que la calcémie moyenne des 18 personnes soit augmentée? • NB: On suppose que la moyenne m’ de la calcémie, de la population dont l’échantillon est issu, suit une loi binomiale.
Réponse: • Choix du Test et vérification des conditions de son application L’échantillon est Petit N<30, mais la VA « Calcémie » suit une loi normale dans la population dont l’échantillon est issu. • Application du Test: Suit une loi de student à 17 ddl (18-1)
Définir H0 et H1 H0: On considère que m’ = m. La moyenne de la calcémie au niveau de l’échantillon ne diffère pas significativement de la moyenne des sujets sains. H1: On considère que m’ > m. La moyenne de la calcémie au niveau de l’échantillon est supérieure à la moyenne des sujets sains.
Fixer la taille du test et définir la règle de décision Puisqu’on veut savoir si la moyenne au niveau de l’échantillon est supérieure à celle de la population, on est dans une situation unilatérale. La valeur critique (ou limite) en situation bilatérale est t(5% / 17ddl) = 2,11. La valeur de t calculée va être comparée à 1,74 puisqu’on est en situation Unilatérale La valeur critique (ou limite) en situation unilatérale est t(10% / 17ddl) = 1,74.
Calcul de t observée On rejette H0 au risque de 5% & on retient H1 on conclu que la moyenne au niveau de l’échantillon est supérieure à celle de la population de référence. • Application de la règle de décision La valeur de t calculée va être comparée à 1,74 puisqu’on est en situation Unilatérale La valeur de tcalculée = 2,7 est supérieure à la valeur de la table t(10% / 17ddl) = 1,74.
III-1. Cas de petits échantillons (Suite): (N<30) III-1-2. Si la distribution de la VA X est inconnue: Dans ces conditions (cf Tableau) il n’existe pas de test non paramétrique pour comparer les moyennes!!!? On utilise alors la médiane. On utilise alors la médiane en comparant la proportion des sujets à droite de la médiane de la population (ou à gauche) par rapport à 50%.
Exemple: Score de la douleur sur 15 patients traité a avec un nouvel morphinique. La médiane de la population de référence traité par un ancien médicament est de 4. Ce score varie de 0 (aucune douleur) à 10 (douleur intense). Les résultats obtenus sont repectivement: 0,0,1,1,2,2,2,3,3,4,5,6,7,8,8 Solution: • Dans l’échantillon le % des patient ayant un score <4 est de 60% (9/15)
Le problème revient donc à la comparaison d’une proportion observée (60%) à une proportion théorique au niveau de la population (50%) On doit donc utiliser un test de conformité pour comparer une fréquence observée à une fréquence théorique. (cf. Chap. Manipulation des fréquences)
III-2. Cas des grands échantillons :(N≥30) Dans ce cas, quelque soit la distribution de la VA X dans la population, on suppose que la distribution des moyenne m suit une loi normale d’espérance m et d’écart type sm.
Cet écart suit une loi normale centrée et réduite e (0,1). Le test consiste donc à calculer l’écart réduit et le confronter à l’écart théorique au niveau de la table de l’écart réduit.
La valeur de l’écart calculé e est confrontée à celle de e lue sur la table théorique au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).
IV- Estimation d’une moyenne théorique m à partir d’une moyenne observée m
III-1. Cas de petits échantillons : (N<30) Dans ces conditions, il est nécessaire de s’assurer de la normalité de la distribution des moyennes. Il est également, obligatoire, de remplacer la variance s2 par son estimation S2. On utilisera pour le calcul statistique le t de student.
III-1. Cas des grands échantillons : (N≥30) Dans ces conditions, on suppose que la variance est connue, et que l’échantillon est assez grand pour considérer une distribution de moyenne normale. On utilisera pour le calcul statistique le e de l’écart centré réduit.
L’intervalle de confiance de la moyenne a (1-a)% chance de recouvrir la moyenne théorique de la population à partir de laquelle l’échantillon de moyenne m a été issu. Une meilleure estimation de l’intervalle de confiance de la moyenne est obtenue en utilisant l’estimateur sans biais de la variance S2 pour le calcul au lieu de la variance s2.
On dispose de 2 Échantillon E1 et E2. E2 E1 Population m2 m1 m= m0 On veut comparer les moyennes observées aux niveaux des 2 Échantillon E1 et E2.
En d’autre termes, le problème peut être posé de 3 manières: • Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale) • Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale) • Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)
Définir H0 et H1 • Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale) m1 et m2 sont respectivement les moyennes théoriques des 2 populations dont on a tirées E1 et E2. H0: On considère que m1 = m2. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2. H1: On considère que m1≠ m2. La moyenne m1 au niveau de l’échantillon E1 diffère significativement de la moyenne m2 de E2.
Définir H0 et H1 • Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale) m1 et m2 sont respectivement les moyennes théoriques des 2 populations dont on a tirées E1 et E2. H0: On considère que m1 = m2. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2. H1: On considère que m1> m2. La moyenne m1 au niveau de l’échantillon E1 es supérieure significativement de la moyenne m2 de E2.
Définir H0 et H1 • Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale) m1 et m2 sont respectivement les moyennes théoriques des 2 populations dont on a tirées E1 et E2. H0: On considère que m1 = m2. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2. H1: On considère que m1< m2. La moyenne m1 au niveau de l’échantillon E1 est inférieure significativement de la moyenne m2 de E2.
On suppose que les variables au niveau des 2 échantillons suivent une loi normale et que les 2 variances sont égales s1 = s2. Dans ces conditions; on estime la variance commune aux 2 échantillons:
On calcul l’écart observé en utilisant le test t de student: La quantité tobs. Suit une loi de student à (N1 +N2-2)ddl sous l’hypothèse nulle. La quantité tobs. Est donc comparée à la table à(N1+N2-2)ddl et à 5%(test bilatéral) ou à 10% (test unilatéral).