290 likes | 408 Views
Test 2. Quand utilise-t-on le 2. On a deux variables quantitatives. On cherche s’il y a un lien entre les 2 variables. Problème. Garçons ou filles : qui réussi le mieux au bac ? Cigarette et cancer : y a t il un lien ? Prévention routière : moins d’accident chez les verbalisés ?
E N D
Quand utilise-t-on le 2 • On a deux variables quantitatives. • On cherche s’il y a un lien entre les 2 variables
Problème • Garçons ou filles : qui réussi le mieux au bac ? • Cigarette et cancer : y a t il un lien ? • Prévention routière : moins d’accident chez les verbalisés ? Autre formulation : • Y a t il un lien entre sexe et réussite au bac ? • Y a t il un lien entre cancer et cigarette ? • Y a t il un lien entre accident et verbalisation ?
1. H0 • H0 : il n’y a pas de lien entre la variable sexe et la variable résultat.
2. Mesures Données brutes Tableau des effectifs Tableau croisé
VB or not vB? This is the question Différence énorme On rejette H0 Pas de différence H0 n’est pas rejetable Variabilité biologique ? Différence significative ? Dans notre lycée :
Problème • On veut un indice qui reflète les disparités de notre tableau. • On veut qu’il soit grand pour et petit pour :
Solution : 2 Pour le calculer : • Tableau des effectifs observés (tableau croisé) • Tableau des effectifs attendus • Tableau des écarts • Tableau des écarts au carré et pondérés • 2
T2 : Effectifs attendus total colonne x total ligne total général Pour chaque case : effectif attendu = Totaux Calcul par case Résultats
T3 : Écarts bruts • Pour chaque case : • écart brut = effectifs observés – effectifs attendus – Effectifs observés Effectifs attendus = Tableau des écarts bruts
T4 : Écarts au carré et pondérés • Pour chaque case : Écart au carré pondéré = (écart brut)2 effectif attendu
Final : 2 • Le 2 est la somme des écarts au carré pondérés • 2 = (Écart au carré pondéré) 2 =0,035+0,015+0,009+0,004=0,63
Généralisation • Y a t il un lien entre couleur des yeux et des cheveux ? • H0 : il n’y a pas de lien entre la couleur des yeux et celle des cheveux
T2 : Effectifs attendus total colonne x total ligne total général Pour chaque case : effectif attendus =
T3 : Écarts bruts • Pour chaque case : • écart brut = effectif observé – effectif attendu – Effectifs attendus Effectifs observés = Tableau des écarts bruts
T4 : Écarts au carré et pondérés • Pour chaque case : Ecart au carré pondéré = (écart brut)2 effectif attendu
Final : 2 • 2 = (écart au carré pondéré) 2= 5,11+1,69+2,66+0,01+ 0,96+0,33+0,52+0,01+ 2,07+0,66+1,04+0,00 = 15,05
2 en bref • 2Obs= (effectifs observés – effectifs théoriques)2 effectif théorique
Problème • Quand un 2 est-il grand ? 2=2,6 2=5,3
DDL • DDL=Degrés de liberté DDL=(Nombre de colonnes-1)x(Nombre de lignes-1) DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1) = 6
4. Probabilité • R : chisq.test(effectifs Observés) 2=2,6 DDL=1 p=0,11 2=5,3 DDL=6 p=0,51
5. Conclusion • Sexe / Réussite : • 2Obs=0,63 et DDL=1 • P=0.11 • On ne peut pas rejeter H0, Il n’y a pas de lien entre Sexe et Réussite • C. Cheveux / C. Yeux : • 2Obs=15,05 et DDL=6 • P=0,0167 • On peut rejeter H0, Il y a un lien entre C. Cheveux et C. Yeux >5% <5%
Pourquoi un 2 EST-il Grand ? Écarts au carré pondérés • Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2
Sous / sur représenté Écarts au carré pondérés Écarts • Cases qui apportent beaucoup : • Sur le tableau des écarts au carré pondéré • Apport positif ou négatifs ? • Sur le tableau des écarts, Blonds / Bleus = + 9 : il y en a beaucoup. • On dit qu’ils sont sur-représentés • Sur le tableau des écarts, Noirs / Bleus = - 4,5 : il en manque beaucoup. • On dit qu’ils sont sous-représentés