330 likes | 491 Views
3. Két független minta összehasonlítása. Csoportosító változók Két független minta átlagának az összehasonlítása Két független minta összehasonlítása ordinális függő változó segítségével. Tartalom. Független minták. 1) Egymástól függetlenül választunk ki mintákat különböző populációkból.
E N D
Csoportosító változók Két független minta átlagának az összehasonlítása Két független minta összehasonlítása ordinális függő változó segítségével Tartalom
1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket. 2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint vagy a nem szerint. Hogyan juthatunk független mintákhoz?
Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú Csoportdefiniálás a ROPstatban GYAK
Az apa érettségije és gyerekének matematika jegye (n = 3507)
Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban? Nullhipotézis: H0: μ1 = μ2 Próbastatisztika: t = (y – x)/SEdif Két független minta átlagának összehasonlítása
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk. Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk. Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk. Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk. Kétmintás t-próba
Minél nagyobb a két mintaátlag közötti különbség, annál valószínűbb, hogy H0 nem igaz. Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2). Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk. Kétmintás t-próba
CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag = 12,1, Y-átlag = 14,0 t(80) = -2,95, p = 0,0041 (p < 0,01) Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507): X-átlag = 4,06, Y-átlag = 3,82 t(3505) = 6,38, p = 0,000 (p < 0,001) Két példa GYAK
Különbségváltozó normalitása Elméleti szórások egyenlősége: σ1 = σ2 Szóráshomogenitás tesztelése: Levene-próba, O’Brien-próba Kétmintás t-próba robusztus alternatívája: Welch-féle d-próba A kétmintás t-próba alkalmazási feltételei
CPI-Fem skála, Férfiak vs. Nők (N = 82): X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése: Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+ Átlagok összehasonlítása: Kétmintás t: t(80) = -2,95 (p = 0,0041)** Welch-féle d: d(13,1) = -2,37 (p = 0,0337)* Példa GYAK
Kezelési hatás két független minta esetén Elméleti változás (különbség): m1 - m2 Cohen-féle delta (átlagok standardizált különbsége): D = (m1 - m2)/s Mintabeli becslés: d = (x1 - x2)/se Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK
Két független minta összehasonlítása ordinális függő változóval
Kvantitatív függő változó Nagyságszint mérése az átlaggal Két független minta átlagának összehasonlítása kétmintás t-próbával. Kétmintás t-próba alkalmazási feltételei: Normalitás Szóráshomogenitás Hagyományos elemzési módszer
Ötlet: dominancia-arányok meghatározása Pl. fiúk és lányok összehasonlítása az IQ segítségével Fiú dom%: milyen gyakran fordul elő, hogy egy fiú nagyobb IQ-értékű, mint egy lány? Lány dom%: milyen gyakran fordul elő, hogy egy lány nagyobb IQ-értékű, mint egy fiú? Ordinális megközelítés
Fiú dominancia % = Lány dominancia % Más szavakkal: A fiúk adata ugyanolyan gyakran nagyobb a lányok adatánál, mint kisebb Sztochasztikus egyenlőség
Két populáció sztochasztikus összehasonlítása Fő kérdés: Ha két populációból vagy eloszlásból véletlenszerűen kiválasztunk 1-1 értéket, milyen gyakran fordul elő, hogy az egyik (X) nagyobb lesz, mint a másik (Y)? A sztochasztikus dominancia legegyszerűbb mértéke: p+= P(X > Y)
Átlagok és p+ értékek a CPI-Feminitás Skála esetében (n = 82) átlag p+ 14,0 66% 12,1 24% Férfiak Nők Férfiak Nők
Átlagok és p+ értékek a Szondi m1 képváltozó esetében (N = 277) átlag p+ 2,95 50% 2,39 21% Férfiak Nők Férfiak Nők
X: vizsgált változó a P1 populációban Y: vizsgált változó a P2 populációban P1 sztochasztikusan egyenlő P2-vel, ha P(X > Y) = P(X < Y) P(X > Y): P1-beli fölény esélye (p+) P(X < Y): P2-beli fölény esélye (p-) A sztochasztikus egyenlőség (SZTE) matematikai jelölése
X-mintaY-minta 01 1 2 8 3 X > Y: (8; 1), (8; 2), (8; 3) X < Y:(0; 1), (0; 2), (0; 3), (1;2), (1; 3) n+= 3(X dominancia); arány: 3/9 = 33% n-= 5(Y dominancia);arány: 5/9 = 56%
H0: Sztochasztikus egyenlőség • Hagyományos próba: • Mann-Whitney-próba (MW-próba) • Alkalmazási feltétel: • szóráshomogenitás • Robusztus változatok: • Brunner-Munzel-próba (BM-próba) • FPW-próba
A MW-próba végrehajtása xi rang yj rang 011 2,5 1 2,5 2 4 8 6 3 5 R1 = 9,5 R2 = 11,5 (ta - tf):megtartási tartomány
Döntés a MW-próbában • Kis minták: táblázat • Nagy minták: normális közelítés (z)
Sztochasztikus egyenlőség nullhipotézise • H0: A12 = A21 = 0,5