500 likes | 1.08k Views
Statistiek 2. Hoofdstuk 7: Variantieanalyse hoofdstuk 7. type AV?. aantal OV?. type OV?. hoeveel populaties?. categorieën afhankelijk?. parametrisch. non-parametrisch. chi-square goodness of fit. one sample t-test / z-test. 1. niet in dit boek. independent t-test / z-test.
E N D
Statistiek 2 Hoofdstuk 7: Variantieanalyse hoofdstuk 7
type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch chi-square goodness of fit one sample t-test / z-test 1 niet in dit boek independent t-test / z-test Rank-sum onafh. nominaal 2 afh. dependentt-test Signed-ranks 1 onafh. oneway ANOVA Kruskal-Wallis > 2 afh. repeatedmeasures ANOVA Friedman’s ANOVA interval/ ordinaal Pearsoncorrelation Spearmancorrelation interval/ ordinaal onafh. n-way ANOVA nominaal afh. repeatedmeasures ANOVA gemengd mixed design ANOVA interval > 1 multiple regression gemengd multiple regression chi-square goodness of fit 1 onafh. nominaal/ ordinaal nominaal 1 ≥ 2 onafh. Pearsonchi-square Hoofdstuk 7: Variantieanalyse
Vandaag Variantieanalyse: oneway ANOVA & Kruskal-Wallis
Variantieanalyse Tot nu toe bij hypothesetoetsing: t-toets en z-toets voor verschil tussen 2 gemiddelden - hebben mensen die therapie A gevolgd hebben minder angst dan mensen die therapie B gevolgd hebben? - besteden jongens en meisjes evenveel tijd aan huiswerk? -> telkens 1 OV (vb. therapie, geslacht) met telkens 2 waarden -> telkens 1 AV (vb. angst, tijd) Hoofdstuk 7: Variantieanalyse
Variantieanalyse Ook mogelijk: toetsen voor verschillen tussen meer dan 2 gemiddelden - is er een verschil in het welbevinden van kinderen met ouders die autoritair, autoritatief of permissief opvoeden? -> telkens 1 OV (vb. opvoedingsstijl) met telkens meer dan 2 waarden (vb. 3) -> telkens 1 AV (vb. welbevinden) eenwegs (‘one way’) variantie-analyse (‘ANOVA’) Bij twee OV: tweewegs (‘two way’) variantie analyse (zie volgende les) Bij meer dan één AV: MANOVA (niet in Statistiek II) Hoofdstuk 7: Variantieanalyse
Variantieanalyse 1. Toetsingssituatie Is er een verschil in gemiddelde tussen groep a, b, c, … op variabele Y? of Is er een effect van variabele X (met niveau’s a, b, c,..) op variabele Y? en: Indien er een effect is, tussen welke groepen is er een verschil? (= post hoc toetsing) Hoofdstuk 7: Variantieanalyse
Variantieanalyse 2. Voorwaarden • AV is gemeten op intervalniveau • OV wordt als nominaal beschouwd (ook al is OV soms ordinaal) • scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke populatie groter dan 30 • varianties in populaties zijn gelijk (homogeniteit) • onafhankelijke steekproeven Assumptie van normaliteit en homogeniteit minder strikt bij gelijke steekproeven Hoofdstuk 7: Variantieanalyse
Variantieanalyse 3. Hypothesen H0: alle populatiegemiddelden zijn aan elkaar gelijk: µa = µb = µc = … = µj als er J populaties zijn H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µj ≠ µj’ voor minstens één paar van j en j’ Dus H1 is NIET µa ≠ µb ≠ µc ≠… ≠ µj H0 wordt getoetst door gebruik te maken van varianties: De tussen-groeps-variantie of between-groups variance mean square between (MSb) De binnen-groeps-variantie of within-groups variance mean square within (MSw) Hoofdstuk 7: Variantieanalyse
Variantieanalyse Within groups Hoofdstuk 7: Variantieanalyse
Variantieanalyse Between groups Within groups Hoofdstuk 7: Variantieanalyse
Variantieanalyse Wanneer de verschillen tussen groepsgemiddelden groter worden en de verschillen binnen elke groep ongeveer hetzelfde blijven wordt de between-groupsvariantie groter ten opzichte van de within-groupsvarianties. Dus: de verhouding between-groupsvariantie/within-groupsvariantie zegt iets over het verschil tussen groepsgemiddelden. Between groups Within groups Hoofdstuk 7: Variantieanalyse
Variantieanalyse MSw = verschillen te wijten aan verschillen tussen personen binnen dezelfde groep = inter-individuele verschillen die niet te wijten zijn aan het effect van de OV = foutenvariantie (varfout) MSb = variantie van groepsgemiddelden + variantie van scores rondom groepsgemiddelden = variantie van de effecten van OV (vareffect) + foutenvariantie (varfout) MSw = varfout MSb = vareffect + varfout Hoofdstuk 7: Variantieanalyse
Variantieanalyse MSb= vareffect + varfout MSw = varfout -> ALS H0 waar is, dwz. vareffect zeer klein is of gelijk is aan 0 DAN: MSb = MSw of MSb / MSw = 1 -> ALS H0 niet waar is, dwz. vareffect verschilt van 0 DAN: MSb > MSw of MSb / MSw > 1 Hoofdstuk 7: Variantieanalyse
Variantieanalyse 4. Toetsingsgrootheid Df b = J – 1 (J =aantal groepen) Df w = N – J (N = totaal aantal waarnemingen; J = aantal groepen) Kansverdeling: F-verdeling (zie bijlage) Vb. Met df b = 3 – 1 = 2 en df w = 27 – 3 = 24 Hoofdstuk 7: Variantieanalyse
Variantieanalyse 5. Beslissingsregels a. Overschrijdingskansen (niet in tabel) Is P r (F) ≤ α ? ja, verwerp H0 neen, verwerp H0 niet Vb. P r (F = 7.13) = 0.0037 voordf b = 2 , df w= 24 P r (= 0.0037) < 0.05 dus H0 verwerpen Hoofdstuk 7: Variantieanalyse
Variantieanalyse b. kritiekewaarden Is F ≥ kritieke F waardebij df teller = df b = J – 1 ja, verwerp H0 dfnoemer = df w = N - J neen, verwerp H0 niet kritieke F waardedf b = 2 , df w= 24 bij alpha = 0.05 = 3.4 (zietabel) F (7.13) > Fkritiek (3.4) dus H0 verwerpen Hoofdstuk 7: Variantieanalyse
Variantieanalyse Hoofdstuk 7: Variantieanalyse
Variantieanalyse Wanneer H0 verworpen is weten we dat minstens 2 groepen verschillen mbt. hun gemiddelde -> welke groepen? = post-hoc toetsing We zouden via t-toetsen elk paar van groepen met elkaar kunnen vergelijken (vb. groep 1-2, 2-3, 1-3). Bij elke t-toets gebruiken we een α = 0.05. Probleem: door herhaaldelijk t-toetsen uit te voeren neemt de fout van de 1e soort toe. Oplossing: bij posthoc toetsing corrigeren voor deze hogere kans op fouten van de 1e soort. >> Bonferroni correctie: wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P ≤ 0.05/3 (ipv. 0.05) (andere mogelijke correcties: Tukey, Scheffé,...) Hoofdstuk 7: Variantieanalyse
Variantieanalyse Post-hoc toetsing in SPSS: SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd. Als P ≤ 0.05 dan is er een significant verschil tussen beide groepen vb. enkel significant verschil ts. Groep 1-3 Hoofdstuk 7: Variantieanalyse
Variantieanalyse Voorbeeld ANOVA in SPSS: stressreductie door chocolade bij dansers Hoofdstuk 7: Variantieanalyse
Variantieanalyse 6. Effectgrootte 7. Rapportering Er was een significant effect van chocolade op het stressniveau van de dansers, F(2, 99) = 3.14, p = .048, r = .24 . De dansers die geen chocolade aten rapporteerden een hoger stressniveau (M = 65.5, SD = 10.54) dan dansers die twee repen chocolade aten (M = 59.12, SD = 12.27). Het stressniveau van de dansers die één reep chocolade aten (M = 61.32, SD = 8.95) verschilde niet significant van de andere condities. Hoofdstuk 7: Variantieanalyse
type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch chi-square goodness of fit one sample t-test / z-test 1 niet in dit boek independent t-test / z-test Rank-sum onafh. nominaal 2 afh. dependentt-test Signed-ranks 1 onafh. oneway ANOVA Kruskal-Wallis > 2 afh. repeatedmeasures ANOVA Friedman’s ANOVA interval/ ordinaal Pearsoncorrelation Spearmancorrelation interval/ ordinaal onafh. n-way ANOVA nominaal afh. repeatedmeasures ANOVA gemengd mixed design ANOVA interval > 1 multiple regression gemengd multiple regression chi-square goodness of fit 1 onafh. nominaal/ ordinaal nominaal 1 ≥ 2 onafh. Pearsonchi-square
tweewegs-variantieanalyse Eénwegs-variantie analyse -> 1 OV met meer dan twee waarden -> 1 AV is er een verschil in het welbevinden van kinderen met ouders die autoritair, autoritatief, of permissief opvoeden? Tweewegs-variantie analyse (of: tweefactor-variantie analyse) -> 2 OV -> 1 AV wat is het effect van drie verschillende lesmethoden en het geslacht van de leerling op de studieresultaten van leerlingen? = 3 X 2 ANOVA = k x r factorieel design met k = aantal niveaus OV1, r = aantal niveaus OV2 Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse Twee vragen: 1. vraag over hoofdeffect van elke OV op AV 2. vraag over interactie-effect tussen OV1 en OV2 op AV hoe hebben de twee OV’s samen in combinatie een effect op AV? is het effect van de ene OV op AV anders naargelang het niveau van de andere OV? - is het effect van ses op toekomstbeeld anders voor jongens dan voor meisjes? - is het effect van chocolade op stressreductie anders voor beginners dan voor gevorderden? Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 1. Toetsingssituatie a. Is er een effect van variabele A (met niveaus a1, a2, …) op variabele Y? b. Is er een effect van variabele B (met niveaus b1, b2, …) op variabele Y? = 2 hoofdeffecten c. Is het effect van variabele A anders naargelang het niveau van variabele B (of omgekeerd)? Wat is het effect van de combinatie van A en B op Y? = interactie-effect tussen A en B d. Indien er een hoofdeffect is van A, tussen welke groepen van A is er een verschil? e. Indien er een hoofdeffect is van B, tussen welke groepen van B is er een verschil? = post hoc toetsing Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 2. Voorwaarden • AV is gemeten op intervalniveau • OV’s worden als nominaal beschouwd (ook al is OV soms ordinaal) • scores van AV zijn in alle populaties normaal verdeeld • varianties in populaties zijn gelijk (F-toets of Levene’s toets) • onafhankelijke steekproeven Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 3. Hypothesen Wat is het effect van ses en geslacht op de toekomstverwachting van jongeren? OV1 (A) = ses (laag, midden, hoog) OV2 (B) = geslacht (jongens, meisje) AV = toekomstbeeld score ts. -10 en +10 -> 3 x 2 design (dus 6 populaties - zie les 2: waarden van OV bepalen aantal populaties) a. Is er een hoofdeffect van variabele A (met i niveaus)? H0: alle populatiegemiddelden van A zijn aan elkaar gelijk µ1 = µ2 = µ3 = … = µi als er I groepen zijn van A H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µi ≠ µi’ voor minstens één paar van i en i’ Of in termen van varianties H0: σ²A = σ²W of σ²A / σ²W = 1 H1: σ²A > σ²W of σ²A / σ²W > 1 Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse b. Is er een hoofdeffect van variabele B (met j niveaus)? H0: alle populatiegemiddelden van B zijn aan elkaar gelijk µ1 = µ2 = µ3 = … = µj als er J groepen zijn van B H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µj ≠ µj’ voor minstens één paar van j en j’ Of in termen van varianties H0: σ²B = σ²W of σ²B / σ²W = 1 H1: σ²B > σ²W of σ²B / σ²W > 1 Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse c. Is er een interactie-effect van variabele AxB ? H0: alle populatiegemiddelden van combinatie AxB zijn aan elkaar gelijk: µ11 = µ12 = … = µij als er I x J groepen zijn H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µij ≠ µi’j’ voor minstens één paar van ij en i’j’ Of in termen van varianties H0: σ²AxB = σ²W of σ²AXB / σ²W = 1 H1: σ²AXB > σ²W of σ²AXB / σ²W > 1 Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 4. Toetsingsgrootheid 4.1 F toets voor hoofdeffect van A met dfA = I – 1 (I = aantal niveaus van A) met dfW = N – (I x J) (N = totaal aantal ) vb. FA = 10/2.02 = 4.95 met dfA = 2 dfW = 24 4.2 F toets voor hoofdeffect van B met dfB = J – 1 (J = aantal niveaus van B) met dfW = N – (I x J) (N = totaal aantal ) vb. FB = 0.53/2.02 = 0.26 met dfB = 1 dfW = 24 4.3 F toets voor interactie-effect van AxB met dfAxB = (I - 1). (J – 1) met dfW = N – (I x J) (N = totaal aantal) vb. FAxB = 30.54/2.02 = 15.12 met dfAxB = 2 dfW = 24 Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 5. Beslissingsregels a. Overschrijdingskansen Is P r (F) ≤ α? ja, verwerp H0 neen, verwerp H0 niet >> overschrijdingskans per mogelijk effect (hoofd / interactie) in ANOVA-tabel SPSS b. Kritieke waarden Ook mogelijk via tabel met F-waarden. Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse significant hoofdeffect ses: jongens en meisjes samengenomen is er een effect van ses geen significant hoofdeffect geslacht: 3 ses niveaus samengenomen is er geen significant verschil tussen j en m een interactie-effect: het verschil ts. j en m is niet hetzelfde voor alle niveaus van ses >> post-hoc toetsing nodig om te weten tussen welke groepen er een verschil is. (SPSS) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse interactie-effect: het verschil ts. jongens en meisjes is niet hetzelfde voor alle niveaus van ses (lijnen lopen niet parallel) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse Post hoc analyse bij two-way ANOVA: Zie post-hoc bij one-way ANOVA: niveaus binnen 1 OV vergelijken. (overbodig als er maar 2 niveaus zijn – bv. geslacht. Kijk dan naar gemiddeldentabel) Om alle cellen paarsgewijs te vergelijken: simple effects – enkel met SPSS syntax (zie boek p. 163) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse Interpretatie resultaten ANOVA: via plots van gemiddelden per groep - 4 alternatieve hypothetischesituaties (hier geïdealiseerd): 1. Eén hoofdeffect en geen interactie-effect - geen hoofdeffect ses: geen verschil ts. laag-midden-hoog groep wanneer j en m samennemen - wel hoofdeffect geslacht: j scoren hoger dan m wanneer 3 ses groepen samennemen - geen interactie-effect: het verschil ts. j en m is hetzelfde voor alle niveaus van ses (lijnen lopen parallel) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 2. Twee hoofdeffecten en geen interactie-effect - een hoofdeffect ses - een hoofdeffect geslacht - geen interactie-effect: het verschil ts. j en m is hetzelfde voor alle niveaus van ses (lijnen lopen parallel) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 3. Twee hoofdeffecten en een interactie-effect - een hoofdeffect ses: jongens en meisjes samengenomen is er een effect van ses - een hoofdeffect geslacht - een interactie-effect: het verschil ts. j en m is niet hetzelfde voor alle niveaus van ses (lijnen lopen niet parallel) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 4. Geen hoofdeffecten maar wel een interactie-effect - geen hoofdeffect ses: jongens en meisjes samengenomen is er geen effect van ses - geen hoofdeffect geslacht: 3 ses niveaus samengenomen is er geen effect van geslacht - een interactie-effect: het verschil ts. j en m is niet hetzelfde voor alle niveaus van ses (lijnen lopen niet parallel) Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 6. Effectgrootte Partial Eta squared: interpreteerbaar zoalsr teberekenen met SPSS Via ANOVA-dialoogbox > options > estimates of effect size aanvinken Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse Demo two-way ANOVA: effect van chocolade én dansniveau op stress? Hoofdstuk 7: Variantieanalyse
tweewegs-variantieanalyse 7. Rapportering Eerst de potentiëlehoofdeffectenbespreken (zie one-way ANOVA, inclusiefeventuele post-hoc) gegevens: gemiddelden, SD, F-waarde, p-waarde, r Daarnapotentieelinteractie-effect, zelfdegegevens. Hoofdeffectenzijnnietmeer relevant alsereeninteractie-effect is, maarmoetenwelgerapporteerdworden. Interpretatie van de resultatengaatenkel over interactie-effect. Hoofdstuk 7: Variantieanalyse
type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch chi-square goodness of fit one sample t-test / z-test 1 niet in dit boek independent t-test / z-test Rank-sum onafh. nominaal 2 afh. dependentt-test Signed-ranks 1 onafh. oneway ANOVA Kruskal-Wallis > 2 afh. repeatedmeasures ANOVA Friedman’s ANOVA interval/ ordinaal Pearsoncorrelation Spearmancorrelation interval/ ordinaal onafh. n-way ANOVA nominaal afh. repeatedmeasures ANOVA gemengd mixed design ANOVA interval > 1 multiple regression gemengd multiple regression chi-square goodness of fit 1 onafh. nominaal/ ordinaal nominaal 1 ≥ 2 onafh. Pearsonchi-square Hoofdstuk 7: Variantieanalyse
Kruskal-Wallis toets voor verschil tussen k populaties 1. Toetsingssituatie Is er een verschil in gemiddelde tussen groep a, b, c, … op variabele Y? >> zelfde situatie als eenwegs-variantieanalyse. 2. Voorwaarden AV is niet normaal verdeeld en/of AV is van ordinaal meetniveau Chocolade als afrodisiacum? Gemeten met: Hoofdstuk 7: Variantieanalyse
Kruskal-Wallis toets voor verschil tussen k populaties 3. Hypothesen H0: θ1 = θ2 = … = θk H1= “niet H0” bij k niveaus van de OV 4. Toetsingsgrootheid Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H >> analyze > non-parametric > legacy dialogs > k independent samples (zie boek 7.3.4) Hoofdstuk 7: Variantieanalyse
Kruskal-Wallis toets voor verschil tussen k populaties 5. Beslissingsregel Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α? ja > verwerp H0 nee > verwerp H0 niet Is ereen effect? post-hoc toetsen met meerdere Mann-Whitney/Wilcoxon Rank-Sum. Gebruikzoweinigmogelijk tests en hanteerBonferroni-correctie: α/ aantal tests. Hoofdstuk 7: Variantieanalyse
Kruskal-Wallis toets voor verschil tussen k populaties Demo Kruskal-Wallis: chocoladealsafrodisiacum? OV : 3 niveauschocolade – geen, éénreep, twee repen AV: ordinaleschaal met 3 niveaus Hoofdstuk 7: Variantieanalyse
Kruskal-Wallis toets voor verschil tussen k populaties 6. Effectgrootte • Geen effectgrootte voor K-W test algemeen • Wel effectgrootte van bijhorendenMann-Whitney tests – zie H5 Hoofdstuk 7: Variantieanalyse
Kruskal-Wallis toets voor verschil tussen k populaties 7. Rapportering Een Kruskal-Wallis toets werd uitgevoerd om het effect van het eten van chocolade op de lustgevoelens van dansers na te gaan. Dit effect bleek inderdaad significant, H = 8.71, p = .013. Bijkomend werden de condities zonder chocolade (mean rank = 41), met één reep chocolade (mean rank = 59.91) en twee repen chocolade (mean rank = 53.59) onderling vergeleken door middel van een Wilcoxon rank-sum toets, waarbij een gecorrigeerd significantieniveau van α = .017 werd gehanteerd. Hieruit bleek dat er enkel een significant verschil was tussen de conditie zonder chocolade en de conditie met één reep chocolade (Ws = 954.5, z = -2.976, p = .003, r = -.36). Het verschil tussen de conditie zonder chocolade en de conditie met twee repen chocolade (Ws = 1034.5, z = -1.861, p = .06, r = -.23) noch het verschil tussen de conditie met één reep chocolade en de conditie met twee repen chocolade (Ws = 1105.5, z = -.917, p = .36, r = -.11) waren significant. Hoofdstuk 7: Variantieanalyse
Voorbeeld analyse met k populaties Fetisjisme bij kwartels? (zie Field, 2009) Çetinkaya, Hakan & Domjan, Michael (2006). Sexual fetishism in a quail (Coturnix japonica) model system: Test of reproductive success. Journal of Comparative Psychology, Vol 120(4), Nov 2006, 427-432. Hoofdstuk 7: Variantieanalyse