230 likes | 356 Views
Analyse van kategorische gegevens. tot nu toe: respons variables continu grootte aantal nakomelingen,.. maar: ecologische gegevens vaak kategorisch overleven aan/afwezigheid andere methodes om continue en kategorische gegevens statistisch te verwerken. Als respons variablen continu.
E N D
tot nu toe: respons variables continu • grootte • aantal nakomelingen,.. • maar: ecologische gegevens vaak kategorisch • overleven • aan/afwezigheid andere methodes om continue en kategorische gegevens statistisch te verwerken
begingrootte groei • grootte aantal nakomelingen • Nutrientengehalte vegatatiedichtheid
Regressie procglmdata=work.statistik;model groei=begingrootte; run;
Behandelingen groei • Bloemkleur reproduktie
100 g 80 r o 60 e i 40 20 n y n y n n y y ANOVA procglmdata=work.statistik;class licht nutrienten;model groei=licht|nutrienten;run;
Behandeling, grootte groei • Behandelingen, natuurlijke waterbeschikbaarheid overleven
100 g 80 r o 60 e i 40 20 40 45 50 55 begingrootte Covariantie analyse procglmdata=work.statistik;class licht nutrienten;modelgroei=licht|nutrienten begingrootte;run;
Als respons variablen niet continu… • Vergelijkbare toetsen, maar werken met andere verdelingen Binominale verdeling Gemeten verdeling predicted verdeling +++ +++ ++++ ++ +
Voorwaarden van regressie-modellen • Geen restrikties op predictor variable (kontinu: regressie, niet kontinu: ANOVA) • Respons variable mag niet beperkt zijn (moet alle mogelijke waarden aan kunnen nemen) Kategorische response variable: • Respons variable sterk beperkt (kan alleen 0 of 1 zijn) probability p zeer beperkt 0 < p < 1
Logit transformatie • verminderd de beperking van de probability p • Upper bound: delen van p door 1-p • Lower bound: logaritmeren ln[p/(1-p)] = kXik + ui • Door logit transformatie worden gegenvens: • Continu • Niet beperkt (- < p < +) • Symmetrisch verdeeld om 0 Assumpties van regressie model heersteld Toetsen van hypotheses: H0: ß1=0 (geen relatie tussen binaire response variable en de voorspelde variable)
Gebruikte toets: afhankelijk van aantal herhalingen • Groote aantal herhalingen: Wald statistics vergelijkbaar t-toets • Weinig herhalingen: 2 statistics G2 = -2ln () = gereduceerd (g(x) = ß0) /full model (g(x) = ß0 + ß1X1) b1 (parameter estimate) = Wald t sb1 (SE van parameter estimate)
Assumpties • Binominale verdeling van de waarden • Als er meerdere voorspellende waarde zijn: geen colinearitiet • Het model (de causaliteit) moet kloppen
Voorbeeld causaliteit • Geen onderling verband tussen voorspellende variablen: Phenole, predatoren herbivoren • “Bottom up” verband Phenole predatoren herbivoren • “Top down” verband Predator phenole herbivoren • Toetsen van causaliteit met b.v. padanalyse
Als geen onderscheid tussen predictor en respons Log-linear model (vergelijkbaar met correlatie – analyse)
Grootte overleven • Lengte van de seizoen reproduktie
o v y e r l e v n e n 40 45 50 55 begingrootte logistische regressie proclogist; model overleven = begingrootte; run;
Behandelingen overleven • Reproduktie overleven • Behandelingen reproduktie
Logit model proclogist; class licht nutrienten;modeloverleven=licht|nutrienten; run;
Behandelingen, grootte overleven • Lengte van de seizoen, geslacht overleven • Bloemkleur, plantgrootte reproduktie
logistische regressie met continue covariable proclogist; class licht nutrienten;model overleven = licht|nutrienten begingrootte; run;