110 likes | 311 Views
Monte Carlo permuta ční test y & Postupný výběr. Line á r ní r egres e : model. Line ární regrese : kvalita. Celková suma čtverců (TSS): Model ová sum a čtverců (MSS): Residu á l ní sum a čtverců (RSS):. Je ten vliv reálný ?. Testování v line á r ní regresi: F statisti ka
E N D
Lineárníregrese: kvalita • Celková suma čtverců (TSS): • Modelová sumačtverců (MSS): • Residuální sumačtverců (RSS):
Je ten vliv reálný? • Testování v lineární regresi: F statistika • Omezená ordinace: F-like statistic MSS – sumakanonickýchcharakteristických čísel;RSS – sumaneomezených charakteristických čísel • Jakou distribuci má tato statistika v nulovém modelu? Monte Carlo permutační test
Test nulové hypotézy Máme-li jen jeden prediktor (jednu skupinu prediktorů): • Obdobné jednocestné ANOVA nebojednoduché regresi • Permutujeme prediktor(y) ve vztahu k druhovým datům • V každé permutaci vypočteme F statistikuvyjadřující “kvalitu” výsledné ordinace: vytvářímepopis distribuce hodnot F
Permutace odvozené z modelu Máme další proměnnéovlivňující vysvětlující proměnné: • Y = b1*X + b2*Z + e H0: b1 = 0 X: vysvětlující proměnná(-é); Z: kovariáta(-y) • nafitujemeY = b2*Z+e, odhadnemeejako • permutujemee =>e* a vypočteme nová data jako • pro každou permutaci vyhodnotímekvalitu (F-statistika)
Permutace odvozené z designu I • Permutace odvozené z modelu často fungují dobře, vedou k asymptoticky přesným odhadůmchyby prvního druhu • Ale pokud je to možné a praktické, používáme exaktní testys permutací odvozenou z designu • Příklad dvoucestné (dvoufaktorové) ANOVY: Y = m + Ai + Bj + e • Efekt faktoruAtestujeme náhodnými permutacemiuvnitř hladin faktoruB, a naopak.
Permutace odvozené z designu II • Při testu interakce (A x B) musíme obvykleprovádět permutace odvozené z modelu • Hierarchickéuspořádání, včetně split-plot: permutace odvozené z modelunefungují správněprovnější (whole-plot) faktory; volba permutovatelných jednotekmusí být založenana správnémjmenovateli F statistiky v ANOVA • Ještě složitější u opakovanýchměření (závislost jednotek v čase)
Volba správných permutací(podle M. Anderson 2001) například MSA/MSblock Je MS ve jmenovateli F statistiky residuálnímean square? Krok 1:Identifikuj permutované jednotky NE ANO Permutovatelné jednotkyjsou kategorie faktoruze jmenovatele MS Permutovatelnými jednotkami jsoupozorování Krok 2:Zohledni dalšíčleny modelu Jsou v modelu další členy, nezohledněnévolboupermutovatelných jednotek? ANO NE Jako úroveň přesnosti testu potřebujeme? Netřeba jiné faktoryzohledňovat přesný asymptoticky přesný Permutace reziduálůredukovaného modelu:permutovatelné jednotky Permutace omezuvnitřkategoriídalších faktorů Neomezené permutacepermutovatelnýchjednotek(přesný test) ANO (asymptoticky přesné, někdyvyšší síla testu) Malý počet možných permutací?NEBOExaktní test nelze provést (např. test interakce)? Omezené permutacepermutovatelnýchjednotek NE (přesný test, ale někdy s nižší sílou)
Postupný výběr (forward selection) • Obdobně jako v regresi: poznání relativního významu jednotlivých prediktorů, vytvoření "minimálního adekvátního modelu" • CANOCO: automatic forward selection – nezávislé (marginal) a podmíněné (conditional) efekty • CANOCO: manual forward selection