1 / 18

Mnohonásobná regrese a mnohorozměrná analýza dat

Mnohonásobná regrese a mnohorozměrná analýza dat. v programu CANOCO. Mnohonásobná regrese. mám více prediktorů ovlivňuje výšku rostliny hnojení a zálivka? ovlivňuje hmotnost těla zeměpisná šířka a nadmořská výška? prediktory by ideálně neměly být korelované lineární model:.

dyre
Download Presentation

Mnohonásobná regrese a mnohorozměrná analýza dat

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mnohonásobná regrese a mnohorozměrná analýza dat v programu CANOCO

  2. Mnohonásobná regrese • mám více prediktorů • ovlivňuje výšku rostliny hnojení a zálivka? • ovlivňuje hmotnost těla zeměpisná šířka a nadmořská výška? • prediktory by ideálně neměly být korelované • lineární model:

  3. Mnohonásobná regrese • lineární - grafem je rovina (pro 2 prediktory)

  4. Mnohonásobná regrese • kvadratická

  5. Mnohonásobná regrese • metoda nejmenších čtverců

  6. Mnohonásobná regrese • koeficienty α a βi-n odhadujemestejně jako u jednoduché regrese • testujeme: • ANOVA celého modelu (ani jeden prediktor nevysvětluje závisle proměnnou) • t-testy jednotlivých regresních koeficientů (k jednotlivým proměnným)

  7. Mnohorozměrná analýza dat • Canoco for Windows • program pro hodnocení společenstev • mám seznam lokalit (vzorky) a druhů, které jsem tam našel • dostanu ordinační diagram - „podobné“ druhy, lokality nebo oboje jsou u sebe • pokud mám ve vzorcích změřené nějaké vysvětlující proměnné (např. abiotické faktory), můžu si najít jestli průkazně ovlivňují druhy a jak

  8. Canoco – velmi stručný návod • v podstatě hledá imaginární „co nejlépe“ vysvětlující proměnné (osy) • viz Mnohorozměrná analýza ekologických dat. Jan Lepš & Petr Šmilauer, BF JU v ČB, 2000 • obecně pomocí Canoca mohu hodnotit jakoukoli (mnohorozměrnou) odpověď • typicky tedy druhy (počty, 0-1, třídy početnosti,…) ve vzorcích • ale i např. hmotnost, strupovitost, chuť a rezistence brambor • známka z M, Čj, Fy, Bi, Tv, D a Ch u studentů • délka pestíku, plocha listů, průměr stonku, počet listů, celková výška u rostlin

  9. Canoco – velmi stručný návod • zdrojová data – v Excelu či jiném tabulkovém procesoru • „druhová“ data: • řádky jsou jednotlivé vzorky • ve sloupcích druhy (nebo to co sleduji) hodnocené téměř libovolným způsobem (0-1, počet, ordinální kategorie, délka, hmotnost,…….)

  10. Canoco – velmi stručný návod • druhová data převedu do formátu Canoca programem WCanoImp (oblast dat v Excelu zkopíruji do schránky, spustím WCanoImp a dám „Save“) • uložím jako *.dta nebo *.spe (pokud chci aby to Canoco zobrazilo, jinak můžu třeba *.xyz) • Spustím Canoco for Windows a zvolím nový projekt

  11. Canoco – velmi stručný návod • vyberu soubor s druhovými daty a zadám soubor, kam se uloží řešení projektu (*.sol) • Type of Analysis – zde můžu zvolit některou nepřímou (neomezenou) analýzu (PCA – Principle Component Analysis, CA – Correspondent Analysis, DCA – detrended CA) • nejprve zvolím DCA, podle výsledku se rozhodnu mezi PCA (lineární) či CA (unimodální)

  12. Lineární metody – předpokládám lineární odpověď, anebo mám krátký úsek gradientu Unimodální – nepředpokládám lineární odpověď, anebo mám dlouhý úsek gradientu podle Lepš a Šmilauer 2000

  13. Canoco – velmi stručný návod • Provedu DCA (většinou nechám defaultní nastavení, pokud mám počty jedinců je dobrá použít odmocninovou transformaci) • Po analýze dostanu souhrnnou tabulku: • pokud je délka gradientu větší než 4, měl bych použít unimodální. Pokud menší než 3, bývá lepší lineární. Pokud 3-4 je to na mně.

  14. Canoco – velmi stručný návod • podle délky gradientu tedy zvolím CA nebo PCA • provedu analýzu, přepnu do CanoDraw Kumulovaná procentuální část variability vysvětlená jednotlivými osami

  15. Canoco – velmi stručný návod • pokud mám u vzorků změřené nějaké vysvětlující proměnné: • mám je v Excelu ve stejném pořadí jako druhová data • oblast vyberu a spustím WCanoImp • uložím jako *.dta nebo *.env • v Canocu užiji omezené (přímé) analýzy – RDA (Redundancy Analysis), CCA (Canonical • Correspondence Analysis) • zase mezi lineárními a unimodálními rozhodnu pomocí DCA

  16. Canoco – velmi stručný návod • proměnné – poměrová, intervalová či ordinální škála • kategoriální proměnné – zadávám jako tzv. dummy variables • nebo fuzzy variables

  17. Canoco – velmi stručný návod • Canoco umí spočítat, jestli daná vysvětlující proměnná (environmentální charakteristika) ovlivňuje vysvětlované proměnné (druhy) statisticky průkazně – tzv. Monte-Carlo permutační testy • manuální „forward selection“ – do analýzy zařadím jen ty proměnné, které mají průkazný efekt (většinou, záleží na tom co chci získat)

  18. Canoco – velmi stručný návod • další postup podobný jako u neomezených analýz • ve výsledcích dostanu omezené a neomezené osy • kategoriální (nominální) proměnné musím v CanoDraw takto značit • pokud mám kovariáty (covariables, vysvětlující proměnné, jejichž vliv chci odfiltrovat) – volím na začátku projektu • další – viz cvičení a Lepš a Šmilauer 2000

More Related