1 / 31

Slo žitější (mnohorozměrné) metody

Slo žitější (mnohorozměrné) metody. stručný nástin možností vybraných metod. Path analysis. přesný český překlad by byl něco jako analýza cestiček Viz též SEM (Structural Equation Modelling [třeba ve programu Statistica; je to o něco širší pojem]), případně causal modelling.

kinsey
Download Presentation

Slo žitější (mnohorozměrné) metody

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Složitější (mnohorozměrné) metody stručný nástin možností vybraných metod

  2. Path analysis • přesný český překlad by byl něco jako analýza cestiček • Viz též SEM (Structural Equation Modelling [třeba ve programu Statistica; je to o něco širší pojem]), případně causal modelling

  3. Klasická (mnohonásobná) regrese • Mnoho prediktorů, jedna odpověď • Ve skutečnosti - dlouhé kauzální řetězce - v přírodě: mnohá proměnná je ovlivňovaná, a zároveň ovlivňuje - vede ke kauzálním sítím

  4. Například typický hydrobiologický model Dravé ryby Ostatní náhodné vlivy (případně tady může být teplota, chemie vody etc. Planktonožravé ryby Zooplankton Fytoplankton

  5. Příklad ze skript

  6. Mluvíme sice o kauzálním modelování • Ale kauzalita je “vnesena” našimi představami o systému, nikoliv experimentální manipulací • Přístupy použití se liší, podle toho jak moc dovolíme, aby náš iniciální model o kauzálních závislstech byl korigován na základě dat

  7. Metoda je užitečná především tam, • kde nemůžeme (alespoň některé) proměnné měnit experimentálně • Oblíbená v evoluční biologii • Ale i v ekologii (zvlášt na úrovni ekosystémů a společenstev ve větších prostorových škálách) • Pozor při interpretaci kauzality

  8. Popsáno + srozumitelně pro biology • Bill Shipley 2004 Cause and Correlation in Biology: A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press. • James B. Grace 2006 Structural Equation Modeling and Natural Systems. Cambridge University Press.

  9. (Hierarchické) klasifikace Děláme stromečky (ale nejen je)

  10. Cíl klasifikace • Vytvořit skupiny objektů, které jsou vnitřně homogenní, ale odlišné od ostatních

  11. Typická data (matice) Snímek číslo

  12. Mohu klasifikovat • snímky, podle podobnosti druhového složení (dostanu skupiny podobných snímků - pak jim třeba můžu nějak říkat [Seslerietum]) • druhy, podle vzájemné podobnosti (korelace) rozšíření (dostanu skupiny druhů s podobnými ekologickými nároky)

  13. Typická data Chci získat skupiny podobných individuí - pozor, data jsou na různých stupnicích

  14. Klasifikace • Numerická taxonomie, numerická fenetika, kladistické metody • Numerické taxonomie (dříve především fenetika), dnes podstatně širší pojetí • Kladistika - fylogenetika - konstrukce fylogenetických stromů - dnes prakticky samostatné odvětví

  15. Klasifikace • S učením vs. bez učení • Hierarchické vs. nehierarchické • Hierarchické - divisivní vs. algomerativní

  16. Shluková analýza • = Hierarchická, aglomerativní metoda, výsledkem strom: • Princip - nejprve spočtu matici podobností mezi všemi páry, pak konstruuju strom

  17. Přži shlukové analýze pamatuj: • Je zásadním způsobem ovlivněna tím, jakou mám míru podobnosti mezi objekty (tzv. (dis)similarity measure, příp. resemblance function). Pokud mám data měřená na různých škálách, musím standardizovat. Míry bývají často specifické pro různá odvětví

  18. Při shlukové analýze pamatuj: • Velmi důležitý je i shlukovací algoritmus • Předvolby (default) v programu Statistica jsou v drtivé většině nevhodné pro biologické účely - je třeba je příslušně změnit

  19. Shluková analýza mi udělá skupiny vždy • ale já je nechci, chci vizualizovat podobnostní strukturu ve složení společenstev

  20. Ordinace: chci dostat(pro složení společenstev) odrinační diagram, kde podobné snímky budou blízko sebe, podobné druhy budou blízko sebe, a druhy budou mít optima v blízkosti snímků, kde se vyskytují

  21. Ordinační diagram Urtica Chenopodium Cactus Nymphea Menyanthes Comarum Aira Drosera Blízkost značí podobnost

  22. Ordinační diagram Nutrients Urtica Chenopodium Cactus Nymphea Menyanthes Water Comarum Aira Drosera Můžu mít i vysvětlující proměnné - buď je promítám ex post, nebo tzv. constrained ordinations.

  23. Různé metody • Correspondence analysis, Principal component analysis, factor analysis • Oblíbené v ekologii, ale i v taxonomii (ukáže, zda jsou mezi druhy přechody), a také v psychologii

  24. Constrained ordinations i pro hodnocení pokusů

  25. Diskriminační analýza • Příklad: Mám diploida a tetraploida - ale nemůžu pokaždé počítat chromozomy - ptám se - jsem schopen najít pravidlo na základě měřených morfologických znaků (jako jejich lineární kombinaci), které mi dvě ploidie od sebe odliší?

  26. Při aplikaci • pozor na důkaz kruhem (expert mi určil dva druhy [hlavně na základě délky prašníků, ale to já nevím] a já pak dokážu, že dva dané druhy existují, a perfektně se odlišují délkou prašníku).

  27. Jiná úspěšná aplikace ve Škodovce (MB, už dávno) • V rámci povinných prohlídek sledovali zaměstnance, a měli data o tlaku, cholesterolu, zda kouří, váhu, výšku etc. • a zda do 10-ti let od prohlídky dostal či nedostal infarkt. • Získali kombinaci znaků, která predikuje - chlapče, dej si pozor, spěješ k infarktu.

  28. Podobnou věc udělají i klasifikační stromy • Založeny na jiném principu (není zde aditivita efektů)

  29. Co užitečného jsme neprobrali v celé Biostatistice (neúplný výběr) • Power analysis (jakou mám šanci zamítnout H0) • Složitější modely ANOVA (a obecně GLM) • Zobecněné lineární modely • Prakticky nic z metod mnohorozměrných • Bayesovskou statistiku

  30. Kde se můžu o statistických metodách dozvědět více • Moderní regresní metody (Šmilauer) • Vizualizace dat (Šmilauer) • Plánování a hodnocení ekologických experimentů (Lepš & Šmilauer) • Praktikum mnohorozměrných metod (Lepš & Šmilauer)

More Related