110 likes | 269 Views
Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují?. Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém stromečku Vzdálenosti mezi pozorováními, které nelze kvantitativně měřit (např. degustační výsledky). Jak s distančními maticemi nakládat?.
E N D
Distanční matice – proč se objevují? • Vzdálenosti mezi objekty v terénu • Vzdálenosti mezi taxony ve fylogenetickém stromečku • Vzdálenosti mezi pozorováními, které nelze kvantitativně měřit (např. degustační výsledky)
Jak s distančními maticemi nakládat? • Můžeme pracovat přímo s hodnotami distancí a z údajů, které nejsou distance, je vypočítat (tak se užívá například Mantelův test).To má ale spoustu nevýhod • Můžeme distance převést na souřadnice – metody mnohorozměrného škálování. Častěji v takovém případě užíváme metrickou metodu (principal coordinates analysis, PCoA)
Distance máme pro druhová data • To je případ, ve kterém nám nevyhovují distance, implikované metodou CCA (chi-square distance) nebo RDA (Eukleidovská distance), spočteme si vlastní • Převedeme na souřadnice pomocí PCoA; nevadí, že jich máme hodně (vysvětlované proměnné mohou být v ordinačních metodách korelovány) • Použijeme tyto souřadnice v metodě RDA – to je tzv. distance-based RDA (db-RDA), Legendre & Anderson, Ecol.Monographs 1999
Distance máme pro prediktory • V tomto případě musíme obvykle z vypočítaných hlavních koordinát vybírat (ty, které dobře vysvětlují hodnoty v druhových datech) – jinak by vysvětlily všechno • Častá je situace, kdy máme některé prediktory jako distance (vzdálenost, fylogenetická spřízněnost), zatímco jiné ne (ekologické vlastnosti druhů, vlastnosti prostředí u snímků)
Prostorové uspořádání I. • Doporučovaná metoda: PCNM (principal coordinates of neighbour matrices), Borcard & Legendre, Ecol.Modelling 2002 • Spočítáme matici vzdáleností mezi jednotlivými vzorky a pak "utneme" všechny distance větší než hodnota největší vzdálenosti mezi bezprostředními sousedy. Tyto "uťaté" hodnoty nahradíme jednou – 4násobkem limity
Prostorové uspořádání II. • Výslednou matici pak zpracujeme pomocí PCoA • Pro pravidelně rozmístěné body odpovídá sinus-cosinus dekompozici (Fourierova transformace) – například lineární transekt • Ale funguje i pro nepravidelně uspořádaná data, například pobřeží jezera
Prostorové uspořádání III. • Nejčastěji užíváme tato data, vysvětlující prostorové souvislosti, v rámci variation partitioning
Fylogenetické vztahy I. • Také se nejčastěji užívá v kombinacis variation partitioning • Pro překryv v objasňujících schopnostech se užívá termín „phylogenetically structured environmental variation“ (Desdevides et al., Evolution 2003), odpovídá pojmu „phylogenetic niche conservatism“ • Tento postup lze užít i v případě, že nejde o mnohorozměrná data (příklad vlivu populační density na velikost těla savců)
Fylogenetické vztahy II. Jak převedeme stromeček na matici? • Musíme mít tzv. ultrametrický strom (všechny cesty od terminálních nód ke kořenu, tj. počátku divergence dané skupiny, jsou stejně dlouhé) • Převod na patristickou matici provádí i některé programy pro fylogenetickou analýzu (ape package v R)
Fylogenetické vztahy III. • Matici převedeme na souřadnice pomocí PCoA (PrCoord) • Vybereme jen souřadnice, které něco průkazně vysvětlují (forward selection), metoda RDA • Zvolené souřadnice lze interpretovat jejich pozicí v původním stromečku • Dále je používáme typicky jako kovariáty