120 likes | 294 Views
Obecný lineární model Analýza kovariance Nelineární modely. Obecný lineární model. General linear model ANOVA – jednocestná: Y ij = b 0 + a i + e ij Regresn í model: Y j = b 0 + b 1 X 1j + b 2 X 2j + e j ANOVA model lze vyj ádřit (a spočítat) obdobným způsobem jako lineární regresi
E N D
Obecný lineární model • General linear model • ANOVA – jednocestná: Yij = b0 + ai + eij • Regresní model: Yj = b0+ b1X1j+b2X2j+ej • ANOVA model lze vyjádřit (a spočítat) obdobným způsobem jako lineární regresi • Obecný lineární model je společné vyjádření, s vysvětlovanou kvantitativní proměnnou a vysvětlujícími buď kvantitativními nebo faktory (kategoriální)
Příklady obecných lineárních modelů • Počet druhů ve společenstvu ~ typ horniny, typ obhospodařování, nadmořská výška • Hladina cholesterolu ~ pohlaví, věk, množství zkonzumovaného bůčku • Míra heterozygozity ~ ploidie,velikost populace
Obecný lineární model: jeden faktor a jeden kvantitativní prediktor • Příklad: jak závisí podíl fixovaného uhlíku, investovaného do reprodukce na množství dostupného fosforu (P) u tří druhů? • Model: %biomasy ~ P + druhtest proměnných P a druh • Model: %biomasy~ P + druh + P:druhtest interakce: závisí míra změny na druhu?
Analýza kovariance (ANCOVA) • Nejběžnější případ obecného lineárního modelu • Obvykle předpoklad rovnoběžnosti přímek (nezávislosti faktorů a kvantitativních vysvětlujících proměnných) • Těžištěm bývá vliv faktorů, kvantitativní proměnné často popisují variabilitu „pozadí“, kterou chci odstranit • Faktor a kvanitativní proměnná by měly být nezávislé (jak jen to jde)
Příklady • Vliv léku na krysy: mám podezření, že výsledek závisí i na váze krysy • Nelze zajistit, aby byly všechny stejně těžké • Použiji váhu na začátku pokusu jako kovariátu (covariate) • Průměr a variabilita hmotností by měly být ve skupinách podobné • Vliv mykorrhizní symbiózy na růst rostliny: výsledná hmotnost (biomasa) závisí i na počáteční • Počáteční výšku (nebo počet lístků) použiji jako kovariátu • Opět se snažím, aby malé i velké semenáčky byly ve všech skupinách
Vysvětlující proměnná: faktor nebo kvantitativní? • V mnoha případech mám na výběr.Studuji vliv živin na biomasu rostlin, tři různé dávky hnojiva (0, 7 a 14 g N / m2) • Regrese: biomasa = b0+b1*N+chybapředpoklad lineární závislosti biomasy na N, model spotřebuje jen 1 stupeň volnosti • ANOVA: biomasa = společný průměr + efekt dávky + chyba2 stupně volnosti, nemusí být lineární vztah • Pokud vztah lineární, je regresní test silnější
Nelineární regrese • Termín nelineární regrese nejednoznačný, alespoň čtyři běžné významy • Transformací dosáhnu linearity: S = c.Az • Používám polynom vysvětlující proměnné (i více): polynomická regrese (polynomial r.) • Odhaduji parametry nelineárního vztahu, který nelze „linearizovat“: růstové křivky apod., non-linear least squares • Používám neparametrické regresní modely
Polynomická regrese 1 • Libovolně složitou funkce lze nahradit (v omezeném rozsahu hodnot prediktoru) polynomem • Obvykle nemá smysl užívat polynomy složitější než kubické (třetí mocnina): kvadratická regrese, kubická regrese • Y = b0+ b1X + b2X2 + b3X3 + e • Při praktickém použití je rozumné proměnnou X „vycentrovat“ (odečíst průměr) • Ortogonální polynomy
Polynomická regrese 2 • Užíváme, pokud je vztah nelineární, ale nemáme konkrétní představu, jakou rovnicí tuto závislost popsat • Postupný výběr složitosti modelu (stepwise regression) • Lze použít i pro dva prediktory, buď představující prostorové souřadnice nebo například dva faktory prostředí
Non-linear least squares • Nelineární metoda nejmenších čtverců • Máme a priori danou rovnici a obvykle musíme dodat i počáteční odhady parametrů • Příklad: saturační křivka rychlosti fotosyntézy,s rostoucí koncentrací CO2 v prostředí rychlost fotosyntézy roste do určité limity • Vztah: nelze linearizovat • Iterativní postup hledání řešení občas nekonverguje nebo najde sub-optimální řešení
Neparametrické regresní modely • Vyhlazovací modely (smoothers)loess smoother • Zobecněné aditivní modely (generalized additive models, GAM) • Musíme volit složitost fitovaného modelu (stupně volnosti, ne vždy celá čísla) • Nemáme k dispozici rovnici, do které bychom mohli dosadit – model je třeba zobrazit