1 / 20

Analýza rozptylu

Analýza rozptylu. Analýza rozptylu při dvojném třídění. Často je nutné analyzovat vliv současného působení dvou faktorů, tzn. že naměřené hodnoty třídíme podle dvou kritérií. Uvažujme dva faktory A a B, které současně působí na určitý statistický znak X.

stanislaw
Download Presentation

Analýza rozptylu

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analýza rozptylu Analýza rozptylu při dvojném třídění

  2. Často je nutné analyzovat vliv současného působení dvou faktorů, tzn. že naměřené hodnoty třídíme podle dvou kritérií. Uvažujme dva faktory A a B, které současně působí na určitý statistický znak X. Faktor A má m úrovní A1, A2, …, Am (podle tohoto faktoru se tedy dají všechna pozorování roztřídit do m skupin), faktor B má n úrovní B1, B2, …, Bn (podle faktoru B lze roztřídit všechny pozorované hodnoty do n skupin). Pokud má každá kombinace úrovní faktoru A a faktoru B pouze jedinou naměřenou hodnotu xij, hovoříme o modelu dvojného třídění s jedním pozorováním v každé podtřídě.

  3. Jednotlivá pozorování xij lze vyjádřit matematickým modelem takto: • xij =  + ai + bj + eij, i = 1, 2, …, m j = 1, 2, … , n, • kdy •  – obecná střední hodnota, • ai – efekt i-té úrovně faktoru A (efekt i-tého řádku), • bj – efekt úrovně Bj faktoru B (efekt j-tého sloupce), • eij – náhodné chyby – nezávislé náhodné veličiny s rozdělením N (0; 2). • Řádkové a sloupcové efekty jsou omezeny reparametrizačními podmínkami

  4. V uvedeném modelu je možno testovat dvě nulové hypotézy: Dvoufaktorový model s pevnými efekty – úrovně obou faktorů jsou fixované, Dvoufaktorový model s náhodnými efekty – úrovně obou faktorů jsou náhodné, Smíšený dvoufaktorový model – úrovně jednoho faktoru jsou pevné a úrovně druhého faktoru jsou náhodně vybrány.

  5. Celkové zdroje variability vyjádřené součtem čtverců odchylek rozkládáme na 3 složky a to: • S1 – efekt třídění A, měřící kolísání „řádkových“ průměrů okolo celkového průměru, • S2 – efekt třídění B, měřící kolísání „sloupcových“ průměrů okolo celkového průměru, • Sr – měří náhodné kolísání hodnot znaku uvnitř tříd. • Pro rozklad součtu čtverců platí S = S1 + S2 + Sr. • Každé třídění má své testové kritérium F1 a F2 a v případě přijetí H1 se pro každé třídění provádí zvlášť podrobnější vyhodnocení výsledku (hodnocení se provádí jako u jednoduchého třídění).

  6. Součty čtverců se stanoví následujícím způsobem:

  7. Tabulka analýzy rozptylu při dvojném třídění s jedním pozorováním v každé podtřídě

  8. Rozhodovací pravidla Je možné konstatovat, že efekty faktoru A jsou významné, efekty faktoru B jsou statisticky významné. Může nastat také situace, kdy se zamítá pouze jedna nulová hypotéza (buď pro faktor A nebo pro faktor B). V případě zamítnutí H0 je potřeba vždy provést podrobnější vyhodnocení, které se provádí pro každou hypotézu zvlášť.

  9. Analýza rozptylu při dvojném třídění se stejným počtem pozorování (p >1) v podtřídách při existenci interakce Při tomto modelu bereme v úvahu i možnost vzájemného vztahu (společné působení) faktoru A a faktoru B na závisle proměnnou. Toto společné působení obou faktorů se nazývá interakce. Interakcí rozumíme jev, při kterém kombinace úrovní faktorů může mít na výslednou hodnotu sledovaného znaku rozdílný účinek než činí „prostý součet účinku každého faktoru uvažovaného zvlášť“.

  10. Používá se v případech, kdy nelze objasnit variabilitu xij pouze aditivním působením jednotlivých faktorů. V modelu s interakcí budeme předpokládat, že pro každou kombinaci úrovní (Ai, Bj) obou faktorů A a B máme k dispozici stejný počet p nezávislých pozorování. Jednotlivá pozorování jsou rozdělena podle faktoru A do m tříd (řádků), podle faktoru B do n tříd (sloupců) a každá podtřída, ležící na průsečíku i-tého řádku a j-tého sloupce obsahuje p pozorování (xij1 , xij2 , …, xijp).

  11. Tabulka dat pro analýzu rozptylu dvojného třídění s více jak jedním opakováním v každé podtřídě pak vypadá takto (náhodně vybraný příklad):

  12. V tomto případě se formulují 3 hypotézy: tzn. že interakce má svoji nulovou hypotézu neboli uvádí, že mezi faktory A a B není žádný vztah. Abychom mohli oprávněně prohlásit, že faktor A ovlivňuje cílovou proměnnou X, musí nutně platit hypotéza o přítomnosti interakce. Ta zaručuje, že efekt faktoru A na dané úrovni je stejný pro všechny úrovně faktoru B.

  13. V odborné literatuře je pak možné nalézt konkrétní vzorce analýzy rozptylu dvojného třídění pro nevyvážené modely nebo pro modely se smíšenými nebo náhodnými efekty. Vícefaktorové modely analýzy rozptylu Teoreticky lze uvažovat neomezený počet faktorů a úrovní. S rostoucím počtem faktorů se analýza stává numericky velmi komplikovanou a komplikuje se i interpretace jejích výsledků, zvláště u interakcí.

  14. Příklad Pro uložení potrubí s vodou byly sledovány rozdíly teplot (měřeno v oC) v různých hloubkách a měsících roku. S použitím analýzy rozptylu dvojného třídění ověřte na hladině významnosti  = 0,05, zda se průkazně liší průměrná teplota půdy a) podle měsíců, b) podle hloubky půdy v cm. Podkladové údaje jsou uvedeny v tabulce. K podrobnějšímu vyhodnocení použijeme analýzu rozptylu dvojného třídění s jedním opakováním v každé podtřídě.

  15. F (1) (m-1); (m-1)(n-1) = F0,05 (4-1); (4-1)(3-1) = 4,76 F (2) (n-1); (m-1)(n-1) = F0,05 (3-1); (4-1)(3-1) = 5,14 zamítáme a rozdíly mezi průměry měsíců (řádkové průměry) jsou statisticky významné zamítáme a rozdíly mezi průměry hloubek půdy (sloupcové) jsou statisticky významné

  16. Podrobnější vyhodnocení – T-metoda Rozdíly mezi průměry jednotlivých řádků (měsíců)

  17. Rozdíly mezi průměry jednotlivých sloupců (hloubka)

More Related