320 likes | 435 Views
Analýza rozptylu. V praxi často je potrebné porovnávať väčší počet nezávislých náhodných výberov z hľadiska úrovne, t. zn. zaujíma nás hypotéza: pre aspoň jeno i (i = 1, 2,…m)
E N D
V praxi často je potrebné porovnávať väčší počet nezávislých náhodných výberov z hľadiska úrovne, t. zn. zaujíma nás hypotéza: pre aspoň jeno i(i = 1, 2,…m) pre m > 2, kde i , i =1, 2, …m sú stredné hodnoty z normálne rozdelených základných súborov s rovnakým rozptylom 2 , t.j. N(, 2) • K overeniu tejto hypotézy sa používa dôležitá štatistická metóda, nazývaná Analýza rozptylu, skrátene ANOVA (resp. AR)
V praxi sa AR používa vtedy, ak skúmame vplyv jedného resp. viacerých faktorov (ošetrení) na skúmaný štatistický znak Faktory budeme označovaťA, B,…a v AR ich budeme zohľadňovať len ako kvalitatívne znaky s rôznymi obmenami - úrovňami faktora výsledný štatistický znak bude kvantitatívny a označíme hoY najčastejšie sa AR používa pri vyhodnocovaní biologických, technických ... experimentov Všimneme si najjednoduchší prípad AR s jedným faktorom, ktorú nazývame jednofaktorová AR
Jednofaktorová AR vyvážené pokusy JARv Zakladné pojmy faktor úroveň faktora pokus – vyvážený, nevyvážený model AR
Zakladné pojmy Úrovňou faktorabudeme označovať: určité množstvo kvantitatívneho faktora, napr. množstvo dávok čistých živín pri hnojení, rôzne príjmové skupiny domácností, určitý druh kvalitatívneho faktora, napr. rôzne odrody tej istej plodiny, rôzne druhy techniky, spôsoby umiestnenia výrobkov v predajni, ... AR je zovšeobecnením Studentovho t-testu pre nezávislé výbery ak ich počet je väčší ako dva AR zároveň skúma vplyv kvalitatívneho faktora (faktorov) na výsledný kvantitatívny znak - teda analyzuje vzťahy (závislosť) medzi znakmi
A 1 2… j… n Yi . yi . 1 y11 y12 y1j y1n Y1.y1. 2 y21 y22 y2j y2n Y2. y2. … ……….. i yi1 yi2 yij yin Yi. yi. … ……….. m ym1 ym2 ymj ymn Ym. ym. Y..y.. Schéma jednofaktorového experimentu “vyvážený pokus” riadkový súčet riadkový priemer opakovania Úrovne faktora celkový priemer Celkový súčet
riadkový súčet: celkový súčet: riadkový priemer: celkový priemer:
Model pre výslednú napozorovanú hodnotu: kde i = 1, 2,…, m j = 1,2,…, n Kde - očakávaná hodnota pre všetky úrovne faktora a napozorované hodnoty, i - efekt i-tej úrovne faktora A eij - náhodná chyba, ktorým je každé meranie zaťažené, resp. výsledok vplyv náhodných činiteľov
alebo Nulovú hypotézu potom môžme formulovať aj nasledovne: Ho : 1 = 2 =… i = m =0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H1: i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly
Odhadmi jednotlivých parametrov sú nasledovné výberové charakteristiky: čo môžme prepísať:
1 2 3 Porovnanie dvoch experimentov s tromi úrovňami faktora 1 2 3
Princíp Analýzy rozptylu Podstata analýzy rozptylu spočíva v rozklade celkovej variability výsledného skúmaného znaku Sr Sc S1 Variabilita medzi úrovňamifaktora, spôsobená pôsobením faktora A, “variabilita medzi triedami, riadkami” Variabilita náhodná, reziduálna, “vo vnútri tried Celková variabilita
ANOVA Variabilita 3 Priemerný štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti Variabilita medzi triedami s12 m-1 S1 Reziduálna variabilta sr2 m.n - m Sr Celková variabilita N-1= m .n-1 Sc
Testovacie kritérium možno pre jednofoktorovú AR - vyvážený pokus zapísať podrobne vzťahom: Hodnotu F testovacieho kritéria porovonáme s príslušnou tabuľkovou hodnotou F-rozdelenia: F , pre stupne voľnosti (m-1) a (m.n - m)
Rozhodnutie o výsledku testu: • Ak F vyp F. ((m-1,(N-m)) Ho zamietame, v takom prípade je aspoň efekt jednej úrovne faktora preukazný, teda priemerna úroveň ukazovateľa sa štatisticky významne líši od ostatných. Resp. aspoň jeden efekt ije štatisticky významne odlišný od nuly. Ak F vyp F Ho nezamietame F Obor nezamietnutia Ho kritický obor, obor zatnutia H0
Ak nulovú hypotézu zamietame: • Zistili sme len, že je preukazný vplyv faktora na skúmaný znak, • ďalej je potrebné skúmať medzi ktorými úrovňami faktora je a medzi ktorými nie je preukazný rozdiel - k tomúto účelu sa používajú testy kontrastov • Medzi testy kontrastov patria: Duncanov test, Scheffeho test, Tuckey test a iné…..
Podmienky použitia AR: • Výbery pochádzajú z normálnych rozdelení, narušenie tohto predpokladu nemá podstatnejší vplyv na výsledky AR • štatistická nezávislosť náhodných chýb eij • zhodné reziduálne rozptyly 12 = 22 = …. = 2 , t.j. D(eij) = 2 pre všetky i = 1,2…., m, j=1,2, …n tento predpoklad je závažnejší a možno ho overovať Cochranovým, resp. Bartlettovým testom
Jednofaktorová AR nevyvážené pokusy JARn
A 1 2… j … ni Yi . yi . 1 y11 y12 y1j ...n1Y1.y1. 2 y21 y22 y2j ...n2Y2. y2. … ……….. i yi1 yi2 yij ...niYi. yi. … ……….. m ym1 ym2 ymj ...nmYm. ym. Y..y.. Schéma jednofaktorového experimentu “nevyvážený pokus” riadkový súčet riadkový priemer Rôzny počet opakovaní Úrovne faktora celkový priemer Kde
3 Priemerný štvorec (1/2) 4 F-krité rium ANOVA Variabilita 1 Súčet štvorcov odchýlok 2 Stupne voľnosti Variabilita medzi triedami s12 m-1 S1 Reziduálna variabilta sr2 N - m Sr Celková variabilita N-1 S
Dvojfaktorová AR s jedným opakovaním v podtriede DARj
Dvojfaktorová analýza rozptylu s jedným pozorovaním v každej podtriede ..DAR • Uvažujme vplyv faktora A, ktorý skúmame na m - úrovniach, i = 1,2,….,m • ďalej uvažujme faktor B, ktorý sledujeme na n - úrovniach , j = 1,2, …, n • na každej i-tej úrovni faktora A a j-tej úrovni faktora B máme len jedno pozorovanie (opakovanie) yij • overujeme tak vplyv dvoch nulových hypotéz
A 1 2 … j … n Yi . yi . 1 y11 y12 y1j y1n Y1.Y1. 2 y21 y22 y2j y2n Y2. y2. … ……….. i yi1 yi2 yij yin Yi. yi. … ……….. m ym1 ym2 ymj ymn Ym. ym. Y.1 Y.2 ...Y.j ...Y.1 Y.. y.1 y.2 ...y.j ...y.1 y.. Schéma dvojfaktorového experimentu s jedným pozorovaním v každej podtriedeDAR riadkové súčty n-úrovní faktora B B m-úrovní faktora A Riadkové priemery celkový priemer Stĺpcové súčty stĺpcové priemery
Overujeme platnosť dvoch nulových hypotéz Model pre skúmaný znak môžme zapísať Hypotéza pre faktor A: Ho1: 1 = 2 =… i = m =0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H11 :i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly
Hypotéza pre faktor B: Ho2: 1 = 2 =… j = n =0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H12 : j 0 pre aspoň jedno j (j = 1,2…m) efekt j aspoň jednej j - úrovne faktora B je preukazný, významne odlišný od nuly
3 Priem. štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti DAR Variabilita Variabilita medzi riadkami S1 s12 m-1 Variabilita medzi stĺpcami n-1 s22 S2 Reziduálna variabilta Sr sr2 (m-1)(n-1) Celková variabilita Sc m.n -1
Rozklad celkovej variability skúmaného znaku:Sc= S1 +S2 +S r Variabilita medzi riadkami, vplyv faktora A Variabilita medzi stĺpcami, vplyv faktora B Reziduálna variabilita Celková variabilita
Testovanie kontrastov Ak zamietneme Ho nulovú hypotézu v AR tj.: záver že neplatí zhoda medzi porovnávanými strednými hodnotami, je nevyhnutné aby sa výsledky analýzy rozptylu doplnili podrobnejším hodnotením, ktorým vyhodnotíme všetky možné dvojice výberov z hľadiska homogenity stredných hodnôt (ktoré z dvojíc výberových priemerov sa líšia štatisticky významne a ktoré len náhodne). Počet všetkých možných dvojíc je definovaný vzťahom: Duncanov test je založený na usporiadaní priemerov podľa veľkosti a vo vzájomnom porovnaní rozdielov dvoch priemerov jednotlivých úrovní ošetrenia A s vypočítanou kritickou hodnotou vzťah (k = 2, 3, ..., m)
Tukeyho metóda ( krátko T – metóda),je citlivejšia na rozdiely medzi strednými hodnotami (je silnejšia ako Scheffeho metóda), avšak vyžaduje aby pokus bol vyvážený Sú tabelované kritické hodnoty studentizovaného rozpätia