470 likes | 627 Views
ANALÝZA ROZPTYLU. Analýza rozptylu. V praxi často je potrebné porovnávať väčší počet nezávislých náhodných výberov z hľadiska úrovne, t. zn. zaujíma nás hypotéza: pre aspoň jeno i (i = 1, 2,…m)
E N D
ANALÝZA ROZPTYLU prof.Ing. Zlata Sojková,CSc.
Analýza rozptylu • V praxi často je potrebné porovnávať väčší počet nezávislých náhodných výberov z hľadiska úrovne, t. zn. zaujíma nás hypotéza: pre aspoň jeno i(i = 1, 2,…m) pre m > 2, kde i , i =1, 2, …m sú stredné hodnoty z normálne rozdelených základných súborov s rovnakým rozptylom 2 , t.j. N(, 2) • K overeniu tejto hypotézy sa používa dôležitá štatistická metóda, nazývaná Analýza rozptylu, skrátene ANOVA (resp. AR) prof.Ing. Zlata Sojková,CSc.
V praxi sa AR používa vtedy, ak skúmame vplyv jedného resp. viacerých faktorov (ošetrení) na skúmaný štatistický znak Faktory budeme označovaťA, B,…a v AR ich budeme zohľadňovať len ako kvalitatívne znaky s rôznymi obmenami - úrovňami faktora výsledný štatistický znak bude kvantitatívny a označíme hoY najčastejšie sa AR používa pri vyhodnocovaní biologických experimentov Všimneme si najjednoduchší prípad AR s jedným faktorom, ktorú nazývame jednofaktorová AR prof.Ing. Zlata Sojková,CSc.
Úrovňou faktorabudeme označovať: určité množstvo kvantitatívneho faktora, napr. množstvo dávok čistých živín pri hnojení, rôzne príjmové skupiny domácností, určitý druh kvalitatívneho faktora, napr. rôzne odrody tej istej plodiny, spôsoby umiestnenia výrobkov v predajni, AR je zovšeobecnením Studentovho t-testu pre nezávislé výbery AR zároveň skúma vplyv kvalitatívneho faktora (faktorov) na výsledný kvantitatívny znak - teda analyzuje vzťahy medzi znakmi prof.Ing. Zlata Sojková,CSc.
A 1 2… j… n Yi . yi . 1 y11 y12 y1j y1n Y1.y1. 2 y21 y22 y2j y2n Y2. y2. … ……….. i yi1 yi2 yij yin Yi. yi. … ……….. m ym1 ym2 ymj ymn Ym. ym. Y..y.. Schéma jednofaktorového experimentu “vyvážený pokus” riadkový súčet riadkový priemer opakovania Úrovne faktora celkový priemer Celkový súčet prof.Ing. Zlata Sojková,CSc.
riadkový súčet: celkový súčet: riadkový priemer: celkový priemer: prof.Ing. Zlata Sojková,CSc.
Model pre výslednú napozorovanú hodnotu: kde i = 1, 2,…, m j = 1,2,…, n Kde - očakávaná hodnota pre všetky úrovne faktora a napozorované hodnoty, i - efekt i-tej úrovne faktora A eij - náhodná chyba, ktorým je každé meranie zaťažené, resp. výsledok vplyv náhodných činiteľov prof.Ing. Zlata Sojková,CSc.
alebo Nulovú hypotézu potom môžme formulovať aj nasledovne: Ho : 1 = 2 =… i = m =0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H1: i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
Odhadmi jednotlivých parametrov sú nasledovné výberové charakteristiky: čo môžme prepísať: prof.Ing. Zlata Sojková,CSc.
1 2 3 Porovnanie dvoch experimentov s tromi úrovňami faktora 1 2 3 prof.Ing. Zlata Sojková,CSc.
Princíp Analýzy rozptylu Podstata analýzy rozptylu spočíva v rozklade celkovej variability výsledného skúmaného znaku Sr Sc S1 Variabilita medzi úrovňamifaktora, spôsobená pôsobením faktora A, “variabilita medzi triedami, riadkami” Variabilita náhodná, reziduálna, “vo vnútri tried Celková variabilita prof.Ing. Zlata Sojková,CSc.
ANOVA Variabilita 3 Priemerný štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti Variabilita medzi triedami s12 m-1 S1 Reziduálna variabilta sr2 m.n - m Sr Celková variabilita N-1= m .n-1 Sc prof.Ing. Zlata Sojková,CSc.
Testovacie kritérium možno pre jednofoktorovú AR - vyvážený pokus zapísať podrobne vzťahom: Hodnotu F testovacieho kritéria porovonáme s príslušnou tabuľkovou hodnotou F-rozdelenia: F , pre stupne voľnosti (m-1) a (m.n - m) (funkcia F.INV.RT , zadávame: alfa, m-1, (m.n-m) prof.Ing. Zlata Sojková,CSc.
Rozhodnutie o výsledku testu: • Ak F vyp F. ((m-1,(N-m)) Ho zamietame, v takom prípade je aspoň efekt jednej úrovne faktora preukazný, teda priemerna úroveň ukazovateľa sa štatisticky významne líši od ostatných. resp. aspoň jeden efekt ije štatisticky významne odlišný od nuly. Ak F vyp F Ho nezamietame F Obor nezamietnutia Ho kritický obor, obor zamietnutia H0 prof.Ing. Zlata Sojková,CSc.
Ak nulovú hypotézu zamietame: • zistili sme len, že je preukazný vplyv faktora na skúmaný znak, • ďalej je potrebné skúmať, medzi ktorými úrovňami faktora je a medzi ktorými nie je preukazný rozdiel - k tomuto účelu sa používajú testy kontrastov • Medzi testy kontrastov patria: Duncanov test, Scheffeho test, Tuckey test a iné….. prof.Ing. Zlata Sojková,CSc.
Podmienky použitia AR: • Výbery pochádzajú z normálnych rozdelení, (narušenie tohto predpokladu nemá podstatnejší vplyv na výsledky AR) • štatistická nezávislosť náhodných chýb eij • zhodné reziduálne rozptyly 12 = 22 = …. = 2 , t.j. D(eij) = 2 pre všetky i = 1,2…., m, j=1,2, …n tento predpoklad je závažnejší a možno ho overovať Cochranovým, resp. Bartlettovým testom prof.Ing. Zlata Sojková,CSc.
A 1 2… j … ni Yi . yi . 1 y11 y12 y1j ...n1Y1.y1. 2 y21 y22 y2j ...n2Y2. y2. … ……….. i yi1 yi2 yij ...niYi. yi. … ……….. m ym1 ym2 ymj ...nmYm. ym. Y..y.. Schéma jednofaktorového experimentu “nevyvážený pokus” riadkový súčet riadkový priemer Rôzny počet opakovaní Úrovne faktora celkový priemer Kde prof.Ing. Zlata Sojková,CSc.
3 Priemerný štvorec (1/2) 4 F-krité rium ANOVA Variabilita 1 Súčet štvorcov odchýlok 2 Stupne voľnosti Variabilita medzi triedami s12 m-1 S1 Reziduálna variabilta sr2 N - m Sr Celková variabilita N-1 S prof.Ing. Zlata Sojková,CSc.
Dvojfaktorová analýza rozptylu bez opakovania • Uvažujme vplyv faktora A, ktorý skúmame na m - úrovniach, i = 1,2,….,m • ďalej uvažujme faktor B, ktorý sledujeme na n - úrovniach , j = 1,2, …, n • na každej i-tej úrovni faktora A a j-tej úrovni faktora B máme len jedno pozorovanie (opakovanie) yij • overujeme tak vplyv dvoch nulových hypotéz prof.Ing. Zlata Sojková,CSc.
A 1 2 … j … n Yi . yi . 1 y11 y12 y1j y1n Y1.Y1. 2 y21 y22 y2j y2n Y2. y2. … ……….. i yi1 yi2 yij yin Yi. yi. … ……….. m ym1 ym2 ymj ymn Ym. ym. Y.1 Y.2 ...Y.j ...Y.1 Y.. y.1 y.2 ...y.j ...y.1 y.. Schéma dvojfaktorového experimentu s jedným pozorovaním v každej podtriedeDAR riadkové súčty n-úrovní faktora B B m-úrovní faktora A Riadkové priemery celkový priemer Stĺpcové súčty stĺpcové priemery prof.Ing. Zlata Sojková,CSc.
Model pre skúmaný znak môžme zapísať Overujeme platnosť dvoch nulových hypotéz Hypotéza pre faktor A: Ho1: 1 = 2 =… i = m =0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H11 :i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
Hypotéza pre faktor B: Ho2: 1 = 2 =… j = n =0 t.j. že efekty všetkých úrovni faktora B sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H12 : j 0 pre aspoň jedno j (j = 1,2…m) efekt j aspoň jednej j - úrovne faktora B je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
3 Priem. štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti DAR Variabilita Variabilita medzi riadkami S1 s12 m-1 Variabilita medzi stĺpcami n-1 s22 S2 Reziduálna variabilta Sr sr2 (m-1)(n-1) Celková variabilita Sc m.n -1 prof.Ing. Zlata Sojková,CSc.
Rozklad celkovej variability skúmaného znaku:Sc= S1 +S2 +S r Variabilita medzi riadkami, vplyv faktora A Variabilita medzi stĺpcami, vplyv faktora B Reziduálna variabilita Celková variabilita prof.Ing. Zlata Sojková,CSc.
Dvojfaktorová analýza rozptylu s opakovaním • Uvažujme vplyv dvoch faktorov: faktora A, ktorý skúmame na m - úrovniach, i = 1,2,….,m a faktoraB, ktorý sledujeme na n - úrovniach , j = 1,2, …, n • Skúmame nielen individuálny vplyv daných faktorov, ale aj ich vzájomné pôsobenie (interakciu) • Pre každú kombináciu úrovní máme viac pozorovaní (opakovaní) yij • Overujeme tak vplyv troch nulových hypotéz prof.Ing. Zlata Sojková,CSc.
Schéma dvojfaktorového experimentu s interkaciou prof.Ing. Zlata Sojková,CSc.
Model pre skúmaný znak môžme zapísať Overujeme platnosť troch nulových hypotéz Hypotéza pre faktor A: Ho : 1 = 2 =… i = m =0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H1:i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
Hypotéza pre faktor B: Ho: 1 = 2 =… j = n =0 t.j. že efekty všetkých úrovni faktora B sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H1: j 0 pre aspoň jedno j (j = 1,2…m) efekt j aspoň jednej j - úrovne faktora B je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
Hypotéza pre interakciu()ij: Ho : 11= 12 =… ij= mn=0 t.j. že pôsobenie interakcie je nulové, teda nepreukazné, oproti alternatívnej hypotéze H1:()ij 0 prof.Ing. Zlata Sojková,CSc.
3 Priem. štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti DAR Variabilita Variabilita medzi riadkami S1 m-1 s12 Variabilita medzi stĺpcami n-1 s22 S2 S12 s122 Interakcia (m-1)(n-1) Reziduálna variabilta Sr m.n.(k-1) sr2 Celková variabilita Sc m.n -1 prof.Ing. Zlata Sojková,CSc.
Rozklad celkovej variability skúmaného znaku:Sc= S1 +S2 +S12+S r Variabilita medzi riadkami, vplyv faktora A Variabilita medzi stĺpcami, vplyv faktora B Variabilita z interakcie Reziduálna variabilita Celková variabilita prof.Ing. Zlata Sojková,CSc.
Testy kontrastov • v prípade, že H0 zamietame, zaujíma nás, medzi ktorými strednými hodnotami existujú štatisticky významné rozdiely • existuje široká škála testov zameraná na viacnásobné porovnanie výberových priemerov • je možné vytvoriť m*(m-1)/2 kontrastov prof.Ing. Zlata Sojková,CSc.
Testy kontrastov • Fischerov LSD test • Duncanov test • Student-Newman-Keulsov test • Tukeyho test • Scheffeho test prof.Ing. Zlata Sojková,CSc.
Fischerov LSD test • LSD = Least Significant Difference • je založený na t-teste • štatisticky významný rozdiel je potvrdený, ak platí vzťah: • kde: kritická hodnota t rozdelenia pri m(n-1) stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
Duncanov test • štatisticky významný rozdiel je potvrdený, ak platí vzťah: • kde: tabuľovaná hodnota Duncanovho testu pre daný počet rozdielov a pri reziduálnom stupni voľnosti prof.Ing. Zlata Sojková,CSc.
Student-Newman-Keulsov test • štatisticky významný rozdiel je potvrdený, ak platí vzťah: • kde: tabuľovaná hodnota Student-Neumannovho - Keulsovho testu pre daný počet porovnávaných rozdielov a pri reziduálnom stupni voľnosti prof.Ing. Zlata Sojková,CSc.
Tukeyho test • štatisticky významný rozdiel je potvrdený, ak platí vzťah: • kde: tabuľovaná hodnota Tukeyho testu. prof.Ing. Zlata Sojková,CSc.
Scheffeho test • štatisticky významný rozdiel je potvrdený, ak platí vzťah: • kde: kritická hodnota F rozdelenia pri (m-1) a m(n-1) stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
Ktorý test použiť? viac konzervatívny,, menej pravdepodobné, že bude objavený skutočný rozdiel viac pravdepo-dobné,, že bude určený nesprávny rozdiel prof.Ing. Zlata Sojková,CSc.
Ktorý test použiť? • závisí, ktorý typ chyby je akceptovateľnejší z hľadiska analýzy daného problému, t.j. neurčenie rozdielu, ak skutočne existuje, resp. určenie rozdielu, ktorý neexistuje. prof.Ing. Zlata Sojková,CSc.
Testy kontrastov - Statgraphics • Multiple Range Tests Method: 95,0 percent LSD CountMeanHomogeneous Groups Col_4 5 303,8 X Col_3 5 337,0 XX Col_1 5 344,2 X Col_2 5 349,8 X ContrastSig.Difference+/- Limits Col_1 - Col_2 -5,6 38,7085 Col_1 - Col_3 7,2 38,7085 Col_1 - Col_4 * 40,4 38,7085 Col_2 - Col_3 12,8 38,7085 Col_2 - Col_4 * 46,0 38,7085 Col_3 - Col_4 33,2 38,7085 * denotes a statistically significant difference. prof.Ing. Zlata Sojková,CSc.
Testy kontrastov - Statgraphics prof.Ing. Zlata Sojková,CSc.
Overenie zhody variability • predpokladáme, že skúmané výberové súbory majú približne normálne rozdelenie a rozdiely rozptylov medzi testovanými skupinami sú nepreukazné. • H0: • Testy: • Cochranov test • Hartleyov test • Bartlettov test prof.Ing. Zlata Sojková,CSc.
Cochranov test • je ho vhodné použiť, ak u skúmaných výberových súborov sú značné rozdiely medzi rozptylmi • testovacia charakteristika: • ak G ≥ Gα, m, n-1 → H0 zamietame • Gα, m, n-1 - tabuľková hodnota pri m a n-1 stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
Hartleyov test • testovacia charakteristika: • ak H ≥ Hα, m, n-1 → H0 zamietame • Hα, m, n-1 - tabuľková hodnota pri m a n-1 stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
Bartlettov test • spočíva v porovnávaní aritmetického a geometrického priemeru rozptylov. Ak sú rozptyly rovnaké, potom aj priemery sú rovnaké. • testovacia charakteristika: ki = ni-1 m – počet výberových súborov ni – rozsah i-teho výberového súboru Ak χ2χ2(m-1), potom H0 zamietame prof.Ing. Zlata Sojková,CSc.
Ďakujem za pozornosť • prof.Ing. Zlata Sojková,CSc.