190 likes | 341 Views
Analýza rozptylu. Karel Zvára. Jednoduché třídění. one-way analysis of variance k nezávislých výběrů z N( i , 2 ) (různé populační průměry, stejné rozptyly) rozhodovat o shodě (populačních) průměrů, tj. o hypotéze rozšíření dvouvýběrového t -testu ( k = 2)
E N D
Analýza rozptylu Karel Zvára
Jednoduché třídění • one-way analysis of variance • knezávislých výběrů z N(i,2) (různé populační průměry, stejné rozptyly) • rozhodovat o shodě (populačních) průměrů, tj. o hypotéze • rozšíření dvouvýběrového t-testu (k = 2) • rozklad variability vysvětlované proměnné
celková = mezi výběry + uvnitř výběrů • celková variabilita předpokládá stejné populační průměry • mezi výběry – variabilita průměrů vážená velikostí výběrů (vysvětlená variabilita) • uvnitř výběrů – sečti součty čtverců odchylek od individuálních průměrů (nevysvětlená variabilita, reziduální) • hodnocení v tabulce analýzy rozptylu
příklad • koncentrace kyseliny listové v červených krvinkách po 24 hodinách ventilace (v každé skupině jiné složení dýchané směsi)
tabulka analýzy rozptylu • na 5% hladině prokázán rozdíl (průkazný rozdíl) • ověření předpokladů (stejně v regresi)
klasický zápis modelu • - společná úroveň všech výběrů • i – efekt i-tého ošetření (součet = 0) • ij – náhodná složka N(0, 2) • hypotéza: efekty i všechny nulové • výhoda: lze zapsat složitější strukturu
Rezidua • základ diagnostiky (ověření předpokladů, použitelnosti modelu) • obecně: pozorování – předpověď • zde: pozorování – průměr v dané skupině • Se -reziduální součet čtverců = součet čtverců reziduí = variabilita uvnitř výběrů
Stabilita rozptylu Bartlettův test B = 0,118, tj. p = 94,3 %
Ukázka nestabilního rozptylu Bartlettův test B = 7,67, tj. p = 2,2 %
Hodnocení normálního rozdělení Shapirův-Wilkův test W = 0,9255, p = 9,9 %
Když nelze předpokládat normální rozdělení • pořadový test (Kruskal-Wallis) • transformace vysvětlované proměnné (často logaritmická, někdy odmocninová) • někdy lze po transformaci hodnotit i četnosti • pro četnosti s Poissonovým rozdělením často odmocninová tranformace
Mnohonásobná porovnání • nelze provést k (k – 1)/2 t-testů (hladina!) • Bonferroni: použít hladinu tolikrát menší, kolik je porovnání, a to v modifikovaném dvouvýběrovém t-testu
náš příklad průkazný jen rozdíl mezi 1. a 2. skupinou
Kruskalův-Wallisův test • když nelze předpokládat normální rozdělení • podobně jako Wilcoxonův test – pořadí • určit pořadí bez ohledu na skupiny • není-li mezi skupinami rozdíl, měla by být průměrná pořadí ve skupinách podobná • test hodnotí variabilitu průměrných pořadí • příklad: 16,125, 8,2221 10
Kruskalův-Wallisův test II • 2 = 6,62 srovnej s 20,95(2) = 5,99 • prokázán rozdíl i takto, p = 3,7 % • méně vadí i nestejné rozptyly, nejen nenormalita • není třeba znát samotná měření, stačí jejich pořadí
Náhodné bloky • příklad – váhové přírůstky myší
tabulka analýzy rozptylu bez přihlédnutí k vrhům by bylo reziduální MS a F :
Náhodné bloky II • kdybychom (nesprávně!) hodnotili jen diety (jednoduché třídění), neprokážeme rozdíl (p = 34 %) • musíme vzít v úvahu rozdíly mezi vrhy • vysvětlíme tak část variability, nevysvětlená (reziduální) variabilita klesne • podobně (místo vrhů) při opakovaných měřeních na stejných objektech