570 likes | 1.53k Views
STATISTIKA U FARMACIJI Analiza varijanse - ANOVA. Testovi za dve i više populacija. dve i više populacija. srednja vrednost. varijansa. 2. broj uzoraka. n. F t est. z-test t-test. ANOVA. F-test za odnos dve varijanse. Parametarski test
E N D
STATISTIKA U FARMACIJI Analiza varijanse - ANOVA
Testovi za dve i više populacija dvei više populacija srednja vrednost varijansa 2 broj uzoraka n F test z-test t-test ANOVA
F-test za odnos dve varijanse • Parametarski test • Testira razliku izmedju dve nezavisne populacione varijanse • Pretpostavka za test: • obe populacije su normalno distribuirane
F-test - postavljanje hipoteze • Hipoteze H0: 12 = 22 i H1: 12≠22 • Izračunava se Dve grupe stepena slobode df1 = N1 - 1; df2 = N2 - 1 Sledi F distribuciju
odbacuje se H0 odbacuje se H0 prihvata se H0 α/2 α/2 0 1,0 F Flevo Fdesno F-test - kritične vrednosti
F-test - Rešenje Sd1 = 1,30 Sd2 = 1,16 H0: 12 = 22 H1: 1222 α 0,05 df1 22df2 24 0,025 0,025 2,00 F H0 se prihvata, nema značajne razlike izmedju Sd12 i Sd22
F-test - Rešenje F0,05, 20, 24 = 2,00 – 2,05 Fizr = 1,25 Fizr < F0,05 H0 se prihvata, nema značajne razlike izmedju Sd12 i Sd22
Testovi za dve i više populacija Analiza varijanse (ANOVA) Jednofaktorska ANOVA Dvofaktorska ANOVA F-test Efekat interakcija Tukey- Snedecor test
Student t-test • Student t-test – testiranje razlike između srednjih vrednosti 2 grupe podataka • H0 : μ1 = μ2H1 : μ1 ≠ μ2 • α = 0,05 (nivo značajnosti testa) • 0,05 (5%) – verovatnoća da se odbaci ispravna nulta hipoteza • greška tip I – odbacivanje ispravne nulte hipoteze • greška tip II – prihvatanje neispravne nulte hipoteze
Student t-test • Testiranje razlike između srednjih vrednosti više grupa podataka • potrebno izvođenje t-testa više puta • Koliko je potrebno t-testova? • 3 grupe podataka: A, B i C – 3 t-testa • poređenja: A:B, A:C i B:C • 4 grupe podataka: A, B, C i D – 6 t-testova • poređenja: A:B, A:C, A:D, B:C, B:D i C:D
Istovremeno izvođenje više t-testova • Kod izvođenja više t-testova javlja se “Familywise error rate” problem (FWER) • FWER – verovatnoća da se neispravno odbaci najmanje jedna nulta hipoteza u grupi poređenja • FWER = 1 – (1 – α)k • α – nivo značajnosti testa • k – broj t-testova • Za 6 t-testova: • FWER = 1 – (1 – 0,05)6 = 1 – 0,735 = 0,265 = 27% • 27% verovatnoće da napravimo najmanje jednu grešku tip I
ANOVA • Analiza varijanse omogućava istovremeno testiranje razlika između više srednjih vrednosti • Ispituje se jedna ili više nezavisnih varijabli – faktora uticaja na zavisnu varijablu • Jedan faktor uticaja – jednofaktorska ANOVA • Više faktora uticaja – višefaktorska ANOVA (multipla ANOVA – MANOVA) • Svaki faktor uticaja ima više kategorija (grupa)
Jednofaktorska ANOVA - hipoteze • H0: 1 = 2 = 3 • Sve populacione srednje vrednosti su jednake • Faktor uticaja nema efekta • H1: 123 H1: 1 = 23 H1: 1 2 = 3 H1: 1 =32H1: -nisu sve jednake • Najmanje 1 srednja vrednost je različita • Postoji efekat faktora uticaja
Jednofaktorska ANOVA Sve srednje vrednosti su jednake: Nulta hipoteza je ispravna (nema efekta faktora uticaja)
Jednofaktorska ANOVA Najmanje jedna srednja vrednost je različita: Nulta hipoteza nije ispravna (postoji efekat faktora uticaja) ili
Logika Analize varijanse • Varijacija (varijansa) između grupaupoređuje se savarijacijom (varijansom) unutar grupa • Varijacija između grupaje varijacija (razlika) između srednjih vrednosti koja je posledica uticaja uzorka i uticaja faktora koji se ispituje (ako postoji) • Varijacija unutar grupaje varijacija koja je posledica uticaja uzorka • Ukupna varijacijaje zbir varijacije između grupa i varijacije unutar grupa
Jednofaktorska ANOVA - osnovna ideja • Uporedjivanje dva tipa varijacije da bi se ocenila razlika izmedju srednjih vrednosti • Baza za poredjenje je odnos varijansi • Zašto ANOVA? • Test baziran na varijansama je osetljiviji nego test baziran na srednjim vrednostima • ANOVA ima manji rizik za grešku tip I • ANOVA ima manji rizik za grešku tip II
Jednofaktorska ANOVA Pretpostavke za test • Eksperimentalne jedinice su slučajno odabrane • Populacije su normalno distribuirane • Homogenost varijansi - Populacije imaju jednake varijanse • Podaci su izraženi intervalnom ili skalom odnosa
Varijansa Varijansa Suma kvadrata odstupanja od srednje vrednosti (suma kvadrata, SK) Broj stepena slobode
Razdvajanje varijacije • Mere varijacije se dobijaju “razdvajanjem” ukupne varijacije varijansa između grupa varijansa unutar grupa ukupna varijansa
Jednofaktorska ANOVA – F test Stepeni slobode • df1 = m – 1 (m = broj grupa) • df2 = N – m (N = ukupan broj podataka u svim grupama zajedno) H0: μ1= μ2 = …= μc H1: μ– najmanje jedna srednja vrednost je različita
odbacuje se H0 prihvata se H0 F 0 Kritične vrednosti F Ako su srednje vrednosti jednake, F =Vig/Vug 1 Odbacuje se H0 samo za veliko F Uvek jednostrani test!
Razdvajanje varijacije • Ukupna varijacija (suma kvadrata odstupanja od srednje vrednosti) može da se razdvoji u dva dela: SKtot = SKig + SKug SKtot = ukupna suma kvadrata (ukupna varijacija) SKig = suma kvadrata između grupa (varijacija između grupa) SKug = suma kvadrata unutar grupa (varijacija unutar grupa)
grupa 1 grupa 2 grupa 3 Ukupna varijacija
grupa 3 grupa 1 grupa 2 Varijacija izmedju grupa
grupa 1 grupa 2 grupa 3 Varijacija unutar grupa
Razlika između srednjih vrednosti + F ANOVA Veličina uzorka + – Varijacija unutar grupa Faktori koji utiču na zaključak
Razlika između srednjih vrednosti mala razlika između grupa Nulta hipoteza se lako dokazuje velika razlika između grupa Nulta hipoteza se teško dokazuje
Veličina uzorka mali broj podataka u grupi Nulta hipoteza se lako dokazuje veliki broj podataka u grupi Nulta hipoteza se teško dokazuje
Varijacija unutar grupa velika varijacija unutar grupa Nulta hipoteza se lako dokazuje mala varijacija unutar grupa Nulta hipoteza se teško dokazuje
ANOVA - izrazi za izračunavanje suma kvadrata odstupanja od srednje vrednosti - SK broj stepena slobode - df C
ANOVA - sumarna tabela kritična vrednost Fα za df1 = m-1 i df2 = N-m
tip A tip B tip C 1,2 1,5 2,0 1,5 1,4 1,8 vreme 1,7 1,3 1,7 (dani) 1,8 1,6 2,2 1,6 1,8 1,9 1,4 1,4 2,1 ∑x 9,2 9,0 11,7 x 1,53 1,50 1,95 sr 2 ∑x 14,34 13,66 22,99 Jednofaktorska ANOVA- primer Ispitivanje toksičnog delovanja leka na tri tipa ćelija Prikazano je vreme (u danima) posle koga je ostalo 50% ćelija
Jednofaktorska ANOVA- primer H0: A = B = C H1: - nisu sve jednake = 0,05 df1 = 2 i df2 = 15
F 0 3,68 ANOVA – primer 1 F0,05 = 3,68 za df1 = 2 i df2 = 15 Nulta hipoteza se odbacuje, negde postoji razlika izmedju srednjih vrednosti !
f(x) μAμB μ3 x ANOVA – Tukey-Snedecor test
ANOVA – primer 2 H0: A = B = C = D H1: - nisu sve jednake = 0,05 df1 = 3 i df2 = 23
F 0 3.03 ANOVA - primer F0,05 = 3,03 za df1 = 3 i df2 = 23 Nulta hipoteza se odbacuje, negde postoji razlika izmedju srednjih vrednosti !
f(x) x μA=μB=μD μC ANOVA - Tukey-Snedecor test