420 likes | 2.36k Views
Imties dydis (apimtis, imties tūris, tiriamųjų skaičius, angl. sample size ) Tyrimo galia. Optimalus skaičius. Pakankamai didelė imtis (moksliniai ar klinikiniai efektai turi būti svarūs, galia 1 )
E N D
Imties dydis(apimtis, imties tūris, tiriamųjų skaičius, angl. sample size)Tyrimo galia
Optimalus skaičius • Pakankamai didelė imtis (moksliniai ar klinikiniai efektai turi būti svarūs, galia1) 1– (power) Sugebėjimas nustatyti skirtumą ar ryšį tikrinant hipotezę, kai jis iš tikrųjų egzistuoja populiacijoje. • Ne per didelė imtis (nešvaistomi resursai nesvarbaus efekto radimui)
Hipotezės tikrinimas – priminimas, reziumė • Statistinis ryšio įvertinimas • Pagal nulinę hipotezę • Suskaičiuojama statistika (kiek nutolę nuo H0): t, F ar X2 --- P reikšmė
Hipotezės tikrinimas 4 išvados iš hipotezės tikrinimo: • Teisingas skirtumo radimas (atmetama H0 - pripažįstamas kaltu) • Teisingas skirtumo neradimas (neatmetama H0, išteisinamas, nekaltas) • α arba I tipo klaida, randam skirtumą/ryšį kai jo nėra, t.y. atmetam H0 (klaidingai teigiamas - pripažįstamas kaltu, kai nekaltas) • β arba II tipo klaida, nerandam skirtumo/ryšio, kai jis yra, t.y. NEatmetam H0 (klaidingai neigiamas - išteisinamas, kai yra kaltas)
I rūšies klaida μ0 Tikimybių tankis Tikimybių tankis I klaida X X α/2 α/2 0 0
Tikimybių tankis I klaida II klaida α/2 α/2 0 0,32 Sąryšis tarp I ir II klaidos Mažinant I klaidos tikimybę, didėja II klaidos tikimybė μ0 Tikimybių tankis μA II klaida 0 0,32
Sąryšis tarp I ir II klaidos Sumažinus H0 ir H1 tikrinamų parametrų skirtumą, II klaidos tikimybė didėja Tikimybių tankis II klaida I klaida α/2 α/2 0 0,23
Problemos su hipotezių tikrinimo klaidomis • Klaidų sąryšis: kuo mažesnė pirmos klaidos tikimybė α →0 (paneigti teisingą H0) tuo didesnė II klaidos tikimybė, (priimti neteisingą H0) kuo mažesnis skirtumas tarp tikrinamų įverčių (∆ ir ∆1 , tuo didesnė II klaidos tikimybė)
Problemų sprendimo būdai: • Didinti imties dydį (taip mažėja abiejų rūšių klaidos) • Formuluoti išvadas apie atmetamą H0, tačiau neformuluoti išvados apie priimamą (neatmetamą) H0. Tai būdas išvengti II klaidos. Atmetame H0, kai testo reikšmė > k (kritinė reikšmė) arba P < 0,05 Negalime atmesti H0, kai testo reikšmė < k (kritinė reikšmė) arba P > 0,05
Galia • Susijusi su II tipo klaida (1-β) • Galia – tai • sugebėjimas nustatyti skirtumą/ryšį hipotezių vertinimu, kai tas skirtumas/ryšys iš tikrųjų egzistuoja populiacijoje. • tikimybė pagrįstai atmesti neteisingą H0 hipotezę, randant statistinį reikšmingumą.
Pavyzdys • Vaiko pasiuntimas į rūsį atnešti įrankį • Tikimybė – Kokia tikimybė, kad įrankis rūsyje? Teisingiau – Jei įrankis rūsyje, kokia tikimybė, kad vaikas jį ras? • Atsakymas є nuo: • Kiek laiko užtruko ieškodamas? • Kokio dydžio įrankis • Ar didelė betvarkė rūsyje?
Kaip tai susiję? • Įrankis = efektas/skirtumas. • Paieškos laikas = imties dydžiui. Daugiau duomenų didesnė galia rasti skirtumą/efektą. • Įrankio dydis = ieškomam skirtumo/efekto dydžiui. Visada didesnė galia nustatant didelį efektą, negu mažą. • Betvarkė rūsyje = duomenų sklaidai. Jei duomenys labai išsibarstę, turim mažiau galios nustatyti efektą.
Pavyzdžio reziume • Jei imties dydis didelis, ieškomas didelis efektas, o stebėjimų sklaida maža, didelė tikimybė, kad rasite “statistiškai reikšmingą efektą”, jei toks egzistuoja visumoje. ARBA galėsite būti gan tikri savo išvada “efektas nebuvo statistiškai reikšmingas”. • Bet jei imties dydis mažas, ieškomas mažas efektas, o stebėjimų sklaida didelė, tada išvada “efektas nebuvo statistiškai reikšmingas” nėra naudinga. ČIA IR GALIMA PADARYTI I IR II RŪŠIES KLAIDAS
Tikimybių tankis I klaida II klaida α/2 α/2 0 0,32 Galia μ0 Tikimybių tankis μA II klaida Galia 0 0,32
Galia Skirtumui sumažėjus, galia mažėja. Tikimybių tankis II klaida Galia I klaida α/2 α/2 0 0,23
Galia Sumažinus μ0 ir μ1 tikrinamų parametrų skirtumus, II klaidos tikimybė didėja, galia mažėja Tikimybių tankis μ0 : ∆=0 μA : ∆=0.12 Galia 0,12 0
Galios didinimo būdai • Imties dydžio padidinimas (jei neįmanoma bendrai, tai gal vienos grupės, kuri pigiau). • Sklaidos sumažinimas (lyginant vidurkius), naudojant tolygesnes (homogeniškesnes). • Kai kurie kompromisai: • α padidinimas (α – slenkstis, už kurio rezultatus laikote “statistiškai reikšmingais”). Įprasta 0,05, galite rinktis pvz. 0,10. Taip padidinsite galią nustatyti efektą, bet kartu klaidingai “reikšmingą”. • Sprendimas - kiek svarbu efekto dydis. Visi tyrimai turi daugiau galios didesniam efektui, o ne mažesniam.
Galia - reziume • Galia yra priešinga II klaidos tikimybei “1- galia” (II klaida) • Mažinant I klaidos tikimybę α, didėja II klaidos tikimybė. Iš to seka, kad mažėja ir galia. • Vienpusių hipotezių galia yra didesnė negu dvipusių. • Galia mažėja (rodo PI), mažėjant skirtumui, imties dydžiui, efektui/skirtumui/ryšiui. didesnė galia leidžia tikslesnius įvertinimus, bet tada reikalinga didesnė imtis. • Priimtina 80%, dažnai didesnė (90%).
n = ____1____ Δ² + 1/ N kur n - imties dydis Δ – paklaidos dydis (0,05) N – generalinės visumos dydis. Jei N=151, tyrimo imtis - 109 respondentai Formulė(priklausomai nuo generalinės aibės)
Formulės(Skaitmeniniams duomenims 1 imčiai) • Jei skaičiuojama ne pagal generalinę aibę, ir turima žinių apie reiškinį, pvz. dispersiją: n - atvejų skaičius atrankinėje grupėje, t.y. imties dydis; z - koeficientas, surandamas iš vadinamųjų Stjudento pasiskirstymo lentelių, ir kuris pasirenkamas pagal tai, kokį patikimumą norime gauti, pavyzdžiui, kai patikimumas 95 proc. (p = 0,05), z = 1,96; kai patikimumas 99 proc. (p = 0,01), z = 2,6 (pastaba: dabartiniuose literatūros šaltiniuose skaičiuojant imties dydį vietoj simbolio t vartojamas simbolis z); s — imties vidutinis kvadratinis (arba standartinis) nuokrypis (SD). Jis gali būti nustatomas 1) remiantis anksčiau atliktais tyrimais arba literatūros šaltiniais; 2) pagal pilotinio tyrimo rezultatus. Δ (delta) — leistinas netikslumas/paklaida, t.y. skirtumas tarp atrankinės grupės ir generalinės visumos vidurkio, laisvai pasirenkamas, atsižvelgiant į ankstesnių tyrimų duomenis bei duomenų tikslumui keliamus reikalavimus (dažnai 0,01-0,05).
Formulės(Kategoriniams duomenims 1 imčiai) • Apklausos; kategoriniai duomenys • Dėl to ir apklausų metu būtini bandomieji tyrimai, kurie dažnai būna viena iš priemonių imties dydžiui nustatyti. • Taikoma ta pati formulė, tik sigma (s) apskaičiuojama pagal formulę: S2 = p× (1 −p) kur p - bandomojo tyrimo metu nustatytas kokybinis rodiklis
Formulės(Kategoriniams duomenims 1 imčiai) IMTIES DYDŽIO NUSTATYMAS, jei pvz. paplitimas 4% S2 = 0,04×(1−0,04) = 0,0384 z = 1,96 Δ = 0,05 n = 59
Formulės(Kategoriniams duomenims 1 anketai+kai daug klausimų) • Apklausos; daug klausimų; dydis kiekvienam klausimui Bendras imties dydis nustatomas pagal didžiausią reikšmę. Pvz. nustatyta, kad pirmo klausimo vienam atsakymų variantui reikia 100 tiriamųjų, kitam - 80 ir t.t. Antro ir trečio klausimo analogiškai 110 ir 150. Lygiai taip pat ir kitiems anketos klausimams. Bendras tiriamųjų skaičius, remiantis šiame pavyzdyje didžiausia reikšme, būtų 150. • Tiriamųjų skaičius pagal kelis pagrindinius anketos klausimus.
Formulės(Kategoriniams duomenims 1 anketai+kai daug klausimų) • IMTIES DYDŽIO NUSTATYMAS S2 = 0,54×(1−0,54) = 0,2484 z =1,96 Δ = 0,05 n = 382.
Formulės(2 imtims) Kategoriniams duomenims N = 2* (zα+zβ) ² * p (1- p) / (d)² p – numatoma dalis Zα=1,96, zβ = 0,84 (jei II tipo klaida 20%, galia 80%) d – numatomas skirtumas p (1-p) = 0,54×(1−0,54) = 0,2484 d = 0,1 n = 390 x 2 gr. = 760 iš viso
Apskaičiavimas internete Internete “sample size calculation/calculator” (+ online…) Pvz. • http://www.raosoft.com/samplesize.html • http://www.dssresearch.com/toolkit/sscalc/size.asp • PS – Power and sample size calculation (įdiegiama) • ir kt.
Kodėl reikia skaičiuoti imties dydį? • Ekonominės ir etinės priežastys: Nešvaistyti pinigų Pvz. klinikiniuose tyrimuose kad nesukeltumėm žmonėms bereikalingo pavojaus (su maža galia, kai negalim gauti išvados) • 80% galia priimtina, kai mažiau – rezultatai mažai reikšmingi
Reikalavimai planuojant imties dydį • Aiškiai apibrėžta, paprasta hipotezė: • Geriausia viena pirminė hipotezė ir viena pirminė išeitis • Kas yra išeitis (end point) • Priimtinos I ir II tipo klaidos: • α = 0,05 • β = 0,1-0,2 • Kliniškai, moksliškai reikšmingo efekto įvertis (mažiausias dydis kliniškai ar moksliškai reikšmingas) Abs vs reliatyvūs Tai nėra statistinis sprendimas • Išeities variabilumo įvertis (SD)
Efektas ir variabilumas • Patirtis • Literatūra • Žvalgomasis tyrimas • Variabilumas proporcijoms neturi reikšmės, nes variabilumas yra juose
Kiti klausimai • Praradimai • Daugybiniai palyginimai • Tarpinės analizės
Prieš pradedant tyrimą, o ne po to • Post-hoc galios skaičiavimas neturi prasmės • Perteklinė info prie P reikšmės ir PI.
Reziume - video http://alexholcombe.wordpress.com/2011/03/01/funny-video-about-p-values-and-statistical-power/