320 likes | 590 Views
STATISTINĖS IŠVADOS ATSITIKTINUMO ĮVERTINIMAS. Tikimybė Hipotezės tikrinimas. Tikimybė. I šeičių dalis, kartojant eksperimentą daug kartų. 0-1 ; iš 100 kūdikių 48 berniukai, tikimybė 0, 48 . Suma / atimtis atskirų tikimybi ų (1) – visiškai nepriklausomi reiškiniai:
E N D
STATISTINĖS IŠVADOSATSITIKTINUMO ĮVERTINIMAS • Tikimybė • Hipotezės tikrinimas Aušra Beržanskytė
Tikimybė • Išeičių dalis, kartojant eksperimentą daug kartų. • 0-1; iš 100 kūdikių 48 berniukai, tikimybė 0,48. • Suma / atimtisatskirų tikimybių (1) – visiškai nepriklausomi reiškiniai: • O:0,46; A:0,43; B:0,08; AB:0,03 • 48 berniukų tikimybė 0,48, mergaičių 0,52. Jei nėra visiškai nepriklausomi - persikloja. Suma negalima. Iš jos reikia atimti persiklojimotikimybę. • Sandauga, jei reiškiniai nepriklausomi: • 3 žmonės O kr. gr. – 0,46x0,46x0,46=0,097 • Jei reiškiniai priklausomi, sandauga netinka (pvz. tėvo ir sūnaus ūgis) Aušra Beržanskytė
Tikimybė • Imties (tyrimo) ir generalinės aibės ryšiui – tikimybės idėja. • Tikimybių skirstiniai: • empiriniai – iš stebėtų duomenų; • teoriniai – nusakoma matematinėmis funkcijomis • Naudojama apskaičiuoti teorines tikimybes • Parametriniams metodams Aušra Beržanskytė
Tikimybė • Tikimybinis skirstinys – tai atsitiktinio dydžio (kuris atrenkamas atsitiktinai) skirstinys • 2 pagrindiniai skirstiniai: • Normalus (Gauso kreivė) – skaitmeniniams kintamiesiems • Binominis – kategoriniams dvinariams kintamiesiems • Puasono – retiems įvykiams Aušra Beržanskytė
Tikimybė • Idėja naudojama dviejų reiškinių priklausomybės įvertinimui, pvz. jei veiksnio paplitimo tarp ligonių ir kontrolinių, tikimybė skirtinga, reiškiniai nėra nepriklausomi. Aušra Beržanskytė
HIPOTEZĖS TIKRINIMAS • Kaip PI apibendrinimui • Efektas ar tikrai, ar atsitiktinis • Tyrimo hipotezė • Statistinė hipotezė – dalis statistinio tyrimo. Dažniausiai siekiame atmesti H0. Statistinė hipotezė - teiginys apie populiacijos parametrą,bet ne apie imties statistiką, neįrodoma, o tik priimama arba atmetama, atsižvelgiant į imties duomenis. Aušra Beržanskytė
Hipotezės tikrinimo žingsniai: 1) Keliamas klausimas: H0: μ1=μ2; p1=p2; (RR=1, OR=1, skirtumas=0) Arba alternatyvi hipotezė: HA: μ1≠μ2; p1≠p2: Kryptinga ar ne (vienpusis testas, dvipusis testas) Aušra Beržanskytė
Hipotezės tikrinimo žingsniai: 2) Reikšmingumo lygio pasirinkimas α • Kiek norima būti tikriems, atmetant H0, t. y. kiek daug kartų iš 100 leisime paskelbti apie neteisingą H0. • α - I tipo klaida (klaidingai teigiamas rezultatas, t.y. atmetama H0, kai iš tikrųjų teisinga) • Paprastai 0,05 Aušra Beržanskytė
Hipotezės tikrinimo žingsniai: 3) Testo pasirinkimas, iš kurio gaunama P reikšmė (t-testas, χ2 ir t.t.). P reikšmė parodo gauto ryšio (skirtumo) tikimybę,jei iš tikrųjų egzistuoja H0. ArbaP reikšmė yra tikimybė gauti nustatytą rezultatą (skirtumą) dėl ATSITIKTINUMO, kai iš tikrųjų egzistuoja H0. Aušra Beržanskytė
Hipotezės tikrinimo žingsniai: 4) Gautoji p-reikšmė lyginama su reikšmingumo lygiu iš 2 žingsnio. Aušra Beržanskytė
Hipotezės tikrinimas P reikšmė yra nuo 0 iki 1. Maža P reikšmė • rodo žemą suderinamumą tarp H0ir gauto skirtumo, nes labai maža tikimybė būtų gauti šį rezultatą, jei H0yra tikrovėje • reiškia, kad alternatyvi hipotezė yra geresnis duomenų paaiškinimas • leidžia manyti, jog neįtikėtina, kad atsitiktinumas būtų rezultato paaiškinimas. Aušra Beržanskytė
Statistiniai susitarimai • P<α, kuri 0,05 yra statistinio reikšmingumo riba • JeiP<0,05, sakome, kad rezultatai negali būti paaiškinami atsitiktinumu, todėl atmetama H0 ir priimama HA. • JeiP≥0.05, sakome, kad rastas skirtumas gali būti dėl atstiktinumo, todėl neatmetame H0. Aušra Beržanskytė
Hipotezės tikrinimas Naudojamas konkretus statistinis patikimumo testas, kuris priklauso nuo • tyrimo tipo, • matavimo būdo, • duomenų tipo • jų skirstinio ir t.t. Aušra Beržanskytė
Hipotezės tikrinimas • Testai (tikimybių skirstiniai): • z testas • t testas (vienos imties, dviejų nepriklausomų, dviejų priklausomų) • Χ2 (+ trendui) • F testas • Fišerio tikslusis • Mann-Whitney • Wilcoxon ir kt. Aušra Beržanskytė
Hipotezės tikrinimas Testo statistika (statistiniai testai) – bendra išraiška: Testas (z)=stebėta reikšmė – hipotetinė reikšmė stebėtos reikšmės SE Pvz.: Pacientų sergančių pirmine biliarine ciroze albuminų koncentracija kraujyje μ0=33,5g/l. Tyrime gauta 34,46g/l, SE=0,397g/l Testas=2,42, p=0,0155. Aušra Beržanskytė
T-testas Testas=skirtumas tarp grupių SE (bendra) Aušra Beržanskytė
χ2 kriterijaus statistika • Plačiausiai naudojama formulė (kategoriniams duomenims): • čia Oi – nustatyti/stebėti dažniai, Ei – tikėtini dažniai. Aušra Beržanskytė
2x2 lentelė Taikoma formulė adaptuota 2x2 lentelei: Χ2 = n*(a*d-b*c)2 / r1*r2*s1*s2 Aušra Beržanskytė
Pavyzdys • Gydymo įtaka mirštamumui. • 1 žingsnis. • H0 : Gydymas neturi reikšmės mirštamumui populiacijoje. • HA: Gydymas turi reikšmės mirštamumui populiacijoje. • 2 žingsnis. α = 0,05. • 3 žingsnis. χ2 • χ2 skirstinio su (r-1)(s-1) laisvės laipsnių (degrees of freedom; df) α lygmens kritinė reikšmė, kur r eilučių skaičius, o s – stulpelių. • Apskaičiuojama p-reikšmė. • http://www.graphpad.com/quickcalcs/pvalue1.cfm • 4 žingsnis. Gautoji p-reikšmė lyginama su pasikliovimo lygmeniu iš 2 žingsnio. Atliekamas sprendimas apie nulinę hipotezę. Užrašoma išvada apie nulinę hipotezę. Aušra Beržanskytė
Pavyzdys • 1 žingsnis • H0 : Gydymas neturi reikšmės mirštamumui populiacijoje. • HA: Gydymas turi reikšmės mirštamumui populiacijoje. • 2 žingsnis • α=0,05 Aušra Beržanskytė
Pavyzdys 3 žingsnis Taikoma formulė adaptuota 2x2 lentelei: Χ2 = n*(a*d-b*c)2 / r1*r2*s1*s2 Χ2 = 105*(36*25-14*30)2 / 50*55*39*66 = 3.42 Aušra Beržanskytė
Pavyzdys Stebėti dažniai (O) Tikėtini dažniai (E): E=ri*si/n Taikoma bendra formulė: (36-31,4)2/31,4+(14-18,6)2/18,6+(30-34,6)2/34,6+(25-20,4)2/20,4= =21,16/31,4+21,16/18,6+21,16/34,6+21,16/20,4= 0,67+1,14+0,61+1,04= 3,46 Aušra Beržanskytė
Pavyzdys • 4 žingsnis • p-reikšmė lygi 0,063>0,05 • Išvada: Vadinasi gydymas ir mirštamumas nėra statistiškai reikšmingai susiję. Aušra Beržanskytė
Pavyzdys Reziumė • 1 žingsnis. H0 : Gydymas neturi reikšmės mirštamumui populiacijoje. HA: Gydymas turi reikšmės mirštamumui populiacijoje. • 2 žingsnis. α = 0,05. • 3 žingsnis. χ2 = 3,46. χ2 skirstinio su (r-1)(c-1) laisvės laipsnių (degrees of freedom; df) α lygmens kritinė reikšmė, kur r eilučių skaičius, o c – stulpelių. Apskaičiuojama p-reikšmė. http://www.graphpad.com/quickcalcs/pvalue1.cfm p-reikšmė lygi 0,063. • 4 žingsnis. Gautoji p-reikšmė lyginama su pasikliovimo lygmeniu iš 2 žingsnio. Atliekamas sprendimas apie nulinę hipotezę. Užrašoma išvada apie nulinę hipotezę. Prisiminkite, kad jeigu p≥ α , tai hipotezė H0 neatmetama. Išvada: Vadinasi gydymas ir mirštamumas nėra statistiškai reikšmingai susiję. Aušra Beržanskytė
Kitas pavyzdys • Pvz.: DES (dietilsilbestrolis) ir krūties vėžys • RR = 1,4 P reikšmė = 0,10 P daugiau už 0,05, todėl nelaikoma statistiškai reikšmingu. Aušra Beržanskytė
Dar apie P reikšmę…. • P reikšmė atspindi skirtumo ar ryšio buvimą • Galimos didžiulės imtys, kur netgi itin mažas skirtumas, rizikos padidėjimas ar sumažėjimas gali būti statistiškai reikšmingas • Galimos mažos imtys, kur netgi didelis skirtumas, rizikos padidėjimas ar sumažėjimas nėra statistiškai reikšmingas. Aušra Beržanskytė
Praktinė užduotis P reikšmės ir pasikliautinių intervalų interpretavimui • Buvo atlikti penki tyrimai, įvertinant tą patį veiksnio - ligos ryšį. Tarkim, jog nebuvo sisteminių klaidų ir TF. Rezultatai pateikti kitoje skaidrėje. Aušra Beržanskytė
Praktinė užduotis Aušra Beržanskytė
Paaiškinkite kiekvieno tyrimo rezultatus pagal reliatyvią riziką, P reikšmę ir pasikliautinį intervalą. • Koks ryšys tarp imties dydžio ir pasikliautinio intervalo pločio? • Koks ryšys tarp imties dydžio ir P reikšmės? • Kas duoda daugiau informacijos: P reikšmė ar PI? Aušra Beržanskytė
Ar yra ryšys tarp imties dydžio ir reliatyvios rizikos? • Įvertinkite statistinį reikšmingumą pagal P reikšmę? • Įvertinkite statistinį reikšmingumą pagal PI • Kas yra klaidingas - P reikšmė ar pasikliautinis intervalas? Aušra Beržanskytė
Apibendrinimas • P reikšmė pasako, kiek nulinė hipotezė suderinama su duomenimis. • PI pasako daugiau: nurodo intervalą, kuriame duomenys gali būti suderinami su hipoteze. Aušra Beržanskytė
Apibendrinimas • P reikšmė ir PI nieko nepasako apie kitus galimus gauto rezultato paaiškinimus: bias ir TF. • P reikšmė ir PI nieko nepasako apiebiologinį, klinikinį ar visuomenės sveikatos reikšmingumą. Aušra Beržanskytė