850 likes | 1.27k Views
Štatistické testovanie hypotéz. Porovnanie dvoch výberov. Iveta Waczulíková Peter Slezák Fakulta matematiky, fyziky a informatiky UK Ústav simulačného a virtuálneho medicínskeho vzdelávania LF UK. Materiál nájdete na: bio-med-stat.webnode.sk naše adresy: peter.slezak5@gmail.com
E N D
Štatistické testovanie hypotéz. Porovnanie dvoch výberov Iveta Waczulíková Peter Slezák Fakulta matematiky, fyziky a informatiky UK Ústav simulačného a virtuálnehomedicínskehovzdelávania LF UK
Materiál nájdete na: bio-med-stat.webnode.sk naše adresy: peter.slezak5@gmail.com waczulikova@gmail.com
Populácia (základný súbor) - konečný rozsah - nekonečný rozsah Parameter (populačná charakteristika) – je číselná charakteristika populácie (napr. priemerná výška mužov na Slovensku). Jej presná hodnota je obvykle neznáma.
Epidemiologické štúdie Príčina/faktor • Rizikový faktor • Diagnostický test • Nový liek • Prognostický faktor • Preventívny faktor Následok • Choroba • Rozlíšenie • Zlepšenie • Prežívanie • -Zabránenie vzniku -Skoré zachytenie -Zabránenie komplikáciám
Premenné – základné definície • Premenná • všeobecnejšie ju možno definovať ako veličinu, ktorá môže nadobúdať rôzne hodnoty. V štatistike sa vzťahuje na MERATEĽNÚ vlastnosť, ktorá sa v čase alebo medzi objektami/subjektami typicky mení. • Typy premenných: • Číselné premenné – (možno zmerať) • spojité (koncentrácia onkomarkera) a intervalové (vek) • Vyznačujú sa reprezentatívnou (strednou) hodnotou (najčastejšie vyjadrenou ako priemer alebo medián) a mierou premenlivosti (smerodajná odchýlka k priemeru alebo dolný a horný kvartil k mediánu) • Kategorické premenné (možno zaradiť) • Nominálne – klasifikujú nejakú vlastnosť (genotyp) • Ordinálne – určujú stupeň vlastnosti (cancerstaging). Charakterizujú sa početnosťami (%) v jednotlivých kategóriách
Deskriptívna(popisná) štatistika - umožňuje pozorované dáta redukovať na „uchopiteľné“ štatistické parametre – reprezentatívnu hodnotu a rozptyl. • Grafická prezentácia rozdelenie dát rozdelenie pravdepodobností (štatistické rozdelenie) • Induktívna (inferenčná) štatistika - umožňuje z pozorovaných dát vytvárať všeobecne platné závery, s uvedením stupňa ich spoľahlivosti.
Formát dát (simulovaná databáza)Dáta časov a možných prognostických faktorov vybraných 11 pacientov s malígnym nálezomvstup: chirurgická intervenciavýstup: úmrtie Kódovanie v programe StatsDirect: Cenzurovanie = 0pre nekompletné dátaoznačenie * alebo + Cenzurovanie = 1pre kompletné dáta (udalosť)
Všetky dáta získané meraním danej charakteristiky v skupinách (pacientov, zvierat, v skupinách laboratórnych experimentov za definovaných podmienok...) ZASTUPUJEME skupinovými reprezentatívnymi hodnotami (priemery) a príslušnými mierami rozptylu (SD) – z ktorých sa dajú odhadnúť Intervaly spoľahlivosti pre populačné priemery (95%CI) Dáta zastupujeme PARAMETRAMI (normálneho rozdelenia) parametrické testy
Ak nesprávne vyberieme parametrický testzáver testovania bude nespoľahlivý!
S2 – rozptyl • SD – smerodajná odchýlka • Smerodajná odchýlka má rovnaké jednotky ako meraná veličina!
Deskriptívna (popisná) štatistika - umožňuje pozorované dáta redukovať na „uchopiteľné“ štatistické parametre – reprezentatívnu hodnotu a rozptyl. • Grafická prezentácia rozdelenie dát rozdelenie pravdepodobností (štatistické rozdelenie) • Induktívna (inferenčná) štatistika - umožňuje z pozorovaných dát vytvárať všeobecne platné závery, s uvedením stupňa ich spoľahlivosti.
„Nemusíte zjesť celého vola na to, aby ste poznali, že mäso je tuhé.“ S.Johnson
Nemusíte sníst celého vola na to, abyste poznali, že maso je tuhé. S. Johnson (Zvárová, J.: I. Základy statistiky pro biomedicínske odbory. Karolinum, Praha, 2004.)
Všeobecný postup pri testovaní hypotéz • (formulovaný vedecký problém) • (formulovaná pracovná hypotéza) • Voľba hladiny významnosti alfa, ktorá udáva pravdepodobnosť, s ktorou bude splnené testovacie kritérium • Formulácia nulovej a alternatívnej hypotézy(obvykle tvrdenie, ktoré chceme vyvrátiť) • Voľba testovacieho kritéria(podľa povahy problému a typu úlohy) • Interpretácia výsledkov(pokiaľ nulovú hypotézu zamietame, riskujeme chybu, ktorej pravdepodobnosť je nanajvýš rovná zvolenej hladine alfa. Pokiaľ ju nezamietame, nevieme, aká je pravdepodobnosť chybného rozhodnutia. Preto nikdy nesmieme tvrdiť, že sme nulovú hypotézu preukázali.)
Čo všetko môžeme testovať • Štatistika nám poskytuje nástroj (kritérium) na rozhodovanie. • Hypotézy zhody • Hypotézy o testovaní rozdielov (v stredných hodnotách) medzi skupinami • Hypotézy o testovaní nezávislosti (vzťahov - asociácie, korelácie)
Predtým, než vyberieme vlastný test, musí byť jasne formulovanávedecká hypotéza a spôsob jej overovania. Následne formulujeme pracovnú hypotézu
Štatistické hypotézy: • Efekt („effect size“) • Nulová hypotéza(H0) – tvrdenie, že efekt je nulový • Alternatívna hypotéza(HA) – tvrdenie opačné ako nulová hypotéza (obvykle „obsahujúce“ všetky ostatné možnosti, ktoré môžu nastať) t.j. efekt nie je nulový. H0: x1 = x2 - dvojstranná alternatíva HA: x1 x2 - jednostranná alternatíva HA: x1x2 alebo x1x2
Štatistické hypotézy: • sú formulované párovo • nulová hypotéza (H0) sa kombinuje s alternatívnou hypotézou (HA) • H0: x1 = x2 • HA: x1 x2
Štatistické hypotézy: • Formulácia hypotéz nie je arbitrárna • vyplýva to z faktu,že nulovú hypotézu môžeme len zamietnuť, ale nikdy nie dokázať (odôvodniť) jej pravdivosť
Testová štatistika (napr.: T-test) • → nazbierame dáta a použijeme rozhodovacie kritérium = testovú štatistiku • Má presne známu distribúciu (známe rozdelenie pravdepodobnosti) • T-test (studentovo t rozdelenie (pravdepodobnosti)) • Zo zistenej testovej štatistiky vieme určiť pravdepodobnosť P-value
P-value • T.j. spočítame pravdepodobnosť, že by sme mohli pozorovať nami zistený výsledok (alebo ešte „extrémnejší“ – menej pravdepodobný), ak by nulová hypotéza platila. • t.j. p-value – dosiahnutá hladina významnosti
P-value • P-value je pravdepodobnosť, s akou by sme mohli získať pozorované dáta rovnako alebo ešte viacej odporujúce nulovej hypotéze za predpokladu, že nulová hypotéza platí. • Je to pravdepodobnosť chyby, ktorej by sme sa dopustili, ak by sme prehlásili, že medzi skupinami je rozdiel a on v skutočnosti nie je (platí nulová hypotéza)
Hladina významnosti „alfa” • Test nulovej hypotézy – porovnanie hodnoty p-value s hladinou významnosti alfa (obvykle 0,05 = 5%) • Ak zamietneme H0 prijímame HA t.j. tvrdíme, že výsledok je štatisticky významný (signifikantný)
Rozdelenie pravdepodobnosti pozorovaných diferencií H1 H0 β α
Štatistická vs. klinická významnosť Δ – klinicky významný rozdiel 0 – nulový rozdiel medzi dvoma porovnávanými skupinami Zvárová et. al. Základy statistiky pro biomedicínské obory. Praha, Karolinum, 2004.
Testovanie hypotéz– 5 krokov • Formulujnulovú a alternatívnuhypotézu • Vypočítaj testovúštatistiku • Nájdi zodpovedajúcu„p-value“ • Dva možné závery: test ZAMIETA (Reject)aleboNEMôŽE ZAMIETNUŤ “fail to reject” nulovúhypotézu • Formuluj vecný záver červená = štatistika, modrá = logika, čierna = teória
Štatistický záver • Hypotéza môže byť zamietnutá jedine s určitou pravdepodobnosťou a nikdy nie s úplnou istotou. • Pri testovaní štatistickej hypotézy nikdy nemôžeme dokázať pravdivosť nulovej hypotézy. Môžeme ju len zamietnuť. • Nesignifikantný výsledok (nezamietnutie) pravdivosť nulovej hypotézy. Znamená len to, že ju nemôžeme v danej situácii zamietnuť.
„Je málo spôsobov ako správne uskutočniť výskumnú štúdiu, ale sú ich tisíce ako ju uskutočniť nesprávne.“ D.L.Sackett
Štatistické chyby a sila testu Štatistická chyba I. druhu– riziko odsúdenia nevinného človeka (nepoznáme, že platí nulová hypotéza) Štatistická chyba II. druhu – riziko prepustenia zločinca (nepoznáme, že neplatí nulová hypotéza)
Rozdelenie pravdepodobnosti pozorovaných diferencií H1 H0 β α
Verifikácia štatistických hypotéz pomocou štatistických testov • Štatistické testy (signifikantnosti): parametrické alebo neparametrické
Štatistické metódy • Parametrické metódy (PM) sa zaoberajú parametrami základného súboru (ZS), t.j. odhadmi a testami. Ich použitie si vyžaduje splnenie prísnych predpokladov o rozdeleniach pravdepodobností výberových štatistík a premennej v ZS (predpoklad normality skúmaného znaku v ZS, resp. v populácii) • Neparametrické metódy (NPM)nevyžadujú také prísne predpoklady o rozdeleniach a nezaoberajú sa len parametrami ZS. Využívajú menej informácií z dát výberového súboru (VS) a tým je ich sila nižšia ako PM. NPM sú metódy s „voľnými“ rozdeleniami.
Najpoužívanejšie parametrické testy • Nepárový t-test • Párový t-test • Fischerov F-test • Jednofaktorová analýza rozptylu (ANOVA) • Jednofaktorová ANOVA s opakovanými meraniami • ANOVA pre dva nezávislé faktory • ANOVA pre dva faktory, „mixed design“ • Dvojfaktorová ANOVA s opakovanými meraniami • Pearsonov korelačný koeficient „r“ a koeficient determinácie R2 • Koeficient mnohonásobnej korelácie „r“ • Koeficient parciálnej a semiparciálnej korelácie
Najpoužívanejšie neparametrické metódy • Kolmogorovov – Smirnovov test - porovnanie dvoch rozdelení (empirických distribučných funkcií) • 2 - test dobrej zhody porovnanie dvoch rozdelení (empirického a teoretického) • Znamienkový test (jednovýberový Wilcoxonov test) - analógia párového t-testu • Mann – Whitneyov U test a dvojvýberový Wilcoxonov test – analógia nepárového t-testu • Friedmanov test - analógia jednofaktorovej analýzy variancie s opakovanými meraniami • Kruskal – Wallisov test - analógia jednofaktorovej analýzy variancie • Spearmanov korelačný koeficient – neparametrická obdoba Pearsonovho korelačného koeficienta
Predpoklady použitia parametrických testov • Náhodný výber z populácie (organizácia experimentu) • Dáta pochádzajú z normálneho rozdelenia • Rozdelenie je spojité • Rovnaké rozptyly (t-test, ANOVA, OLS) • Výbery sú nezávislé– pre párové dáta sa vyhodnocujú normálne rozdelené diferencie)
Miery polohy a typy rozdelení medián=priemer=modus modus priemer modus medián modus medián priemer priemer medián modus
(štandardizované) Normálne rozdelenie 68,28% 95,45% +1 +3 +3 -2 -3 -1 99,73%
Normalita Mnoho štatistických metód vyžaduje aby premenné s ktorými pracujeme mali približne normálne rozdelenie. Napríklad: t-test(y), F-test, regresná analýza. Všetky vyžadujú v určitom zmysle normalitu rozdelenia dát.