1 / 84

Štatistické testovanie hypotéz. Porovnanie dvoch výberov

Štatistické testovanie hypotéz. Porovnanie dvoch výberov. Iveta Waczulíková Peter Slezák Fakulta matematiky, fyziky a informatiky UK Ústav simulačného a virtuálneho medicínskeho vzdelávania LF UK. Materiál nájdete na: bio-med-stat.webnode.sk naše adresy: peter.slezak5@gmail.com

Download Presentation

Štatistické testovanie hypotéz. Porovnanie dvoch výberov

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Štatistické testovanie hypotéz. Porovnanie dvoch výberov Iveta Waczulíková Peter Slezák Fakulta matematiky, fyziky a informatiky UK Ústav simulačného a virtuálnehomedicínskehovzdelávania LF UK

  2. Materiál nájdete na: bio-med-stat.webnode.sk naše adresy: peter.slezak5@gmail.com waczulikova@gmail.com

  3. Populácia (základný súbor) - konečný rozsah - nekonečný rozsah Parameter (populačná charakteristika) – je číselná charakteristika populácie (napr. priemerná výška mužov na Slovensku). Jej presná hodnota je obvykle neznáma.

  4. Epidemiologické štúdie Príčina/faktor • Rizikový faktor • Diagnostický test • Nový liek • Prognostický faktor • Preventívny faktor Následok • Choroba • Rozlíšenie • Zlepšenie • Prežívanie • -Zabránenie vzniku -Skoré zachytenie -Zabránenie komplikáciám

  5. Premenné – základné definície • Premenná • všeobecnejšie ju možno definovať ako veličinu, ktorá môže nadobúdať rôzne hodnoty. V štatistike sa vzťahuje na MERATEĽNÚ vlastnosť, ktorá sa v čase alebo medzi objektami/subjektami typicky mení. • Typy premenných: • Číselné premenné – (možno zmerať) • spojité (koncentrácia onkomarkera) a intervalové (vek) • Vyznačujú sa reprezentatívnou (strednou) hodnotou (najčastejšie vyjadrenou ako priemer alebo medián) a mierou premenlivosti (smerodajná odchýlka k priemeru alebo dolný a horný kvartil k mediánu) • Kategorické premenné (možno zaradiť) • Nominálne – klasifikujú nejakú vlastnosť (genotyp) • Ordinálne – určujú stupeň vlastnosti (cancerstaging). Charakterizujú sa početnosťami (%) v jednotlivých kategóriách

  6. Deskriptívna(popisná) štatistika - umožňuje pozorované dáta redukovať na „uchopiteľné“ štatistické parametre – reprezentatívnu hodnotu a rozptyl. • Grafická prezentácia rozdelenie dát rozdelenie pravdepodobností (štatistické rozdelenie) • Induktívna (inferenčná) štatistika - umožňuje z pozorovaných dát vytvárať všeobecne platné závery, s uvedením stupňa ich spoľahlivosti.

  7. Formát dát (simulovaná databáza)Dáta časov a možných prognostických faktorov vybraných 11 pacientov s malígnym nálezomvstup: chirurgická intervenciavýstup: úmrtie Kódovanie v programe StatsDirect: Cenzurovanie = 0pre nekompletné dátaoznačenie * alebo + Cenzurovanie = 1pre kompletné dáta (udalosť)

  8. Histogrammorfometrický údaj z USG štítnej žľazy

  9. Histogrammorfometrický údaj z USG štítnej žľazy

  10. Všetky dáta získané meraním danej charakteristiky v skupinách (pacientov, zvierat, v skupinách laboratórnych experimentov za definovaných podmienok...) ZASTUPUJEME skupinovými reprezentatívnymi hodnotami (priemery) a príslušnými mierami rozptylu (SD) – z ktorých sa dajú odhadnúť Intervaly spoľahlivosti pre populačné priemery (95%CI) Dáta zastupujeme PARAMETRAMI (normálneho rozdelenia) parametrické testy

  11. Ak nesprávne vyberieme parametrický testzáver testovania bude nespoľahlivý!

  12. S2 – rozptyl • SD – smerodajná odchýlka • Smerodajná odchýlka má rovnaké jednotky ako meraná veličina!

  13. Odhad populačnej σ

  14. Deskriptívna (popisná) štatistika - umožňuje pozorované dáta redukovať na „uchopiteľné“ štatistické parametre – reprezentatívnu hodnotu a rozptyl. • Grafická prezentácia rozdelenie dát rozdelenie pravdepodobností (štatistické rozdelenie) • Induktívna (inferenčná) štatistika - umožňuje z pozorovaných dát vytvárať všeobecne platné závery, s uvedením stupňa ich spoľahlivosti.

  15. „Nemusíte zjesť celého vola na to, aby ste poznali, že mäso je tuhé.“ S.Johnson

  16. Všeobecný postup pri testovaní hypotéz

  17. Nemusíte sníst celého vola na to, abyste poznali, že maso je tuhé. S. Johnson (Zvárová, J.: I. Základy statistiky pro biomedicínske odbory. Karolinum, Praha, 2004.)

  18. Všeobecný postup pri testovaní hypotéz • (formulovaný vedecký problém) • (formulovaná pracovná hypotéza) • Voľba hladiny významnosti alfa, ktorá udáva pravdepodobnosť, s ktorou bude splnené testovacie kritérium • Formulácia nulovej a alternatívnej hypotézy(obvykle tvrdenie, ktoré chceme vyvrátiť) • Voľba testovacieho kritéria(podľa povahy problému a typu úlohy) • Interpretácia výsledkov(pokiaľ nulovú hypotézu zamietame, riskujeme chybu, ktorej pravdepodobnosť je nanajvýš rovná zvolenej hladine alfa. Pokiaľ ju nezamietame, nevieme, aká je pravdepodobnosť chybného rozhodnutia. Preto nikdy nesmieme tvrdiť, že sme nulovú hypotézu preukázali.)

  19. Čo všetko môžeme testovať • Štatistika nám poskytuje nástroj (kritérium) na rozhodovanie. • Hypotézy zhody • Hypotézy o testovaní rozdielov (v stredných hodnotách) medzi skupinami • Hypotézy o testovaní nezávislosti (vzťahov - asociácie, korelácie)

  20. Predtým, než vyberieme vlastný test, musí byť jasne formulovanávedecká hypotéza a spôsob jej overovania. Následne formulujeme pracovnú hypotézu

  21. Štatistické hypotézy: • Efekt („effect size“) • Nulová hypotéza(H0) – tvrdenie, že efekt je nulový • Alternatívna hypotéza(HA) – tvrdenie opačné ako nulová hypotéza (obvykle „obsahujúce“ všetky ostatné možnosti, ktoré môžu nastať) t.j. efekt nie je nulový. H0: x1 = x2 - dvojstranná alternatíva HA: x1 x2 - jednostranná alternatíva HA: x1x2 alebo x1x2

  22. Štatistické hypotézy: • sú formulované párovo • nulová hypotéza (H0) sa kombinuje s alternatívnou hypotézou (HA) • H0: x1 = x2 • HA: x1 x2

  23. Štatistické hypotézy: • Formulácia hypotéz nie je arbitrárna • vyplýva to z faktu,že nulovú hypotézu môžeme len zamietnuť, ale nikdy nie dokázať (odôvodniť) jej pravdivosť

  24. Testová štatistika (napr.: T-test) • → nazbierame dáta a použijeme rozhodovacie kritérium = testovú štatistiku • Má presne známu distribúciu (známe rozdelenie pravdepodobnosti) • T-test (studentovo t rozdelenie (pravdepodobnosti)) • Zo zistenej testovej štatistiky vieme určiť pravdepodobnosť P-value

  25. P-value • T.j. spočítame pravdepodobnosť, že by sme mohli pozorovať nami zistený výsledok (alebo ešte „extrémnejší“ – menej pravdepodobný), ak by nulová hypotéza platila. • t.j. p-value – dosiahnutá hladina významnosti

  26. P-value • P-value je pravdepodobnosť, s akou by sme mohli získať pozorované dáta rovnako alebo ešte viacej odporujúce nulovej hypotéze za predpokladu, že nulová hypotéza platí. • Je to pravdepodobnosť chyby, ktorej by sme sa dopustili, ak by sme prehlásili, že medzi skupinami je rozdiel a on v skutočnosti nie je (platí nulová hypotéza)

  27. Hladina významnosti „alfa” • Test nulovej hypotézy – porovnanie hodnoty p-value s hladinou významnosti alfa (obvykle 0,05 = 5%) • Ak zamietneme H0 prijímame HA t.j. tvrdíme, že výsledok je štatisticky významný (signifikantný)

  28. Dvojstranná alternatíva

  29. Jednostranná alternatíva

  30. Rozdelenie pravdepodobnosti pozorovaných diferencií H1 H0 β α

  31. Štatistická vs. klinická významnosť Δ – klinicky významný rozdiel 0 – nulový rozdiel medzi dvoma porovnávanými skupinami Zvárová et. al. Základy statistiky pro biomedicínské obory. Praha, Karolinum, 2004.

  32. Hypothesis Testing – 5 Steps • State null and alternative hypotheses • Calculate a test statistic • Find the corresponding p-value • “Reject” or “fail to reject” the null hypothesis (your only 2 choices) • Draw substantive conclusions Red = statistics, blue = logic, black = theory

  33. Štatistický záver • Hypotéza môže byť zamietnutá jedine s určitou pravdepodobnosťou a nikdy nie s úplnou istotou. • Pri testovaní štatistickej hypotézy nikdy nemôžeme dokázať pravdivosť nulovej hypotézy. Môžeme ju len zamietnuť. • Nesignifikantný výsledok (nezamietnutie)  pravdivosť nulovej hypotézy. Znamená len to, že ju nemôžeme v danej situácii zamietnuť.

  34. „Je málo spôsobov ako správne uskutočniť výskumnú štúdiu, ale sú ich tisíce ako ju uskutočniť nesprávne.“ D.L.Sackett

  35. Štatistické chyby a sila testu Štatistická chyba I. druhu– riziko odsúdenia nevinného človeka (nepoznáme, že platí nulová hypotéza) Štatistická chyba II. druhu – riziko prepustenia zločinca (nepoznáme, že neplatí nulová hypotéza)

  36. Rozdelenie pravdepodobnosti pozorovaných diferencií H1 H0 β α

  37. Verifikácia štatistických hypotéz pomocou štatistických testov • Štatistické testy (signifikantnosti): parametrické alebo neparametrické

  38. Štatistické metódy • Parametrické metódy (PM) sa zaoberajú parametrami základného súboru (ZS), t.j. odhadmi a testami. Ich použitie si vyžaduje splnenie prísnych predpokladov o rozdeleniach pravdepodobností výberových štatistík a premennej v ZS (predpoklad normality skúmaného znaku v ZS, resp. v populácii) • Neparametrické metódy (NPM)nevyžadujú také prísne predpoklady o rozdeleniach a nezaoberajú sa len parametrami ZS. Využívajú menej informácií z dát výberového súboru (VS) a tým je ich sila nižšia ako PM. NPM sú metódy s „voľnými“ rozdeleniami.

  39. Najpoužívanejšie parametrické testy • Nepárový t-test • Párový t-test • Fischerov F-test • Jednofaktorová analýza rozptylu (ANOVA) • Jednofaktorová ANOVA s opakovanými meraniami • ANOVA pre dva nezávislé faktory • ANOVA pre dva faktory, „mixed design“ • Dvojfaktorová ANOVA s opakovanými meraniami • Pearsonov korelačný koeficient „r“ a koeficient determinácie R2 • Koeficient mnohonásobnej korelácie „r“ • Koeficient parciálnej a semiparciálnej korelácie

  40. Najpoužívanejšie neparametrické metódy • Kolmogorovov – Smirnovov test - porovnanie dvoch rozdelení (empirických distribučných funkcií) • 2 - test dobrej zhody porovnanie dvoch rozdelení (empirického a teoretického) • Znamienkový test (jednovýberový Wilcoxonov test) - analógia párového t-testu • Mann – Whitneyov U test a dvojvýberový Wilcoxonov test – analógia nepárového t-testu • Friedmanov test - analógia jednofaktorovej analýzy variancie s opakovanými meraniami • Kruskal – Wallisov test - analógia jednofaktorovej analýzy variancie • Spearmanov korelačný koeficient – neparametrická obdoba Pearsonovho korelačného koeficienta

  41. Výber štatistického testu

  42. Predpoklady použitia parametrických testov • Náhodný výber z populácie (organizácia experimentu) • Dáta pochádzajú z normálneho rozdelenia • Rozdelenie je spojité • Rovnaké rozptyly (t-test, ANOVA, OLS) • Výbery sú nezávislé– pre párové dáta sa vyhodnocujú normálne rozdelené diferencie)

  43. Normalita, transformácia dát, odľahlé hodnoty

  44. Miery polohy a typy rozdelení medián=priemer=modus modus priemer modus medián modus medián priemer priemer medián modus

  45. (štandardizované) Normálne rozdelenie 68,28% 95,45% +1 +3 +3 -2 -3 -1 99,73%

  46. Normalita Mnoho štatistických metód vyžaduje aby premenné s ktorými pracujeme mali približne normálne rozdelenie Napríklad: t-test(y), F-test, regresná analýza. Všetky vyžadujú v určitom zmysle normalitu rozdelenia premenných

More Related