1 / 42

Priprema podataka za statističku raščlambu : 1-2-3-4-5

Statistička obradba i tumačenje biomedicinskih podataka prof. dr. sc. Mladen Petrovečki dr. sc. Lidija Bilić-Zulle Vanja Pupovac, prof. Katedra za medicinsku informatiku Medicinski fakultet Sveučilišta u Rijeci. Priprema podataka za statističku raščlambu : 1-2-3-4-5.

mareo
Download Presentation

Priprema podataka za statističku raščlambu : 1-2-3-4-5

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistička obradba i tumačenje biomedicinskih podatakaprof. dr. sc. Mladen Petrovečkidr. sc. Lidija Bilić-ZulleVanja Pupovac, prof.Katedra za medicinsku informatikuMedicinski fakultet Sveučilišta u Rijeci

  2. Priprema podataka za statističku raščlambu: 1-2-3-4-5 • vrsta podataka  izbor testa • naziv varijable (plus opis varijable) • šifriranje (binariziranje, “nula” = ne) • nedostatak podatka  prazno polje • preračunavanje složenih podataka

  3. Programska potpora

  4. Mjere ishoda • varijable koje odabiremo kao pokazatelje za ishod pokusa: • glavne  često teško mjerljive (npr. kvaliteta života, stanje stijenki krvnih žila...) • zamjenske (surogatne)  dostatno opisuju glavne mjere ishoda, lako mjerljive (npr. pokretljivost, duljina remisije bolesti, koncentracija kolesterola) Oprez pri odabiru surogatnih mjera!

  5. Raspodjela podataka • grafički prikaz mjerenja prikazan samostalno ili u odnosu na druge podatke • prikazuje: • raspon mjerenja • jednolikost raspodjele • modalnost raspodjele • simetričnost raspodjele • normalna raspodjela

  6. Prikaz podataka • kvalitativni podatci  kontingencijska tablica • kvantitativni podatci  mjere središta (centralne tendencije) i raspršenja

  7. Mjere središta i raspršenja • Najčešće rabljeni: • aritmetička sredina i standardna devijacija (normalna raspodjela i veliki N) • medijan i raspon (percentili, interkvartili)(nenormalna raspodjela, mali N) • interval pouzdanosti (i za aritmetičku sredinu i za medijan) • Rjeđe • varijanca, računski raspon, pogrješke...

  8. Odabir testa • testovi dokazivanja statističkih hipoteza • kriterij odabira • osobine obilježja  mjerne ljestvice • osobine uzorka • veličina • povezanost • osobine raspodjele (normalnost) • parametrijski testovi • neparametrijski testovi • broj obilježja  uni/bi/multivarijatni testovi

  9. Ovisnost o broju pokazatelja • univarijatni • raščlanjuju samo jedan pokazatelj • bivarijatni • raščlanjuju dva pokazatelja • multivarijatni • raščlanjuju više pokazatelja

  10. Ovisnost o raspodjeli • Parametrijski testovi • pokazatelji koji slijede normalnu raspodjelu • obrađuju izvorna mjerenja • Neparametrijski testovi • nisu ograničeni normalnošću raspodjele • ne raščlanjuju izvorne podatke nego položaje (rangove)

  11. Ovisnost o osobini uzorka • Veličina • veliki uzorci  parametrijski testovi • mali uzorci  neparametrijski testovi • Zavisnost • nezavisni uzorci  neparni testovi • zavisni uzorci  parni testovi

  12. Osobine obilježja – mjerne ljestvice

  13. Biranje testa

  14. Tumačenje i prikaz rezultata • Poopćavanje s uzorka na populaciju • Kontingencijske tablice i mjere središnjice • Tablični i slikovni prikaz podataka • frekvencije: stupčasti grafikon • središnjice i rasap: kutije i brkovi (box and whisker) • Vrijednosti koje odskaču (outliers) • Raspon pouzdanosti (confidence interval, CI) • statističko i logičko zaključivanje

  15. Statistička i stvarna značajnost • Statistička značajnost: ukazuje je li razlika ili povezanost između skupina značajna Pitanje: A je li važna? • Odgovor: stvarna (klinička) značajnost i tumačenje znanstvenika

  16. Ne zaboravite: 1-2-3-4! • Vrijednost P uvijek se piše s tri decimalna mjesta; nema “P<0,05”, “P>0,05” ili p=NS • Vrijednost statističkog testa i koeficijenta korelacije pišu se s dva decimalna mjesta • Udjeli za N<100 i diskretne vrijednosti izražavaju se cijelim brojevima (bez decimalnih mjesta) • Učestalost u malim skupinama nije primjereno predstavljati relativno (“od tri miša 33% je pobjeglo”)

  17. dodatak I

  18. Veličina uzorka • veće  bolje • manje  etika  cijena  vrijeme istraživanja • mali uzorak  zbog snage testa ne dokazivanje svojstva koje uistinu postoji • rješenje  optimalna veličina uzorka

  19. Izračun veličine uzorka • snaga testa, 1- • razina značajnosti, α • varijabilnost obilježja • najmanja vrijednost promjene koja je bitna za promjenu koja se istražuje • istinska, klinička, biološka, itd. značajnost

  20. Postupci • matematičke jednadžbe • brze jednadžbe • tablični podaci • nomogrami • programska potpora

  21. matematičke jednadžbe • brze jednadžbe • Lehrovejednadžbe a = 0,05 b = 80% 16N = ------------------------------------ standardizirana razlika2 npr. Pearsonov t-test: najmanja bitna razlika x1 i x2st. razlika = ---------------------------------------- standardna devijacija

  22. matematičke jednadžbe • brze jednadžbe • tablični podaci • nomogrami • Altmanov nomogram

  23. matematičke jednadžbe • brze jednadžbe • tablični podaci • nomogrami • programska potpora

  24. dodatak II

  25. Članak, CMJ • http://www.cmj.hr/2004/45/4/15311405.pdf • by Tom Lang(http://www.tomlangcommunications.com/) • #5 CMJ rad • SEM vs. SD

  26. dodatak III

  27. koja se hipoteza dokazuje što se računa kako (što je temelj matematičkog izračunavanja) prednosti uvjeti koja su ograničenja Što DA i što NE?

  28. y y y x x x Primjer 1: kada NE računati r

  29. uvjet N r p lin(bsj) : mt 118 0,25 0,006 log(bsj) : mt 118 0,43 <0,001

  30. Primjer 2: kada NE računati 2 hrana studenti studenti u kantini iz Zagreba izvan Zagreba dobra 10 31 loša 0 19 ukupno 10 50

  31. Primjer 3: kada NE zaključiti ovako Lupus 2004;14:426

  32. Pomoć e-priopćavanjem

  33. Pogrješka temeljne prosudbe Kahneman D, Tversky A. On prediction and judgement. Oregon Res Inst Bull 1972;371:100.

  34. Teorija... (1/3) Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan ISPRAVNO POZITIVNI LAŽNO POZITIVNI nalaz (TP) (FP) negativan LAŽNO NEGATIVNI ISPRAVNO NEGATIVNI nalaz (FN) (TN)

  35. Teorija... (2/3) Osjetljivost testa = TP / (TP + FN) Specifičnost testa = TN / (FP + TN) Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan ISPRAVNO POZITIVNI LAŽNO POZITIVNI nalaz (TP) (FP) negativan LAŽNO NEGATIVNI ISPRAVNO NEGATIVNI nalaz (FN) (TN)

  36. Teorija... (3/3) Osjetljivost testa = TP / (TP + FN) Specifičnost testa = TN / (FP + TN) Pozitivna prediktivna vrijednost = TP / (TP + FP) Negativna prediktivna vrijednost = TN / (FN + TN) Stanje Postupak postoji (npr. bolestan) ne postoji (npr. zdrav) pozitivan ISPRAVNO POZITIVNI LAŽNO POZITIVNI nalaz (TP) (FP) negativan LAŽNO NEGATIVNI ISPRAVNO NEGATIVNI nalaz (FN) (TN)

  37. Priča, saobraćajna nezgoda... (1/4) 15% 85% PROMETNA NEZGODA, NOĆ, VOZAČ POBJEGNE p(zeleni) = ? p = 0,15 (15%)

  38. Priča, saobraćajna nezgoda... (2/4) 15% 85% OČEVIDAC NEZGODE: “ZELENI TAXI” p(zeleni) = ? p = 1,0 (100%)

  39. Priča, saobraćajna nezgoda... (3/4) 15% 85% OSPORAVANJE IZJAVE, TESTIRANJE NOĆNE VIDLJIVOSTI RAZLUČIVANJA BOJA:PREPOZNAJE 80%, GRIJEŠI 20% (OBJE)p(zeleni) = ? Osjetljivost testa = 80%, Specifičnost testa = 80% p = 0,8 (80%)

  40. Stvarna boja vozila Svjedok vidi zeleno 12 17 plavo 03 68 ukupno 15 85 Priča, saobraćajna nezgoda... (4/4) Osjetljivost testa = 80%, Specifičnost testa = 80% Poz. PV = 12/(12+17) = 12/29 = 0,41 p = 0,41 (41%)

  41. Mudrost zaključivanja! ZNANOST

  42. mladenp@medri.hr

More Related