1 / 60

Statističko modeliranje istraživanja

Poslijediplomski znanstveni studij “BIOMEDICINA” akad. god. 200 3. /0 4. Statističko modeliranje istraživanja. Prof.dr.sc. Josipa Kern jkern@snz.hr. Statistički model istraživanja se temelji na…. Definiranim ciljevima istraživanja Postavljenoj hipotezi Planu istraživanja i evaluaciji plana

gyala
Download Presentation

Statističko modeliranje istraživanja

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Poslijediplomski znanstvenistudij“BIOMEDICINA” akad. god. 2003./04. Statističko modeliranje istraživanja Prof.dr.sc. Josipa Kern jkern@snz.hr

  2. Statistički model istraživanja se temelji na… • Definiranim ciljevima istraživanja • Postavljenoj hipotezi • Planu istraživanja i evaluaciji plana • Entitetima i atributima • Raspoloživim mogućnostima

  3. O čemu će se danas govoriti? • O uzorku i populaciji, uzorkovanju i veličini uzorka • O primjerima statističkih analiza, prikazima rezultata i interpretaciji • O “nevažnim” stvarima prilikom analize podataka

  4. Uzorak i populacija • U malim populacijama uzorkovanje nije potrebno • Uzorkovanje • temeljeno na vjerojatnosti (probability sampling) (VU) • koje ne uključuje vjerojatnost (nonprobability sampling) (ne-VU)

  5. Definicija populacije uključuje… • Identificiranje skupine – entiteta koje će se promatrati • Određivanje područja u kojemu skupina egzistira • Određivanje perioda unutar kojega će se prikupljati podaci (ako je to potrebno)

  6. Uzorkovanje ovisi o svrsi… • Generalizacija (uzorak  populacija) zahtijeva slučajni uzorak • Okvir uzorkovanja (sampling frame) zahtijeva: • Uključivanje samo pripadnika skupine od interesa • Uključivanje svih pripadnika skupine od interesa • Bez dupliciranja • Bez ikakvog pravila pri uključivanju pripadnika u uzorak

  7. Kako izabrati uzorak za potrebe generalizacije? • Jednostavni slučajni uzorak • Sistematski uzorak (može zamijeniti slučajno uzorkovanje u slučaju velikih populacija) • Stratificirani uzorak

  8. Kako odrediti veličinu uzorka? • Razina pouzdanosti (confidence level), npr. 95% ili više/manje • Prihvaćena/očekivana razina “ne-odgovaranja” (nonresponse), ako je potreban uzorak veličine 80, a očekuje se da 30% osoba iz uzorka neće odgovoriti, onda treba računati s uzorkom veličine 114=80/.7)

  9. Uzorkovanje u nekim drugim situacijama • Uzorak kvote – uzimanje slučajeva u uzorak dok se ne postigne ona kvota (%) koja postoji u populaciji • Namjerni uzorak – uzimanje “informacijama bogatih” slučajeva (objekata, entiteta, jedinica promatranja)

  10. http://www.uwex.edu/ces/pdande/evaluation/evaldocs.html

  11. Ponešto o podacima…

  12. Prikupljanje podataka • Opis podataka (skale mjerenja – nominalna, ordinalna, intervalna, omjerna) • Organizacija podataka (datoteka, baza podataka – ovisno o kompleksnosti; posebna pozornost kvaliteti podataka) • Uvažavanje postojećih resursa odnosno traženje novih (računalni programi)

  13. Kojim jezikom govori statistika i kako uskladiti želje i potrebe istraživača s mogućnostima i zahtjevima statistike?

  14. Hipoteze istraživanja… • Formulirati u terminima statistike tražeći primjerene modele analize podataka: • prepoznavanje strukture, • traženje homogenih podskupina, • provjeravanje postojanja razlika i/ili povezanosti, itd.

  15. Primjeri statističkih modela analize podataka

  16. Prvi primjer…1-zdravi2-bolesni ali to ne znaju3-bolesni koji se liječe

  17. Pogledajmo čime raspolažemo…

  18. Primjer “grafičkog” prikazivanja distribucije iz kojega se može pročitati frekvencija svake pojedinačne vrijednosti (stem-and-leaf) DOB Stem-and-Leaf Plot for SPOL= 1 Frequency Stem & Leaf 5,00 Extremes (=<49) 3,00 5 . 001 3,00 5 . 233 2,00 5 . 55 10,00 5 . 6666667777 14,00 5 . 88888899999999 12,00 6 . 011111111111 30,00 6 . 222222222222222333333333333333 18,00 6 . 444444445555555555 18,00 6 . 666666666667777777 11,00 6 . 88888999999 14,00 7 . 00000011111111 12,00 7 . 222222333333 6,00 7 . 444555 4,00 7 . 6666 Stem width: 10 Each leaf: 1 case(s)

  19. Primjer grafičkog prikazivanja distribucija skupinakoje se uspoređuju (Box-Plot)

  20. Provjeravanje normalnosti distribucije

  21. Postoje li neke razlike među promatranim skupinama?

  22. Testiranje razlika – analiza varijance – program: SAS

  23. Neki uvjeti za primjenu AV nisu zadovoljeni (distribucija nije normalna)

  24. Sugerira se transformacija varijable BMI kao 1/BMI

  25. Uvjeti za primjenu AV su zadovoljeni – rezultat se može interpretirati

  26. Rezultat AV izražen vrijednostima F, DF, p

  27. Izračunate srednje vrijednosti transformirane kao 1/BMI i interval pouzdanosti

  28. Postoji li povezanost – možemo li predviđati?

  29. Povezanost – predikcija – regresijska analiza

  30. Predikcija – grafički prikaz

  31. Ima li prediktorski skup prediktivnu vrijednost?

  32. Regresijski koeficijenti

  33. Regresijska analiza… • Služi analizi povezanosti dvaju skupova varijabli • Kriterijska ili zavisna varijabla (kvantitativna) • Prediktori ili nezavisne varijable • Poopćenje – kanonička analiza

  34. Predikcija klase a ne numeričke vrijednosti…

  35. Logistička regresija

  36. Može li se govoriti o prediktorima?

  37. Koji su prediktori važni?

  38. Što povećava “rizik”?

  39. Kako izračunati “rizik” za pojedinca?

  40. Fizička aktivnost 1-teška 2-srednja 3-laka Prediktori Dob Sistolički tlak Dijastolički tlak Alkohol Ulje/mast BMI Drugi primjer…

  41. Rezultati…

  42. Rezultati - nastavak

  43. Logistička regresija… • Služi analizi povezanosti dvaju skupova varijabli • Kriterijska ili zavisna varijabla (kvalitativna) • Prediktori ili nezavisne varijable • Kriterijska varijabla može biti binarna, multinomijalna, ordinalna

  44. Još neki pogledi na analizu povezanosti i traženje relacija među podacima …

  45. Inteligentna analiza podataka (IAP) • Otkrivanje znanja (knowledge discovery) • “Raskopavanje” podataka (data mining) • Strojno učenje (machine learning) • Raspoznavanje uzoraka (pattern recognition) • Itd.

  46. Alati za IAP… http://www.rulequest.com • See5 • Cubist • Magnum Opus http://dms.irb.hr • ILLM • Statistica – Neural network

  47. See5…primjena… • primjena.names – imena klasa kojima pojedini ispitanici pripadaju i atributa koji ih opisuju • Atributi mogu biti:diskretnimjereni na nominalnoj ili ordinalnoj skali ili kontinuirani(numeričke vrijednosti).

  48. See5…primjena… • primjena.data – podaci iz kojih će See5 ekstrahirati modele povezanosti atributa i klasa. • Svaki zapis sadrži podatke (klasa, atributi) jednog ispitanika

  49. See5…primjena…primjer… • Epidemiološka studija (1970-1990) • Uzorak ispitanika koji su umrli od kardiovaskularnih bolesti tijekom tog perioda • Pitanje: Jesu li oni znali da su bolesni? • 1 – zdravi • 2 – bolesni (uzimaju lijekove, pozitivni klinički i/ili laboratorijski nalazi)

More Related