140 likes | 436 Views
Kvantitativna analiza podatkov. dr. Barbara Korousic Seljak barbara.korousic@ijs.si. v. v. Kako se lotiti kvantitativne analize podatkov?. Zberemo in razvrstimo podatke Izberemo statistično metodo za kvantitativno analizo podatkov Uporabimo ustrezno računalniško orodje
E N D
Kvantitativna analiza podatkov dr. Barbara Korousic Seljak barbara.korousic@ijs.si v v
Kako se lotiti kvantitativne analize podatkov? • Zberemo in razvrstimo podatke • Izberemo statistično metodo za kvantitativno analizo podatkov • Uporabimo ustrezno računalniško orodje • Prikažemo rezultate populacija G vzorec H v enota z znacilnostmi X
Zbiranje podatkov v Obicajno nelinearen proces Raziskave običajno potekajo v fazah: • Zbiranje podatkov pri empiričnih raziskavah: • z anketo (ali drugo pisno obliko vprašalnika, npr. z ocenjevalno lestvico) ali ustno s strukturiranim intervjujem; • z instrumenti; • Statistična obdelava in razlaga podatkov; • Objava rezultatov. Pri kvantitativni analizi podatkov raziskujemo značilnosti množičnih pojavov: • nekaj primerjamo, npr. mnenja udeležencev raziskave; • iščemo povezave ali korelacije, npr. povezanost med prekomerno težo mater in otrok; • odkrivamo skupne dejavnike.
Vrste podatkov Zbrani podatki tvorijo množico statističnih spremenljivk: • odvisne / neodvisne; Opisne / atributivne Stevilske / numericne v v lat. nomen = ime Nominalne Ordinalne Intervalne Razmernostne - Primerjamo razlike med vrednostmi; - Ničelno vrednost določimo po presoji; - npr. telesna teža, starost - Primerjamo razmerja med vrednostmi; - Absolutna ničelna vrednost; - npr. krvni pritisk, telesna višina - Vrednosti razvrščamo; - npr. sprememba zdravstvenega stanja ozdravitev, izboljšanje, ozdravitev - Vrednosti le razlikujemo; - Poimenovanje lastnosti, npr. spol: Ž/M
Kaj pomenijo izrazi? • : stopnja značilnosti preskusa (sprejemljiva verjetnost ali tveganje, da bomo zavrnili ničelno hipotezo, čeprav je ta pravilna) • ANOVA: analiza variance • MEAN: (vzorčna) aritmetična sredina ali povprečje • RANGE: rang (num. spr.) • SAMPLE: vzorec • SIGNIFICANCE: nivo statistične pomembnosti • STD DEVIATION: standardni odklon • SAMPLE VARIANCE: vzorčna varianca Standardni odklon = koren variance v
v Parametricna statistika Preskušanje parametričnih hipotez, t.j. domnev o vrednostih neznanih parametrov statistične spremenljivke: • Ničelna hipoteza H0 (q=q0) : alternativna hipoteza H1 (qq0) s stopnjo značilnosti; • domneva je dvostranska () ali enostranska (> ali <); • H0 zavrnemo ali o njej ne odločimo! Kdaj uporabimoparametrično statistiko? • Vse numerične spremenljivke so normalno porazdeljene; • Enakost (homogenost) varianc (še zlasti, ko so skupine vzorcev različno velike).
v Neparametricna statistika Preskušanje neparametričnih hipotez , t.j. domnev o tipu porazdelitvenega zakona ene ali več slučajnih spremenljivk: • Prilagoditveni preskusi: ničelna hipoteza H0 (Fx=F0) : alternativna hipoteza H1 (FxF0) s stopnjo značilnosti ; • Primerjalni preskusi: ničelna hipoteza H0 (Fx=FY) : alternativna hipoteza H1 (FxFY) s stopnjo značilnosti ; Kdaj uporabimoneparametrično statistiko? • Neizpolnjeni pogoji za parametrično statistiko (pogosto pri majhnih vzorcih, n30); • Pri analizi atributivnih spremenljivk.
v Statisticne metode za analizo podatkov 1 Povezanost med spremenljivkami ?
v Neparametricnipreskusi v Parametricnipreskusi v Statisticne metode za analizo podatkov 2 Razlike med vzorci ?
Licenčna oprema: SPSS (Statistical Package for the Social Sciences ), MS Excel, http://www.analyse-it.com/ (vtičnik za MS Excel za neparametrično statistiko) MicrocalTM Origin, SAS, ... Brezplačna oprema: http://www.freestatistics.info/stat.php http://www.socr.ucla.edu/htmls/SOCR_Analyses.html v v Izbor racunalniskega orodja
Prikazovanje rezultatov analize 1 Zdravstvena statistika Opisna statistika - prikaz zbranih in razvrščenih podatkov: besedno, tabelarično ali grafično: • Za atributivne spremenljivke: • Števila (frekvence f) in/ali • Deleži (%); • Za numerične spremenljivke: • Mere srednje vrednosti (aritmetična sredina, mediana, modus); • Mere razpršenosti (varianca in standardni odklon, min, max); • Asimetrija (koeficient asimetričnosti) / sploščenost (koeficient sploščenosti). Origin Excel
Prikazovanje rezultatov analize 2 Biostatistika Inferenčna statistika – postopek ocene verjetnosti, da povezanost oziroma razlike niso slučajne in lahko posplošujemo iz vzorca na celotno statistično množico: • Kriterij posploševanja: npr. 95-% verjetnost ali stopnja tveganja (P ali ), ki je navadno 0,05, kar označuje 5-% tveganje; • Enostavna / multivariantna.
Zaključek Povzetek Ne pozabimo • Predno se lotimo analize podatkov, se dobro pripravimo; • Jasno postavimo hipotezo, priredimo ničelno hipotezo in določimo stopnjo tveganja; • Glede na vrsto podatkov (numerične / atributivne spremenljivke) in njihovo porazdelitev, izberimo ustrezno statistično metodo; • Rezultate analize pravilno in jasno obrazložimo. Posvetujmo se s starejšimi raziskovalci in kolegi, ki imajo izkušnje z analizo podatkov. Izogibajmo se • Površni obdelavi podatkov; • Nejasnemu in nepravilnemu prikazovanju rezultatov. Literatura: 1. ADAMIČ, Š. (1995) Temelji biostatistike, Ljubljana: Medicinska fakulteta Univerze v Ljubljani. 2. SAGADIN, J. (2003) Statistične metode za pedagoge, Maribor: Obzorja. 2. KIRKWOOD, B. R. in STERNE, J. A. C. (2004) Esential Medical Statistics. Malden: Blackwell Publishing Company.