140 likes | 287 Views
TYTUT21. TUME II / Tilastollinen osuus Tilastoaineiston hankinta Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008. Tilastoaineiston hankinta…. Perusjoukko sisältää siis kaikki tilastoyksiköt, jotka liittyvät tutkimukseen
E N D
TYTUT21 TUME II / Tilastollinen osuus Tilastoaineiston hankinta Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008
Tilastoaineiston hankinta… • Perusjoukko sisältää siis kaikki tilastoyksiköt, jotka liittyvät tutkimukseen • Jos kaikkia tilastoyksiköitä ei voida tutkia, muodostetaan perusjoukon osajoukko. • Osajoukko on otos, jos jokaisella perusjoukkoon kuuluvalla tilastoyksiköllä on sama mahdollisuus tulla valituksi otokseen • Osajoukko on näyte, jos valituksi tuleminen ei tapahdu satunnaisesti • Rajattu perusjoukko on nimeltään kehikko • Otoksen koko vaikuttaa tutkimuksen luotettavuuteen ja virhemarginaaliin
Tilastoaineiston hankinta… • Todennäköisyyteen perustuvat otantamenetelmät otos • Yksinkertainen satunnaisotanta • Systemaattinen otanta • Ositettu otanta • Ryväsotanta • Muut menetelmät näyte • Harkinnanvarainen otanta • Kiintiöotanta
Tilastoaineiston hankinta… • Yksinkertainen satunnaisotanta (simple random sampling), satunnaisotanta • Otantayksiköt poimitaan satunnaisesti, jokainen valittu otantayksikkö voi tulla samalla todennäköisyydellä valituksi • Arpomalla tai satunnaislukumenetelmällä • Kehikon muodostaa perusjoukon otantayksiköt • Kehikon otantayksiköt numeroidaan juoksevalla numerolla • Päätetään, kuinka monta otetaan otoskoko • Arvotaan satunnaislukuja otoskoon verran ja valitaan otantayksiköt • Esim. Tehdään Tertan opiskelijoista tutkimus jonkin viitekehyksen näkökulmasta. Opiskelijoilla on juokseva opinto-oikeusnumero. Määritetään vaikkapa 100 opiskelijaa tutkimukseen, joten arvotaan opiskelijanumeron mukaisesta numeroavaruudesta 100 numero. Arpaonnen mukaiset henkilöt saavat kyselylomakkeen.
Tilastoaineiston hankinta… • Systemaattinen otanta (systematic sampling) • Kehikon muodostaa perusjoukko ja otantayksiköt numeroidaan järjestykseen. • Järjestetystä listasta poimitaan tasavälein olevat numerot • Poimintaväli (k) lasketaan kaavasta k=N/n ja tulos pyöristetään kokonaisluvuksi • Ensimmäinen otokseen kuuluva otantayksikkö arvotaan väliltä k-1 ja seuraavat valitaan k yksikön välein • Esim. Tertan opiskelijat… jos opiskelijamäärä on 1000 ja tutkimukseen halutaan 100 opiskelijaa, niin poimintavälin on 10. Arvonnan perusteella on valittu ensimmäiseksi opiskelijanumeroksi 10105, joten seuraavat opiskelijanrot ovat 10115, 10125, 10135, jne
Tilastoaineiston hankinta… • Ositettu otanta (stratified sampling) • Perusjoukko jaetaan toistensa poissulkeviin osiin ositteet • Ositteiden tulee olla homogeenisiä tutkittavan asian suhteen • Ositteista poimitaan omat otokset satunnaisotannalla tai systemaattisella otannalla • Otoskoon jakamista eri ositteiden kesken kutsutaan kiintiöinniksi • Esim. Tertan opiskelijatutkimus… Opiskelijoilla on erilaisia taustakoulutuksia. Opiskelijat jaetaan lukio-ositteeseen, terveysalan ammatilliseen-ositteeseen, muun alan ammatilliseen ositteeseen. Nyt jokaisesta ositteesta otetaan kiintiön mukainen määrä otoksia vaikkapa satunnaisotannalla.
Tilastoaineiston hankinta… • Ryväsotanta (cluster sampling) • Perusjoukko jaetaan toistensa poissulkeviin osiin, ryppäisiin • Jokainen rypäs on kuten perusjoukko eli ryppäässä olevat otantayksiköt vaihtelevat ominaisuuksiltaan toisiinsa verrattuna • Ryppäistä valitaan joku, joka toimii tutkimusyksikkönä • Ryppäissä voidaan tehdä kokonaistutkimus tai otantatutkimus • Esim. Tertan opiskelijat… Muodostetaan vaikkapa 5 perusjoukon mukaista ryvästä. Ryppäissä on eri sukupuolia, eri koulutustaustan henkilöitä, eri ikäisiä, jne eli ryväs on pienoiskoossa oleva perusjoukko. Nyt arvotaan, mikä ryväs jatkaa tutkimuksessa. Valitun ryppään sisällä voidaan tehdä kokonaistutkimus tai vaikkapa satunnaisotanta.
Tilastoaineiston hankinta… • Harkinnanvarainen otanta (convenience sampling) • Haastattelija valitsee haastateltavansa, paikkana tyypillisesti ostoskeskukset • Harkinnanvaraisesta otannasta ei tule edustavaa otosta, sillä esim. Prismassa ei käy kaikki Tertan opiskelijat • Esim. Tertan ruokalan edessä tehdään haastattelu ruokailijoiden ruokailutottumuksesta, tai uuden ruuan lisäämisestä ruokalistaan
Tilastoaineiston hankinta… • Kiintiöotanta (quota sampling) • Perusjoukko jaetaan toistensa poissulkeviin osiin jonkin asian perusteella, vaikkapa sukupuoli • Samalla määritetään otantayksiköiden suhteellinen osuus tai absoluuttinen määrä eri kiintiöille • Poimitaan otantayksiköt jokaisen kiintiön mukaan täyteen • Esim. Kiintiöidään Tertan opiskelijat eri koulutusalojen mukaan. Jokaisesta koulutusalasta poimitaan suhteellisten osuuksien mukaan opiskelijoita ja tehdään heille kyseinen haastattelu
Tilastoaineiston hankinta… • Otoskoko • Otoskoko on oltava riittävän iso, jotta otos on edustava • Otoskoko voidaan laskea kaavalla n=z2*(p*(1-p))/e2) , missä z=riskitasoon liittyvä normaalijakauman arvo, p=otoksen laskettu osuus, e=suurin sallittu virhe • Otoskokoa voi arvioida valmiiden taulukoiden avulla, josta valitaan riskitaso (tyypillisesti 5%) sekä ilmiön esiintymisen prosenttiosuus (esim. kroonista kipua kokee 20% väestöstä) • Otantasuhde ilmoittaa prosentteina, paljonko otoksen koko on perusjoukosta. Esim. Perusjoukossa on 1054 henkilöä ja siitä tehdään 100 henkilön otos. • Otantasuhde = 100/1054 ≈ 0,095 ≈ 9,5 % Mikä on otoskoko, kun koulutusohjelmaan osallistuvien määrä on 20%, virhemarginaali saa olla 2% ja erehtymisriski on 5%? n=1,962*(0,20*(1-0,20))/0,022=1537 eli otoskoko on 1550
Tilastoaineiston hankinta… • Virhelähteet otantatutkimuksessa • Kokonaisvirhe • Otantavirhe (esim. sopimaton otantamenetelmä, otos ei ole edustava, otoskoko pieni) • Muu kuin otantavirhe • Vastaamiseen liittyvä virhe • Vastaajasta johtuva virhe (esim. vastaaja ymmärtää kysymyksen väärin) • Haastattelijasta johtuva virhe (esim. vastauksen väärin kirjaaminen, vastaajan auttaminen) • Tutkijasta johtuva virhe (esim. huono tavoitteiden määrittely, väärä kohderyhmä, puutteet kyselylomakkeessa) • Vastaamattomuudesta johtuva virhe (tahallinen tai tahaton) • Tavoittamattomuudesta johtuva virhe • Vastaamattomuus ja tavoittamattomuus muodostaa kadon
Tilastoaineiston hankinta… • Kyselylomake • Tehdään, kun tutkimusongelma ja tietotarve on määritelty • Kysymyksessä kysytään VAIN yhtä asiaa • Vastausvaihtoehdot selkeitä • Lomake testataan (testikysely) ennen kyselyä • Käytetään sopivia kysymystyyppejä, huom. avointen kysymysten tulkinta tilastollisesti voi olla hankalaa • Lomakkeella voi olla jollakin tavalla koodattu tieto, joka kuvastaa vastaajaryhmää, vastaajan tietoja, jne... joita vastaaja ei osaa arvata (onko tullut kirje, että et ole vastannut kyselyymme, toivomme pikaista vastausta?) • Kysymysten määrä harkittava (laaja kysely aiheuttaa katoa) • Kyselyssä olisi hyvä näkyä aika, jonka kysely vie • Tietokonepohjaisissa kyselyissä olisi hyvä näkyä navigointi, missä vaiheessa vastaaja on • Kuvaa julkaisussasi, miten olet testannut, että kysely mittaa sitä asiaa, mitä on tarkoituskin mitata
Tilastoaineiston hankinta… Ei vastausohjetta Avoin kysymys Lisätietoja pyytävä, syventävä Kaksiarvoinen kysymys Kysymyksen muoto Suljettu kysymys Vaihtoehdot luetteleva suljettu kysymys Skaalattu kysymys ilman tulkintaa Skaalattu kysymys Skaalattu kysymys, jossa vaihtoehdot skaalattu verbaalisesti Kysymystyyppien ryhmittely
Harjoitus… • Harjoitus 1 • Perusjoukon koko on 1400 tilastoyksikköä ja siitä tehdään 150 :kpl:n otos systemaattisella otannalla. Määrää poimintaväli. • Perusjoukossa on 1860 nuorta, 2735 keski-ikäistä ja 1520 vanhusta. Kuinka monta henkilöä eri ikäryhmistä poimitaan 200 henkilön otokseen, kun käytetään ositettua otantaa ja suhteellista kiintiöintiä ? • Harjoitus 2 • Olet tekemässä tutkimusta opiskelijoiden opintomenestyksestä opiskelun aikana. Tutkimuksessa selvitetään, onko iällä, sukupuolella, tausta koulutuksella, opiskeluun käytettävällä ajalla (opiskelua tunteina / vko), • Mieti muuttujat ja muuttujien mitta-asteikot • Minkä tyyppisiä kysymyksiä tutkimukseesi tulee? • Harjoitus 3 • Avaa tutkimusdata ”ratsastuskoulu.xls”, tiedostossa on valmiina Excel-toteutus ratsastuskoulua käyvien henkilöiden otantatutkimukselle • Minkä tyyppisiä kysymykset ovat?