80 likes | 226 Views
TYTUT21. TUME II / Tilastollinen osuus Jakaumien tarkastelu Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008. Jakaumien tarkastelu…. Numeerisen datan lukeminen voi olla hankalaa, jos aineisto on laaja
E N D
TYTUT21 TUME II / Tilastollinen osuus Jakaumien tarkastelu Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008
Jakaumien tarkastelu… • Numeerisen datan lukeminen voi olla hankalaa, jos aineisto on laaja • Datan ensimmäinen käsittely kannatta tehdä graafeilla ja taulukoilla tieto on helpommin luettavassa muodossa • Tarkastelun avulla saa selville jo raa’an kuvan tuloksista sekä datan laatu on huomioitavissa • Tarkastelut ovat hyvin yksinkertaisia toteuttaa tietokoneohjelmilla • Tarkastelun tulokset ovat käyttökelpoista tietoa ja opinnäytteen/tutkimuksen raporttiin, esim. vastaajien lukumäärä, sukupuolijakaumat, luokitellut ikäjakaumat, koulutusohjelmien jakaumat • Jakaumat voivat olla suoria (lukumääriä) tai suhteellisia (prosenttiosuuksia) • Havainnollistamisessa voidaan tarkastella yhtä muuttujaa kerrallaan, luokitella muuttujien tietoa, taulukoida tai esittää muuttujien tietoja graafeina/kuvioina • N = koko populaatio, n = vastanneiden määrä
Jakaumien tarkastelu… • Taulukot • Yhden muuttujan taulukko, yksiulotteinen taulukko, suora jakauma • Frekvenssijakaumaa (=esiintymiskertojen lukumäärä) esittävä taulukko • Suhteellista osuutta esittävä taulukko, jossa esim. frekvenssitiedoista lasketaan osuusprosentit muuttujan eri arvoille • Kumulatiivista (summafrekvenssi) tietoa esittävä taulukko kuvaa kyseisen arvon ja sitä edeltävien arvojen summaa • Luokitellut taulukot, jossa muuttujan data jaetaan luokkiin ja lasketaan luokkaan kuuluvien frekvenssejä (jatkuville arvoille tehtävä luokitus, vrt. esim. ikä, luokitus on tutkijan päätettävissä) • Kaksiulotteinen taulukko (ristiintaulukointi), jossa sarake ja rivi sisältävät omat muuttujat, soluun tulee kyseisen muuttujaparin frekvenssi tai suhteellinen osuus • Koostetaulukot sisältävät monen taulukon tiedot - yhteenveto • Huomioitavia asioita • Taulukon helppolukuisuus (selkeys) sen asian suhteen, jota taulukolla ensisijaisesti esitetään • Raportissa taulukkoteksti tulee ennen taulukkoa, lisäksi tekstissä on viittaus taulukkoon • Taulukkoteksti kuvaa taulukon sisällön (lukijan tulee ymmärtää, mitä taulukko esittää) • Taulukossa voidaan tiedot järjestää nousevasti tai laskevasti jonkun muuttujan suhteen • Joissakin tilanteissa suhteellinen osuus kuvaa paremmin • Muuttujastaan voidaan esittää frekvenssejä, suhteellisia osuuksia, kumulatiivista tietoa • Taulukon muotoilun avulla selkeytetään luentaa • Muuttujasta esitetään taulukossa yksikkötyyppi, esim. pituus (m) • Kieli – sama kuin raportissa
Jakaumien tarkastelu… • Kuviot l. graafit l. diagrammit • Pylväs-, palkki-, viiva-, ympyrä-, piste-, pinta-, alue-, jne kaaviot, teemakartat (esim. flunssien esiintymien määrät eri väreillä Suomen kartalla) • Välitetään tietoa visuaalisesti, helpottaa vertailua, yleiskuva/yksityiskohtia, analysoitua tietoa • ”Hätävale, vale, emävale, tilasto” – huonosti laadittu diagrammi voi vääristää totuutta • Graafit tuovat mielikuvan asiasta nopeasti • Huomioitavia asioita • Kaavioiden akselit verrattavissa toisiin kaavioihin pylvään pituus tuo tietyn mielikuvan ja sitä verrataan helposti toisen kaavion pylvääseen • Akselin nollakohdan valinta voi vääristää kaaviota • Kaavioita käytetään, kun vertailua tehdään usean tiedon suhteen. Kahden pylvään diagrammi ei ole hyvä • 3D-kaavio voi olla hankalalukuinen • Yksinkertainen on kaunista • Selite, tietotaulu, apuviivat, akseleiden selitteet, diagrammin otsake, jne selkeyttävät kaaviota • Asteikko tasavälinen, jotta luenta helpottuu • Laatueroasteikollinen (nominal) tieto palkkikaaviolla • Joissakin kaaviotyypeissä voidaan esittää useita muuttujia kerrallaan • Kaaviotyypin valinta tilanteen mukaisti • Tietojen esitysjärjestyksen mietintä • Arvoakselille ja luokka-akselille selitteet (esim. frekvensseissä arvoakselille f)
Jakaumien tarkastelu… • Ristiintaulukointi • Ristiintaulukoinnin avulla saadaan 2D-taulukko, jossa voidaan vertailla vaikkapa kahden muuttujan eri kombinaatioiden eroja toisiinsa nähden • Nopea tapa saada aineistosta perustietoa • Auttaa päättämään, millaista jatkotutkimusta kannattaa tehdä • Auttaa näkemään, millaisia ilmiöitä aineistosta voi nousta
Aputoimintoja • Etsi-toiminnon avulla voidaan tarkastella tietyn muuttujan arvoja • Lajittelun avulla saadaan tietyn muuttujan mukainen suuruusjärjestys helpottaa datan tarkastelua joissakin tilanteissa • Osajoukon muodostamisen avulla voidaan tarkastella aineistosta tiettyjä, mielenkiintoisia tilastoyksikköjä • Havaintoarvojen painotuksen avulla voidaan mm. tunnuslukujen laskennoissa painottaa tietyn muuttujan mukaan, esim. kuntien asukasmääräinen painotus • Luokittelussa esim. jatkuvasta muuttujasta muodostetaan diskreetti muuttuja • Muuttujan arvojen kääntämisellä voidaan muuttaa negatiivisen kysymyksen suuntaa samaksi kuin muidenkin kysymysten • Laskutoimitusten avulla saadaan muuttujista luotua uusia muuttujia, esim. tulotaso on laskettu markkoina, niin laskennan avulla saadaan tulotaso muutettua euroiksi
Harjoitus • Erilliset SPSS- ja Excel-ohjeet • Tutustu SPSS-ohjeisiin • Jos toteutus Excelillä, niin tutustu luettelon tekoon Excelissä • Harjoitus 1 (perustoimintoja, lajittelua, uusien muuttujien tekoa, suodatusta, jatkuvan datan luokittelua..) • Avaa ”kunnat2003.sav” tiedosto • Etsi Kuopio tilastoyksikkö ja tutustu samalla muuttujiin ja muihin tilastoyksiköihin • Korvaa Kaavin asukasluvuksi 3560 • Lajittele kunnat asukasmäärän mukaan suuruusjärjestykseen, monenneksiko suurin kunta on Kuopio asukasluvultaan? • Monenneksiko suurin on Siilinjärvi Muiden kuntatyyppien joukossa? • Laske Tulotasot euroiksi, uuden muuttujan nimi on Tulotaso_eur (1€ = 5,94573 mk) • Laske tulotason ja asukasmäärän tulona kunnan tulotaso • Muuta aineiston läänejä siten, että Oulun ja Lapin läänistä tuleekin Pohjois-Suomen lääni. Käytä uuden läänin koodina nroa 7. Tee muutos samaan muuttujaan kuin missä tieto on ollut alunperinkin • Monenneksiko suurin kunta Rovaniemi on nyt uudessa Pohjois-Suomen läänissä? • Tarkastele kunta-aineistossa vain kuntia, jotka kuuluvat uuteen Pohjois-Suomen lääniin, huomaa muiden havaintoyksiköiden näkyminen ja yliviivaus (filtterointi) • Muodosta uusi muuttuja, jossa luokittelet kunnat As.lukuRyhma-muuttujaan Asukkaat-muuttujan mukaan. (1=0…10000, 2=10001…100000, 3= >100000)
Harjoitus • Harjoitus 2 (frekvenssitaulukot, ristiintaulukointi, kaaviot, Output-tiedon vienti Word-tekstiin) • Tee taulukko, jossa luetellaan läänit ja eri lääneihin kuuluvien kuntien määriä ja osuuksia (suorajakauma) • Tee vastaavasta kuntien määristä lääneittäin palkkidiagrammi (nominal-asteikollinen tieto esitetään palkkeina). Diagrammissa on lukumäärien kohdalla (Y-akseli) jakoviivat (grid) • Tee ristiintaulukoinnin avulla analyysi, jossa vertailet kuntien lukumääriä Lääni- ja Kuntamuoto-muuttujien avulla • Tee ristiintaulukoinnilla Lääni- ja Tyyppi-muuttujien avulla prosenttiosuuksien avulla vertailua, missä läänissä on suhteellisesti eniten maaseutumaisia tai kaupunkimaisia kuntia • Tee boxplot-tyyppinen kaavio, jossa kuvataan lääneittäin asukasluvun muutos (huomioi, mikä tieto tulee x-akselille ja mikä on muuttuja). Millä läänillä näyttäisi 2003 menevän parhaiten asukasluvun muutoksen suhteen? • Siirrä ensimmäisen kohdan taulukko Word-tekstiin. Miten raportissa kuvaisit taulukkotekstin? Testaa Wordissä Liitä määräten –toiminnon eri vaihtoehtoja, sillä liitetty tieto vaihtelee valintasi mukaan • Siirrä viimeisin boxplot-kaavio Word-raporttiin. Miten raportissa kuvaisit kuvatekstin?