1 / 8

TYTUT21

TYTUT21. TUME II / Tilastollinen osuus Jakaumien tarkastelu Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008. Jakaumien tarkastelu…. Numeerisen datan lukeminen voi olla hankalaa, jos aineisto on laaja

flint
Download Presentation

TYTUT21

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TYTUT21 TUME II / Tilastollinen osuus Jakaumien tarkastelu Seppo Räsänen Savonia-amk Terveysala Kuopio Kevät 2008

  2. Jakaumien tarkastelu… • Numeerisen datan lukeminen voi olla hankalaa, jos aineisto on laaja • Datan ensimmäinen käsittely kannatta tehdä graafeilla ja taulukoilla  tieto on helpommin luettavassa muodossa • Tarkastelun avulla saa selville jo raa’an kuvan tuloksista sekä datan laatu on huomioitavissa • Tarkastelut ovat hyvin yksinkertaisia toteuttaa tietokoneohjelmilla • Tarkastelun tulokset ovat käyttökelpoista tietoa ja opinnäytteen/tutkimuksen raporttiin, esim. vastaajien lukumäärä, sukupuolijakaumat, luokitellut ikäjakaumat, koulutusohjelmien jakaumat • Jakaumat voivat olla suoria (lukumääriä) tai suhteellisia (prosenttiosuuksia) • Havainnollistamisessa voidaan tarkastella yhtä muuttujaa kerrallaan, luokitella muuttujien tietoa, taulukoida tai esittää muuttujien tietoja graafeina/kuvioina • N = koko populaatio, n = vastanneiden määrä

  3. Jakaumien tarkastelu… • Taulukot • Yhden muuttujan taulukko, yksiulotteinen taulukko, suora jakauma • Frekvenssijakaumaa (=esiintymiskertojen lukumäärä) esittävä taulukko • Suhteellista osuutta esittävä taulukko, jossa esim. frekvenssitiedoista lasketaan osuusprosentit muuttujan eri arvoille • Kumulatiivista (summafrekvenssi) tietoa esittävä taulukko kuvaa kyseisen arvon ja sitä edeltävien arvojen summaa • Luokitellut taulukot, jossa muuttujan data jaetaan luokkiin ja lasketaan luokkaan kuuluvien frekvenssejä (jatkuville arvoille tehtävä luokitus, vrt. esim. ikä, luokitus on tutkijan päätettävissä) • Kaksiulotteinen taulukko (ristiintaulukointi), jossa sarake ja rivi sisältävät omat muuttujat, soluun tulee kyseisen muuttujaparin frekvenssi tai suhteellinen osuus • Koostetaulukot sisältävät monen taulukon tiedot - yhteenveto • Huomioitavia asioita • Taulukon helppolukuisuus (selkeys) sen asian suhteen, jota taulukolla ensisijaisesti esitetään • Raportissa taulukkoteksti tulee ennen taulukkoa, lisäksi tekstissä on viittaus taulukkoon • Taulukkoteksti kuvaa taulukon sisällön (lukijan tulee ymmärtää, mitä taulukko esittää) • Taulukossa voidaan tiedot järjestää nousevasti tai laskevasti jonkun muuttujan suhteen • Joissakin tilanteissa suhteellinen osuus kuvaa paremmin • Muuttujastaan voidaan esittää frekvenssejä, suhteellisia osuuksia, kumulatiivista tietoa • Taulukon muotoilun avulla selkeytetään luentaa • Muuttujasta esitetään taulukossa yksikkötyyppi, esim. pituus (m) • Kieli – sama kuin raportissa

  4. Jakaumien tarkastelu… • Kuviot l. graafit l. diagrammit • Pylväs-, palkki-, viiva-, ympyrä-, piste-, pinta-, alue-, jne kaaviot, teemakartat (esim. flunssien esiintymien määrät eri väreillä Suomen kartalla) • Välitetään tietoa visuaalisesti, helpottaa vertailua, yleiskuva/yksityiskohtia, analysoitua tietoa • ”Hätävale, vale, emävale, tilasto” – huonosti laadittu diagrammi voi vääristää totuutta • Graafit tuovat mielikuvan asiasta nopeasti • Huomioitavia asioita • Kaavioiden akselit verrattavissa toisiin kaavioihin  pylvään pituus tuo tietyn mielikuvan ja sitä verrataan helposti toisen kaavion pylvääseen • Akselin nollakohdan valinta voi vääristää kaaviota • Kaavioita käytetään, kun vertailua tehdään usean tiedon suhteen. Kahden pylvään diagrammi ei ole hyvä • 3D-kaavio voi olla hankalalukuinen • Yksinkertainen on kaunista • Selite, tietotaulu, apuviivat, akseleiden selitteet, diagrammin otsake, jne selkeyttävät kaaviota • Asteikko tasavälinen, jotta luenta helpottuu • Laatueroasteikollinen (nominal) tieto palkkikaaviolla • Joissakin kaaviotyypeissä voidaan esittää useita muuttujia kerrallaan • Kaaviotyypin valinta tilanteen mukaisti • Tietojen esitysjärjestyksen mietintä • Arvoakselille ja luokka-akselille selitteet (esim. frekvensseissä arvoakselille f)

  5. Jakaumien tarkastelu… • Ristiintaulukointi • Ristiintaulukoinnin avulla saadaan 2D-taulukko, jossa voidaan vertailla vaikkapa kahden muuttujan eri kombinaatioiden eroja toisiinsa nähden • Nopea tapa saada aineistosta perustietoa • Auttaa päättämään, millaista jatkotutkimusta kannattaa tehdä • Auttaa näkemään, millaisia ilmiöitä aineistosta voi nousta

  6. Aputoimintoja • Etsi-toiminnon avulla voidaan tarkastella tietyn muuttujan arvoja • Lajittelun avulla saadaan tietyn muuttujan mukainen suuruusjärjestys  helpottaa datan tarkastelua joissakin tilanteissa • Osajoukon muodostamisen avulla voidaan tarkastella aineistosta tiettyjä, mielenkiintoisia tilastoyksikköjä • Havaintoarvojen painotuksen avulla voidaan mm. tunnuslukujen laskennoissa painottaa tietyn muuttujan mukaan, esim. kuntien asukasmääräinen painotus • Luokittelussa esim. jatkuvasta muuttujasta muodostetaan diskreetti muuttuja • Muuttujan arvojen kääntämisellä voidaan muuttaa negatiivisen kysymyksen suuntaa samaksi kuin muidenkin kysymysten • Laskutoimitusten avulla saadaan muuttujista luotua uusia muuttujia, esim. tulotaso on laskettu markkoina, niin laskennan avulla saadaan tulotaso muutettua euroiksi

  7. Harjoitus • Erilliset SPSS- ja Excel-ohjeet • Tutustu SPSS-ohjeisiin • Jos toteutus Excelillä, niin tutustu luettelon tekoon Excelissä • Harjoitus 1 (perustoimintoja, lajittelua, uusien muuttujien tekoa, suodatusta, jatkuvan datan luokittelua..) • Avaa ”kunnat2003.sav” tiedosto • Etsi Kuopio tilastoyksikkö ja tutustu samalla muuttujiin ja muihin tilastoyksiköihin • Korvaa Kaavin asukasluvuksi 3560 • Lajittele kunnat asukasmäärän mukaan suuruusjärjestykseen, monenneksiko suurin kunta on Kuopio asukasluvultaan? • Monenneksiko suurin on Siilinjärvi Muiden kuntatyyppien joukossa? • Laske Tulotasot euroiksi, uuden muuttujan nimi on Tulotaso_eur (1€ = 5,94573 mk) • Laske tulotason ja asukasmäärän tulona kunnan tulotaso • Muuta aineiston läänejä siten, että Oulun ja Lapin läänistä tuleekin Pohjois-Suomen lääni. Käytä uuden läänin koodina nroa 7. Tee muutos samaan muuttujaan kuin missä tieto on ollut alunperinkin • Monenneksiko suurin kunta Rovaniemi on nyt uudessa Pohjois-Suomen läänissä? • Tarkastele kunta-aineistossa vain kuntia, jotka kuuluvat uuteen Pohjois-Suomen lääniin, huomaa muiden havaintoyksiköiden näkyminen ja yliviivaus (filtterointi) • Muodosta uusi muuttuja, jossa luokittelet kunnat As.lukuRyhma-muuttujaan Asukkaat-muuttujan mukaan. (1=0…10000, 2=10001…100000, 3= >100000)

  8. Harjoitus • Harjoitus 2 (frekvenssitaulukot, ristiintaulukointi, kaaviot, Output-tiedon vienti Word-tekstiin) • Tee taulukko, jossa luetellaan läänit ja eri lääneihin kuuluvien kuntien määriä ja osuuksia (suorajakauma) • Tee vastaavasta kuntien määristä lääneittäin palkkidiagrammi (nominal-asteikollinen tieto esitetään palkkeina). Diagrammissa on lukumäärien kohdalla (Y-akseli) jakoviivat (grid) • Tee ristiintaulukoinnin avulla analyysi, jossa vertailet kuntien lukumääriä Lääni- ja Kuntamuoto-muuttujien avulla • Tee ristiintaulukoinnilla Lääni- ja Tyyppi-muuttujien avulla prosenttiosuuksien avulla vertailua, missä läänissä on suhteellisesti eniten maaseutumaisia tai kaupunkimaisia kuntia • Tee boxplot-tyyppinen kaavio, jossa kuvataan lääneittäin asukasluvun muutos (huomioi, mikä tieto tulee x-akselille ja mikä on muuttuja). Millä läänillä näyttäisi 2003 menevän parhaiten asukasluvun muutoksen suhteen? • Siirrä ensimmäisen kohdan taulukko Word-tekstiin. Miten raportissa kuvaisit taulukkotekstin? Testaa Wordissä Liitä määräten –toiminnon eri vaihtoehtoja, sillä liitetty tieto vaihtelee valintasi mukaan • Siirrä viimeisin boxplot-kaavio Word-raporttiin. Miten raportissa kuvaisit kuvatekstin?

More Related