140 likes | 275 Views
TYTILM1. Tilastolliset menetelmät MUITA TESTEJÄ JA NIIDEN MERKITYKSIÄ EXCEL-FUNKTIOITA Seppo Räsänen Savonia-amk Terveysala Kuopio Syksy 2005. Muita testejä ja merkityksiä. Ryhmien vertailu Esim. ”Onko tilastollisessa mielessä eri ryhmien keskiarvoilla eroa?”
E N D
TYTILM1 Tilastolliset menetelmät MUITA TESTEJÄ JA NIIDEN MERKITYKSIÄEXCEL-FUNKTIOITA Seppo Räsänen Savonia-amk Terveysala Kuopio Syksy 2005
Muita testejä ja merkityksiä • Ryhmien vertailu • Esim. ”Onko tilastollisessa mielessä eri ryhmien keskiarvoilla eroa?” • Ryhmien vertailussa verrataan ryhmää johonkin toiseen ryhmään, esim. verrokkiryhmään tai vaikkapa ennen testiä ja testin jälkeen ryhmään • Hypoteesit: • H0: ryhmillä ei ole eroja tilastollisessa mielessä • H1: ryhmillä on eroja tilastollisessa mielessä • Testaamismenetelmiä ovat: • ANOVA (varianssianalyysi) • T-testi • Mann-Whitneyn U-testi
Muita testejä ja merkityksiä • ANOVA • Vertaa ryhmien välisten keskiarvojen eroja (vaihtelun arvioinnissa käytetään variansseja, keskihajontojen neliötä) • Selittää, vaikuttaako koemuuttuja (selittävä muuttuja) selitettävän muuttujan käyttäytymisen eron • Selittävä muuttuja jaetaan ryhmiin • Edellytykset: • Muuttujan arvot ovat normaalisti jakautuneita (tai lähes normaalisti) • Otokset riippumattomia ja satunnaisia • Muuttujien varianssit (tai keskihajonnat) ovat yhtä suuria (tai lähes) eri ryhmissä !!!! • Vertailussa selitettävien muuttujien tulee olla Scale-asteikollinen (keskiarvon laskenta) ja selittävän muuttujan Nominal- tai Ordinal-asteikollinen (muodostettava ryhmiä) • Yksisuuntaisessa varianssianalyysissä (one-way analysis of variance) vertaillaan yhden selittävän muuttujan suhteen • Muita varianssianalyysejä ovat: kaksisuuntainen varianssianalyysi (vertailua tehdään kahden selittävän muuttujan suhteen), kovarianssianalyysi (yksi tai useampi selittävä muuttuja ja ne ovat scale-asteikkoa) ja monen muuttujan varianssianalyysi (vertaillaan useamman selittävän muuttujan suhteen)
Muita testejä ja merkityksiä • ANOVA • Vertailu tehdään p-arvon (sig-arvo) avulla, jos p-arvo on alle 0,05, niin silloin hylätään nollahypoteesi (=ryhmien välillä ei ole tilastollisessa mielessä eroa) • Analyse/Comrare Means/One-Way ANOVA • Esimerkki ratsastuskoulusta… onko sukupuolella eroa rat.koulun aloitusikään? • Levenen testin hypoteesit: • H0: variansseilla ei ole tilastollista eroa • H1: variansseilla on tilastollista ero
Muita testejä ja merkityksiä • T-Testi • Vertaa ryhmien välisten keskiarvojen eroja (vaihtelun arvioinnissa keskiarvon keskivirhettä) • Yksisuuntaisessa testissä verrataan onko yleensäkään kahdella ryhmällä eroja, kaksisuuntaisessa testataan myös eron lisäksi, että mihin suuntaan ero on • Edellytykset: • Satunnainen ja riippumaton otos • Vertailussa selitettävien muuttujien tulee olla Scale-asteikollinen (keskiarvon laskenta) ja selittävän muuttujan Nominal- tai Ordinal-asteikollinen (muodostettava ryhmiä) • Muuttujan arvot ovat normaalisti jakautuneita (tai lähes normaalisti) • Testissä vertaillaan ensin Levenen varianssi, josta päätellään Sig-arvon avulla, kumpaa hypoteesia luetaan • Toisena päättelynä tehdään p-arvon perusteella, onko ryhmillä eroa
Muita testejä ja merkityksiä • T-Testi • Analyse/Comrare Means/Independent-Samples T Test.. • Esimerkki ratsastuskoulusta… onko sukupuolella eroa rat.koulun aloitusikään?
Muita testejä ja merkityksiä • Mann-Whitneyn U-testi • Vertaa ryhmien välisten keskiarvojen eroja (perustuu havaintoarvojen järjestyslukuun muuttuja voi olla ORDINAL-asteikollinen) • Testaa kahden mediaanin eron tilastollista merkitsevyyttä • Tehokas testi, voi käyttää vaikkapa t-testin tilalla • Edellytykset: • Satunnaiset otokset • Mitattava muuttuja vähintään ordinal-asteikollinen • Perusjoukon jakaumat keskenään samanlaisia • Päättely tehdään jälleen kerran p-arvon perusteella
Muita testejä ja merkityksiä • Analyze/Nonpara-metric Tests/ 2 Independent Samples… • Onko sukupuolella merkitystä yleisarvosanaan?
Muita testejä ja merkityksiä • Reliabiliteetin määritys • Cronbachin Alfa -kerroin (mittaa ennen kaikkea mittarin yhtenäisyyttä) • Arvot välillä 0...1 (yli 0,6 kertoo hyvästä reliabilisuudesta) • Testauksessa määritetään ne muuttujat, jotka heikentävät testiä • Heikentävät muuttujat poistetaan jatkotarkasteluista • Reliabiliteettianalyysissä on tarkasteltavat muuttujat analyysituloksesta luetaan korrelaatiot sekä Alpha-arvot • Korrelaatio kertoo, miten selittävä ko. muuttuja on • Alpha-arvo kertoo, millainen on selittävyys, jos muuttuja jätetään pois kyseisen muuttuja Alpha-arvoa verrataan koko aineiston Alpha-arvoon. • Voidaan käyttää myös summamuuttujien testaamiseen (summamuuttujat voidaan valita faktorianalyysin avulla)
Muita testejä ja merkityksiä • Reliabiliteetin määritys • Analyze/Scale/Relia-bility Analysis • Mittaavatko ratsastuskoulun Opetustunnit …. Arvosana samaa asiaa?
Muita testejä ja merkityksiä • Riippuvuustestit • Testaa, että onko muuttujilla keskinäistä riippuvuutta • Selvittää kahden muuttujan riippumattomuuden, muttei laatua (syy – seuraus) • Luokitteluasteikolle Χ2-testi (khii toiseen testi), testaa nominal-asteikon riippuvuuden • Järjestysasteikon muuttujille Speamanin korrelaatio • Välimatka-asteikon muuttujalle Pearsonin korrelaatio • Käsitelty aiemmilla luennoilla!!
Muita testejä ja merkityksiä • Ryhmittely • Ryhmittelyn avulla selvitetään, mitkä muuttujat muodostavat piilorakenteita • Ryhmittely tehdään faktorianalyysin avulla • Faktori on uusi muuttuja, johon yksittäiset muuttujat latautuvat • Latautumista kuvaa korrelaatioarvot • Kun faktori saadaan selville, katsotaan muuttujien sisällön perusteella, onko piilorakenne järkevä • Faktorianalyysillä saadaan siis selville latentit (piilo) muuttujat • Faktorianalyysissä saatuja latentteja muuttujia voidaan käyttää hyväksi vaikkapa summamuuttujissa, jotka mittaavat samaa asiaa • Summamuuttujien korrelaatioiden avulla voidaan selvittää, onko latenteilla muuttujilla riippuvuuksia
Muita testejä ja merkityksiä • Normaalijakauman testaaminen • Vinous + diagrammi, huipukkuus • Histogrammi, jossa normaalijakauman käyrä • -2 ≤ Vinous / keskivirhe ≤ 2 jakauma symmetrinen • Kolmogorov-Smirnov:n testi mittaa muuttujan normaalisti jakautumista • Pienellä otoskoolla konservatiivinen ei hylkää helposti H0:aa • Tulkinta tehdään p-arvon perusteella - H0: Jakauma ei poikkea normaalista - H1: Jakauma poikkeaa normaalista • Analyze/Nonparametric Tests / 1 Sample K-S
Muita testejä ja merkityksiä • Muutamia tarpeellisia Excel-funktioita (kts. käyttö ohjeista) • Lukumäärä =laske(), =laske.jos() • Pienin =min() • Suurin =maks() • Keskiarvo =keskiarvo() • Korrelaatio =korrelaatio() • Varianssi =varp(), var() • Vaihteluväli =maks()-min() • Kvartiili =neljännes() • Vinous =jakauman.vinous() • Huipukkuus =kurt() • Keskihajonta =keskihajonta(), keskihajontap() • Moodi =moodi() • Mediaani =mediaani() • Normaalijakauma =norm.jakauma() • T-testi =ttesti() • Lineaarinen regressio =linregr() • Luottamusväli =luottamusväli() • Jne… • Apuohjelmissa on Analyysityökalut, joilla voi tehdä tilastollista päättelyä Tietojen analysointi –toiminnon avulla • Diagrammit ovat Excelissä helposti toteutettavissa ja ne ovat laajat • Omien kaavojen avulla voi laskea lisää eri tilastollisia arvoja