140 likes | 315 Views
tilastollinen todennäköisyys. tilastollinen todennäköisyys on luku, jota suhteellinen frekvenssi lähestyy (esimerkiksi harhaton rahanheitto) klassinen todennäköisyys äärellinen määrä tulosvaihtoehtoja esiintymismahdollisuudet yhtä suuria
E N D
tilastollinen todennäköisyys • tilastollinen todennäköisyys on luku, jota suhteellinen frekvenssi lähestyy (esimerkiksi harhaton rahanheitto) • klassinen todennäköisyys • äärellinen määrä tulosvaihtoehtoja • esiintymismahdollisuudet yhtä suuria • liittyy esim. tilastollisten testien kysymyksenasetteluun
tilastollinen todennäköisyys • ehdollinen todennäköisyys • tieto jonkin tapahtuman esiintymisestä muuttaa siitä riippuvien tapahtumien todennäköisyyksiä • tilastollinen riippuvuus • tapahtumat ovat riippumattomia mikäli tieto tapahtuman B esiintymisestä ei vaikuta tapahtuman A todennäköisyyteen
normaalijakauma • Normaalijakauma (= kellokäyrä = Gaussin käyrä) • kuvaa usein hyvin havaintojen jakaumaa tilanteissa, joissa muuttuja on useiden osatekijöiden summa • käyrä on teoreettinen malli havaintojen jakautumiselle • tilastotieteen tärkein jakauma • havaintoaineistosta tehdyt otokset approksimoivat usein normaalijakaumaa
normaalijakauma • normaalijakauma voidaan kuvata lyhyesti yhtälöllä: N(μ, σ2)μ = odotusarvo σ = hajonta • käytännön tilanteissa odotusarvoa (μ) kannattaa approksimoida aritmeettisella keskiarvolla • teorettiisen jakauman arviointia kutsutaan estimoinniksi • keskiarvo ja hajonta kuvaavat havaintoarvojen jakaumaa sitä paremmin, mitä paremmin normaalijakauma approksimoi havaintoaineiston jakaumaa
normaalijakauma • normaalijakauman ominaisuuksia: • kuvaaja yksihuippuinen; maksimiarvo pisteessä x=μ • symmetrinen, “kirkonkellon” muotoinen sivukuva • odotusarvon (μ)ympärillä kupera ulospäin • pisteissä (μ-σ) ja (μ+σ) käännepisteet • saa posititvisia arvoja kaikille x:n arvoille • kuvaajan ja vaaka-akselin pinta-ala = 1
normaalijakauma • kaikille normaalijakaumille pätee: • 68% kuvaajan ja vaaka-akselin välisestä pinta-alasta välillä (μ-σ), (μ+σ) • 95% pinta-alasta välillä (μ-2σ), (μ+2σ) • 99.7%pinta-alasta välillä (μ-3σ), (μ+3σ) • standardoitu normaalijakauma esitetaään kaavalla: z = x –μ σ
normaalijakauma • Normaalijakauman pinta-ala on keskeinen tekijä todennäköisyyksiä (0-1) arvioitaessa • aikaisemmin käytettiin valmiita taulukoita • nykyisin tilastolaskentaohjelmat antavat suoraan halutut pinta-alat • standardoitu normaalijakauma • kertoo kuinka monta havainnon mittaa havaintoarvo poikkeaa kaikkien havaintojen keskiarvosta
normaalijakauma… z = xi –xxi = muuttujan havaitut arvot six = keskiarvo si = hajonnat • Esimerkki: onko vainaja A (196 cm) poikkeuksellisen pitkä (keskiarvo 180 cm, hajonta 5 cm)? z = xi –x = 196-180 = 3.2 sx 5 Vastaus: vainaja A on poikkeaa yli kolmen hajonnan verran pituuksien keskiarvosta (vähemmän kuin 0.3 % havaintoaineiston vainajista on yhtä pitkiä tai pitempiä)
otanta • otanta • populaatiosta kerätään joukko yksilöitä analyysiä varten • otoksen riippumattomuus tärkeää • satunnaisvalinnan toteuttaminen oleellista • usein noudatetaan jotain otantakehikkoa • voi olla joko “täydellinen” tai “epätäydellinen”
otanta otanta äärellisestä populaatiosta • yksinkertainen (umpimähkäinen) satunnaisotanta (simple random sampling) • populaatio muodostuu N havainnosta, josta otetaan kokoa n oleva yksinkertainen satunnaisotanta • jokaisella n:n kokoisella osajoukolla on sama todennäköisyys muodostaa otos • Esim. satunnaisotanta Suomen kunnista
otanta • Ositettu otanta (stratified sampling) • kokoa N oleva populaatio jaetaan ennakkotiedon perusteella m ositteeseen (strata), joiden koot ovat N1, N2,…Nm • kussakin ositteessa sovelletaan yksinkertaista satunnaisotantaa • pyritään mahdollisimman homogeenisiin ryhmiin • Esim. Suomen kunnat kannattaa jakaa ensin kaupunkeihin ja muihin kuntiin
otanta • Systemaattinen otanta (systematic sampling) • kokoa N olevan populaation alkiot numeroidaan ja järjestetään • otoksiksi valitaan tasavälisesti joka k:s havainto • ensimmäinen havainto valitaan satunnaisesti ensimmäisen k havainnon joukosta • Esim. 70 henkilön populaatio (järjestetty painon mukaan pienimmästä suurimpaan); valitaan 7 hengen otos; ensimmäinen umpimähkäisesti valittu havainto (henkilö) on nro 5: seuraavat ovat: 15, 25, 35, 45, 55, 65
otanta • Ryväsotanta (cluster sampling) • otosyksiköt muodostavat ryhmiä eli rypäitä • poimitaan umpimähkäinen otos rypäiden muodostamasta perusjoukosta • kaikkiin rypääseen kuuluvuun otosyksiköihin kohdistetaan tutkimukseen kuuluvat mittaukset • esim. perheet muodostavat rypään • haastattelija haastattelee kaikki perheen jäsenet samalla kertaa