1 / 14

tilastollinen todennäköisyys

tilastollinen todennäköisyys. tilastollinen todennäköisyys on luku, jota suhteellinen frekvenssi lähestyy (esimerkiksi harhaton rahanheitto) klassinen todennäköisyys äärellinen määrä tulosvaihtoehtoja esiintymismahdollisuudet yhtä suuria

tex
Download Presentation

tilastollinen todennäköisyys

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. tilastollinen todennäköisyys • tilastollinen todennäköisyys on luku, jota suhteellinen frekvenssi lähestyy (esimerkiksi harhaton rahanheitto) • klassinen todennäköisyys • äärellinen määrä tulosvaihtoehtoja • esiintymismahdollisuudet yhtä suuria • liittyy esim. tilastollisten testien kysymyksenasetteluun

  2. tilastollinen todennäköisyys • ehdollinen todennäköisyys • tieto jonkin tapahtuman esiintymisestä muuttaa siitä riippuvien tapahtumien todennäköisyyksiä • tilastollinen riippuvuus • tapahtumat ovat riippumattomia mikäli tieto tapahtuman B esiintymisestä ei vaikuta tapahtuman A todennäköisyyteen

  3. normaalijakauma • Normaalijakauma (= kellokäyrä = Gaussin käyrä) • kuvaa usein hyvin havaintojen jakaumaa tilanteissa, joissa muuttuja on useiden osatekijöiden summa • käyrä on teoreettinen malli havaintojen jakautumiselle • tilastotieteen tärkein jakauma • havaintoaineistosta tehdyt otokset approksimoivat usein normaalijakaumaa

  4. normaalijakauma • normaalijakauma voidaan kuvata lyhyesti yhtälöllä: N(μ, σ2)μ = odotusarvo σ = hajonta • käytännön tilanteissa odotusarvoa (μ) kannattaa approksimoida aritmeettisella keskiarvolla • teorettiisen jakauman arviointia kutsutaan estimoinniksi • keskiarvo ja hajonta kuvaavat havaintoarvojen jakaumaa sitä paremmin, mitä paremmin normaalijakauma approksimoi havaintoaineiston jakaumaa

  5. normaalijakauma • normaalijakauman ominaisuuksia: • kuvaaja yksihuippuinen; maksimiarvo pisteessä x=μ • symmetrinen, “kirkonkellon” muotoinen sivukuva • odotusarvon (μ)ympärillä kupera ulospäin • pisteissä (μ-σ) ja (μ+σ) käännepisteet • saa posititvisia arvoja kaikille x:n arvoille • kuvaajan ja vaaka-akselin pinta-ala = 1

  6. normaalijakauma • kaikille normaalijakaumille pätee: • 68% kuvaajan ja vaaka-akselin välisestä pinta-alasta välillä (μ-σ), (μ+σ) • 95% pinta-alasta välillä (μ-2σ), (μ+2σ) • 99.7%pinta-alasta välillä (μ-3σ), (μ+3σ) • standardoitu normaalijakauma esitetaään kaavalla: z = x –μ σ

  7. normaalijakauma • Normaalijakauman pinta-ala on keskeinen tekijä todennäköisyyksiä (0-1) arvioitaessa • aikaisemmin käytettiin valmiita taulukoita • nykyisin tilastolaskentaohjelmat antavat suoraan halutut pinta-alat • standardoitu normaalijakauma • kertoo kuinka monta havainnon mittaa havaintoarvo poikkeaa kaikkien havaintojen keskiarvosta

  8. normaalijakauma… z = xi –xxi = muuttujan havaitut arvot six = keskiarvo si = hajonnat • Esimerkki: onko vainaja A (196 cm) poikkeuksellisen pitkä (keskiarvo 180 cm, hajonta 5 cm)? z = xi –x = 196-180 = 3.2 sx 5 Vastaus: vainaja A on poikkeaa yli kolmen hajonnan verran pituuksien keskiarvosta (vähemmän kuin 0.3 % havaintoaineiston vainajista on yhtä pitkiä tai pitempiä)

  9. otanta • otanta • populaatiosta kerätään joukko yksilöitä analyysiä varten • otoksen riippumattomuus tärkeää • satunnaisvalinnan toteuttaminen oleellista • usein noudatetaan jotain otantakehikkoa • voi olla joko “täydellinen” tai “epätäydellinen”

  10. otanta otanta äärellisestä populaatiosta • yksinkertainen (umpimähkäinen) satunnaisotanta (simple random sampling) • populaatio muodostuu N havainnosta, josta otetaan kokoa n oleva yksinkertainen satunnaisotanta • jokaisella n:n kokoisella osajoukolla on sama todennäköisyys muodostaa otos • Esim. satunnaisotanta Suomen kunnista

  11. otanta • Ositettu otanta (stratified sampling) • kokoa N oleva populaatio jaetaan ennakkotiedon perusteella m ositteeseen (strata), joiden koot ovat N1, N2,…Nm • kussakin ositteessa sovelletaan yksinkertaista satunnaisotantaa • pyritään mahdollisimman homogeenisiin ryhmiin • Esim. Suomen kunnat kannattaa jakaa ensin kaupunkeihin ja muihin kuntiin

  12. otanta • Systemaattinen otanta (systematic sampling) • kokoa N olevan populaation alkiot numeroidaan ja järjestetään • otoksiksi valitaan tasavälisesti joka k:s havainto • ensimmäinen havainto valitaan satunnaisesti ensimmäisen k havainnon joukosta • Esim. 70 henkilön populaatio (järjestetty painon mukaan pienimmästä suurimpaan); valitaan 7 hengen otos; ensimmäinen umpimähkäisesti valittu havainto (henkilö) on nro 5: seuraavat ovat: 15, 25, 35, 45, 55, 65

  13. otanta • Ryväsotanta (cluster sampling) • otosyksiköt muodostavat ryhmiä eli rypäitä • poimitaan umpimähkäinen otos rypäiden muodostamasta perusjoukosta • kaikkiin rypääseen kuuluvuun otosyksiköihin kohdistetaan tutkimukseen kuuluvat mittaukset • esim. perheet muodostavat rypään • haastattelija haastattelee kaikki perheen jäsenet samalla kertaa

More Related