1 / 27

Introduksjon til statistikk

Introduksjon til statistikk. 21.08.2006 Knut Reidar Wangen Statistisk sentralbyrå ( krw@ssb.no ) Institutt for helseledelse og helseøkonomi ( k.r.wangen@medisin.uio.no ) Trefftid: Mandager. Avtale per e-post. Noen praktiske ting først:. Web-side for kurs:.

eben
Download Presentation

Introduksjon til statistikk

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Introduksjon til statistikk 21.08.2006 Knut Reidar Wangen Statistisk sentralbyrå (krw@ssb.no) Institutt for helseledelse og helseøkonomi (k.r.wangen@medisin.uio.no) Trefftid: Mandager. Avtale per e-post

  2. Noen praktiske ting først: Web-side for kurs: • (http://www.uio.no/studier/emner/medisin/helseadm/HSTAT1101/h06) • Detaljert undervisningsplan • Opplysning om viktige datoer (prøveeksamen, eksamen…) • Beskjeder (for eksempel avlyst undervisning…)

  3. Pensum/lærekrav: • Aalen, O.O. et al.: Statistiske metoder i medisin og helsefag. 2006. Gyldendal. • Pensum er endret. Tidligere utgave var Aalen, O.O.: Innføring i statistikk, 2. utgave. 1998. Gyldendal. • ”Pensum er også annet stoff som gjennomgås i forelesninger og øvelser. Utskrifter fra statistikkprogrammet SPSS må kunne fortolkes innenfor de rammene som er gitt i undervisningen.”

  4. Undervisning: • Forelesninger: Mandag 09:15-11:00, Harald Schjeledrups hus, seminarrom 1 • Seminar/PC-øvinger: Mandag 14:15-16:00. • Seminar holdes i Harald Schjelderups hus, seminarrom 1 • PC-øvinger holdes i Domus Medica, PC-stue i 2. etasje. (Sjekk detaljert undervisningsplan på kurssiden!) • OBS! Ingen undervisning uke 39 (25. september)

  5. Prøveeksamen • Deles ut på forelesning 30. oktober • Innlevering før 6. november kl. 11:00 • Gjennomgang 13. november på seminar • Eksamen 11. desember

  6. Introduksjon • Hvorfor bør (må?) dere lære statistikk? • Statistikk brukes i mange fag: Medisin, økonomi, fysikk, kjemi, biologi, sosiologi, kryptografi, språkvitenskap, arkeologi osv. • Vi overøses med statistikk eller forskning basert på statistikk • ”Norge er det eneste landet i verden som aldri har tapt mot Brasil i fotball” (16. august 2006, Fotballkommentator) • ”4.660.000 bor nå i landet” (17. august 2006, Aftenposten/SSB) • ”Nå er også hvitvin sunt” (17. august 2006, Aftenposten/Forskning.no) • ”Selvdisiplin gir gode karakterer”. Betydningen av selvdisiplin var dobbelt så stor som betydningen av elevenes intelligens for eksamensresultatet… (17. august 2006, Aftenposten/Amerikansk studie, ca 300 barn 14-15 år)

  7. Hva er bra med statistikk? • Kan forenkle en kompleks datasituasjon (for oss selv eller andre). Datareduksjon • Kan gi bedre forståelse av beslutningsproblemer med usikkerhet • Motvekt til overtro. Eks: Hvis myntknipsing gir kron 5 ganger på rad – hva er sannsynligheten for å få kron neste gang?

  8. Deskriptiv/beskrivende statistikk • Mål: Summere opp data. Redusere datamengden. Rendyrke relevant info • ”Nøkkeltall” og tabeller. Eks: Gjennomsnitt, maksimum, minimum, standardavvik, … • Grafikk. Eks: Histogram, plot, tidsserier,…

  9. Eksempel på datareduksjon • Originaldata:

  10. Oppsummering av data:

  11. Visualisering (hyppighet):

  12. Visualisering (Kummulativ relativ hyppighet):

  13. Hva er det typiske i et datasett? Mål for sentrum • Gjennomsnitt • Median • Faktisk midterste verdi hvis antall observasjoner er et oddetall • Hvis antall observasjoner er et partall, så er det gjennomsnittet av de to midterste

  14. Gjennomsnitt versus median • Avhenger av form på fordeling. Eks: ”tung” høyre hale gir Gjennomsnitt < Median • Median mindre følsom for ekstreme obs. • Formål kan avgjøre relevans

  15. Variasjonen i en fordeling. Spredningsmål • Eks: 2 fordelinger, likt gjennomsnitt, ulik spredning • Empirisk varians • Empirisk standardavvik

  16. Range. Avstand mellom maksimum og minimum • Avstand mellom fraktiler • En fraktil angir et nivå slik at en gitt fraksjon av data har verdier under dette nivået • Eks. Median er 50% persentilen • 60% persentilen er nivået som 60% av data ligger under • Første kvartil er det nivået som 25% av data ligger under • Eks: Avstand mellom 10% og 90% fraktilene

  17. Grupperte (kontinuerlige) data • Når man ikke har tilgang til opprinnelige data • Eks: Individuelle data er sensitive og upublisert, mens gruppegjennomsnitt er tilgjengelig • Eks: Individer kan være uvillige eller ute av stand til å svare eksakt, men villige/i stand til å opplyse om intervall (inntekt, alder?)

  18. Gruppert gjennomsnitt

  19. Gruppert empirisk varians/standardavvik • Gruppert median

  20. Kategoriske data • Gruppering av observasjoner uten naturlig gitt ordning • Søylediagram • Kakediagram

  21. Tidsserier • Plot av en (eller flere) variable over tid

  22. Sammenligning av grupper

  23. Beskrivelse av samvariasjon

  24. Årsakssammenheng?

More Related