600 likes | 801 Views
Tall kan temmes! Om brukervennlig formidling av statistikk. Jan Erik Kristiansen – september 2007 jkr@ssb.no. Det er noget fint og forstandigt ved tal. De véd hvad de vil og de gør, hvad de skal. Piet Hein. Statistikk er. … å sammenlikne tall
E N D
Tall kan temmes! Om brukervennlig formidling av statistikk Jan Erik Kristiansen – september 2007 jkr@ssb.no
Det er noget fint og forstandigt ved tal. De véd hvad de vil og de gør, hvad de skal. Piet Hein
Statistikk er... • … å sammenlikne tall • … og: Å sørge for at tallene er (mest mulig) sammenliknbare • Misbruk/feil bruk av statistikk skyldes bare sjelden bevisst manipulasjon av tallene, men er langt oftere et resultat av at vi sammenlikner tall som ikke er (helt) sammenliknbare
DATA: Hansen: 230 000 Jensen: 310 000 Olsen: 258 500 etc. STATISTIKK: Gjennomsnittsinntekt: 263 400 Kvinner: 247 500 Menn: 276 400 Data vs. statistikk: Statistikk beskriver grupper, ikke enkeltindivider
Definisjoner Sammenlikning: - Tabeller - Diagrammer - Analyser Data om: - Personer - Husholdninger - Bedrifter Datainnsamling: - Telling - Utvalg - Register Bearbeiding: - Koding - Kontroll - Klassifisering - Beregninger Ulike feilkilder Fra data til statistikk:Skjematisk framstilling av statistikkproduksjonen Statistikk er altså en sosial konstruksjon og er ikke uberørt av menneskehender
Datainnsamling (”datafangst”)? eller ... Datakonstruksjon?
Definisjoner er viktig! Eksempel: Andelen fattige/med lav inntekt
Definisjoner er viktig: (forts) Eksempel ”Innvandrer”: • 1. generasjon: 289 000 • 1. + 2. generasjon: 349 000 • ”Med innvandringsbakgrunn” 575 000 Flere eksempler: ”Ferietur” ”Arbeidsledighet” ”Samboer” ”Trafikkulykke” ”Flypassasjer” Statistikk er altså en sosial konstruksjon og ikke uberørt av menneskehender
Enhet: (forts) Andel enslige: 38% av husholdningene = 17 prosent av alle personer Eksempel: 4 husholdninger:A:1 person B: 2 personer C: 2 personer D: 3 personer Sum: 8 personer Dvs.: Enslige = 25% av husholdn./13% av personene
Enhet: (forts) Tilsvarende: Personer og ekteskap "Hver fjerde gifter seg med utlending" (Aftenposten 20/11 2002) Fire inngåtte ekteskap, hvorav ett med utlending = 25 prosent Sju nordmenn inngår ekteskap, hvorav en med utlending = 14 prosent
Vanskelig å tolke statistikk uten sammenlikningsgrunnlag: F.eks. • 244 døde i trafikken • 10 245 skilsmisser • 72 prosent barnehagedekning i Namsos • 467 000 kvinner hadde høyere utd. i 2005
2 hovedtyper sammenlikninger Forbruk av melk og mineralvann per person per år. Liter • Utvikling over tid • Sammenlikning av grupper (kjønn, alder, bosted...) Gjerne både – og:
Sammenlikning:Gjerne både - og Boligareal: Nye boliger og fritidshus
Flere begreper • Relative tall • Prosent • Forholdstall (elever pr. lærer, elever pr. PC) • Rater: pr. 1 000 innb., skilsmissehyppighet • Indekser • Absolutte tall • Antall (personer, husholdn, bedrifter, trafikkulykker, aborter, ekteskapsinngåelser, etc.) • Kroner • Mengder: Liter, kg., tonn Når bruke relative tall og absolutte tall?
Relative tall, men hvilke? • Pr. 100 000 innb. • Pr. 100 000 biler • Pr. xxx kjørte km • Døde i trafikken • Pr. 1 000 kvinner 15-49 år • Aldersspesifikke rater • Samlet aborttall • Som andel av alle fødsler/graviditeter • Ant. aborter
Praktiske prosenter • Én av flere måter å gjøre det lettere å sammenlikne ulike tallstørrelser på • To typer prosenter • Prosentandeler; viser fordeling eller forholdet mellom deler og helhet. Summerer alltid til 100. • Prosentvise endringer. Kan både være negative og større enn 100 prosent – kan ikke summeres.
Prosent • Kombinasjonen av prosentandeler og prosentvise endringer kan være vrien: En økning fra 5 prosent til 10 prosent = 100 prosent økning - eller: en økning på 5 prosentpoeng
Prosent (forts) 200 prosent nedgang? "Bruken av mobiltelefonen blir billigere og billigere. Fra januar 1996 til januar 2001 er prisen redusert med 200 prosent" (Computerworld 7. juni 2001) • 100 prosent økning = dobling • 200 prosent økning = tredobling • 300 prosent økning = firedobling • 50 prosent nedgang = halvering • Bare en økning kan være mer enn 100 prosent; ikke en nedgang.
Elever per årsverk Kilde: Utdanningsforbundet, Faktaark 2004:1 Forholdstall
Forholdstall ”Inntektsgapet øker” Aftenposten 8/10 2006 Kvinner: kr 161 000 Menn: kr 289 000 Menn tjener 80 % mer enn kvinner Kvinners inntekt i prosent av menns: 56 % Kvinner tjener 44 % mindre enn menn
24 970 kinobesøk per 10 000 innb. eller 2,5 kinobesøk per innb.? Klassekampen 10. juni 2006
Store og små tallOm nøyaktighet, avrunding og desimaler • Statistikkens dilemma: • På den ene siden: Å skulle bidra til å presisere samfunnsforhold • På den annen side: Å forenkle verden slik at den blir forståelig
"Fra 1990 til 2001 økte antallet kvinnelige studenter fra 33 764 til 65 756, mens antallet mannlige studenter økte fra 28 435 til 43 567". "Fra 1990 til 2001 økte antallet kvinnelige studenter fra 33 800 til 65 800, mens antallet mannlige studenter økte fra 28 400 til 43 600".
Dagbladet 3. august 2005 Om store tall: = 2 890 nye Bislett stadion à 450 millioner Blir vi klokere av denne sammenlikningen?
"Til sammen reiste vi en distanse tilsvarende 150 000 ganger rundt ekvator med buss, bane og båt". SSB 31/10 2006 Oppslag i Dagsavisen.no og ca. 50 andre aviser 31. oktober 2006
Nøyaktighetens tyranni Prosenter: 64,53% Forventet levealder: 80,44 år SFT: 1,763 Mange desimaler øker ikke nødvendigvis tilliten – og i alle fall ikke brukervennligheten
Fra: Kval, Mellbye & Tranøy: Politikk og makt. Cappelen 2003 Fra: Moan & Bakkerud: Frihet og velferd. 2. utgave. 2006
Fra: Norsk pasientregister Fra: Kommunehelseprofiler
Motto:? Bedre å presentere et omtrentlig, men tilnærmet riktig tall, enn et helt nøyaktig, men galt tall.
Fuglene flyver i flok, når de er mange nok Benny Andersen
De store talls lov Andelen gutter som andel av alle fødte. Kommuner. 2004
Usikkerhet • Prosent: Når er en forskjell en forskjell? Eksempel: Andelen som mener at statistikk er interessant øker fra 46 til 49 prosent. Er dette en økning som er verdt å kommentere? Tommelfingerregel: Prosentdifferanser under 4-5 sjelden interessante NB: Gjelder utvalgsundersøkelser
Usikkerhet: (forts) • Er det noen forskjell på en økning • fra 5 til 10 prosent og... • fra 40 til 45 prosent? JA! ...
Usikkerhet: (forts) De små talls hevn
Men: • At en forskjell eller endring er statistisk signifikant, betyr ikke at den er samfunnsmessig betydningsfull. • Og motsatt: En tidsserie med bare små forskjeller mellom de enkelte år kan like fullt være uttrykk for en trend
Usikkerhet: (forts) • Mindre differanser enn 5 prosentpoeng kan likevel være interessante når de inngår i en trend, f.eks.:
Antall drepte i trafikken ”… samferdselsministeren må svare på hvorfor antall døde økte sterkt i fjor”. Bodil Tenden (V) (Nettavisen 2/1 2007)
De små talls hevn Antall siktede for forbrytelser per 1 000 innbyggere Indeks 1980 = 100
”Facebook-feber Antall nordmenn i nettsamfunnet har vokst med 2600 prosent de siste fire månedene”. Aftenposten.no 26/4 2007 3 000 80 000
Fallgruver: Sammenhenger Ikke alle sammenhenger innebærer årsak og virkning: ”Spuriøse”/tilfeldige sammenhenger? f.eks. mellom tidsserier: Antall barnehageplasser og antall skilsmisser. 1 000
Fallgruver: Sammenhenger Rentenivå og antall drepte i trafikken
Om tolkning av tall • ”Kraftmagasinene fylles opp”(TV2 Nettavisen 22/9 04) • ”Fortsatt lav vannstand”(DN 22/9 04) • ”Regnet redder magasinene”(Hegnar Online 22/9 04) • ”Sykefraværet synker”(Aftenposten 21/9 04) • ”Langt unna målet”(NRK 21/9 04) • ”Foreldres utdanning betyr lite for barna”(Dagsavisen 11/8 04) • ”Akademikerbarn er vinnerne i arbeidslivet” (NTB/Universitas 11/8 04)
Aftenposten Aften 20. februar 2007 Men: Seks av ti kjenner altså en innvandrer! "Svak økning i antall lærere” Pressemelding fra Kunnskapsdepartementet 19. desember 2006 Gjennomsnittlig gruppestørrelse i grunnskolen i skoleåret 2006-07 hadde gått ned fra 14,10 til 14,09!
Enig: 38 % Uenig: 56 % Vet ikke: 6 % I alt: 100 % • Knapt/snaut 40 prosent er enige i at ... • Bare 40 prosent … • Nærmere/nesten 40 prosent ... • Hele 40 prosent ...
Om diagrammer • Hvorfor bruke diagrammer, når tabeller gir langt mer informasjon? Svaret er: Nettopp derfor! • I store tabeller kan det være vanskelig å se skogen for bare tall: informasjonen drukner lett i numerisk støy.
Diagrammer … • … gir et visuelt, helhetlig inntrykk som gjør det lettere å oppfatte f.eks. hovedtendenser i en utvikling eller forskjeller mellom grupper • … er pedagogiske; de er langt lettere å huske enn variasjoner i én eller flere tallrekker • … komprimerer data