1 / 28

Presentasjon av data: deskriptiv statistikk

Presentasjon av data: deskriptiv statistikk. Mest egnet for videre statistiske analyser. 75 80 85 90 95 100 105 110 115 120 125. Repetisjon: Målenivå på variabler. Nominal (nome betyr navn)

zytka
Download Presentation

Presentasjon av data: deskriptiv statistikk

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Presentasjon av data: deskriptiv statistikk

  2. Mest egnet for videre statistiske analyser 75 80 85 90 95 100 105 110 115 120 125 Repetisjon: Målenivå på variabler • Nominal (nome betyr navn) • Tallverdi kun en ”merkelapp” uten å si noe om mengde av egenskap. F eks kjønn (Kvinne = 1, mann =2). Eksperimentgruppe = 1, kontrollgruppe = 2 • Ordinal: • Rangering av egenskap, men ikke samme avstand mellom tallverdier • Grunnskole (1), Høyskole (2), Bachelor (3), Master (4), Doktor (5) • Intervall • fast avstand mellom tallverdier, men ikke absolutt nullpunkt • IQ • Rationivå/forholdstall – har et absolutt nullpunkt • Reaksjonstid, alder, antall ganger man utfører en atferd

  3. Formål med deskriptiv statistikk • Bli bedre kjent med ditt utvalg • Få en oversikt over hvem som har svart, hvilke skårer de har osv. • Benytter vanligvis statistikkprogram til dette

  4. Eks: Eksperiment med trening og depresjon

  5. Kakediagram

  6. Histogram – fordeling i depresjonsskårer

  7. Eksempel på søylediagram – skåre depresjon før og etter

  8. Eksempel på linjediagram – skåre depresjon før og etter

  9. Mål på sentraltendens Sentraltendens: hvilken verdi er mest beskrivende for utvalget? • Gjennomsnittsverdi: For pretest ekspr.gruppen: (40 + 42 + 49 + 42 + 35)/ 5 = 41,6 • Median - ranger alle verdier, finn midtverdien 35, 40, 42, 42, 49 = 42 • Modalverdi – hyppigst forekommende verdi: 42 forekommer flest ganger

  10. Modal Median Gj.snitt Skjev fordeling (negativt skjev/venstreskjev)

  11. Normalfordeling Gjennomsnitt Median Modal

  12. Mål på spredning • Variasjonsbredde (laveste til høyeste verdi) • Vårt eksempel: (35, 40, 40, 42, 49), dvs. fra 35 til 49 • Interkvartilrange • Grense fra de 25% laveste verdier til de 75 % høyeste • Varians og standardavvik – the best!:

  13. Samme gjennomsnitt, forskjellig spredning Skåre på depresjon Utvalg 1 Utvalg 2 Utvalg 3 s = 1,6 s = 4,1 s = 7,9

  14. 13,6% 34,1% 34,1% 13,6% 2,2 % 0,1 % 0,1 % 2,2 % Normalfordeligskurvens skjønnhet 50 % skårer over 50 % skårer under -3 s -2 s -1 s X +1 s +2 s +3 s

  15. = 100 s = 15 13,6% 34,1% 34,1% 13,6% 2,2 % 0,1 % 0,1 % 2,2 % Eksempel: IQ-skårer og normalfordelig 50 % skårer over 100 50 % skårer under 100 55 70 85 100 115 130 145

  16. 1. En person skårer 115 poeng på en IQ test som har middelverdi= 100 og s = 15. a) Hvor mange prosent skårer lavere enn personen? b) Hvor mange standardavvik avviker personen fra gjennomsnittsverdien? 2 En person skårer 60 poeng på test for depresjon. (Høy skåre = mye depresjon) Skårene på testen er normalfordelt med middelverdi lik 40 og s = 10. a) Vil du si at personen har høy grad av depresjon i forhold til andre? To oppgaver

  17. Korrelasjonskoeffisienten – repetisjon • Måler grad av sammenheng mellom to variabler • Pearson’s produkt-moment korrelasjon mest brukt, men det finnes andre også • Utrykkes vanligvis som r • r kan ha verdier mellom –1 og +1. • Hvis r = 0, ingen sammenheng • Formel (ikke nødv. å pugge denne):

  18. Positiv sammenheng: en-eggede tvillinger og intelligens r = .91 Har den ene høy IQ skåre, har den andre tvillingen også det. Har den ene lav skåre, har den andre også det

  19. Ingen sammenheng, r = 0.00

  20. Negativ sammenheng r = -.70 Jo mer IQ øker, jo færre voldsepisoder. Men sammenhengen er ikke perfekt

  21. Kurvlineær sammenheng r = 0.00 Betyr ikke nødvendigvis at det ikke er en sammenheng mellom to variabler

  22. En r på 0.80 er mer enn dobbelt så sterk som en r på 0.40 Opphøyer vi r til R2, får vi et uttrykk for sammenhengens styrke r = 0.40, R2= 0.40*0.40 =.16 r = 0.80, R2= 0.80*0.80 =.64 R2 er et utrykk for hvor mye varians X og Y har til felles Hvis R2= .16, 16 % felles variasjon Hvis R2= .64, 64 % felles variasjon R2 – delt varians (coefficient of determination)

  23. Regresjon – finner linje som beskriver sammenhengen mellom to variabler r mellom år utdanning og inntekt er i dette eksemplet lik 0.81 Men hvor mye mer i inntekt gir ett års utdanning?

  24. Regresjonsligningen • Ŷ er den predikerte skåre på Y (inntekt). • X er den aktuelle skåren det predikeres fra (år utdanning). • b er stigningstallet for regresjonslinjen • a er konstantleddet, dvs verdi på Y når X = 0 (inntekt ved null års utdanning)

  25. Formel for utregning

  26. Mer spesifikk utregning

  27. Utregning for Altså: Inntekt forventes å øke med 23,25 (23 250 kr) for hvert år med utdanning man tar En som har 0 (null) år med utdanning forventes å ha en inntekt på 187 (187 000 kr)

  28. Regresjon – finner linje som beskriver sammenhengen mellom to variabler Finn forventet inntekt for to ulike verdier på utdanning Trekk en linje mellom de to punktene Da har du regresjonslinjen

More Related