1 / 33

Denne gang

Stratificering, vægtning, statistiske test og elaborering af sammenhænge Plan & Miljø, forår 2009 Onsdag den 21. april. Denne gang. Stikprøver & population, bortfald, stratificering og vægtning Måling af enkeltvariabler, konfidensintervaller og statistisk hypotesetest

noelle
Download Presentation

Denne gang

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Stratificering, vægtning, statistiske test og elaborering af sammenhængePlan & Miljø, forår 2009Onsdag den 21. april

  2. Denne gang • Stikprøver & population, bortfald, stratificering og vægtning • Måling af enkeltvariabler, konfidensintervaller og statistisk hypotesetest • Sammenhænge mellem variabler – Chi2og Gamma korrelationskoefficient • Multivariat analyse / elaborering I alle opgaver benyttes datasættet ”Hovedstadsomraadet …”

  3. Er stikprøven repræsentativ? • Population, udvalgsramme, stikprøve og analyseudvalg • Bortfaldsproblemer, bortfaldsanalyse • Disproportionalt stratificerede stikprøver • Analyser på ikke repræsentative stikprøver

  4. Vægtning af datamateriale • Hvornår skal man overveje vægtning? • Hvordan skal der i givet fald vægtes? • Konsekvenser af vægtning. Løsning af ét problem medfører et andet – estimering af standardfejl bliver biased. • Nye avancerede metoder til korrekt estimering (f.eks. SPSS-modulet Complex Samples). • Alternativ til vægtning: indføje strata-variablerne i de statistiske modeller. • I SPSS (og andre statistik-programpakker) kan vægtning benyttes til hurtigt at beregne teststørrelser til krydstabeller, man kun har fra rapporter, og hvor man altså ikke har adgang til datagrundlaget.

  5. Den centrale grænseværdisætning For tilfældig stikprøveudtrækning gælder, at når stikprøve-størrelsen ’n’ vokser, så vil fordelingen af stikprøvegennemsnit ’Y’ tilnærme sig en normalfordeling. • Dette gælder uanset formen af populationens fordeling. • Sætningen gælder også for andele, da en andel er en slags gennemsnit (på en dummy-variabel, der kan antage værdierne 0 og 1). • I de fleste tilfælde er en stikprøve på omkring 30 cases nok til en god tilnærmelse til normalfordelingen af stikprøvegennemsnittene. For andele gælder, at der bør være mindst 15 enheder i den mindste af de to kategorier. • 95 pct. af stikprøverne, som man hypotetisk udtrækker, vil have et gennemsnit, der ligger højst ca. to standardfejl fra populationsgennemsnittet (mere præcist 1,96 standardfejl). • Jo større stikprøve, jo mindre standardfejl og jo større præcision.

  6. Fejlmargin ved stikprøveandel Sikkerhedsinterval for andele: Hvor standardfejlen (se) er lig med:

  7. Højere skat på el? Der er et flertal i stikprøven, der går ind for betale mere for elektriciteten, hvis det hjælper i kampen mod den globale opvarmning, men hvordan med populationen?

  8. Beregning af konfidensinterval • Meningsmålingen fra Gallup, februar 2007, viser altså, at 58 pct. i en stikprøve på 1.149 personer, tilfældigt udvalgt blandt den danske befolkning på 18 år og derover, går ind for at betale mere for elektriciteten, hvis det hjælper i kampen mod den globale opvarmning. • Undersøgelsesspørgsmål: Indenfor hvilket interval ligger denne andel i populationen med 95 pct. sikkerhed • 95 pct. sikkerhedsinterval hvor indenfor populationens andel ligger: • Med 95 pct. sikkerhed ligger andelen i populationen altså over 50 pct. • Bemærk: Det kan diskuteres, hvilken basis man skal beregne svarprocenterne i de enkelte svarkategorier ud fra. ”Ved ikke”-kategorien er inkluderet i ovenstående, men der kunne argumenteres for at lade de 100 pct. være eksklusiv denne.

  9. Hypotesetest på eksemplet • Meningsmålingen fra Gallup, februar 2007, viser altså, at 58 pct. i en stikprøve på 1.149 personer, tilfældigt udvalgt blandt den danske befolk-ning på 18 år og derover, går ind for at betale mere for elektriciteten, hvis det hjælper i kampen mod den globale opvarmning. • Undersøgelsesspørgsmål: Er der et flertal i befolkningen som helhed (selv under den ’konservative’ antagelse, at alle ’ved ikke’-svarerne vil ende med at gå imod højere skat? • Beregning af teststatistik (z-værdi): (p-værdi < 0,001)

  10. Opgave 1 Fortæl lidt om sikkerheden i undersøgelsen ved at beregne et konfidensinterval for andelen blandt alle, der mener, det er vigtigst, at vejtrafikken udbygges. (1337 repræsentativt udvalgte personer)

  11. Konfidensinterval for procentdifferencer Ud fra regneregler på varianser kan man endvidere beregne konfidensinterval på forskellen mellem to andele, f.eks. om der er forskel mellem mænd og kvinder i andel, der går ind for udbygning af vejtrafikken: Under forudsætning om cirka lige mange kvinder og mænd.

  12. Forskel i gennemsnit mellem to grupper • I forbindelse med rekodningerne til første lektion blev der bl.a. dannet en ny variabel for alder i to kategorier, alder2, samt en ny variabel for personlig indkomst, persindt2, hvor indtægten angives i tusinder kroner. • I samme eksempel blev der set på, om der var forskel mellem yngre og ældre (alder2) i gennemsnitlig personlig indtægt (persindt2) blandt erhvervsaktive (erhvakt). • En såkaldt t-test kan benyttes til at finde ud af, om der ser ud til at være forskel i populationen med en vis statistisk sikkerhed: Analyze  Compare Means  Independent-Samples T Test. Det prøver vi nu!

  13. Opgave 2 • Undersøg om der i populationen er forskel mellem kvinder og mænd (koen) i gennemsnitlig personlig indkomst (persindt2) blandt erhvervsaktive (erhvakt). • Kan man uden videre gå ud fra, at det fundne signifikansniveau gælder for forskellen mellem mænd og kvinder i hele hovedstadsområdet?

  14. Sammenhæng/korrelation i population? I lektion 1 viste jeg følgende tabel over sammenhæng mellem køn og gudstro. Der er øjensynligt sammenhæng i stikprøven, men hvad kan man sige om populationen?

  15. Grundtræk i Chi2-test for uafhængighed mellem to variable • To variable er uafhængige, hvis de betingede fordelinger er ens i populationen. • Chi2-testen går ud på at teste en nul-hypotese om uafhængighed mellem to kategoriske variable på baggrund af stikprøvedataene: H0: Variablene er statistisk uafhængige HA: Variablene er statistisk afhængige • Chi2 -værdien er en teststørrelse på samme måde som z er det. Chi2 -værdien er imidlertid chi2-fordelt, men det gælder også her, at jo højere værdi, jo mindre p-værdi (ved samme antal frihedsgrader).

  16. Chi2-testen benytter antal forventede og observerede værdier i beregningerne • Det forventede antal observationer i hver tabelcelle er det antal observationer, som man kunne forvente, hvis der var uafhængighed mellem variablene, og givet at de marginale fordelinger er som i tabellen. • Man ville altså ved uafhængighed forvente, at der for både mænd og kvinder gjaldt, at 43,3 pct. sagde ’nej’, mens 56,7 pct. sagde ’ja’.

  17. 2) Man finder det forventede antal i hver celle under antagelse om uafhængighed således: 3) Til hver celle udregnes nu en chi2-værdi: 4) Derpå sammenlægges alle disse chi2-værdier til en samlet chi2 -værdi for tabellen: Trinnene i beregningen af p-værdien For at komme til test-statistikken (Chi2-værdien): 1) Man har som udgangspunkt antal observerede i hver celle i tabellen. 5) Til slut findes den tilhørende p-værdi, enten i chi2 -tabellen eller vha. computer.

  18. Beregning af chi2 -værdi Beregning af fe(Antal forventede i hver celle) hvor ’o’ = antal observeredeog ’e’ = antal forventede (Der mangler en del mellemregninger i ovenstående!)

  19. Resultatet af Chi2-testen • Her findes p-værdien for chi2-testen øverst ud for ’Pearson Chi-Square’. • Især for 2x2 tabeller kommer der andre resultater ud. Fisher’s Exact Test er f.eks. for små stikprøver (uden for pensum). • Bemærkningen i parantes om at det er en ’2-sided’ test angår i øvrigt ikke chi2-testen.

  20. Karakteristika og krav vedr. Chi2-testen • Kun statistisk test for sammenhæng, ikke mål for styrke i sammenhæng. • Der kræves som minimum mere end én forventet observation i hver celle, og helst ikke mere end 20 pct. af cellerne må have mindre end fem forventede observationer. • Testen benytter ikke oplysninger om eventuel rangorden i kategorierne, hvilket i nogle tilfælde er en fordel og i andre en ulempe: • Det er en fordel i de tilfælde, hvor der enten ikke er nogen rangorden på kategorierne, eller hvor sammenhængen i hvert fald ikke er rangordensmæssig. • Det er en ulempe i de tilfælde, hvor der er en rangordensmæssig sammenhæng. I det tilfælde findes der andre test-størrelser, der er stærkere.

  21. Gamma korrelationskoefficient • Rangordens korrelationskoefficient. • Måler styrken af sammenhængen mellem to ordinalskalerede variabler. • F.eks. des højere uddannelsesniveau, des højere løn. • Kan antage værdier fra -1 over 0 til +1. • Fungerer endvidere som statistisk test for monoton sammenhæng. Nulhypotese: Gamma = 0 i populationen. • Dikotome variabler kan altid indgå i Gamma-beregning, uanset skalaniveau. • Intervalskalerede variabler kan også benyttes, evt. efter rekodning til diskret variabel. • For at kunne fungere som statistisk test kræves, at der kan dannes minimum 50 henholdsvis konkordante og diskordante par ud fra krydstabellen.

  22. Beregning af Gamma P beregnes ved at multiplicere frekvensen i hver rude i tabellen med summen af frekvenserne i de ruder, der ligger til højre og lavere i tabellen, og summere. For en tabel med 3 rækker og 3 kolonner sker multiplikationen sådan: Q beregnes ved at multiplicere frekvensen i hver rude i tabellen med summen af frekvenserne i de ruder, der ligger til venstre og lavere i tabellen, og summere. For en tabel med 3 rækker og 3 kolonner sker multiplikationen sådan:

  23. Eksempel på Gamma analyse i SPSS Først bivariat analyse af sammenhæng mellem respondentens faders uddannelse og respondentens egen selvplacering mht. status i samfundet:

  24. Opgave 3 • I første lektions opgaver skulle der bl.a. dannes to nye variabler: alder2 (alder i to kategorier) og bilhver2 (rejselængde i bil på hverdage i to kategorier). • Endvidere skulle sammenhængen mellem disse undersøges. Undersøg nu denne igen, blot inklusiv statistisk test for sammenhæng samt mål for sammenhængens styrke. • Rekod nu variablen alder til en ordinalskaleret variabel, der kan antage seks til otte værdier (via Transform  Recode into different variable). • Undersøg sammenhængen mellem den nye aldersvariabel og bilhver2. Igen også med statistiske mål. • Er Gamma stadigvæk et rigtig godt egnet mål for styrken af sammenhængen?

  25. Kontrolleret Gamma-analyse Kontrol/elaborering af gamma-analysen mellem to variabler kan også foretages via Analyze  Descriptive Statistics  Crosstabs. Der vælges her en kontrolvariabel, der hentes over i det nederste højre felt (her er valgt variablen ”egenudd”. Skal der kontrolleres for flere variabler på en gang, skal man klikke på Next, hvorefter endnu en kontrolvariabel kan overføres. Husk også at foretag valg i Cells og Statistics!

  26. Partial Gamma i kontrolleret analyse Skal der beregnes en såkaldt partial Gamma, skal man inde i Crosstabs-vinduet klikke på paste og foretage en tilføjelse i programmet, sådan som det er vist i eksemplet nedenfor. CROSSTABS variables fme_udd3 (1,3) selvpla3 (1,3) e_uddan3 (1,3) /TABLES=fme_udd3 BY selvpla3 BY e_uddan3 /FORMAT= AVALUE TABLES /STATISTIC=GAMMA /CELLS= COUNT ROW /COUNT ROUND CELL . CROSSTABS /TABLES=fme_udd3 BY selvpla3 BY e_uddan3 /FORMAT= AVALUE TABLES /STATISTIC=GAMMA /CELLS= COUNT ROW /COUNT ROUND CELL . Tilføjelsen er markeret her. Tallene i parentes indikerer min- og max-værdier for variablene.

  27. Bivariat Gamma Kontrolleret Gamma. Dette output kommer kun ved tilføjelse i syntax! Kontrol for respondentens egen uddannelse Såkaldt lokale Gamma-værdier

  28. Konklusion • Effekten fra faderens uddannelse på respondentens selvplacering i samfundspyramiden er for i hvert fald langt den største part en indirekte effekt gennem respondentens egen uddannelse. • Respondentens egen uddannelse er altså en mellemkommende variabel i dette tilfælde.

  29. Eksempel med interaktion

  30. Kontrol for alder i tre kategorier

  31. Gammaværdier til kontrolleret analyse Stigende tendens for lokale Gamma-værdier. Stort set ingen ændring i den generelle effekt.

  32. Konklusion • Om man helt eller delvist bifalder utroskab afhænger tilsyneladende af uddannelsesgrad, sådan at jo højere uddannelse, jo mere bifalder man typisk utroskab. • Sammenhængens styrke afhænger imidlertid af ens alder, sådan at stigende alder betyder stærkere effekt fra uddannelse. Der er altså interaktion mellem alder og uddannelse. Man kan også sige, at alder specificerer sammenhængen mellem uddannelse og synet på utroskab. • Det skal tilføjes, at ovenstående stadigvæk kun kan betragtes som en indledende analysekonklusion.

  33. Opgave 4 • Gennemfør en Gamma-analyse med kontrol for en tredje variabel på datasættet ”Hovedstadsomraadet …”. • Gå enten ud fra en af de bivariate analyser, du har lavet, eller start på en frisk med nye variable.

More Related