1 / 42

Utvalgsteori og modellbasert statistisk teori

Utvalgsteori og modellbasert statistisk teori. Ronny Klæboe Transportøkonomisk institutt. Før vi starter på utvalgsmetodikk;. Vi er ofte interessert i sammenhenger mellom variable for å forstå virkningsmekanismer og mulige utviklingsbaner.

afya
Download Presentation

Utvalgsteori og modellbasert statistisk teori

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Utvalgsteori og modellbasert statistisk teori Ronny Klæboe Transportøkonomisk institutt

  2. Før vi starter på utvalgsmetodikk; Vi er ofte interessert i sammenhenger mellom variable for å forstå virkningsmekanismer og mulige utviklingsbaner. Populasjonen vi ser på kan da sees som en av mange mulige realisasjoner av de mekanismene som virker, men da er det ikke lenger utvalgsstatistikk vi bedriver, men modellbasert statistikk. Metodekurs utvalgsteori 13. mai 2011

  3. Om statistisketeorier for tolkingav data Deteksisterer to statistisketeoriar, statistiskutvalsteoriogmodellbasertstatistisk teori ”I den samfunnsvitskaplege metodelitteraturen har utvalsteorien fått ein brei plass, medan modellbasert statistisk teori sjeldan eller i liten grad bliromtalt ... Vanlegvisønskjer samfunnsforskarane å studere strukturar i sosiale prosessar. Dataanalysen mådabaserastpåteorien for stokastiskemodellar… Brukavutvalsteorienislikesituasjonareridemessiggaltogkandessutangiopphavtilfeilaktigeslutningar. Rolf Aaberge, PetterLaakeTidskrift for samfunnsforskning 1984 Metodekurs utvalgsteori 13. mai 2011

  4. Hvaerutvalgsteori, hvaeregenskapene Detteerteori for hvordan vi kansinoeom en endeligpopulasjonved å trekke et utvalgavdenne (Gallup, meningsmåling) Brukavutvalgerstatteroftefullstendigetellinger/ manntallhvor en fastslåregenskapenetilalleenhetene Kostnadenevedregistreringenkanværestor, ogbrukavutvalgsstatistikkgirvesentligeinnsparinger Vi skalaltsåfastslåegenskapervedpopulasjonenved å undersøkenoenfåavmedlemmene Prosedyrenesomfølgesnår en trekker enheter, bestemmer de statistiskeegenskapenetilanslagene en kommerframtil Metodekurs utvalgsteori 13. mai 2011

  5. Reeltellertenkteksperiment -- Design viktig Modellbasertstatistiskteori (stokastiskemodellar) byggjerpåideen om at observasjonane i eit gitt materiale er resultata frå eit reeltellertenkteksperiment. Sosialefenomensomlivslengdatil folk, giftemålogskilsmissekan vi sjåpåsomresultatavtenkteikkje-deterministiskeeksperiment. Modellbasertstatistiskteoriereinmatematiskdisiplinsomerblittutvikla for å handterereelleellertenkteikkje-deterministiskeeksperiment Metodekurs utvalgsteori 13. mai 2011

  6. Modellbasertstastistikknødvendig for å studeresammenhenger Samfunnsforskarane er ofte interessert i å studere samanhengar eller strukturar mellom variablar. For å kunne gjere dette på ein meiningsfull måte må vi formulere ein stokastisk modell. Dei aktuelle samanhengane eller strukturane blir da uttrykt ved parametrenei den stokastiskemodellen. Problemet med å studeredeiaktuellestrukturaneerdaoverførttilparametreneimodellen. Vi trengdametodar for analyse avdesseparametrene. Den modellbasertestatistisketeoriengiropphavtilnødvendigeanalysemetodar Metodekurs utvalgsteori 13. mai 2011

  7. Utvalgsmetodikk Vi har imidlertid fortsatt behov for å planlegge undersøkelser og ta utvalgsstatistikken i bruk når vi skal gi en beskrivelse av egenskapene ved ulike befolkninger. Det er vanligvis alt for dyrt å spørre eller undersøke hele befolkningen. Det kan være lure måter å gå fram på og som gjør at vi får mer for pengene (mer presise anslag) Metodekurs utvalgsteori 13. mai 2011

  8. Variasjonstårisentrum Populasjonenersammensattavenheter (oftepersoner) somerulike. For å beskrive en heterogenebefolkning, erdetnødvendig å skaffetilveieobservasjoner/svarsomgjør at vi kantrekkekonklusjoneromulikegrupperibefolkningen.

  9. Oftekontekstuelle rammer somdetmåtashensyntil Æra Kultur Budsjett Kunnskap Ressurser Logistikk/ Tid Respondenter Tillatelser

  10. Design avutvalgsundersøkelser • Seleksjonsprosessen • Hvilke variable er vi interesserti, hvordandefinerer vi dem? • Hvordanhar vi tenkt å foretautvalget: • Matcher utvalget -- problemstillingen (Selvseleksjon, konkurranseflater, scope) • Hvordanhar vi tenkt å målevariablene vi erinteresserti • Estimeringen • Hvordanhar vi tenkt å gåfram for å sluttenoeompopulasjonenetter at vi harfåtttakiutvalget • Ofte mange “kunder” til en ogsammeundersøkelse, ikkesålett å svaregenereltomhvasomerønskeligpresisjonpåestimatene -- Oftekompromisser. Metodekurs utvalgsteori 13. mai 2011

  11. Utvalgsramme: Hvautvalgetforteller deg Befolkningen du vilsinoeom Befolkning Trekningsmåten Utvalgs-ramme Utvalget Selve utvalgsplanen Gjennomføringen Resultatet (frafall) Slutningeromhelebefolkningenog sub-grupper I befolkningen

  12. Utvalgikke bare geografioggruppe men ogsåtid Temporal spredning: Sommerpopulasjonkontravinterpopulasjon Promilleprøverpånattaellerpåmorgenen Søvnkvelden/nattenellermorgenen Snøellersolskinn Ungeførere – utvalgkanbliskjevthvis en ikke tar hensyntil at de bare harførerkortdeleravførsteår Metodekurs utvalgsteori 13. mai 2011

  13. Enkelt tilfeldig utvalg (Simple randomsample) Uttrekkingsprosedyren bestemmer egenskapene: Sverdrup m. fl. Metodekurs utvalgsteori 13. mai 2011

  14. Estimering av et prosenttall (proporsjon) La p angi andelen i populasjonen som har en egenskap: Vi estimerer denne andelen ved å bruke gjennomsnittet i utvalget: Metodekurs utvalgsteori 13. mai 2011

  15. Animasjoner Vi viser nå en animasjon over usikkerheten knyttet til prosenttall hvor andelen av de som er spurt går fra en forsvinnende liten del av populasjonen som skal undersøkes (vanlig når vi trekker fra et helt land eller en storby), til en stor andel av befolkningen som skal undersøkes. Metodekurs utvalgsteori 13. mai 2011

  16. Utvalgsbrøken Her ser du hvor stort utvalget er Kolonnep=50% Her finner du usikkerheten når n=1000, og p=50% Rad n=1000 Metodekursutvalgsteori 13. mai 2011

  17. Metodekursutvalgsteori 13. mai 2011

  18. Metodekurs utvalgsteori 13. mai 2011

  19. Metodekurs utvalgsteori 13. mai 2011

  20. Metodekurs utvalgsteori 13. mai 2011

  21. Metodekurs utvalgsteori 13. mai 2011

  22. Metodekurs utvalgsteori 13. mai 2011

  23. Metodekurs utvalgsteori 13. mai 2011

  24. Metodekurs utvalgsteori 13. mai 2011

  25. Metodekurs utvalgsteori 13. mai 2011

  26. Metodekurs utvalgsteori 13. mai 2011

  27. Metodekurs utvalgsteori 13. mai 2011

  28. Animasjoner Mens den forrige animasjonen viser usikkerheten i prosent, er det også mulig å se på den relative feilen. Dette får fram at en to prosent feilanslag kan være stort når det er en liten gruppe i populasjonen en ønsker anslag for. Metodekurs utvalgsteori 13. mai 2011

  29. Som før, men nå se vi på den relative feilen Variansen delt på p Metodekurs utvalgsteori 13. mai 2011

  30. Metodekurs utvalgsteori 13. mai 2011

  31. Metodekurs utvalgsteori 13. mai 2011

  32. Metodekurs utvalgsteori 13. mai 2011

  33. Metodekurs utvalgsteori 13. mai 2011

  34. Den som sist har geburtsdag – flertrinnsutvalg Metodekurs utvalgsteori 13. mai 2011

  35. Enperson og flerpersonhusholdninger har ulike sjanser for å bli valgt ut, men har det betydning? Metodekurs utvalgsteori 13. mai 2011

  36. Bilen er tilgjengelig for hele husholdningen Når en spør etter person som sist har bursdag må dataene vektes med valgbar husholdningsstørrelse. Bilhold (sjansen for at det er en bil i husholdningen) større dessto større husholdningen er Husholdningsinntekten er større med antall personer Større mengde fritidsreiser, reiser der en er sjåfør Færre handlereiser (siden flere kan dele oppgaven) Metodekurs utvalgsteori 13. mai 2011

  37. Optimum cluster size • Two opposing factors in optimum cluster size • Smaller cluster size, lower design effect = more precision for given sample size. • Larger cluster size, easier & cheaper = larger sample size for given cost • You can estimate the optimal cluster size if you know: • transport costs to each cluster • cost for interviewing each respondent • Roh • Total field costs = C1m + C2mb C1 = cost of travel to each cluster C2 = cost for interviewing (and listing) each individual in chosen clusters m = number of clusters b = number in each cluster * Optimum cluster size (b) = Square root of (C 1/C2)[(1-roh) / roh]

  38. Cluster sampling • Used when: • Researchers lack a good sampling frame for a dispersed population. • The cost to reach an element to sample is high. • Each cluster is as varied heterogeneous internally and homogeneous to all the other clusters. • Usually less expensive than Simple Random Sampling (SRS) but not as accurate • Each stage in cluster sampling introduces sampling error—the more stages there are, the more error there tends to be. • Can combine SRS, SS, stratification and cluster sampling!!

  39. Stratumlotteriske utvalg – ”optimale” utvalg Med en god inndeling i strata (strata som er homogene) kan vi tjene mye Ofte velger en utvalgsstørrelsen er proporsjonal med antallet enheter i hvert av strataene (ProportionalProbability sampling PPS) Enda bedre (men mer komplisert) er det om man i tillegg velger proposjonalt med variasjonen i strataene Har man ett stratum med kloner, og et med stort mangfold kan det være greit å bruke relativt lite ressurser på klonene og mer der forskjelligheten er større Ytterligere forbedring kan en få gjennom å ta hensyn til kostnadene ved å hente inn informasjonen – Ulandsproblematikk, tilgang til måleutstyr, ekspertise mv. Metodekurs utvalgsteori 13. mai 2011

  40. Metodekurs utvalgsteori 13. mai 2011

  41. Bootstrapping kan brukes for å få numeriske anslag på usikkerhet – ikke alltid enkelt analytisk Metodekurs 19. 8 2011

  42. Goderåd • Tenkførst ! • Tenkpåmuligehovedfunnog alternative forklaringer • Innebærer at vi avogtilønsker å spørre for å utelukkehellerenn å bekrefte • Forståtemaet for undersøkelsen – ogbruksområdet • Ofteviktig å vitehvasomikkedekkes • Oftevanskelig å leggetil data iettertid • Hvaerviktigkontrahvaergjorttidligere Et element avinnovasjonialleundersøkelser Noe en gjørbedreenntidligere – noenytt, en “perle” Metodekurs utvalgsteori 13. mai 2011

More Related