170 likes | 311 Views
Kvantitative metoder 2. Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007. Program for i dag og næste gang:. Beskrivende statistik som grundlag for en økonometrisk analyse Statistiske metoder til analyse af kvalitative data
E N D
Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007 Kvantitative metoder 2: F2
Program for i dag og næste gang: • Beskrivende statistik som grundlag for en økonometrisk analyse • Statistiske metoder til analyse af kvalitative data • Test i multinomialfordelingen: Q-testet (BL.13.1-2) • To-dimensionale kontingenstabeller (BL.13.5) • 2 x 2 tabeller • r x c tabeller • Test af uafhængighed og homogenitet Kvantitative metoder 2: F2
Beskrivende statistik • Formål: At analysere og dokumentere datasættets struktur • Relevante spørgsmål: • Hvilke typer af ”individer” (personer, firmaer, lande,..)? • Hvilken perioder/hvilket land/region? • Hvad er de væsentligste karakteristika: • Fx udelukkende kvinder: Uegnet til analyse af diskrimination • Fx udelukkende OECD-lande: Uegnet til analyse af bistand • Fx udelukkende små virksomheder: Uegnet til analyse af forskning og udvikling i erhvervslivet. • Fejl og mangler: Er der sket trunkering? Er der ”outliers” i data? • Dokumenteres af en beskrivende analyse. Kvantitative metoder 2: F2
Redskaber til beskrivende statistik (BL.7) • Analytiske grafiske redskaber: • Krydsplots af kontinuerte variabler (Proc GPLOT) • Histogram (Proc UNIVARIATE) • Analytiske tabeller: • Beregning af beskrivende statistik for kontinuerte og kvalitative variabler (Proc MEANS) • Krydstabulering af kategoriserede variabler (Proc FREQ) • Eksempel: Datasæt til analyse af effekten af politiovervågning på økonomisk kriminalitet (biltyverier) (januar 2007-opgaven i Økonometri 1) Kvantitative metoder 2: F2
Analyse af kvalitative data: Fordelinger af kategoriserede variabler • Ofte indeholder datasættet en eller flere kategoriserede variabler: Hver enkelt observation falder i én af i alt k gensidigt udelukkende kategorierer (en klassedeling). • Kategorierne er ikke (nødvendigvis) ordnede. Må nødvendigvis behandles som en kvalitativ variabel • Eksempler i dag: • Ex: Kønsproportioner • Ex: Valg nu? • Ex: Kønsproportioner i store (!) familier • Har det statistiske grundlag for at analysere og teste hypoteser på fordelingen over kategorier: Multinomialfordelingen (BL.4.8). Kvantitative metoder 2: F2
En variabel med to udfald: BL.4.2 Binomial fordelt, Kvantitative metoder 2: F2
En variabel med to udfald Kvantitative metoder 2: F2
En variabel med to udfald Kvantitative metoder 2: F2
En variabel med to udfald: Eksempel: Kønsproportioner (BL.ex.13.1a) • Ser på nulhypotesen: H0: overfor H1: Kvantitative metoder 2: F2
Eksempler på økonomiske modeller med børnefødsler og kønsproportioner • Kvinders arbejdsudbud • Analyseret af mange, bl.a. Browning. • US: Fødsler påvirker kvinders arbejdsudbud senere i karrieren, størrelsen af effekten er omstridt. • Heller ikke afklaret, hvilken retning effekten (primært) går: Er det (forventet) fremtidig løn og beskæftigelse, der påvirker den aktuelle fertilitet? • Ledelsestransitioner i familieejede virksomheder: • Analyseret af Bennedsen mfl. på et stort antal danske firmaer • Videreførelse af ledelsesposter indenfor familien sker oftere i firmaer, hvor ejerens/lederens førstefødte barn er en dreng. • Kønnet på den førstefødte er tilfældigt og uden relation til økonomiske variabler og valg: Nyttig information for den økonometriske analyse! Kvantitative metoder 2: F2
En variabel med k udfald: Multinomialfordelingen Kvantitative metoder 2: F2
En variabel med k udfald • Ser på nulhypotesen: Kvantitative metoder 2: F2
En variabel med k udfald: Opdatering af eksempel i AFJM.7: Megafonmåling 26/1-07 Parti/måling 21-25/1 2007 Frekvens Valget 2005 Soc. dem. 28,4% 246 25,8% Rad. V. 9,2% 80 9,2% Kons. 10,5% 90 10,3% CD 0,2% 2 1,0% SF 8,6% 75 6,0% Kristendem. 1,0% 9 1,7% DF 12,6% 109 13,3% Venstre 25,8% 224 29,0% EL 3,4% 29 3,4% Andre 0,4% 3 0,3% I alt 100% 867 100% Kvantitative metoder 2: F2
En variabel med k udfald: Megafon meningsmåling • Er der sket signifikante forskydninger siden valget i 2005? • H0: Ingen forskydning vs. H1: Forskydning af generel art • VALG.SAS Kvantitative metoder 2: F2
En variabel med k udfald: r ukendte parametre i multinomialfordelingen Kvantitative metoder 2: F2
En variabel med k udfald: r ukendte parametre i multinomialfordelingen Kvantitative metoder 2: F2
Hvad bliver det næste? • Næste forelæsning: Mandag den 12. februar: Mere om analyse af kvalitative data. Uafhængigheds- og homogenitetstest. BL.13.5, AFJM.7. • Øvelserne: Begynder i næste uge. • Ugeseddel 1: På hjemmesiden fra fredag. • NB: Hold 1: Øvelser flyttet til onsdag kl. 15-18 i Større Øvelsessal Kvantitative metoder 2: F2