240 likes | 366 Views
Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger.
E N D
Økonometri1 Inferens i den lineære regressionsmodel 25. september 2006 Økonometri 1: F6
Oversigt: De næste forelæsninger • Statistisk inferens: ” …hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på grundlag af data, […] blandt andet punktestimation og intervalestimation af parametre samt metoder til afprøvning af statistiske hypoteser.” (TSØ p. 238) • Simulationseksperimenter (Note på hjemmesiden) • Ideen med at lave simulationseksperimenter • Opbygning af en simulationsalgoritme • Eksempel: Den forventede startløn for en økonom • Eksempel (ugeseddel 3): Alternativ middelret estimator • Resultater om OLS med endeligt antal observationer (kap. 4): • Normalitetsantagelse (MLR.6). • Test af en enkelt lineær restriktion på koefficienter i lineær regressionsmodel. • Asymptotiske resultater for OLS: (kap. 5). • Test af flere lineære restriktioner (kap. 4.5 og 5.2). Økonometri 1: F6
Hvorfor simulationseksperimenter? • Simulationseksperimenter kaldes også ”Monte Carlo” eksperimenter. • De introduceres i Økonometri 1 for at illustrere vigtige statistiske begreber: Middelret estimation, varians, efficiens,… • Simulationseksperimenter er (stort set) ikke dækket af Wooldridge (men se Table C.1, p.771), så derfor benyttes en note (se hjemmesiden). • I noten analyserer vi fordelingen af OLS estimatoren og sammenligner med fordelingen af en alternativ estimator • Simulationseksperimenter vil også optræde i øvelserne (ugeseddel 4, 5, 7, 12). • Kommer igen i Økonometri 2. Økonometri 1: F6
Monte Carlo eksperiment: Ideen • Simulationer af ”datasæt” fra en fuldt specificeret model: Datagenererende proces (DGP) • Eksempel: • Vi kender de "sande parametre" og . Genererer et sæt af fx n=100 observationer fra modellen: • ”Glemmer” at vi kender og : Anvend estimator (”regneregel”) til at skønne over ud fra et konkret (men kunstigt) sæt af observationer: • Fx gennemsnittet: Økonometri 1: F6
Monte Carlo eksperimenter: Ideen (fortsat) • Kan vi på en nem måde vurdere, om er en ”rimelig” estimator for ? • Lav en uafhængig trækning af et nyt datasæt, der er genereret af den samme DGP. • Lav mange uafhængige trækninger (”replikationer”): • Beregn værdien af estimatoren for hvert datasæt: • Se på fordelingen af estimaterne over replikationerne: Beregn fx fordelingens gennemsnit og varians. • Parallel til ”tankeeksperimentet”: Vores konkrete faktiske datasæt er blot ét blandt mange potentielle udfald. Økonometri 1: F6
Monte Carlo eksperimenter: Ideen (fortsat) • Formål med Monte Carlo eksperimenter: • Efterprøve analytiske resultater: Fx at OLS er middelret under MLR.1-4. • Analysere konsekvenserne, hvis antagelserne ikke holder. • Sammenligne forskellige estimatorer eller test, hvor det er besværligt/umuligt analytisk. • Vurdere hvor mange observationer der skal til, for at man kan bruge asymptotiske resultater i praksis (kap. 5). Økonometri 1: F6
Monte Carlo eksperimenter: Eksempel • DJØFs hjemmeside www.djoef.dk: ”Vejledende startløn” for en privatansat, nyuddannet økonom er kr. 29.500 om måneden (pr. februar 2005). • Antag: • Startlønninger er uafhængige og normalfordelte. • Sand middelværdi i lønfordelingen er kr. 29.500. • Sand lønfordeling har standardafvigelse på kr. 1.500. • Hermed er lønfordelingen fuldt specificeret. • Simulere en situation, hvor der indhentes en tilfældig stikprøve af n=100 startlønninger. Økonometri 1: F6
Monte Carlo eksperimenter: I praksis ProcIML; antalobs = 100; mu = j(antalobs,1,29.5); seedvct = j(antalobs,1,1) ; seedvct = 117*seedvct ; e = normal(seedvct) ; y = mu + 1.5 * e ; quit; Økonometri 1: F6
Monte Carlo eksperimenter: I praksis (fortsat) m1est=sum(y)/antalobs; * estimatet m1 (gennemsnittet); m2est=1/2*(min(y)+max(y)); * estimatet m2 (gns. min og max); Økonometri 1: F6
Monte Carlo eksperimenter: I praksis (fortsat) antalrep = 10000; * antal replikationer i simulationen; m1 = j(antalrep,1,.); * vektorer til at gemme estimaterne i; m2 = j(antalrep,1,.); do j=1 to antalrep; * løkke over simulationer; … * her beregnes estimater for hvert datasæt> * estimaterne gemmes for hver replikation ; m1[j,1]=m1est ; * m1 ; m2[j,1]=m2est ; * m2 ; … end; Trin 3: Gentag trin 1 og 2: M=10.000 replikationer: Trin 4: Analysér fordelingerne af de to sæt estimater: • Histogram • Gennemsnit, varians, højere momenter Økonometri 1: F6
Monte Carlo eksperimenter: Eksempel • Brug algoritmen til at analysere og som estimatorer for middelværdien i fordelingen af startlønninger. • Simulere telefoninterviews med tilfældigt udvalgte, nyuddannede økonomer, som oplyser (?) deres startløn. • SAS-programmet MC.sas udfører M=10.000 replikationer. Se på n=100, n=50 og n=10. • Link til SAS • ”Hjemmeopgave”: Brug SAS-programmet MC.sas til at køre et simulationseksperiment, hvor du har n=100, men sætter antallet af replikationer til M=5.000. Sammenlign og fortolk dine resultater. Økonometri 1: F6
Monte Carlo eksperimenter: Eksempel (fortsat) Middelværdi og varians af de to estimatorer baseret på M=10.000 simulationer • har lavest varians • Varians aftager medn Økonometri 1: F6
Eksempel: En alternativ middelret estimator i en simpel lineær regressionsmodel • Model: • Alternativ estimator: • Gennemsnit for de observationer, der svarer til de mindste og største værdier af • Ugeseddel 3: Vis at er middelret. • Ugeseddel 5: Sammenlign med i et simulationseksperiment Økonometri 1: F6
Monte Carlo eksperimenter: Afrunding • Husk: • Resultater og konklusioner fra Monte Carlo eksperimenter afhænger potentielt af de valgte parametre og fordelinger. • I praktiske anvendelser må man i hvert enkelt tilfælde godtgøre, at den valgte model har relevans for den problemstilling, man ønsker at belyse. Økonometri 1: F6
Hypotesetest i den lineære regressionsmodel: Endelige stikprøver (kap. 4) • For hypotesetest behøver vi fordelingen af . • Introducere yderligere antagelse: Normalitet. • MLR.6: u er uafhængig af og normalfordelt med middelværdi nul og varians . • MLR.1-6 definerer den klassiske lineære model (CLM). • Restriktiv antagelse: • Argument for: u opsamler alle de mange effekter der er udeladt af modellen: Central grænseværdisætning køres i stilling. • Argumenter imod i konkrete problemstillinger: Begrænsede variabler (positive!), andre typer af fordelinger (log-normal, diskrete). Økonometri 1: F6
Fordeling af OLS estimatoren: Endelig stikprøve • Linearitet af i u og CLM giver følgende resultat: • Theorem 4.1: Under CLM antagelserne og betinget på gælder at hvor Heraf følger: Økonometri 1: F6
Fordeling af OLS estimatoren: Endelig stikprøve (fortsat) • Theorem 4.1 indeholder den ukendte parameter , derfor ikke umiddelbart operationel. • Erstattes af kan man vise at der gælder følgende resultat: • Theorem 4.2: Under CLM antagelserne og betinget på gælder at • hvor k+1 er antal regressorer i modellen inkl. konstantled. • t-fordelingen går mod N(0,1) når antallet af frihedsgrader vokser (fin approximation hvis større end 120). Økonometri 1: F6
Hypotesetest: Restriktion på en enkelt koefficient • Betragt en nulhypotese om en regressionskoefficient: , hvor a er en konstant. • Under nulhypotesen påstår vi altså en bestemt værdi af en parameter i den sande model. • Analogt til at specificere en parameter i DGP’en for et Monte Carlo eksperiment. • Tænk på nulhypotesen som DGP’en for et tankeeksperiment: Givet denne værdi af kender vi fordelingen af . • Bruge afvigelsen mellem estimatet, og den postulerede værdi, a, til at vurdere gyldigheden af nulhypotesen. Økonometri 1: F6
Hypotesetest: Restriktion på en enkelt koefficient • t-testet for er givet ved • og er fordelt som under nulhypotesen. • Alternativhypotesen: • Ensidede alternativer:eller • Tosidet alternativ: • Ex. Afkast af uddannelse: Hypotese om • Nulhypotese: • Relevant alternativ: Økonometri 1: F6
Hypotesetest: Restriktion på en enkelt koefficient • Klassisk teststrategi: • Vælg signifikansniveau: Sandsynlighed for at afvise nulhypotesen, givet at den er sand. Typisk vælges 5 %. • Vælg alternativhypotese: Bestemmer den kritiske region, givet signifikansniveauet. • Beregn teststatistik. • Afvis nulhypotesen hvis testet er i den kritiske region. • Afvis ellers ikke. • Alternativ: Beregn p-værdi: Marginale signifikansniveau som netop ville betyde at nulhypotesen må afvises. Økonometri 1: F6
Hypotesetest: Restriktion på en enkelt koefficient • Typiske eksempler: • a=0: Standard signifikanstest. • a=1 eller a=-1: Test af homogenitet eller proportionalitet. • Konfidensinterval: Givet signifikansniveau, , fx 5 %. Så er 100- % konfidensintervallet givet ved: • Konstrueres intervallet således vil det i 100- % af udfaldene rumme den sande værdi. Nulhypoteser om værdier udenfor vil således blive afvist. • Skitsér på tavlen. • Eksempel: Lønrelationen. Økonometri 1: F6
Hypotesetest: Eksempel: Lønrelationen Afhængig variabel: log(timeløn) Kilde: Output fra SAS-programmet lon_udd2.sas Økonometri 1: F6
NB’er fra denne forelæsning • Monte Carlo eksperimenter som en måde at gøre det statistiske ”tankeeksperiment” mere konkret. • Resultater fra Monte Carlo eksperimenter afhænger potentielt af de valgte parametre for DGP’en. • Antal observationer i stikprøven (n) og antal replikationer (gentagelser) i eksperimentet (M). • Eksplicit om ingredienser i klassisk teststrategi. Økonometri 1: F6
Hvad bliver det næste? • Fredag: Mere om kapitel 4, starter på kapitel 5 om ”asymptotiske” resultater. • Hjemmeopgave på ugeseddel 3: Den ”alternative” estimator • Ugeseddel 4: Simulationseksperiment. Økonometri 1: F6