1 / 20

Økonometri 1

Økonometri 1. Inferens i den multiple regressionsmodel 27. februar 2003. Inferens i den multiple regressionsmodel. Emnet for denne og de to næste forelæsninger er statistisk inferens, specielt hypotesetest. Resultater om OLS med et endeligt antal observationer (kap. 4): Normalitetsantagelse.

jerome
Download Presentation

Økonometri 1

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003 Økonometri 1: Inferens i den multiple regressionsmodel

  2. Inferens i den multiple regressionsmodel • Emnet for denne og de to næste forelæsninger er statistisk inferens, specielt hypotesetest. • Resultater om OLS med et endeligt antal observationer (kap. 4): Normalitetsantagelse. • Mere generelle antagelser: Asymptotiske resultater for OLS: (kap. 5). • Introducere et nyttigt redskab: Monte Carlo eksperimenter (forelæsningsnote ligger på hjemmesiden). Økonometri 1: Inferens i den multiple regressionsmodel

  3. Dagens program • Monte Carlo eksperimenter: Anvendes på Ugeseddel 4 og 5 og fremover. • Ideen med at lave simulationseksperimenter • Opbygning af en simulationsalgoritme • Et eksempel: Den forventede startløn for en økonom • Hypotesetest og konfidensintervaller i den multiple regressionsmodel: Wooldridge kap. 4.1-4.3. • Kendt stof fra Teoretisk Statistik. • Genovervej i lyset af Monte Carlo noten. Økonometri 1: Inferens i den multiple regressionsmodel

  4. Monte Carlo eksperimenter: Ideen • Simulationer af ”datasæt” fra en fuldt specificeret model: Datagenererende proces (DGP) • Eksempel: • Vi kender de "sande parametre" μ og σ² og genererer et sæt af fx N=100 observationer fra modellen: • ”Glemmer” at vi kender μ og σ²: Anvend estimator (”regneregel”) til at skønne over fx μ ud fra det foreliggende sæt af observationer: Fx gennemsnittet: Økonometri 1: Inferens i den multiple regressionsmodel

  5. Monte Carlo eksperimenter: Ideen (fortsat) • Kan vi på en nem måde vurdere, om er en rimelig estimator for μ ? • Lav nye uafhængige trækninger af datasæt genereret af den samme DGP. • Beregn værdien af estimatoren for hvert datasæt: • Lav mange trækninger (”replikationer”). • Se på fordelingen af estimaterne over replikationerne: Beregn fx fordelingens gennemsnit og varians. • Parallelt til ”tankeeksperiment”: Vores konkrete datasæt er blot ét blandt mange potentielle udfald. Økonometri 1: Inferens i den multiple regressionsmodel

  6. Monte Carlo eksperimenter: Ideen (fortsat) • Formål med Monte Carlo eksperimenter: • Efterprøve analytiske resultater: fx at OLS er middelret under MLR.1-4. • Sammenligne forskellige estimatorer eller test, hvor det er besværligt/umuligt analytisk. • Vurdere hvor mange observationer der skal til for at man kan bruge asymptotiske resultater (kap. 5). Økonometri 1: Inferens i den multiple regressionsmodel

  7. Monte Carlo eksperimenter: I praksis ProcIML; antalobs = 100; * antal observationer i datasættet; Y = j(antalobs,1,.); * data-vektoren (startlønnen) ; do i=1 to antalobs; * generer datasæt; e = rannor(1); * fejlleddet genereres; y[i,1] = 27 +1.5* e; * beregn y variabel ; end; quit; Økonometri 1: Inferens i den multiple regressionsmodel

  8. Monte Carlo eksperimenter: I praksis (fortsat) m1[j,1]=sum(y)/antalobs; * estimatet m1 (gennemsnittet); m2[j,1]=1/2*(min(y)+max(y)); * estimatet m2 (gns. min og max); Økonometri 1: Inferens i den multiple regressionsmodel

  9. Monte Carlo eksperimenter: I praksis (fortsat) Trin 3: Gentag trin 1 og 2: M=10.000 replikationer: antalsim = 10000; * antal replikationer i simulationen; m1 = j(antalsim,1,.); * vektorer til at gemme estimaterne i; m2 = j(antalsim,1,.); do j=1 to antalsim; * løkke over simulationer; . <her beregnes estimater for hvert datasæt> . end; Trin 4: Analysér fordelingerne af de to sæt estimater: • Histogram • Gennemsnit, varians, højere momenter Økonometri 1: Inferens i den multiple regressionsmodel

  10. Monte Carlo eksperimenter: Eksempel • Brug algoritmen til at analysere og som estimatorer for middelværdien i fordelingen af startlønninger. • Ex: Telefoninterviews med tilfældigt udvalgte, nyuddannede økonomer, som oplyser (?) deres startløn. • Sæt (begge i 1000 kr.) • SAS-programmet MC.sas udfører M=10.000 replikationer. Se på N=100, N=50 og N=10. • Link til SAS Økonometri 1: Inferens i den multiple regressionsmodel

  11. Monte Carlo eksperimenter: Eksempel (fortsat) Middelværdi og varians af de to estimatorer baseret på M=10.000 simulationer • har lavest varians • Varians aftager medN Økonometri 1: Inferens i den multiple regressionsmodel

  12. Monte Carlo eksperimenter: Afrunding • Husk: • Resultater og konklusioner fra Monte Carlo eksperimenter afhænger potentielt altid af de valgte parametre og fordelinger. • I praktiske anvendelser må man i hvert enkelt tilfælde godtgøre, at den valgte model har relevans for den problemstilling, man ønsker at belyse. PAUSE Økonometri 1: Inferens i den multiple regressionsmodel

  13. Hypotesetest i den multiple regressionsmodel: Endelige stikprøver (kap. 4) • For hypotesetest behøver vi fordelingen af . • Introducere yderligere antagelse: Normalitet. • MLR.6: u er uafhængig af og normalfordelt med middelværdi nul og varians . • Definerer den klassiske lineære model (CLM). • Restriktiv antagelse: • Argument for: u opsamler alle de mange effekter der er udeladt af modellen: Central grænseværdisætning køres i stilling. • Argumenter imod i konkrete problemstillinger: Begrænsede variabler (positive!), andre typer af fordelinger (log-normal, diskrete). Økonometri 1: Inferens i den multiple regressionsmodel

  14. Fordeling af OLS estimatoren: Endelig stikprøve • Linearitet af i u og CLM giver følgende resultat: • Theorem 4.1: Under CLM antagelserne og betinget på gælder at hvor Heraf følger: Økonometri 1: Inferens i den multiple regressionsmodel

  15. Fordeling af OLS estimatoren: Endelig stikprøve (fortsat) • Theorem 4.1 indeholder den ukendte parameter , derfor ikke umiddelbart operationel. • Erstattes af kan man vise at der gælder følgende resultat: • Theorem 4.2: Under CLM antagelserne og betinget på gælder at hvor k+1 er antal regressorer i modellen inkl. konstantled. Økonometri 1: Inferens i den multiple regressionsmodel

  16. Hypotesetest: Endelig stikprøve • Betragt en simpel nulhypotese om en regressionskoefficient: , hvor a er en konstant. • Under nulhypotesen fastlægger vi altså værdien af en parameter i den sande model. • Analogt til at specificere DGP’en for et Monte Carlo eksperiment. • Tænk på nulhypotesen som DGP’en for et tankeeksperiment: Givet denne værdi af kender vi fordelingen af . • Kan derfor bruge afvigelsen mellem estimatet, og den postulerede værdi, a, til at vurdere gyldigheden af nulhypotesen. Økonometri 1: Inferens i den multiple regressionsmodel

  17. Hypotesetest: Endelig stikprøve • t-testet for er givet ved og fordelt som under nulhypotesen. • t-fordelingen går mod N(0,1) når antallet af frihedsgrader vokser. Fin approximation hvis større end 120. • Alternativhypotesen: • Ensidede alternativer:eller • Tosidet alternativ: Økonometri 1: Inferens i den multiple regressionsmodel

  18. Hypotesetest: Endelig stikprøve • Klassisk teststrategi: • Vælg signifikansniveau: Sandsynlighed for at afvise nulhypotesen, givet at den er sand. Typisk vælges 5 %. • Vælg alternativhypotese: Bestemmer den kritiske region, givet signifikansniveauet. • Beregn teststatistik. • Afvis nulhypotesen hvis testet er i den kritiske region. • Afvis ellers ikke. • Alternativ: Beregn p-værdi: Marginale signifikansniveau som ville betyde at nulhypotesen ville blive afvist. Økonometri 1: Inferens i den multiple regressionsmodel

  19. Hypotesetest: Endelig stikprøve • Typer af simple hypoteser: • a=0: Standard signifikanstest. • a=1 eller a=-1: Test af homogenitet eller proportionalitet. • Konfidensinterval: Givet signifikansniveau, , fx 5 %. Så er 100- % konfidensintervallet givet ved: • Konstrueres intervallet således vil det i 100- % af udfaldene rumme den sande værdi. Nulhypoteser om værdier udenfor vil således blive afvist. • Skitsér på tavlen. Økonometri 1: Inferens i den multiple regressionsmodel

  20. Næste gang: • Generelle lineære hypoteser på regressionskoefficienterne under normalitet: W 4.4-4.6 • Uden normalitetsantagelser: Store stikprøver: W 5.1 om konsistens af OLS. Økonometri 1: Inferens i den multiple regressionsmodel

More Related