170 likes | 301 Views
Økonometri 1. Gentagne Tværsnit og Paneldata II. Gentagne tværsnit (W 13.1-2): Opsamling. Kombinerer tværsnit indsamlet på forskellige tidspunkter. ”Partial” pooling: Tillader koefficienterne til nogle af variablerne at ændres mellem tidsperioder. Inkluder tidsdummier og interaktionseffekter.
E N D
Økonometri 1 Gentagne Tværsnit og Paneldata II
Gentagne tværsnit (W 13.1-2): Opsamling. • Kombinerer tværsnit indsamlet på forskellige tidspunkter. • ”Partial” pooling: Tillader koefficienterne til nogle af variablerne at ændres mellem tidsperioder. • Inkluder tidsdummier og interaktionseffekter. • ”Hjemmeopgave”: Lønligningseksempel (data i CPS78_85): • Signifikant ændring i ”afkastet af uddannelse” fra 1978 til 1985. • Ingen signifikant ændring i ”the gender wage gap” mellem 1978 og 1985. • Chow-testet? • Politik-analyse: Placering af et forbrændingsanlæg: • Signifikant negativ effekt på priser på huse i nærheden, alt andet lige. • Diff-in-diff metode: Forskelle mellem ”områder” af forskelle over tid. Renser for bestående forskelle i huspriser mellem områder og generel prisudvikling. Gentagne tværsnit og paneldata II
Gentagne tværsnit og paneldata Prøveeksamensopgaven udleveres i denne uge. Vejledende besvarelse udleveres 26. november, gennemgås 30. november. Mere info på hjemmesiden. I dag: To-periode panel data: Følger de samme individer over to perioder (13.3-4) • ”Unobserved effects model”: Tids-invariante og ”idiosynkratiske” effekter • Udeladt variabel bias (heterogeneitetsbias) • Første-differens estimation • Politikanalyse med to-periode paneldata Gentagne tværsnit og paneldata II
Datastruktur • Panel data: Samme n individer i periode 1 og periode 2. • Periode 1: • Periode 2: • Totalt: 2n observationer af n individer • Periode 2 kan være flere år (måneder, uger, …) efter periode 1 • Kaldes også longitudinale data. • Simpelt tilfælde: En regressor. Ønsker at estimere effekten af x påy, alt andet lige. Gentagne tværsnit og paneldata II
”Unobserved effects” model • Model: • Tidsdummy: samme værdi for alle individer (”makroeffekt”) • Sammensat fejlled: • Uobserveret ”fixed effect” (uobserveret heterogenitet): • Tids-invariant • Specifik for hvert individ • Idiosynkratisk fejl: • Varierer tilfældingt både over individer og tid: Det ”sædvanlige” fejlled Gentagne tværsnit og paneldata II
Antagelser på modellen for T=2: • Tilfældig stikprøve (ingen korrelation mellem individ i og j). • Sammensat fejlled: • Betinget middelværdi, givet regressorerne og individ-specifik effekt: • Implicerer at det ”idiosynkratiske” fejlled er ukorreleret • med de observerede regressorer • og med den uobserverede individ-specifikke effekt • NB: Vi gør ingen antagelser om (indtil videre): ”Fixed effects” tilgang. Gentagne tværsnit og paneldata II
Korreleret uobserveret heterogenitet • Uobserveret individ-specifik effekt kan meget vel være korreleret med de observerede variabler: • ”Pooling” af observationer og estimation med OLS: Vil være en inkonsistent estimator når . • Hvis data kun består af et enkelt tværsnit af og kan problemet ikke løses uden yderligere antagelser. • Gentagne observationer af samme individer giver mulige løsninger. • ”Fixed effect” paneldata løsning: Estimér en model hvor: • Parameteren af interesse, , er identificeret og… • …”fixed effekten”, , ikke indgår. • En metode der opfylder disse betingelser er første-differens (FD) estimation. Gentagne tværsnit og paneldata II
Første-differens estimation • Model: • Den uobserverede men tids-invariante ”fixed effect” bliver ”differenset” væk. • Vi har et tværsnit af første-differenser som tillader os at estimere konsistent: Givet antagelserne om er Gentagne tværsnit og paneldata II
Første-differens estimation • Mere generelt tilfælde: Flere observerede regressorer. Nogle kan være tids-invariante. Gentagne tværsnit og paneldata II
Første-differens estimation Gentagne tværsnit og paneldata II
Politikanalyse med paneldata (”programevaluering”) • Paneldata kan være endnu mere nyttige end gentagne tværsnit for politikanalyse. • Programevaluering: • Ønsker at måle effekten af, at et individ deltager i et program • ”Aktiv arbejdsmarkedspolitik” program • Subsidier for at få virksomheder til at være mere innovative, mere produktive, begynde at eksportere, …. • Effektvariabler: Løn (efter programmet), R&D udgifter, produktivitet, eksport intensitet, … • Problem: • Individer vælger sig ofte ind i programmet… • … Eller de bliver udskrevet til programmet … på grundlag af nogle karakteristika som kan være relaterede til den variabel, der måler programmets effekt. Gentagne tværsnit og paneldata II
Politikanalyse med paneldata • Et antal af de observerede individer gennemgår ”programmet”, resten gør ikke. Effekten måles fra periode 1 til periode 2. • Definerer en ”treatment” dummy: • Deltagere ( ) • Ikke-deltager ( ) • Model: • Panel data tillader en fejlledsstruktur: • Kontrollerer for tids-invariante karakteristika af deltagere og ikke-deltagere, inklusiv variabler som må formodes at påvirke beslutningen om at deltage i programmet. Gentagne tværsnit og paneldata II
Politikanalyse med paneldata • Første-differens model: • Deltagelse finder kun sted i periode 2 (”før-efter”) så og OLS estimatet bliver • Diff-in-diff estimat. • Panelstruktur: Ingen antagelser er nødvendige på • Må stadig antage at og er ukorrelerede for at sikre konsistens. Gentagne tværsnit og paneldata II
Politikanalyse med paneldata: Eksempel (W s. 445-6) • Eksempel: Effekt af subsidier til virksomheders efteruddannelsesprogram • Formål: At øge produktiviteten for arbejderne i virksomheden. • Effektmål: ”Scrap rate” (andel af produkter med fejl): • Mange fejl = lavt gennemsnitligt produktivitetsniveau i virks. i • Få fejl = høj produktivitet. • Model: • Hvordan opnår vi et konsistent estimat af effekten, , af subsidieprogrammet? Gentagne tværsnit og paneldata II
Politikanalyse med panel data: Eksempel • Problem: • Deltagelse i subsidieprogrammet kan være relateret til uobserverede virksomhedseffekter (ledelsesevner, mængden af kapital i virksomheden,…). • Uobserverede effekter er potentielt relaterede til produktivitet. • OLS på ”pooled” sæt af observationer: • Diff-in-diff metode: Gentagne tværsnit og paneldata II
Politikanalyse med panel data: Eksempel • ”Hjemmeopgave” : • Er der tegn på heterogenitetsbias her? • I hvilken retning er der mest sandsynligt bias? • Kan vi sige noget om, hvad der får virksomheder til at vælge at deltage i programmet? Gentagne tværsnit og paneldata II
Næste gang • Torsdag 8-10! • Panel data med flere observationer over tid for de samme individer. • W sec. 13.5, 14.1. • Prøveeksamen: Starter ved øvelserne i denne uge. • Hold 202: Vester A21 i dag kl. 12-15. Gentagne tværsnit og paneldata II