170 likes | 307 Views
Kvantitative metoder 2. Specifikation og dataproblemer 30. april 2007. Program for de to næste forelæsninger. Emnet er specifikation og dataproblemer (Wooldridge kap. 9)
E N D
Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007 KM2: F21
Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) • Fejlleddet kan være korreleret med de forklarende variabler: Endogene regressorer og MLR.4 holder ikke; OLS er hverken middelret eller konsistent. • Fokus er her på de forskellige problemtyper og på test. Mulige løsninger i kap. 13-15. • Misspecifikation af den funktionelle form • Brug af proxy-variabler • Betydning af målefejl • Dataudvælgelse • Feedback på Obligatorisk opgave 2 + eksempler på multiple choice spørgsmål KM2: F21
Funktionel form misspecifikation • Hvad nu, hvis man benytter en forkert funktionel form? • Generelt vil OLS estimaterne ikke være middelrette og ikke konsistente • Forkert funktionel form kan opfattes som udeladte variable • Eksempel: Antag, at i den sande model er y beskrevet ved et 2. gradspolynomium i x: • Antag, vi benytter en lineær funktion i x til estimationen (forkert funktionel form) • Det kvadratiske led er en udeladt variabel, som generelt vil give biased estimater KM2: F21
Funktionel form misspecifikation • Lønrelation: Antag at den sande model er • Modellen, som estimeres, er • OLS estimaterne er ikke middelrette og konsistente • Fortolkningen af afkastet af erfaring er forkert • I den sande model: • I den ”forkerte” model”: KM2: F21
Funktionel form misspecifikation • Økonomisk teori giver sjældent præcise anvisninger på den funktionelle form • Forkert funktionel form: • Den afhængige variabel har forkert funktionel form: • Log(y) i stedet for y • Forklarende variabel har forkert funktionel form: • Log(x) i stedet for x eller exp(x) i stedet for x • mangler • Mangler interaktionsled mellem og • Men bemærk: Vi observerer de relevante variabler KM2: F21
Funktionel form misspecifikation • Problem med funktionel misspecifikation betragtes derfor som mindre fatalt end ”ægte” udeladte variabler (som man typisk ikke har information om) • I tilfælde med forkert funktionel form har man i princippet mulighed for at opstille den rigtige model • Fremgangsmåde: • Estimer modellen med OLS • Udregn residualerne • Plot residualerne mod de forklarende variabler: Grafisk test • Beregn formelle test KM2: F21
Formelle test for misspecifikation • Udgangspunkt i at hvis MLR.1- MLR.4 er opfyldt og man tilføjer fx kvadratiske led af regressorerne, bør disse være insignifikante. • Generelt kan man approksimere en ukendt funktionel form med et polynomium • Antag at modellen er givet ved og opfylder MLR.1-4. • Simpelt test: Tilføj kvadratiske led af de forklarende variabler og interaktionsled. Udfør et sædvanligt F-test af deres signifikans: Ej signifikante hvis specifikationen er OK. KM2: F21
RESET • Specialiseret test af funktionel forms misspecifikation: REgresssion Specification Error Test (RESET) • Antag: Modellen opfylder MLR.1- MLR.4 • I RESET tilføjes et polynomium i de predikterede værdier i y • Testet af korrekt funktionel form er et test for hypotesen • Teststørrelsen er approx. F-fordelt (2, n-k-3) KM2: F21
Test af ”ikke-nestede” alternativer • ”To nest”: To put inside one another: to nest boxes. • Udenfor den almindelige testteori: Model under nulhypo-tesen er ikke specialtilfælde af model under alternativet. • Ex. Model 1: Model 2: • Tilgang 1: Estimér omfattende model (Mizon og Richard) Her kan vi teste flg. to hypoteser: KM2: F21
Test af ”ikke-nestede” alternativer • Tilgang 2: Tilføje prediktion fra alternativ model (Davidson-MacKinnon) • Hjælperegression 1: Hypotese: • Hjælperegression 2: Hypotese: KM2: F21
Test af ”ikke-nestede” alternativer • Konklusionen er ikke nødvendigvis entydig. • Begge modeller kan blive afvist: • Prøv en tredje funktionel form • Ingen af de to modeller kan afvises: • Brug andre kriterier for modelvalg, fx • Selvom en model ikke kan afvises, er det ikke nødvendigvis den ”sande” model. • Ikke-nestede alternativer med forskellige afhængige variabler er et (endnu mere) kompliceret problem. KM2: F21
Proxy variabler • Proxy variabler kan bruges, når den variabel, som man egentlig er interesseret i at korrigere for (men ikke måle effekten af), er uobserverbar. • Proxy variablen indgår som erstatning for den ”sande” variabel. Ideen er at fjerne/-minimere problemet med udeladte variabel bias • Eksempler: • Tilbagetrækning fra arbejdsmarkedet: Alder, uddannelse og indkomst som forklarende variabler. Helbred spiller en rolle og”self-reported health status” bruges som proxy • Løn-uddannelses relation: IQ som proxy for ”evner” KM2: F21
Proxy variabler • Tavlegennemgang KM2: F21
Proxy variabler • Eksempel: Lønrelation (på US data) • Se tabel 9.2 • I alle lønestimationer er der problemer med, at ”evner” ikke er medtaget. Kan være korreleret med både løn, erfaring og uddannelse • Giver ikke middelrette/konsistente estimater (specielt problem med uddannelse) • IQ bruges som en proxy for evner • Resultaterne viser, at estimatet på uddannelse falder, når proxyen medtages • Er det som forventet? KM2: F21
Proxy variabler • ”Lagget” variabel som proxy: Sidste periodes værdier • I nogle tilfælde kan man kontrollere for udeladte variabler ved at korrigere med laggede værdier af den afhængige variabel • Den laggede afhængige variabel kan her opfattes som en proxy for udeladte variabler: • vil være korreleret med de udeladte variabler i sidste periode • må ikke være korreleret med denne periodes fejlled KM2: F21
NB’er • Funktionel form misspecifikation: De relevante variabler er til rådighed, men formen kendes ikke. • RESET er et test for misspecifikation af den funktionelle form, ikke for fx ”ægte” udeladte variabler eller for heteroskedasticitet. • Proxyvariabler bruges som erstatning for udeladte variabler, men proxyens ”effekt” på y har sjældent nogen selvstændig interesse. • Der må argumenteres for proxyvariablens gyldighed i hvert enkelt tilfælde. KM2: F21
Næste gang • Næste forelæsning er onsdag den 2. maj • Mere om kapitel 9: • Målefejl • Dataudvælgelse • Eksempler på multiple choice opgaver KM2: F21