210 likes | 432 Views
Økonometri 1. Specifikation og dataproblemer 10. november 2006. Program. Info om ”prøveeksamen” Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Mere om brug af proxy-variabler Betydning af målefejl Dataudvælgelse: Manglende observationer Endogen og eksogen dataudvælgelse
E N D
Økonometri 1 Specifikation og dataproblemer 10. november 2006 Økonometri 1: F15
Program • Info om ”prøveeksamen” Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): • Mere om brug af proxy-variabler • Betydning af målefejl • Dataudvælgelse: • Manglende observationer • Endogen og eksogen dataudvælgelse • Ekstreme og indflydelsesrige observationer Økonometri 1: F15
Info om ”prøveeksamen” Ugeseddel 10 er en frivillig ”prøveeksamen”. Formål: I får lejlighed til - under eksamensrealistiske forhold - at: • Løse en opgave af samme type som eksamensopgaven (men ca. halv størrelse) • Afprøve ”infrastrukturen” omkring download og upload af data og programmer • Afprøve den computer og SAS-installation som I har tænkt jer at løse eksamensopgaven på Forløb: • ”Prøveeksamens”-opgaven udleveres/downloades ved øvelserne i uge 47 (21/11 hhv. 23/11). • Opgaven afsluttes ved øvelserne i uge 48. Anbefalet samlet tidsforbrug i løbet af uge 47/48: 10 timer. • Besvarelsen skal ikke afleveres, men upload af SAS-programmer og datafiler afprøves. • Vejledende besvarelse udleveres på hjemmesiden fredag den 1. december. • Opgaven bliver gennemgået ved forelæsningen den 4. december. Økonometri 1: F15
Målefejl • Der må ofte antages at være målefejl i økonomiske data • Grunde til at målefejl opstår: • Spørgeskemaundersøgelser – retrospektiv information • Præcis information, der svarer til det teoretiske begreb, findes ikke • Tastefejl • To hovedtilfælde: • Målefejl i afhængig variabel • Målefejl i forklarende variabler Økonometri 1: F15
Målefejl i den afhængige variabel • Antag følgende model • Modellen opfylder MLR.1-MLR.4 • Desværre observerer man ikke y*, i stedet observeres y hvor kan opfattes som en målefejl • For at kunne estimere modellen skal y* erstattes med y: Økonometri 1: F15
Målefejl i den afhængige variabel • Fejlleddet i den ”nye” model: • Hvornår giver OLS middelrette og konsistente estimater af ? • Under antagelserne • Middelværdien af målefejlene er 0 • Målefejlene er uafhængige af de forklarende variable vil den ”nye” model med y opfylde MLR.1-MLR.4, og derfor er OLS middelret og konsistent • Hvis målefejlene ikke har middelværdi 0, men stadig er uafhængige af de forklarende variabler, vil OLS blot give et skævt estimat af Økonometri 1: F15
Målefejl i den afhængige variabel • Variansen i det nye fejlled: • Normalt antager man, at variansen af målefejlen er konstant. Så er antagelsen MLR.5 også opfyldt for den ”nye” model. • .. Hvis ikke giver det anledning til heteroskedasticitet • Hvis målefejlene og u er ukorrelerede, er variansen • Variansen er større med målefejl -> større varians af parameterestimaterne. Økonometri 1: F15
Målefejl i den afhængige variabel • Multiplikative målefejl • Målefejl som er proportionale med den afhængige variabel • Hvis den afhængige variabel transformeres med log fås Økonometri 1: F15
Målefejl i de forklarende variabler • Antag følgende model: • x* er uobserverbar. I stedet observeres x, som er givet ved • Antagelserne om målefejl: • x kan opfattes som en proxy for x* • OLS er middelret og konsistent Økonometri 1: F15
Målefejl i de forklarende variabler • At målefejlen er ukorreleret med det observerede x, er ofte en urealistisk antagelse • Klassiske målefejl: Målefejlen er ukorreleret med den sande værdi af variablen. • Antagelser: • Disse antagelser er ofte mere naturlige. Desværre giver de anledning til alvorlige problemer. Økonometri 1: F15
Målefejl i de forklarende variabler • Egenskaber ved OLS estimatoren • OLS ikke konsistent • Tavlegennemgang • I kapitel 15 ser vi på, hvordan man kan få konsistente estimater når der er målefejl Økonometri 1: F15
Data problemer • Indtil nu har vi antaget, at MLR.2 altid er opfyldt • Vi har antaget, at data stammer fra en tilfældig stikprøve • Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis: • Manglende observationer: Tilfældigt eller ej? • Ikke-tilfældig dataudvælgelse: Exogent eller endogent. Økonometri 1: F15
Manglende observationer • Er manglende observationer for en eller flere variabler et problem? • Manglende observationer vil reducere antallet af brugbare observationer i analysen • Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler • Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mindre præcise estimater Økonometri 1: F15
Ikke-tilfældig dataudvælgelse • Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt): • Eksogen dataudvælgelse • Endogen dataudvælgelse • Stratificeret dataudvælgelse • Det er ikke alle typer af ikke-tilfældig dataudvælgelse, som giver anledning til skæve eller inkonsistente OLS estimater Økonometri 1: F15
Ikke-tilfældig dataudvælgelse • Eksogen dataudvælgelse: • Dataudvælgelse baseret på en af de forklarende variabler • Denne type af dataudvælgelse vil (under forudsætninger af nok variation i de forklarende variabler) stadig give middelrette og konsistente OLS etimater • Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS estimaterne er middelrette og konsistente Økonometri 1: F15
Ikke-tilfældig dataudvælgelse • Endogen dataudvælgelse: • Dataudvælgelse baseret på den afhængige variabel eller variabler, der er korrelerede dermed • Eksempler • Formue i model for investeringsstrategier blandt aktieinvestorer (kun baseret på folk med formue under 0,5 mill. kr.) • Lønrelationen (kun baseret på folk som arbejder) • OLS estimator er ikke middelret og ikke konsistent Økonometri 1: F15
Ikke-tilfældig dataudvælgelse • Stratificeret dataudvælgelse: • Populationen er delt i grupper (disjunkte grupper som udgør hele populationen) • Nogle af grupperne er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen • OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variabler Økonometri 1: F15
Ekstreme observationer • Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne • En ekstrem observation får stor betydning på OLS estimater, da OLS bestemmes ved at minimere de kvadrerede residualer • Hvorfor er der ekstreme observationer: • Fejl i data • Enkelte enheder i populationen er meget forskellige fra resten Økonometri 1: F15
Ekstreme observationer • Hvad gør man ved ekstreme observationer: • Hvis man er sikker på, at de skyldes fejl i data: Ekstreme observationer udelades • Hvis det ikke er en oplagt fejl, er der ingen nemme løsninger: • Estimér modellen med og uden de ekstreme observationer og sammenlign resultaterne • Der findes estimatorer, som er mere robuste overfor ekstreme observationer end OLS Økonometri 1: F15
NB’er • Målefejl i den afhængige variabel giver oftest anledning til mindre præcis estimation, men berører sædvanligvis ikke konsistensen af OLS estimation. • Klassiske målefejl: Mest rimelige antagelse i mange tilfælde. Desværre giver dette tilfælde anledning til alvorlige problemer (inkonsistente OLS estimater). • Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anledning til bias. Økonometri 1: F15
Næste gang • Næste forelæsning er mandag den 13. november • Nyt emne: Gentagne tværsnit og paneldata: Kapitel 13+14 i Wooldridge. Økonometri 1: F15