210 likes | 424 Views
Økonometri 1. Dummy variable 17. marts 2003. Dagens program. Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4) HUSK EKSAMENSTILMELDING Kvalitative variable Dummy variable for kvalitative variable med to kategorier
E N D
Økonometri 1 Dummy variable 17. marts 2003 Økonometri 1: Dummy variable
Dagens program Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4) • HUSK EKSAMENSTILMELDING • Kvalitative variable • Dummy variable for kvalitative variable med to kategorier • Dummy variable for kvalitative variable med flere end to kategorier • Interaktionsled med dummy variable • Chow testet Økonometri 1: Dummy variable
Kvalitative variable • Indtil nu har vi (hovedsagligt) set på kvantitative variable (løn, priser, forbrug, indkomst) • .. Men hvad med kvalitative variable? • Kvalitative variable: • Diskrete variable • Eksempler: • Køn • Kommune • Sektor • Arbejdstid (ikke arbejde, halvtid, fuld tid) • Helbred (dårligt, middel, godt) Økonometri 1: Dummy variable
Kvalitative variable • I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal • Eksempler: arbejdstid og helbred Økonometri 1: Dummy variable
Kvalitative variable med to kategorier • For kvalitative variable med to kategorier laves ofte en dummy variabel • Dummy variable • Diskret variabel • Antager kun værdien 0 og 1. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0 • Dummy variable benyttes meget i regressionsmodeller • Kategorien hvor Dummy = 0 kaldes reference-kategorien • Dummy variable kaldes også for indikator variable og binære variable Økonometri 1: Dummy variable
Kvalitative variable med to kategorier • Dummy variable kan inkluderes i den multiple regressionsmodel som alm. forklarende variable • Eks: lønrelationen • hvor kvinde er en dummy variabel • Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR 3 er opfyldt Økonometri 1: Dummy variable
Kvalitative variable med to kategorier • Fortolkning af parameteren til dummy variablen: • Parameteren til dummy variablen måler forskellen mellem de to kategorier • Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet • ..men afkast af de øvrige forklarende variable er de sammen for de to grupper • Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) • Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) • Vil man have den eksakte procentuelle forskel skal følgende formel anvendes Økonometri 1: Dummy variable
Kvalitative variable med to kategorier • Valg af referencegruppe: • Hvad hvis vi i stedet havde inkluderet en dummy for mand? • Man kan blot omparametrisere så får man den samme model (Husk ) • Begge variable kan ikke inkluderes (hvis der også er et konstantled i modellen) -> Perfekt multikollinaritet Økonometri 1: Dummy variable
Evaluering af programmer • Et meget vigtigt eksempel på dummy variable er ”program evaluation” • Eks: Effekten af jobtræningskurser • Simpel tilfælde: to grupper • ”Treatment” (forsøgs-) gruppen: dem som deltager i programmet • ”control” (kontrol) gruppen: dem som ikke deltager • Parameteren til dummy variablen for ”treatment” gruppen måler effekten af at have deltaget • Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer) Økonometri 1: Dummy variable
Kvalitative variable med flere end to kategorier • Hvad hvis den kvalitative variabel har m kategorier (og m>2) • Generelt skal man lave m-1 dummy variable • Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien • Hvis man inkluderer m dummy variable og et konstantled er der perfekt multikollinaritet • Parametrene til dummy variablene angiver forskellen mellem den pågældende kategori og reference kategorien • Betyder valget af reference kategori noget? • Nej, ikke for estimation, prediktioner • Ja, fortolkningen af parametrene til dummy variablene afhænger af reference kategorien Økonometri 1: Dummy variable
Kvalitative variable med flere end to kategorier • Eksempel: • Hvad hvis man brugte dummy variable til at kontrollere for uddannelse • Uddannelseskategorier for højeste fuldførte udd.: • Folkeskole (udd<=9) • 10. klasse (udd=10) • Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,13) • Videregående uddannelse (udd>13) • Model Økonometri 1: Dummy variable
Kvalitative variable med flere end to kategorier (fortsat) • Hvilke fordele/ulemper er der ved at bruge dummy variable? • Fordele: generelt mere fleksibel form • Ulempe: flere variable i regressionen (tab af frihedsgrader) • Test for betydning af den kvalitative variabel udføres ved et F-test for at alle parametrene til dummyerne er lig 0 Økonometri 1: Dummy variable
Kvalitative variable med flere end to kategorier (fortsat) • Eksempel: sammenligning af effekten af uddannelse Økonometri 1: Dummy variable
Interaktionsled med to dummy variable • Interaktionsled med dummy variable er helt analogt til interaktionsled med kvantitative variable og ofte anvendt • Eksempel: Arbejdsudbud • Denne model er meget restriktiv (urealistisk), fordi man antager, at effekten af børn er uafhængig af køn • Denne restriktion kan fjernes ved at introducere et interaktionsled Økonometri 1: Dummy variable
Interaktionsled med to dummy variable • Eksempel: lønrelationen – interaktion mellem køn og ægteskabelig status • Hvorfor skal ægteskabelig status med i en lønrelation? • Skal der en interaktionseffekt mellem køn og ægteskabelig status med? Økonometri 1: Dummy variable
Interaktionsled med dummy variable og kvantitative variable • Interaktionsled mellem dummy variable og kvantitative variable kan fortolkes som forskellig effekt (eller afkast) af den kvantitative variabel • Grafisk kan det illustreres ved forskellige hældninger (se figur 7.2) • Eksempel: Lønrelationen- afkastet af erfaring afhænger af køn Økonometri 1: Dummy variable
Interaktionsled med dummy variable og kvantitative variable • Tests • Samme afkast af erfaring: • Ingen forskel på mænd og kvinder: Økonometri 1: Dummy variable
Chow test • Test for om der er forskel mellem to grupper • Modellen kan formuleres ved brug af dummy’er (d=1 for gruppe 2) • Hypotesen kan formuleres som • Hvis der er mange forklarende variable kan modellen skrives som • hvor g=1,2 (to forskellige grupper) • Hypotese • k+1 restriktioner Økonometri 1: Dummy variable
Chow test (fortsat) • Teststørrelsen udregnes ved at lave tre regressioner af y på en konstant og (uden dummy-variable), hvor SSR størrelsen noteres: • Regression for gruppe 1 alene -> SSR1 • Regression for gruppe 2 alene -> SSR2 • Regression for både gruppe 1 og 2 ->SSRP Økonometri 1: Dummy variable
Chow test (fortsat) • Teststørrelsen • Hvor n er det samlede antal obs. (både fra gruppe 1 og 2) • k+1 er antal restriktioner • Teststørrelsen er F-fordelt med (k+1, n-2(k+1)) frihedsgrader • NB: Dette test er det klassiske F-test Økonometri 1: Dummy variable
Chow test (fortsat) • Eksempel: Lønrelation • Grupper: mænd og kvinder • Model • Teststørrelse (se SAS-output) • F-fordelt med (3,1040) frihedsgrader Økonometri 1: Dummy variable