240 likes | 332 Views
Økonometri 1. Den simple regressionsmodel 11. september 2006. Dagens program. Den simple regressionsmodel – SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition af SLR Antagelser for SLR Udledning af OLS estimatoren (tavlegennemgang)
E N D
Økonometri1 Den simple regressionsmodel 11. september 2006 Økonometri 1: F2
Dagens program Den simple regressionsmodel – SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) • Motivation for gennemgangen af SLR • Definition af SLR • Antagelser for SLR • Udledning af OLS estimatoren (tavlegennemgang) • Forudsagte værdier og residualer • ”Mekaniske” egenskaber ved OLS estimatoren • Eksempel på en simpel regressionsmodel • Variablernes enheder Økonometri 1: F2
Motivation for simpel regressionsmodel (SLR) Vi beskæftiger os med modeller, hvor vi ønsker at forklare y med x. Eksempler: • Hvordan påvirker kunstgødning udbyttet af sojabønner (Ex 1.3)? • Hvordan påvirker uddannelsesniveauet timelønnen (Ex. 1.4)? • Hvordan afhænger virksomhedens afkast af direktørens løn (Ex. 2.3)? • Regressionsmodellen vil være den samme som i Teoretisk Statistik. • Estimatoren – OLS – er også den samme. • De statistiske antagelser for modellen er (lidt) anderledes: • Ofte mere realistiske for økonomiske anvendelser • Grundlag for generalisering/alternativer senere i kurset Økonometri 1: F2
Motivation (fortsat) Når modellen opstilles, er vi nødt til at forholde os konkret til flg. spørgsmål: • Hvad nu, hvis x ikke er den eneste faktor, som har betydning for y ? • Hvilken funktionel form kan beskrive sammenhængen mellem y og x ? • Kan y fx beskrives som en lineær funktion af x ? Eller log(x)? • Eller kan y beskrives som en funktion af x? log(x)? • Kan modellen bruges til ceteris paribus fortolkninger? Økonometri 1: F2
Definition af SLR Den simple regressionsmodel • Kaldes også for den bivariate regressionsmodel • y: afhængig variabel • x: forklarende variabel • u: (uobserveret) fejlled • β0: konstantled (intercept) sjældent fortolkeligt • β1: hældningskoefficient (”slope”) • Konstantleddet og den forklarende variabel kaldes under ét regressorerne Økonometri 1: F2
Definition (fortsat) Når vi opskriver den simple regressionsmodel, besvarer vi implicit spørgsmålene i motivationen: Andre faktorer: • Andre faktorer (end x), som påvirker y: Er indeholdt i fejlleddet u • Fejlleddet u indeholder derfor: • Udeladte faktorer/variable • Målefejl • Hvad indeholder u i eksemplet med uddannelse og løn? Økonometri 1: F2
Definition (fortsat) Funktionel form: • Vi antager, at variablerne er bragt på en form, så y kan beskrives som en lineær funktion af x. • En ændring i y kan forklares ved en ændring i x (forudsat Δu=0) • Parameteren β1angiver hældningskoefficienten for y som funktion af x. Økonometri 1: F2
Definition (fortsat) Ceteris paribus fortolkning af parameter: • Vi kan ikke generelt lave ceteris paribus fortolkninger af parameterne. • Fortolkningen af β1 som effekten af x på y forudsætter at Δu=0. • I uddannelse – løn eksemplet, hvad kan problemet med ceteris paribus antagelsen være ? Økonometri 1: F2
Statistiske antagelser for regressionsmodellen • Antagelse 1 - (2.5) i Wooldridge. • Middelværdien af u er lig 0 • Samme antagelse som i Teoretisk Statistik • Antagelsen er normalt uproblematisk, så længe det er effekten af x, som er den interessante parameter, og der er et konstantled i modellen • …men gør også tit fortolkningen af konstantleddet problematisk Økonometri 1: F2
Antagelser (fortsat) • Antagelse 2 - (2.6) i Wooldridge. • Den betingede middelværdi af u givet x er lig 0 • Denne antagelse er ofte kritisk • Lidt om antagelsen (se Appendix B.4): Økonometri 1: F2
Antagelser (fortsat) Økonometri 1: F2
Antagelser (fortsat) • Eksempel: Timeløn og uddannelse • Vi har følgende model: • Fejlleddet u indeholder blandt andet ”evner” og ”arbejdsiver”. • Er følgende antagelsen rimelig? Økonometri 1: F2
Udledning af OLS estimatoren • OLS estimatoren udledes vha. moment metoden (Method of Moments) • Ideen med moment metoden illustreres ved et eksempel: • Antag at man har en tilfældig stikprøve af n observationer af en variabel x. • x har en ukendt middelværdi , som man er interesseret i at bestemme. Dvs. . • Hvad vil være et naturligt estimat for middelværdien? • Gennemsnittet!! • Moment estimationgår ud på at erstatte teoretiske ”momenter” med data ”momenter” (her: Gennemsnittet) Økonometri 1: F2
Udledning (fortsat) • Resten af udledningen af OLS estimatoren foregår som tavlegennemgang Økonometri 1: F2
Forudsagte værdier og residualer • Forudsagte værdier: Populations regressionsfunktionen Ud fra estimaterne for parametrenekan de forudsagte værdier af y bestemmes: • Residualer: Residualerne kan bestemmes som forskellen mellem den faktiske og forudsagte værdi af y: Økonometri 1: F2
Forudsagte værdier og residualer (fortsat) • For residualerne (baseret på en OLS estimation med konstantled) gælder følgende sammenhænge mekanisk: • Hvorfor er dette ikke så underligt? • OLS estimatoren kan ækvivalent opnås ved at minimere residualkvadratsummen: • Sådan blev OLS estimatoren udledt i Teoretisk Statistik Økonometri 1: F2
Flere egenskaber ved OLS • Variansanalyse: Den afhængige variabel y dekomponeres i to komponenter: • Forudsagte værdi: • Residualet: • Variationen i y (total sum of squares) : hvor Økonometri 1: F2
Flere egenskaber ved OLS (fortsat) • Den totale variation kan også dekomponeres i to dele: SST=SSE+SSR • ”Explained sum of squares” • ”Residual sum of squares” I Teoretisk Statistik kaldes SST for SAK, SSR for SRK Økonometri 1: F2
Egenskaber ved OLS (fortsat) • Goodness of fit: På baggrund af variansanalysen kan man definere et mål for, hvor meget variation modellen (den forklarende variabel) forklarer: Hvilke værdier kan R2antage? Økonometri 1: F2
Eksempel: Timeløn og uddannelse • I dette eksempel estimeres en simpel model for timelønnen: • Til estimationen benyttes danske registerdata fra Danmarks Statistik. • Data består af 2000 tilfældigt udtrukne individer. • For disse personer har vi en række oplysninger om arbejdsmarkedsforhold i perioden 1980-1994. • Datasættet ligger på forelæsningssiden under ”Eksempler” Økonometri 1: F2
Eksempel (fortsat) • Til analysen benyttes følgende variabler: • Timelønnen beregnet på baggrund af årlig lønindkomst (registreret hos SKAT) divideret med det årlige antal arbejdstimer udregnet på baggrund af ATP indbetalinger • Uddannelse er antallet af års gennemført uddannelse • Vi benytter data vedr. 1980. Data består af personer: • 20-69 år • Lønmodtagere • Timelønnen er større end 20 kr. Økonometri 1: F2
Enhederne på variablerne: Hjemmeopgave • Hvad sker der, hvis man skifter enhed på den afhængige variabel? • Hvad sker der med estimaterne, hvis timelønnen omregnes til 2000-kr. (dvs. )? • Hvad sker der med R2? • Hvad sker der, hvis den forklarende variabel skifter enhed? • Hvad sker der med estimaterne, hvis uddannelse opgøres i antal måneder i stedet for år? • Hvad sker der med R2? Økonometri 1: F2
NB’er fra denne forelæsning • At skelne mellem • Den simple lineære regressionsligning • Og den regneregel, vi bruger til at opnå et estimat af ligningens koefficienter (her: OLS estimatoren). • At skelne mellem • Statistiske antagelser om populationen (fx ) • Og de mekaniske egenskaber som fremkommer ved at anvende en given regneregel (her: OLS estimatoren) på data i en given stikprøve. • De forklarende variabler opfattes som udgangspunkt som stokastiske variabler Økonometri 1: F2
Næste gang • Fredag om kapitel 2.4-2.6. • Husk: • ”Hjemmeopgaven” om enheder på variablerne. • Øvelserne starter i denne uge: • Læs Ugeseddel 1 om estimation af Engelkurver (ugeseddel og data ligger på hjemmesiden). • Læs Varian ”Intermediate Microeconomics” kap. 6.1-6.3. • Medbring ”Elementær indføring i SAS” og ”Statistik med SAS” Økonometri 1: F2