450 likes | 631 Views
ZÁKLADY EKONOMETRIE 4. cvičení METODOLOGICKÝ POSTUP ŘEŠENÍ EKONOMETRICKÉHO PROBLÉMU. Náhodná složka G-M předpoklady Vlastnoti bodové odhadové funkce. Náhodná složka. Gauss-Markovy předpoklady: E( u ) = 0 Náhodné vlivy se vzájemně vynulují E(u u T ) = σ 2 I n
E N D
ZÁKLADY EKONOMETRIE4. cvičeníMETODOLOGICKÝ POSTUP ŘEŠENÍ EKONOMETRICKÉHO PROBLÉMU
Náhodná složka • G-M předpoklady • Vlastnoti bodové odhadové funkce
Náhodná složka • Gauss-Markovy předpoklady: • E(u) = 0 • Náhodné vlivy se vzájemně vynulují • E(u uT) = σ2 In Konečný a konstantní rozptyl = homoskedasticita → Porušení: Heteroskedasticita Náhodné složky jsou sériově nezávislé → Porušení: Autokorelace • X je nestochastická matice – E(XTu) = 0 • Veškerá náhodnost je obsažena v náhodné složce • X má plnou hodnost k • matice Xneobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → Porušení: Multikolinearita
Vlastnosti bodové odhadové funkce - Malý výběr • Počet pozorování n< 30 • Nevychýlený = nestranný odhad: E (b) = β b – získáme z více výběrových vzorků pokud E(b) > β– odhady jsou nadhodnoceny, E(b) < β– odhady jsou podhodnoceny • Vydatný odhad: standardní chyba regresního koeficientu sbmusí být minimální ze všech jiných postupů - to způsobuje, že intervalové odhady jsou nejmenší. Jako nevychýlený odhad může sloužit více statistik, z nichž nejvhodnější je ta, která má minimální rozptyl.
Vlastnosti bodové odhadové funkce - Velký výběr • počet pozorování n ≥ 30 • Konzistentní – bodový odhad b je konzistentním odhadem, jestliže jeho hodnota s rostoucím počtem pozorování nkonverguje ke skutečnému=populačnímu parametru • Asymptoticky nestranný – je to slabší vlastnost, (pokud je odhad konzistentní, tak je i asymptoticky nestranný) • Asymptotická vydatnost – rozptyl konverguje k nule rychleji než s použitím jiné odhadové funkce
Příklad Vraťme se k příkladu z minulého cvičení, podívejme se, zda je odhad nestranný? Víme, že v celé populaci platí závislost: Proveďte simulaci – 500krát odhadněte model. Jaká byla nejvyšší hodnota odhadu parametru β? A jaká byla nejnižší hodnota? Soubor: 1.cviceni_LRM_s_resenim.xlsx 11
Možná otázka do závěrečného testu • Odvození bodové odhadové funkce a její vlastnosti (rozdělit pro malé a velké výběry). • Princip metody MNČ. • Gaussovy-Markovovy předpoklady
Metodologický postup • Specifikace modelu • Odhad parametrů (tj. kvantifikace) • Verifikace • Aplikace
1. Specifikace modelu • Orientace v dané ekonomické problematice • Určení proměnných • Určení vzájemných vazeb mezi proměnnými • Formulace hypotéz – v podobě algebraických vztahů (tj. jedné či více rovnic) • Specifikace náhodných vlivů
Specifikace modelu • Ekonomický model • Stanovení základní hypotézy (tj. které proměnné použijeme, jak budou působit, jejich intenzita, apod.) • Slovní vyjádření • Ekonomicko-matematický model • převedení slovního vyjádření do podoby • jedné rovnice (jednorovnicový model) • soustavy rovnic (vícerovnicový model) • Ekonometrický model • zahrnutí faktoru nejistoty v podobě náhodné složky
Náhodná složka u • modely obvykle pracují s 3 či 4 vysvětlujícími proměnnými – působení ostatních nepodstatných vlivů je zahrnuto v náhodné složce • o náhodné složce se předpokládá, že má normální rozdělení se střední hodnotou 0 a rozptylem σ2 u~N(0; σ2)
Matematická vs. ekonometrická fce • Matematická funkce: 1 vysvětlující proměnná: y = f (x) více vysvětlujících proměnných: y = f (x1, x2, …) • Ekonometrická funkce: 1 vysvětlující proměnná: y = f (x) + u více vysvětlujících proměnných: y = f (x1, x2, …) + u
Druhy proměnných v modelu • Endogenní • tj. vysvětlované, závisle proměnné • hodnoty jsou generovány systémem či modelem • Exogenní • tj. vysvětlující, nezávisle proměnné • působí na zkoumaný systém, samy systémem nejsou ovlivňovány • jejich hodnoty jsou determinovány mimo systém • Predeterminované • Exogenní + endogenní-zpožděné
Metodologický postup • Specifikace modelu • Odhad parametrů (tj. kvantifikace) • Verifikace • Využití
2. Odhad parametrů • Využití disponibilní (tj. výběrové) informace z dat • Použití vhodné odhadové techniky
Metodologický postup • Specifikace modelu • Odhad parametrů (tj. kvantifikace) • Verifikace • Využití
3. Verifikace • Aneb jak se odhadnutý model shoduje s teorií a napozorovanými daty • Ekonomická (jestli proměnné modelu mají správný směr a intenzitu) • Statistická (ověření přesnosti a významnosti výsledků) • Ekonometrická (zda byly dodrženy podmínky pro použití dané odhadové techniky a statistických testů)
Metodologický postup • Specifikace modelu • Odhad parametrů (tj. kvantifikace) • Verifikace • Využití
4. Využití • Kvalitativní a kvantitativní analýza minulého vývoje • Předpovědi (predikce, prognózy) • Volba hospodářské politiky • analýza různých scénářů • simulační experimenty
Příklad 1 – eko1.xls • Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. • Y – maloobchodní obrat potřeb pro domácnost v mld. CZK • X1 – disponibilní příjem v mld. CZK • X2– cenový index Proveďte predikci bodovou a intervalovou. Ověřte, zda je model vhodný k predikci.
Příklad 2 – data.in7 • Odhadněte závislost spotřeby (CONS) na disponibilním důchodu (INC). • Proveďte • Specifikaci • Kvantifikaci • Verifikaci • Aplikaci • Použijte datový soubor data.in7
A. Specifikace • CONS– endogenní proměnná (vysvětlovaná) • INC – exogenní proměnná (vysvětlující) • Forma závislosti: CONSt = β0 + β1INCt +ut • Ekonomický předpoklad: • S růstem důchodu, roste spotřeba – kladné znaménko u koeficientu β1, • β1 náleží do intervalu (0,1) – v dlouhodobém horizontu platí: nemůžu spotřebovat více, než vydělám
B. Kvantifikace • Pomocí výběru n = 159, budeme odhadovat model CONSt = b0 + b1INCt + et CONSt^ = b0 + b1INCt • Použijeme PcGive a MNČ
B. Kvantifikace • Odhadnutý regresní model: CONSt = -181,27 + 1,186INCt +et CONSt^ = -181,27 + 1,186INCt • Intervalový odhad parametrů
C. Verifikace ekonomická • b1 náleží do intervalu (0,1) ? – nesplňuje! • Absolutní pružnost • Zvýší-li se důchod (INC) o jednu jednotku, tzn. o jednu miliardu, zvýší se spotřeba (CONS) v průměru o 1,186 miliard, ceterisparibus • Relativní pružnost • Bere se vždy vzhledem k nějakému datu, v %! • Např. pro období 1954-2, Y = 884,528, X = 894,831, • qx= 1,1865*884,528/894,831 = 1,173 • Zvýší-li se v druhém čtvrtletí roku 1954 disponibilní důchod o jedno %, poté se spotřeba zvýší v průměru o 1,173%.
C. Verifikace statistická • Standard Error • Standardní chyba regresních koeficientů podle následujícího vztahu • Slouží k určení významnosti parametrů, k intervalovým odhadům • s je odhad σ – u nás ve výstupu je to sigma
Verifikace statistická – významnost proměnných • T-statistika, t-value, t-prob • t statistika slouží k určení významnosti jednotlivých parametrů v modelu. H0: βj = 0 ... Nevýznamná proměnná H1: βj ≠ 0 ... Významná proměnná • Obecně pro t-statistiku platí • popř. p-hodnota ≤ α→ zamítám hypotézu H0 o nevýznamnosti proměnné v modelu, proměnná je tedy významná • popř. p-hodnota > α→ nepodařilo si mi zamítnout hypotézu H0 o nevýznamnsoti proměnné v modelu, proměnná je nevýznamná Na hladině významnosti 5 % zamítáme nulovou hypotézu o nevýznamnosti proměnné INC. Proměnná disponibilní důchod je v modelu významná.
C. Verifikace statistická • Pro úrovňovou konstantu neprovádíme statistické vyhodnocení, ale vždy ji ponecháme v modelu. • Part. R2 – parciální (dílčí) korelační koeficient • Určuje, jak daná proměnná vysvětluje závislou proměnnou bez ohledu na ostatní exogenní proměnné
C. Verifikace statistická • Koeficient vícenásobné determinace R2 • Hodnotí celkovou kvalitu modelu, určuje, jak se model shoduje s daty • Rozptyl Y = Vysvětlený rozptyl + nevysvětlený rozptyl • Rozptyl empirických hodnot • n – 1 stupně volnosti • v obrázku a + b • Rozptyl vyrovnaných hodnot .. • k – 1 stupně volnosti • v obrázku a • Reziduální rozptyl (RSS=NSČ) .. • n – k stupně volnosti • v obrázku b
C. Verifikace statistická • Vícenásobný koeficient determinace • , pokud 1 – dokonalý model • Korigovaný koeficient vícenásobné determinace • Používá se pro srovnávání více modelů s jiným počtem vysvětlujících proměnných
C. Verifikace statistická – významnost modelu • F-poměr • testuje statistickou významnost modelu (využívá se Fischerovo rozdělení) • Používá se pokud máme v modelu dvě a více exogenní proměnné. H0: R2 statisticky nevýznamné, β0 =β1 =...βj = 0 H1: R2 statisticky významné, βj ≠ 0 • F > F(k – 1, n – k – 1)* … odmítáme H0 ve prospěch H1. • [0.000] - počítá nám p-value • [číslo] ≤ α → zamítám hypotézu H0, model je tedy významný • [číslo] > α→ nepodařilo se mi zamítnout hypotézu H0, model je tedy nevýznamný Protože máme v modelu pouze jednu exogenní proměnnou nemusíme vyhodnocovat statistickou významnost modelu
C. Verifikace statistická – zbylý výstup • Sigma – Odhad směrodatné chyba (odchylka) náhodné složky u • RSS - residua sum ofsquares, aneb naše NSČ – je to vlastně hodnota naší účelovou funkci, kterou minimalizujeme. • Log-likelihood– věrohodnostní poměr – alternativa metody minimálních čtverců, je metoda maximální věrohodnosti
C. Verifikace ekonometrická • Ověřuje splnění podmínek pro použití MNČ • Testuje se heteroskedasticita, autokorelace, mulikolinearita • DW – Durbin-Watson– testuje autokorelaci prvního řádu, budeme řešit později !!!
D. Aplikace • Predikce apod. , ukládání vyrovnaných hodnot, reziduí... • Predikce – dosazení konkrétních hodnot do regresní funkce
Závěry plynoucí z analýzy • Koeficient u proměnné INC nesplňuje ekonomický předpoklad, protože je větší než 1. • Z pohledu statistické verifikace je model v pořádku. • K tomu, abychom statistickou verifikaci mohli považovat za „právoplatnou“, potřebujeme ověřit, zda byly splněny podmínky pro použití MNČ Toto řešení tedy není úplné, je potřeba doplnit ekonometrickou verifikaci a model se nezdá příliš vhodný z důvodu nesplnění ekonomických předpokladů.
Predikce • Predikce bodová a intervalová • Ex ante a ex post
Predikce • Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace • Ex-ante - podmíněná • Ex-post - pseudopředpověď
Predikce Ex-Ante • Podmíněná volbou vysvětlující proměnné • vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu • Predikce může být bodová • nebo intervalová
Predikce Ex-post • Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou. • Chyba odhadu • H0: Chyba není statisticky významná(model je vhodný k predikci) • H1: Chyba je statisticky významná • Testujeme pomocí t-statistiky