270 likes | 693 Views
ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA. Predikce. Predikce bodová a intervalová Ex ante a ex post. Predikce. Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace Ex-ante - podmíněná
E N D
Predikce • Predikce bodová a intervalová • Ex ante a ex post
Predikce • Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace • Ex-ante - podmíněná • Ex-post - pseudopředpověď
Dělení predikce • období • extrapolaci do budoucna, • extrapolace do minulosti nazývanou jako retrospektiva, • znalosti endogenní proměnné v období prognózy na • ex-post predikci, kdy známe hodnotu endogenní proměnné v období - pseudopředpověď, • ex-ante - klasické chápání předpovědi, • znalosti exogenních proměnných v období prognózy na • podmíněnou predikci – pro období předpovědi neznáme hodnoty exogenních proměnných, tyto hodnoty musíme také predikovat, předpověď Y je tedy podmíněná předpovědí hodnot X, • nepodmíněnou predikci – pro období předpovědi známe hodnoty exogenních proměnných.
Predikce Ex-Ante • Podmíněná volbou vysvětlující proměnné • vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu • Predikce může být bodová • nebo intervalová – v GiveWinu 2 možnosti: • Intervalovou předpověď můžeme interpretovat tak, že pro opakované výběry daný interval obsahuje se spolehlivostí (1–α)∙100 % skutečnou hodnotu proměnné Y v období předpovědi.
Predikce Ex-post • Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou. • Chyba odhadu • H0: Chyba není statisticky významná(model je vhodný k predikci) • H1: Chyba je statisticky významná • Testujeme pomocí t-statistiky
Příklad 1 – eko1.xls • Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. • Y – maloobchodní obrat potřeb pro domácnost v mld. CZK • X1 – disponibilní příjem v mld. CZK • X2– cenový index Proveďte predikci bodovou a intervalovou pro disponibilní příjem 211 mld. CZK a cenový index 113. Ověřte, zda je model vhodný k predikci pomocí ex-post predikce.
Ekonomická specifikace = tj. zhodnocení odhadnutých koeficientů z hlediska znaménka a intervalu b0– úrovňová konstanta může být libovolná, vzniká z podmínky, aby součet čtverců reziduí byl minimální b1– v intervalu (0,1) pokud nepracujeme s úsporami nebo >0 s úsporami b2– by mělo být < 0
Příklad – eko1.xls Výstup z GiveWinu: EQ( 1) Modelling y by OLS (using eko1.xls) Theestimation sample is: 1966 to 1973 CoefficientStd.Error t-value t-probPart.R^2 Constant 3.01620 1.032 2.92 0.033 0.6308 x1 0.103550 0.004550 22.8 0.000 0.9904 x2 -0.0979638 0.01583 -6.19 0.002 0.8845 sigma 0.120682 RSS 0.0728202076 R^2 0.997094 F(2,5) = 857.8 [0.000]** log-likelihood 7.44531 DW 1.95 no. ofobservations 8 no. ofparameters 3 mean(y) 10.5 var(y) 3.1325
Regresní nadrovina – zápis: • Napozorované hodnoty: Y = 3,016 + 0,104X2 – 0,098X3 + e • Vyrovnané hodnoty: Y^ = 3,016 + 0,104X2 – 0,098X3
Intervalový odhad Provést intervalový odhad alespoň u jednoho parametru, který je statisticky významný • pro β2: 0,104 – 0,0046*2,57<= β2<= 0,104 + 0,0046*2,57 0,092 <= β2<= 0,114
Absolutní pružnost • dle vzorců: • b1= 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld CZK) a X2se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld CZK. • b2= - 0,098 – vzroste-li cenový index X2o jeden procentní bod a X1se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 98 miliónu CZK. • definovány v daných jednotkách
Relativní pružnost pro r. 2003 Y(73) = 13,6; X2(73) = 209, X3(73) = 113 zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 % zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %
Predikce – EX ANTE • Bodová predikce Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast (SE) 2004 13.7953 0.1207 Dynamic (ex ante) forecasts for y (SE with parameter uncertainty) Horizon Forecast (SE) 2004 13.7953 0.1584 • Intervalová predikce • S parametrem sigma: • S parametrem chyby předpovědi:
Predikce – EX POST • Odhadnutý model na období 1996 – 2001 Provedena predikce 2002, 2003 Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast SE Actual Error t-value 2002 12.3717 0.1076 12.1000 -0.271654 -2.524 2003 13.7732 0.1076 13.6000 -0.173184 -1.609 • Intuitivní vyhodnocení pomocí % chyby z skutečné hodnoty: X = 0,2716/12,1 = 0,022 = 2,2 % < 5 % • Pomocí t-testu: H0: Chyba není st. Významná 2,524 (z výstupu abs hodnota) < 2,57 (tabulková hodnota) → Nezamítáme H0, chyba není statisticky významná.
MULTIKOLINEARITA • Podstata • Příčiny • Důsledky • Měření
MULTIKOLINEARITA • Multikolinearita = existence více než jednoho vztahu lineární závislost mezi pozorováními vysvětlujících proměnných • Kolinearita = existence pouze jednoho lineárního vztahu Pozn. Většinou se v obou případech používá pojem multikolinearita
MULTIKOLINEARITA • Týká se pouze výběrového vzorku, nikoliv abstraktního modelu !!! • multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru • Podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými • Zda je či není multikolinearita únosná
Příčiny • Tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im) • Průřezová analýza (např. proměnná příjem a bohatství) • Zahrnutí zpožděné endo nebo exo proměnné. • Špatně diskretizovaná proměnné pomocí 0, 1
Důsledky • Snížená přesnost odhadů regresních koeficientů • Velké standardní chyby odhadové funkce MNČ • Pochybnosti či nejistotu pokud jde o správnost specifikace modelu • Odhady zůstávají nestranné, vydatné • Velká citlivost odhadové funkce MNČ na velmi malé změny v matici X • Obtížné vyjádření odděleného působení silně kolineárních proměnných.
Měření multikolinearity – Metoda I • Použití párových korelačních koeficientů • Pouze pro 2 vysvětlující proměnné: • multikolinearita je únosná, pokud: • rX1X2≤ 0,9 a současně koeficient vícenásobné determinace modelu
Párové korelační koeficienty • modul PcGive • Package → Descriptive Statistics • Model → Formulate – Vložím proměnné • zvolit nabídku korelační matice
Měření multikolinearity – Metoda II • Využívá se pomocných regresí • Více vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty) • Využívá se koeficientů pomocné regrese Ri2 • Pokud máme model Y = f(X1, X2, X3) … z modelu … R2 • X1= f (X2,X3) … R12 • X2= f (X1,X3) … R22 • X3= f (X1,X2) … R32 jsou-li všechna Ri2< R2, pak je multikolinearita únosná
Příklad 2 – eko1.xls • Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. • Y – maloobchodní obrat potřeb pro domácnost v mld. CZK • X1 – disponibilní příjem v mld. CZK • X2– cenový index Je v modelu multikolinearita?
Příklad KUŘE • Určete, jak závisí počet prodaných kuřat na níže uvedených proměnných. K dispozici máme roční pozorování od roku 1960 do roku 1982. • Y – počet prodaných kuřat (v desítkách milionů kusů) • X2 – výše dotace do zemědělství (v miliardách Kč) • X3– cena za kuře (Kč/kilo) • X4 – cena vepřového (Kč/kilo) • Je v modelu multikolinearita?
Možná otázka do závěrečného testu • Predikce • Multikolinearita • Podstata • Příčiny • Důsledky • Měření