310 likes | 490 Views
EKONOMETRIA PREDNÁŠKA 4. PPROBLÉMY ŠPECIFIKÁCIE EKONOMETRICKÉHO MODELU. Obsah prednášky:. PPROBLÉMY ŠPECIFIKÁCIE EKONOMETRICKÉHO MODELU 4.1 Špecifikácia funkčného tvaru modelu 4.2 Lineárny ekonometrický model s umelými premennými
E N D
EKONOMETRIAPREDNÁŠKA 4 PPROBLÉMY ŠPECIFIKÁCIE EKONOMETRICKÉHO MODELU
Obsah prednášky: • PPROBLÉMY ŠPECIFIKÁCIE EKONOMETRICKÉHO MODELU • 4.1 Špecifikácia funkčného tvaru modelu • 4.2 Lineárny ekonometrický model s umelými premennými • 4.2.1 Lineárny ekonometrický model s umelými vysvetľujúcimi premennými • 4.2.2 Lineárny ekonometrický model s umelými i kvantitatívnymi vysvetľujúcimi premennými • 4.2.3Lineárny ekonometrický model s umelými vysvetľujúcimi premennými, vyjadrujúcimi sezónne vplyvy • 4.3 Nepresná špecifikácia modelu • 4.3.1 Vynechanie relevantnej vysvetľujúcej premennej • 4.3.2 Zaradenie nerelevantnej vysvetľujúcej premennej • 4.3.3 Overovanie špecifikácie modelu • 4.4 Chyby meraní • Otázky k 4. PREDNÁŠKE
Ak je špecifikácia modelu správna, potom odhad parametrov a induktívne postupy o ekonometrickom modeli neprinášajú komplikácie. V praktických ekonometrických analýzach však nikdy nemáme stopercentnú istotu, že model je špecifikovaný správne. Ekonomická teória neposkytuje jednoznačný návod, na základe ktorého by mal byť model konštruovaný. Problémom sú aj dáta, na základe ktorých odhadujeme parametre modelu. Preto je v ekonometrii obvyklé analyzovať niekoľko špecifikácií, z ktorých vyberáme tú, ktorá najlepšie modeluje analyzovanú ekonomickú hypotézu. Problémom, alebo chybou špecifikácie označujeme situáciu, kedy pri formulácii modelu vychádzame z jedného, alebo viacerých nekorektných predpokladov. Najčastejšie je možné tieto problémy sformulovať do nasledovných štyroch okruhov: Prvým nesprávnym predpokladom je chybná špecifikácia funkčného tvaru modelu Použitie kvalitatívnych resp. diskrétnych premenných, a možnosť ich kvantifikácie Vynechanierelevantných a zaradenie nerelevantných vysvetľujúcich do modelu Chyby meraní, ako špeciálny problém špecifikácie modelu, a ich vplyv na vlastnosti estimátora metódy najmenších štvorcov.
4.1 Špecifikácia funkčného tvaru modelu Doteraz sme predpokladali, že ekonomickú hypotézu budeme formulovať v tvare lineárneho ekonometrického modelu. Avšak v niektorých prípadoch dospejeme k záveru, že vzťah medzi endogénnou premennou a vysvetľujúcimi premennými je možné adekvátne popísať len pomocou nelineárneho vzťahu. V takom prípade sú možné dva postupy. Jedným z nich je odhadnúť parametre nelineárneho ekonometrického modelu pomocou niektorých zodpovedajúcich nelineárnych odhadových postupov napr. nelineárna metóda najmenších štvorcov (touto problematikou sa nebudeme zaoberať). Druhým postupom v mnohých prípadoch je použitie metódy najmenších štvorcov, ak vhodným spôsobom upravíme pôvodné premenné alebo dáta tak, aby závislosť medzi transformovanými pozorovaniami, alebo premennými mala lineárny charakter. Transformovaný ekonometrický model môže byť lineárny tak v premenných, ako aj v parametroch. Pre použitie metódy najmenších štvorcov je rozhodujúca linearita v parametroch. Nelinearita v premenných sa dá ľahko odstrániť vhodnou substitúciou, poprípade odlišnou definíciou premenných. Najčastejším spôsobom linearizácie ekonometrického modelu nelineárneho v parametroch je logaritmická transformácia. Logaritmická transformácia je založená na linearizácii funkčného tvaru ekonometrického modelu použitím logaritmov. Predpokladajme napr. mocninovú funkciu s konštantnými koeficientmi pružnosti v tvare: (4.1)
Náhodná zložka u je v multiplikatívnom vzťahu. Funkcia (4.1) je nelineárna v parametroch a tak aplikáciou metódy najmenších štvorcov nie je možné odhadnúť parametre modelu priamo. Ak však model zlogaritmujeme upravíme ho do tvaru: (4.2) Parametre tohto dvoj logaritmického modelu (často označujeme aj log – log), už môžeme odhadnúť metódou najmenších štvorcov, lebo nelinearita transformovaného modelu v premenných, ako sme už spomínali, sa dá odstrániť jednoduchou substitúciou: (4.3) Symbolom * vpravo hore označujeme substitúcie pôvodných premenných ich logaritmami t.j.: (4.4) pre všetky (4.5) Po takejto úprave premenných budú do riešenia vstupovať logaritmi pôvodných premenných, z ktorých priamo vypočítame metódou najmenších štvorcov odhad parametrov .
Parameter vypočítame odlogaritmovaním parametra . Pre náhodnú zložku u platí , a v pôvodnej špecifikácii tiež . Vstupné matice pre odhad parametrov metódou najmenších štvorcov budú mať tvar: (4.6) Semilogaritmická transformácia je špeciálnou formou logaritmickej transformácie, ktorá je vhodná pri špecifikácii lineárneho ekonometrického modelu za predpokladu, že relatívna zmena endogénnej premennej Y závisí lineárne na absolútnej zmene vysvetľujúcej premennej, alebo naopak absolútna zmena Y je lineárnou funkciou relatívnej zmeny vysvetľujúcej premennej. V prvom prípade dospejeme k logaritmicko – lineárnemu modelu (log – lin) t.j.: (4.7)
ktorý zodpovedá pôvodnej špecifikácii ekonometrického modelu vo forme exponenciálnej funkcie: (4.8)
Podobne postupujeme aj v prípade odhadu parametrov nelineárnych ekonometrických modelov, ktoré sú síce nelineárne v premenných, ale sú lineárne v parametroch. Príkladom takého modelu je pôvodná alebo modifikovaná Phillipsova krivka v tvare reciprokého vzťahu: (4.10) Podobne postupujeme aj v prípade nelineárneho ekonometrického modelu v tvare polynomického vzťahu premennej X : (4.11)
Pričom X je nestochastická premenná, nadobúdajúca konečné hodnoty. Napr. nákladovú funkciu individuálnej firmy je možné vhodne aproximovať polynómom tretieho stupňa: (4.12) Polynóm k – teho stupňa premennej X
4.2 Lineárny ekonometrický model s umelými premennými Doposiaľ sme pri špecifikácii ekonometrických modelov predpokladali, že všetky jeho premenné, okrem náhodnej poruchy sú priamo merateľné kvantitatívne dáta. V ekonometrickej analýze sa však bežne stáva, že niektoré vysvetľujúce premenné, zahrnuté do modelu v súlade s ekonomickou hypotézou, majú kvalitatívny charakter, resp. kvantitatívne premenné intervalovo zadané a teda ich nie je možné priamo kvantifikovať a merať. Najčastejšie sa kvalitatívne a intervalovo zadané kvantitatívne premenné vyskytujú v úlohe vysvetľujúcich exogénnych premenných, ale môžu vystupovať aj ako vysvetľované endogénne premenné. Meranie kvalitatívnych premenných je možné pomocou techniky umelých premenných. Ich výhodou je, že umožňujú relatívne jednoduchým spôsobom nahradiť empirické kvalitatívne dáta, pričom im priraďujeme jednoduché kvantitatívne hodnoty, ktoré čo najlepšie aproximujú zmeny, či intenzitu pôsobenia činiteľov, ktoré chceme kvantifikovať a merať. V prierezovej ekonometrickej analýze nahrádzame umelými premennými obvykle vysvetľujúce premenné, reprezentujúce sociálne, demografické, regionálne a iné charakteristiky, ktoré majú charakter kvalitatívnych či intervalovo zadaných kvantitatívnych znakov. Jedná sa napríklad o stupeň vzdelania či kvalifikácie (základné, stredoškolské, vysokoškolské), pohlavie (muž, žena), sociálna či profesná príslušnosť, úroveň bývania, ekonomický rozvoj krajiny, či regiónu t.j. atribúty, ktoré často hrajú dôležitú rolu v chovaní individuálnych ekonomických subjektov.
V analýze časových radov sa umelé premenné využívajú často pri posudzovaní krátkodobých, či sezónnych, alebo konjunkturálnych vplyvov. Prvým krokom pri konštrukcii umelých premenných (často ich nazývame proxy, dummy, binárne, či nula – jednotkové), je voľba klasifikačnej stupnice (škály). Najčastejšie sa používa nula – jednotkové schéma, kedy umelá premenná nadobúda dve číselné hodnoty pre definovanie určitej obmeny, alebo kategórie kvalitatívnej premennej. Nula sa používa v prípade, keď sa daná obmena či kategória nevyskytuje a jednotkou označujeme opačnú situáciu, t.j. výskyt danej obmeny, alebo kategórie (resp. prítomnosť určitého sledovaného atribútu). Umelé vysvetľujúce premenné možno v regresnom modeli využiť aj iným spôsobom (napr. pri konštruovaní po častiach lineárneho modelu, modelu nerovnovážnych situácií, porovnávať dve, alebo viac regresií a podobne). • 4.2.1 Lineárny ekonometrický model s umelými vysvetľujúcimi premennými Uvažujme najskôr jednoduchý ekonometrický model, kedy vysvetľujeme zmeny endogénnej premennej Y len jednou kvalitatívnou vysvetľujúcou premennou . Ako príklad takejto závislosti uvažujme analýzu vplyvu výšky príjmu od kvalitatívneho faktora pohlavie . Je zrejmé, že sa tým dopúšťame určitého zjednodušenia, pretože výška príjmu závisí aj od takých faktorov, ako sú dĺžka praxe, vzdelanie, pracovné zaradenie a iné. Najskôr, kvôli jednoduchosti použijeme hypotézu s jedinou vysvetľujúcou kvalitatívnou premennou pohlavie. Keďže pohlavie zahŕňa iba dve kategórie: muž a žena, model príjmu môžeme formulovať v tvare :
(4.13) Premenná Pi je umelá premenná, nadobúdajúca len dve hodnoty 0 a 1: Pi = 1, ak i - ty pracovník je muž a Pi = 0, ak i – ty pracovník je žena. Podmienená stredná hodnota mzdy muža bude rovná: (4.14) A podmienená stredná hodnota mzdy ženy sa bude rovnať: (4.15) Parameter predstavuje rozdiel medzi strednými hodnotami mzdy muža a ženy. Všimnime si, že kvalitatívna premenná pohlavie obsahovala dve kategórie (muž a žena), pričom do modelu (4.13) sme zahrnuli len jednu umelú premennú.
Ak budeme uvažovať kvalitatívnu premennú dosiahnuté najvyššie vzdelanie s tromi kategóriami (obmenami znaku: základné, stredoškolské a vysokoškolské vzdelanie), musíme do modelu zahrnúť dve umelé premenné. Platí pritom pravidlo, že počet umelých premenných zahrnutých do modelu namiesto kvalitatívnej premennej sa rovná počtu obmien znaku mínus jedna t.j.: Medzi umelými premennými vzdelanie platí nasledujúci vzťah:
Ak model obsahuje aj úrovňovú konštantu , ktorú odhadujeme pomocou premennej , pozostávajúcu s jednotkového vektora o rozsahu n potom platí: (4.16) Premenné vo vzťahu (4.16) by boli lineárne závislé a predpoklad 5 by nebol splnený, preto je potrebné jednu umelú premennú (ktorúkoľvek) vylúčiť. Predpokladajme, že vylúčime premennú a model závislosti platu na kvalitatívnej vysvetľujúcej premennej bude mať tvar: (4.17) Pre lepšie pochopenie významu parametrov modelu (4.17) vyjadríme podmienené stredné hodnoty endogénnej premennej Y, pre každú z troch kombinácii s umelými premennými : (4.18)
Zo vzťahu (4.18) je zrejmé, že úrovňová konštanta reprezentuje plat vysokoškoláka. Parameter predstavuje rozdiel v priemerných platoch vysokoškoláka a pracovníka so základným vzdelaním. Regresný koeficient vyjadruje rozdiel v priemerných platoch vysokoškoláka a stredoškoláka. Testovaním štatistickej významnosti parametrov modelu je potom možné overiť, či rozdiely v platoch pracovníkov s rôznym vzdelaním sú štatisticky významné, alebo nie. Rozšírme vzťah (4.17) o ďalšiu umelú vysvetľujúcu premennú pohlavie Pi, pričom tvar modelu sa zmení: (4.19) Kde P = 1, ak ide o muža P = 0, ak ide o ženu. Premenné, sú definované zhodne s modelom (4.17). K interpretácii parametrov modelu opäť definujeme podmienené stredné hodnoty endogénnej premennej zodpovedajúce jednotlivým kombináciám hodnôt umelých vysvetľujúcich premenných:
4.2.2 Lineárny ekonometrický model s umelými i kvantitatívnymi vysvetľujúcimi premennými Predpokladajme jednoduchý model, kedy mzda je závislá od pohlavia (kvalitatívna premenná), ale aj od dĺžky praxe (kvantitatívna premenná). V modeli budú potom vystupovať oba typy premenných: (4.21) Interpretácia parametrov modelu opäť vychádza z podmienenej strednej hodnoty endogénnej premennej s kombináciami všetkých vysvetľujúcich premenných t.j.: • Je zrejmé, že regresná priamka pre mužov sa líši od regresnej priamky pre ženy v úrovňových konštantách: • Pre mužov je úrovňová konštanta rovná , pre ženy je rovná • Smernica pri premennej je rovnaká pre obe pohlavia . • Vplyv pohlavia na úroveň mzdy je definovaná rozdielom v úrovňovej konštante medzi pohlaviami . Ak by sme pri verifikácii modelu zistili štatistickú významnosť tohto parametra , potom by to poukazovalo na mzdovú diskrimináciu žien zahrnutých do výberu.
Rozšírme aj tento model o ďalšiu kvalitatívnu premennú vzdelanie, resp. doplníme do modelu (4.19) kvantitatívnu premennú , dĺžka praxe: (4.22) Určime aj pre tento model podmienené stredné hodnoty endogénnej premennej pre jednotlivé kombinácie vysvetľujúcich premenných: (4.23)
Vo vzťahu (4.23) platí: • Muž, základné vzdelanie • Muž, stredoškolské vzdelanie • Muž, vysokoškolské vzdelanie • Žena, stredoškolské vzdelanie • Žena, základné vzdelanie • Žena, vysokoškolské vzdelanie • Jednotlivé stredné hodnoty miezd sa líšia len úrovňovými konštantami pre jednotlivé skupiny pracovníkov, vplyv kvantitatívnej premennej bol na obe pohlavia rovnaký. • 4.2.3 Lineárny ekonometrický model s umelými vysvetľujúcimi premennými, vyjadrujúcimi sezónne vplyvy V predchádzajúcich častiach umelé premenné mali povahu prierezových údajov, ale často sa môžeme s ich použitím stretnúť aj u časových radov pri analýze sezónnosti resp. modelovaní cyklických vplyvov. Keďže dáta majú charakter časových radov budeme označovať index pozorovania symbolom t . Predpokladajme závislosť priemerných spotrebných výdavkov na určitý tovar od výšky disponibilného príjmu domácností za jednotlivé štvrťroky. Je možné predpokladať, existenciu sezónnych výkyvov v spotrebe. Pre vyjadrenie sezónneho kolísania sa často využívajú umelé premenné, a model bude mať tvar: (4.24)
(4.25) Ekvivalentným postupom v prípade lineárneho regresného modelu, obsahujúceho kvalitatívne aj kvantitatívne premenné vysvetľujúce premenné je analýza kovariancie. Umelé vysvetľujúce premenné je možné využiť v regresnom modeli aj iným spôsobom. Možno pomocou nich konštruovať po častiach lineárny model, modely nerovnovážnych situácií, porovnávať dve, alebo viac regresií. Umelé premenné je možné použiť aj ako závisle premenné, avšak situácia v takom prípade je zložitejšia.
4.3 Nepresná špecifikácia modelu • Pri formulácii ekonometrického modelu nikdy nemáme istotu, že model je presne špecifikovaný. Najčastejší je postup, kedy skúšame niekoľko možných spôsobov konkrétnej špecifikácie modelu, vychádzajúcej zo základnej ekonomickej hypotézy, ale líšiacej sa počtom zaradených vysvetľujúcich premenných, analytickým tvarom modelu a rozdielnou formou zaradenia náhodnej poruchy do modelu. Ak nie je model presne špecifikovaný vznikajú rôzne špecifikačné chyby, ktoré rôznym spôsobom ovplyvňujú vlastnosti odhadových funkcii. Najčastejšie sa môžeme stretnúť s týmito špecifikačnými chybami: • Vynechanie relevantnej vysvetľujúcej premennej • Zaradenie nepodstatnej vysvetľujúcej premennej 4.3.1 Vynechanie relevantnej vysvetľujúcej premennej Predpokladajme, že správne špecifikovaný lineárny model má tvar : (4.26) kde matica pozorovaní vysvetľujúcich premenných obsahuje stĺpcov, avšak v skutočnosti odhadujeme chybne špecifikovaný model v tvare: (4.27)
4.3.3 Overovanie špecifikácie modelu Ekonomická teória neposkytuje jednoznačný návod na presnú špecifikáciu premenných v ekonometrickom modeli. Informácie, ktoré nie je možné získať priamo z ekonomickej teórie treba získať empiricky, t.j. analýzou dát, čo je náročnejšie a prácnejšie. Pri výbere vysvetľujúcich premenných je dôležité prihliadať k tomu, aby premenné boli slabo exogénne, t.j. nemali by byť korelované s náhodnou poruchou. Rôzni autori uvádzajú aj ďalšie kritéria, ktoré doporučujú použiť pri výbere špecifikácie premenných. Viacerými sme sa už zaoberali, napr. t – test, umožňuje na zvolenej hladine významnosti identifikovať nerelevantné premenné, ktoré štatisticky nevýznamne prispievajú k vysvetleniu variability endogénnej premennej, F – test, na overenie združenej hypotézy, koeficient determinácie , korigovaný koeficient determinácie . Existujú aj ďalšie kritéria, ktoré pomáhajú rozhodovať, či zaradenie ďalšej vysvetľujúcej premennej zlepšilo model, teda určiť, ktorý z dvoch konkurenčných modelov treba preferovať. Jedným z takýchto kritérií je Akaikeho informačné kritérium (AIK): (4.30)
kde k je počet vysvetľujúcich premenných, n počet pozorovaní a e základ prirodzených logaritmov a e i sú náhodné poruchy. Druhým často používaným kritériom je Schwarzovo informačné (bayesovské) kritérium (SBK) , líšiace sa od AIK len penalizáciou priemernej sumy štvorcov: (4.31) Z dvoch, alebo viacerých porovnávaných modelov sa preferuje ten, ktorého hodnota použitého kritéria je najnižšia. Kritéria AIK a SBK sú súčasťou výstupných zostáv vo všetkých ekonometrických programových balíkoch. Častejšie sa kritériá (4.30) a (4.31) počítajú ako prirodzené logaritmy: (4.32) (4.33)
Z porovnania kritérií vyplýva, že väčšiu penalizáciu využíva Schwarzovo kritérium, slabšiu penalizáciu má Akaikeho kritérium a najslabšiu penalizáciu má korigovaný koeficient determinácie. Všetky uvedené kritéria používame už na špecifikované modely, teda nepomáhajú odpovedať na otázku, či v danom modeli nechýba relevantná premenná, t.j. nevieme jednoznačne odpovedať na otázku chybnej špecifikácie. Všeobecným testom chybnej špecifikácie modelu je RESET test (Regression Specification Error Test) , ktorý navrhol Ramsey. Testovacia procedúra má nasledovný postup. Vyjdeme z modelu: (4.34) Nulová hypotéza je formulovaná nasledovne model (4.34) je špecifikovaný správne, RESET test nevyžaduje formuláciu alternatívnej hypotézy . Z testu však nevyplýva, aký model je pri zamietnutí lepší. Po formulácii nulovej hypotézy odhadneme parametre modelu (4.34) a vypočítame vyrovnané hodnoty endogénnej premennej a koeficient determinácie . Naformulujeme nový ekonometrický model tak, že do pôvodného modelu (4.34) pridáme ďalšie vysvetľujúce premenné, ktoré sú mocniny vyrovnaných hodnôt endogénnej premennej : (4.44)
Počet mocnín môže byť aj menší. Odhadneme parametre takto rozšíreného modelu (4.44) a vypočítame koeficient determinácie rozšíreného modelu . Testovacia štatistika pre overenie platnosti nulovej hypotézy sa vypočíta: (4.45)
4.4 Chyby meraní Doposiaľ sme predpokladali, že vysvetľované a vysvetľujúce premenné v ekonometrických modeloch sú bez chýb, takže empiricky zistené dáta korešpondujú presne s premennými, definovanými ekonomickou teóriou. Pri praktických ekonometrických analýzach však tomu tak nie je, lebo v priebehu zberu, agregácie a spracovaní sa štatistické dáta stávajú lepšou, alebo horšou aproximáciou skutočných hodnôt premenných modelu. Je preto potrebné skúmať, aký vplyv majú tieto chyby meraní na vlastnosti odhadových funkcií metódy najmenších štvorcov. Vyjadríme klasický ekonometrický model obsahujúci všetky premenné nezaťažené chybami meraní v tvare: (4.46)
Otázky k 4. PREDNÁŠKE Popíšte najčastejšie štyri okruhy do ktorých je možné sformulovať problémy špecifikácie modelu. Popíšte problém špecifikácie ekonometrického modelu pri chybnej formulácii funkčného tvaru modelu. Popíšte problém špecifikácie funkčného tvaru modelu označovaný lin – log, log – lin a log -log. Popíšte techniku umelých premenných . Popíšte techniku umelých premenných v ekonometrických modeloch popisujúcich sezónnosť. Vysvetlite problém špecifikácie modelu pri vynechaní relevantných premenných v modeli. Vysvetlite problém špecifikácie modelu pri zaradení nerelevantných premenných do modelu. Aké kritéria sa využívajú pri overovaní správnosti špecifikácie Popíšte overovanie správnej špecifikácie modelu RESET testom. Ako sa prejavia chyby meraní z hľadiska špecifikácie modelu.