260 likes | 435 Views
Energiatervezési módszerek. Ökonometriai eszközök statisztikai jellemzők regressziószámítás. Ökonometria. Mi az ökonometria ? Az ökonometria feladata gazdasági-társadalmi jelenségek statisztikai modellezése . Milyen ismeretek szükségesek: matematika (algebra) statisztika
E N D
Energiatervezési módszerek Ökonometriai eszközök statisztikai jellemzők regressziószámítás
Ökonometria Mi az ökonometria? Az ökonometria feladata gazdasági-társadalmi jelenségek statisztikai modellezése. Milyen ismeretek szükségesek: • matematika (algebra) • statisztika Felhasznált módszer és eszköz: módszer: regressziószámítás eszköz: táblázatkezelő (MS Excel, OO Calc) és gretl. A gretlelérhető: http://gretl.sourceforge.net/
Modellalkotás • A modellek jellemzői • Modell = egyszerűsítő (torzított) lényegkiemelés • Kényelmes eszközzel (matematikai módszer) vizsgálható • Kulcskérdés: absztrakciós szint megválasztása • Egyensúlyozás: kezelhetőség ↔ valósághűség • Mire jók a modellek? • elemzés • előrejelzés
Modellalkotás Modellalkotás lépései • hipotézis felállítása (gondolkodási modell, célok és eszközök) • adatgyűjtés • matematikai modell megválasztása • modellparaméterek meghatározása (becslése) • validáció (ellenőrzés)
Matematikai (statisztikai) fogalmak Átlag (számtani): Szórás: Kovariancia: torzított becslés, n≥30 korrigált szórás torzítatlan becslés, n<30
Regressziószámítás Jelölések: • eredmény- vagy függő változó: y vagy y (vektor) • magyarázó- vagy független változó: x vagy X (mátrix) • maradék vagy hiba: ε vagy ε (vektor) • együtthatók: β vagy β (vektor) k számú változóval és változónként n megfigyeléssel:
Regressziószámítás • Becsült lineáris regressziós fgv. (^: becsült paraméter) • A becsült regressziós fgv. hibája: reziduum (maradék): Fontos!
Regressziószámítás Regressziós fgv. paramétereinek becslése Módszer: klasszikus legkisebb négyzetek módszere (OrdinaryLeastSquares, OLS) Célfüggvény: eltérések (reziduumok) négyzetösszege Cél: MIN(g)!
Regressziószámítás A regresszió „jóságát” meghatározó mutatók eltérések négyzetösszege: (sum of squaresofresiduals) regressziós (magyarázott)négyzetösszeg: (explained sum of squares) teljes négyzetösszeg: TSS=ESS+RSS determinációs együttható: (a korrelációs együttható négyzete)
Regressziószámítás Paramétertesztelés nullhipotézisH0: βj=0; ellenhipotézis H1: βj≠0 H0 fennáll ha t-statisztikára: α: szignifikanciaszint (fontosság) annak a valószínűsége, hogy a jó (null-) hipotézist elvetjük általában: 5% vagy 10% kockázat p-érték a nullhipotézis elfogadásának valószínűsége
Hipotézisvizsgálat • azadatforrásműködési„mechanizmusát” egyvéletleneloszlás/függvénykapcsolatjellemzi • azadatokismeretébenmegfogalmazódnakbizonyoshipotézisekerreazeloszlásra/függvénykapcsolatranézve • ellenőrizzük, hogyazadatokmennyiretámasztjákalá a hipotéziseket
Statisztikai próbák t-statisztika (egymintás t-próba): m: feltételezett (megadott) érték Nullhipotézis: Alternatív hipotézis: A nullhipotézist el kell vetni ha
t-próba Példa:sokaságból vett minta feltételezett normáleloszlás minta: 483, 502, 498, 496, 502, 483, 494, 491, 505, 486 átlag: 494 szignifikás-e (jellegzetes-e) az eltérés, valóban 500 az átlag? Nullhipotézis: az átlag = 500 szabadságfok: f=n-1 elemszám: 10 szórás: 8,05 t=2,36 Táblázatból: t0,05=2,26, mivel t≥t0,05, ezért a sokaság átlaga nem 500, az eltérés szignifikáns
Regressziószámítás A p-értékfogalma van egyolyanlegkisebbszigni- fikanciaszint, amelyenmár biztosan el kellfogadnunk a nullhipotézist elfogadási tartomány Ezazún. p-érték a p-értéknagy a p-értékkicsi H0-t elfogadjuk H0-t elvetjük
Példa - Adatelemzés GDP-TPES (1990-2009): nem látszik kapcsolat
Példa - Adatelemzés GDP-villamos energia (1990-2009): lineáris (?) kapcsolat
Példa - Eredmények • βStd. hiba t-statisztikap-érték • const 15326,4 3238,07 4,73320,00017 *** • GDP 4,01053 0,466223 8,6022 <0,00001 *** • Meandependent var 43028,30 S.D. dependentvar 351,920 • SSR87790511 S.E. of regression 2208,450 • R-squared 0,838685 Adjusted R-squared 0,829723 • F(1, 18) 73,99734P-value(F) 8,59e-08 • Log-likelihood -181,3261 Akaike criterion 366,6522 • Schwarz criterion 368,6436 Hannan-Quinn367,0409 • rho 0,306655Durbin-Watson 1,326367 A GDP jó magyarázó változó A modell meggyőző erejű (a változás 83%-át magyarázza)
Példa2 – Kétváltozós regresszió vill.en.=f(GDP, árindex) létezik?
Példa2 - Eredmények • CoefficientStd. Error t-ratio p-value • const -4440,38 11648,3-0,3812 0,70777 • GDP 4,83871 0,743157 6,5110 <0,00001 *** • price_idx122,986 60,238 2,0417 0,05702 * • Meandependent var 43028,30 S.D. dependentvar 51,920 • Sum squared resid 79632667 S.E. of regression 2164,318 • R-squared 0,853675Adj.R-squared 0,836460 • F(2, 17) 51,00601 P-value(F) 6,55e-08 • Log-likelihood -180,3508 Akaikecriterion 366,7016 • Schwarz criterion 369,6888 Hannan-Quinn367,2847 • rho 0,270488 Durbin-Watson 1,375572 Az árindex még elfogadható (határeset) magyarázó változó. A modell jósága növekedett.
Regressziószámítás - Ellenőrzés Több változó további ellenőrzés Változók közötti kapcsolat: egymást magyarázzák? Kollinearitás, multikollinearitás Variancianövelő tényező: VIF (varianceinflationfactor) : determinációs együttható a j-edik és a többi vált. között : tolerancia VIF≥1, 10 felett: erős kollinearitás
Példa2 – Kollienearitásellenrőzése Variance Inflation Factors Minimum possible value = 1.0 Values > 10.0 may indicate a collinearity problem GDP 3,386 price_idx 3,386 A változók nem magyarázzák egymást, függetlenek.
Regressziószámítás - Ellenőrzés Korrigált determinációs együttható n: változók száma p: paraméterek száma R2: eredeti det. együttható Jellemzői: • „bünteti” új változók bevonását • negatív is lehet
Regressziószámítás - Ellenőrzés Akaike információs kritérium (AIC) n: a mintaelemszám RSS: a hibanégyzet összeg, DFerror: a hiba szabadságfoka (n-p-1), p: a modell paraméterszáma Mivel a hibán (RSS) alapul, minél kisebb, annál jobb. Sok paraméter (p) jól magyaráz (RSS csökken) lényegkiemelő szerep csökken
Regressziószámítás - Ellenőrzés Normalitás vizsgálat A maradékoknak (e) normális eloszlásúnak kell lenniük! Eszközök (grafikus, vizuális eszközök): • maradékok sűrűségfüggvénye (gyakoriságok) • Q-Qplot (Q-Q diagram) • további eszközök (pl. P-P plot stb.)
Példa2 – Normalitás vizsgálat Normalitás vizsgálat – maradékok gyakorisága
Példa2 – Normalitás vizsgálat Normalitás vizsgálat – Q-Q plot Pontok illeszkedjenek az egyenesre!