380 likes | 552 Views
výška. ···. t. t+1. t+2. …. t+k. 4.3. Výber vhodných modelov. Časový rad výšky tučniakov priemerná výška generácie dospelých tučniakov ČR je stacionárny. dcéra. matka. P. priemer. t. t. +1. t. t. +1. 4 .3. Výber vhodných modelov. Autokorelácia vo výške tučniakov
E N D
výška ··· t t+1 t+2 … t+k 4.3. Výber vhodných modelov • Časový rad výšky tučniakov • priemerná výška generácie dospelých tučniakov • ČR je stacionárny
dcéra matka P priemer t t +1 t t +1 4.3. Výber vhodných modelov • Autokorelácia vo výške tučniakov • výška je dedičstvom po rodičoch • budúca hodnota závisí od minulých - autokorelácia • ak správne popíšeme túto závislosť, vysvetlíme veľkú časť variability
4.3. Výber vhodných modelov • Typy nesezónnych ARIMA modelov • všetky vychádzajú z autokorelácie v časovom rade Čisté autoregresívne modely Kombinované autoregresívne modelykĺzavých priemerov Čisté modelykĺzavých priemerov Nesezónne ARIMA modely
t-2 AR(2) t-1 priemer P 4.3. Výber vhodných modelov • Čisté autoregresívne modely - AR(p) • predikujú výšku tučniakov ako súčet násobkov • výšky priemerného tučniaka • výšky predchádzajúcich p generácií tučniakov • čím vzdialenejšia je generácia, tým menší vplyv má na predikciu prenásobenie a sčítanie výšky priemerneja predchádzajúcich generácií... ...slúži na predikciu výškybudúcej generácie...
AR(2) 4.3. Výber vhodných modelov • Čisté autoregresívne modely - AR(p) • sú modelmi náhodných procesov, ktorých hodnota v čase t je vážená suma • celkového priemeru časového radu • hodnôt časového radu v čase t-1, t-2, … t-p • náhodnej chybovej zložky
chyba predikcie predikované aktuálne t-1 t-1 4.3. Výber vhodných modelov • Čisté modely kĺzavých priemerov - MA(q) • sú založené na chybe predikcie • rozdiel medzi skutočnou a predikovanou hodnotou časového radu pre daný okamih
násobky chýb t-1 t-2 Priemer MA(2) P 4.3. Výber vhodných modelov • Čisté modely kĺzavých priemerov - MA(q) • predikujú výšku tučniakov ako súčet násobkov • výšky priemerného tučniaka • chýb predikcie pre výšky predchádzajúcich q generácií tučniakov • čím vzdialenejšia je generácia, tým menší vplyv má chyba je predikcie Suma priemerua násobkov predchádzajúcich chýbpredikcie... ...slúži na predikciu výškybudúcej generácie...
AR(2) 4.3. Výber vhodných modelov • Čisté modely kĺzavých priemerov - MA(q) • sú modelmi náhodných procesov, ktorých hodnota v čase t je vážená suma • celkového priemeru časového radu • hodnôt náhodných chýb predikcie v čase t, t-1, t-2, … t-q
násobky chýb t-2 t-1 t-2 násobky výšky t-1 ARMA(2,2) P 4.3. Výber vhodných modelov • Kombinované autoregresívne modely kĺzavých priemerov - ARMA(p,q) • predikujú výšku tučniakov ako kombináciu AR a MA metódy Suma násobkov výškya násobkov predchádzajúcich chýbpredikcie... ...slúži na predikciu výškybudúcej generácie...
ARMA(1,1) 4.3. Výber vhodných modelov • Kombinované autoregresívne modely kĺzavých priemerov (ARMA) • sú modelmi náhodných procesov, ktorých hodnota v čase t je vážená suma • celkového priemeru časového radu • hodnôt časového radu v čase t-1, t-2, … t-p • hodnôt náhodných chýb predikcie v čase t, t-1, t-2, … t-q
Predaj výrobkov tabakového priemyslu v USA ? 4.3. Výber vhodných modelov • Výber nesezónneho ARIMA modelu Odhadnúť AR model? Koľko p? Odhadnúť ARMA model? Odhadnúť MA model? Koľko q?
Model 4.3. Výber vhodných modelov • Výber nesezónneho ARIMA modelu • pridávanie parametrov do modelu • zvyšuje presnosť odhadu • znižuje jednoduchosť - zrozumiteľnosť modelu • cieľom je nájsť optimálnu rovnováhu medzi presnosťou a jednoduchosťou modelu Presnosť Jednoduchosť
= d + f + Y Y a - t 1 t 1 t 4.3. Výber vhodných modelov • Výber nesezónneho ARIMA modelu • ak je časový rad stacionárny • autokorelácia medzi pozorovaniami slúži ako základný návod • pri výbere modelu • pri určení počtu parametrov • vychádzame z jej grafického znázornenia • grafy autokorelačných funkcií
4.3. Výber vhodných modelov • Výber modelu na základe grafov autokorelácie • každý typ ARIMA modelov má svoj vlastný podpis • špeciálny vzhľad grafov autokorelácie • vhodný ARIMA model vyberieme na základe porovnania • vzorového vzhľadu grafov autokorelácie • skutočného vzhľadu v analyzovanom časovom rade • vychádzame z dvoch grafov • grafu výberovej autokorelačnej funkcie • grafu výberovej parciálnej autokorelačnej funkcie
t–2 t–1 t 4.3. Výber vhodných modelov • Výberová parciálna autokorelačná funkcia • Sample Partial Autocorrelation Function - SPACF • zobrazuje parciálne koeficienty autokorelácie k-rádu • merajú silu závislosti medzi pozorovaniami časového radu vzdialenými od seba o k období • za predpokladu, že vplyv iných pozorovaní je vylúčený • tzv. čistá autokorelácia
SACF SPACF Exponenciálnypokles po p=2miznú 4.3. Výber vhodných modelov • Grafy autokorelácie pre AR(p) • veľkosť koeficientov SACF klesá exponenciálne • koeficienty SPACF miznú po oneskorení p podpisový vzor modelu AR(2)
P 4.3. Výber vhodných modelov • SACF pre AR(p) • môže vyzerať rôzne • základnou črtou je vyhladený, exponenciálny pokles koeficientov SACF
Posledný významný koeficient má k=2ide o model AR(2) Hranice významnosti pre =0.05 4.3. Výber vhodných modelov • SPACF pre AR(p) • graf môžeme doplniť o hranice významnosti koeficientov • pre test zhody koeficienta s nulou • na základných hladinách významnosti • posledný významný parciálny koeficient autokorelácie určuje rád AR modelu
SACF SPACF 4.3. Výber vhodných modelov • Príklady grafov pre AR(p) jednoznačne AR(2) diskutabilné, ale tiež AR(2)
SACF SPACF miznú po q=2 Exponenciálnypokles 4.3. Výber vhodných modelov • Grafy autokorelácie pre MA(q) • koeficienty SACF miznú po oneskorení q • posledný významný koeficient určuje rád MA modelu • veľkosť koeficientov SPACF klesá exponenciálne podpisový vzor modelu MA(2)
SACF SPACF Exponenciálny pokles 4.3. Výber vhodných modelov • Grafy autokorelácie pre ARMA(p,q) • SACF exponenciálne klesá po oneskorení q-p • SPACF exponenciálne klesá po p-q podpisový vzor modelu ARMA(1,1)
SACF SPACF A AR(p) A MA(q) A ARMA(p,q) 4.3. Výber vhodných modelov • Zhrnutie identifikačných znakov
4.3. Výber vhodných modelov • Hľadajte model ČR 1 ČR 2
4.3. Výber vhodných modelov • Hľadajte model ČR 3 ČR 4
4.3. Výber vhodných modelov • Hľadajte model ČR 5 ČR 6
narodení v lete narodení v zime P priemer t t+4 t t+4 4.3. Výber vhodných modelov • Sezónny časový rad • ak je časový rad dlhší ako rok, môže obsahovať sezónnosť • výška tučniakov už nebude len vecou dedičstva po rodičoch • bude závisieť aj ročného obdobia, v ktorom sa generácia narodila • musíme je zahrnúť do modelu
SACF SPACF nesezónnaautokorelácia prejav sezónnej autokorelácie 4.3. Výber vhodných modelov • Graf sezónnej autokorelácie • je vlastne súčasťou bežných grafov autokorelácie • sezónna autokorelácia sa prejaví významný koeficientmi na miestach s oneskorením rovným násobku dĺžky sezóny
4.3. Výber vhodných modelov • Sezónne ARIMA modely • sú vlastne dva ARIMA modely v jednom • jeden pre vyjadrenie nesezónnej autokorelácie - nesezónny • druhý pre vyjadrenie sezónnej autokorelácie - sezónny • pre sezónne modely platia rovnaké princípy, ale sledujú sezónnu časovú škálu • tiež tri typy • čisté sezónne autoregresívne modely • čisté sezónne modely kĺzavých priemerov • kombinované sezónne autoregresívne modely kĺzavých priemerov Nesezónny model Sezónny model
SACF SPACF Sezónny podpisový vzor Nesezónny podpisový vzor 4.3. Výber vhodných modelov • Výber sezónnych ARIMA modelov • tiež je založený na analýze grafov SPACF a SACF • hľadáme známe podpisové vzory, ale na miestach s ročným oneskorením
ARIMA (p, d, q) (P, D, Q) s Sezónny model Nesezónny model 4.3. Výber vhodných modelov • Zápis sezónnych ARIMA modelov • umožňuje rozlíšenie sezónnych a nesezónnych zložiek • p, P - rád AR modelov • q, Q - rád MA modelov • d, D - rád diferencií potrebných na stacionarizáciu • s - sezónnosť, napr. 12, 6, 4
rozliatie do susedných hodnôt 4.3. Výber vhodných modelov • Prelievanie sezónnej autokorelácie • ak časový rad obsahuje sezónnu aj nesezónnu zložku • koeficienty na sezónnych miestach, akoby sa rozliali do susedných hodnôt koeficientov • koeficienty v ich okolí sa javia ako významné a aj tak s nimi pracujeme • vyplýva to z matematickej podstaty modelu, nie je to porušenie kvality modelu
4.3. Výber vhodných modelov • Hľadajte model ČR 7 (mesačný)
4.3. Výber vhodných modelov • Hľadajte model ČR 8 (mesačný)
2 R 2 Adjusted R R 2 Random Walk Amemiya’s 2 Adjusted R 4.4. Porovnanie kvality modelov • Miery kvality modelu • Prognózovací systém počíta viac ako 20 mier presnosti odhadu prognostického modelu MinError MSE AIC SSE Max Error SBC MAPE RMSE
Model 2 R RMSE Presnosť Jednoduchosť 4.4. Porovnanie kvality modelov • Tradičné miery kvality modelu • napr. MSE, RMSE, R2 • porovnávajú modely v absolútnych mierach • pre modely s podobným počtom parametrov je ako najlepší vybraný model s najmenšou RMSE alebo najväčším R2 • pri hodnotení kvality uprednostňujú presnosť • to môže viesť k výberu preparametrizovaného modelu • treba použiť aj iné miery
Model AIC SBC Presnosť Jednoduchosť 4.4. Porovnanie kvality modelov • Penalizačné miery kvality modelu • napr. Akaikeovo informačné kritérium (AIC) alebo Schwarz-Bayesovo kritérium • hľadajú lepšiu rovnováhu medzi jednoduchosťou a presnosťou • vychádzajú z MSE • zvyšujú ho penalizačný faktor, ktorý rastie s počtom parametrov • najlepší model minimalizuje tieto miery
··· ··· Odhadová vzorka Zadržaná vzorka 4.4. Porovnanie kvality modelov • Zadržaná vzorka • ak je časový rad dostatočne dlhý, • rozdelíme ho na dva po sebe idúce intervaly • prvý použijeme na odhad parametrov modelu • druhý - zadržanú vzorku - použijeme na výpočet mier kvality odhadnutého modelu • kvalitu a stabilitu modelu možno overiť aj zmenami dĺžky intervalov • najlepší model má najlepšie výsledku pre najväčší počet vzoriek
Stacionarizujúce transformácie Stationarland “Skutočný svet” Prognóza 4.5. Výpočet prognózy • Transformácia prognostického modelu do pôvodných jednotiek Odhad modelu Aplikácia modelu