520 likes | 852 Views
Analýza časových radov. -klasick á analýza -nelineárna analýza. Definícia časového radu. Je to postupnosť hodnôt nejakej premennej meranej v čase , o ktorej predpokladáme, že má nejakú vnútornú štruktúru, ktorú možno odhaliť. Dôvody analýzy č. radu:
E N D
Analýza časových radov -klasická analýza -nelineárna analýza
Definícia časového radu Je to postupnosť hodnôt nejakej premennej meranej v čase, o ktorej predpokladáme, že má nejakú vnútornú štruktúru, ktorú možno odhaliť. Dôvody analýzy č. radu: 1. Porozumieť procesom, ktoré produkujú dáta namerané v čase. 2. Vytvorenie modelu, ktorý umožní predpovedať ďalší vývoj radu a poprípade umožní uplatniť feedback kontrolu.
Aplikácie - predpovedanie ekonomických parametrov vývoja - predpovede vývoja trhu - predpovede pre burzu cenných papierov - predpovede klimatického vývoja - kontrola procesov v priemysle - odhad parametrov tam, kde ich nemôžeme zmerať - atď….
Identifikovateľné patterny 1. Trend - zložka, ktorá je systematická, buď lineárna alebo nelineárna a neopakuje sa v rámci dát , ktoré máme k dispozícii (napr. exponenciálny rast, lineárny pokles hodnôt) 2. Sezónnosť - zložka, u ktorej možno vystopovať systém, s ktorým sa opakuje (napr. periodické zmeny v nejakom časovom intervale. 3. Cyklická zložka - cyklické zmeny s premennou periódou 4. Reziduálna zložka- náhodné zmeny,ktoré ostanú po odstránení predošlých systematických zmien.
Príklad 1: Predaj nejakého produktu sa s rokmi lineárne zvyšuje (trend), ale zároveň aj podlieha sezónnym výkyvom, napr. najmenší predaj v januári, najvačší v decembri. Príklad 2: Cykly v ekonomike : ekonomický rast a úpadok sa strieda každých 5 až 7 rokov. Príklad 3: Cyklické zmeny v móde….apod.
Analýza trendu 1. vyhladzovanie dát - ak sú dáta veľmi zašumené - speriemerňovacie metódy (moving average) - exponenciálne vyhladzovanie 2. fitovanie funkcie - možeme skúsiť aproximovať trend lineárnou funkciou, alebo nejakou známou nelineárnou funkciou
Spriemerňovacie a vyhladzovacie metódy Manažér v obchodnom dome sa zaujíma o to, koľkotisíc dolárov zaplatí priemerný zákazník za mesiac. 1. 9 7. 11 2. 8 8. 7 3. 9 9. 13 4. 12 10. 9 5. 9 11. 11 6. 12 12. 10
Línie sú len vodítkom pre oči 11 9 7 predaj v tis. mesiac 8 12 10 4 2 -spriemernené dáta -pôvodné dáta -priemer pôvodných dát
priemer: 10 Je priemer dobrým odhadom výdajov priemerného zákazníka? Môžeme to určiť tak, že spočítame strednú kv. chybu pre bodové odhady výdaju 10 a trebárs pre 7, 9, a 12. Odhad: 7 9 10 12 MSE: 12 4 3 7 Vidíme, že priemer minimalizuje strednú kv. chybu (MSE), ale nie je dobrým odhadom, keď predpokladáme trend.
Alternatíva : single moving average (MA) Počítame priemery z menšieho počtu dát tak, že postupujeme časovým radom s určitým oknom , napr veľkosti 3. Keď dáta v okne nahradíme ich priemerom (MA), zároveň ich aj vyhladzujeme. N - dĺžka okna MA sa dokáže vysporiadať s jednoduchými trendami.
Double moving average (DMA) pre lin. trendy Počítame MA z dát získaných po prvom vyhladení typu MA. Existujú programy, ktoré použitím DMA dokážu predpovedať slušne hodnoty premennej radu 1 časovú jednotku dopredu a vystihnúť aj signifikantnejšie trendy. DMA: Počíta sa „moving average“ pre už raz spriemernené hodnoty (cez MA). Problém: nedostatok dát
Lineárne trendy Ak po vyhladení zistíme, že trend je lineárny, aproximujeme ho priamkou , ktorej parametre zistíme lineárnou regresiou.
Exponenciálne vyhladzovanie (“single”) Predpoklad: , kde b je pomaly sa s časom meniaci “trend” a je “chybová zložka”, ktorá sa s časom mení rýchlo. Počítame “moving average “ ale tak, že pozorovania v čase bližšie majú vačšiu váhu ako vzdialenejšie pozorovania. je vyhl. hodnota v čase t, je vyhladzovacia konštanta, , a y sú namerané hodnoty
Výhody “single exponential smoothing” a odhad - najlepšia metóda na predpovedanie jedného kroku dopredu Odhadz praxe: prax ukazuje , že hodnota okolo 0.3 funguje najlepšie Odhadz dát: skúšame s nejakým krokom, vypočítame vyhladené dáta a spočítame str. kvadratickú chybu. Berieme také ,pre ktoré je najmenšia. Odhad vizualizáciou: Plotujeme náš odhad s daným a zároveň pozorované hodnoty.
Predpovedanie (SES) - chyba predpovede pre čas t Nová predpoveď je sumou predošlej predpovede a chyby, ktorú sme urobili pri predošlej predpovedi. SES nie je veľmi dobrá metóda ak existuje trend v dátach.
Double exponential smoothing (DES) - rôzne možnosti voľby počiat. hodnoty b.
Predpovedanie s DES predpoveď o jednu čas. jednotku a fitujeme tak aby str. kv. chyba bola čo najmenšia. Ak existuje trend, DES pracuje lepšie ako SES. predpoveď o m čas. jednotiek dopredu
DSE vystihuje trend lepšie ako SSE, dokáže dáta sledovať s menšou strednou kvadratickou chybou
Sezónnosť v časových radoch Sezónna zložka časových radov: 1. Aditívna 2. Multiplikatívna Aditívna zložka: Predaj istej hračky má peak v decembri, ale zároveň predaj tejto hračky každý rok stúpne o 1. milión dolárov. Multiplikatívna zložka: Predaj inej hračky má tiež peak v decembri, ale každým rokom stúpa s faktorom 1.4.
Dekompozícia aditívna, všetky zložky sú v absolútnych číslach cyklic sezón náh trend multiplikatívna, trend je absolútna hodnota, ostatné relatívne voči trendu
Ako odhaliť sezónnosť v časových radoch? 1. Nakresliť priebeh radu v čase, ak je sezónnosť výrazná, možno ju odhaliť zrakom. Poprípade, ak poznáme trend, odčítame ho. 2. Ak poznáme periódu sezónnych zmien, nakreslíme priebeh jednej periódy, zvýrazníme tým jemnejšie sezónne zmeny. Môžeme spriemerovať viacero periód (ak sú zmeny identické až na náhodné šumy), odčítať trend, vyhladiť rad… 3. Multiple box plot . 4. Nakresliť závislosť autokorelačného koeficientu od časového intervalu.
Priebeh časového radu Je to prvá vec, ktorú treba skúsiť. - skúsime rad fitovať nejakou funkciou -skúsime ho vyhladiť (nízkofrekvenčný filter ?) -ak odhalíme trend, skúsime ho odčítať -skúsime nakresliť časový priebeh radu s odčítaným trendom -použijeme „triple exponential smoothing“ na fitovanie sezónnych zložiek
Jednoduchý prístup k sezónnej zložke (ukážka) Rad: Záznam školskej správy o výdajoch počas obdobia troch rokov. 1000 MA vyhladenie 500 100 štvrťročné obdobia
1. Vidíme, že sezónna zložka je multiplikatívna. 2.Centrovaný MA s oknom trošku väším ako perióda sezónnosti sezónne zmeny vyhladí. Prípadnú cyklickú zložku necháva nedotknutú. Teda vyhladená čiara je 3. Spriemerníme januárové, februárové…..hodnoty za 3 roky a tým potlačíme náhodnú zložku. 4. Od spriemernenej sezónnej zložky odčítame trend, získaný pomocou MA.
koncentrácia látky v ovzduší mesiac Sezónnosť v zložitých časových radoch Predpoklad: asi budú sezónne zmeny, len ich ťažko rozoznať
Box plot Technika, ktorá umožňuje sumarizovať dáta - vystúpia sezónnezmeny 1. Zoradíme dáta podľa veľkosti a nájdeme maximálnu a minimálnu hodnotu. 2. Nájdeme medián. 3. Nájdeme mediány hornej a dolnej polovice dát (horný a dolný kvartil). 4.Nakreslíme čiaru spájajúcu maximum a minimum v dátach a predelíme ju čiarou mediánu, a kvartíl.
max min 50 0 E h kvartil medián d kvartil 100 Pre 1. mesiac
E 150 100 50 1 2 3 4 Multiple box plot Pre 4 mesiace
Autokorelačný koeficient - ak sú dáta nezávislé, tento koeficient bude blízky nule pre akýkoľvek časový interval - ak existuje sezónnosť, pre isté časové intervaly, rovné perióde sezónnych zmien, budú existovať maximá
Ako spočítať autokorelačný koeficiant? 1. Os y: autokorelačný koeficient , je autokovariačná funkcia a je variačná funkcia
2. Os x: časový interval h, h= 1,2,3,4…. 3. Intervaly spoľahlivosti: Línie rovnobežné s osou x, ktoré ohraničujú s akou spoľahlivosťou môžeme vyhlásiť, že . Tvoríme ich takto: a) ak testujeme nezávislosť (t.j. v dátach nie je časová závislosť
b) v dátach je časová závislosť, chceme na ich nafitovať ARIMA modelom k je časový interval, N veľkosť vzorky
Triple exponential smoothing (TES) Technika, ktorá vyhladí dáta vykazujúce zároveň trend i sezónnosť. -celkové vyhladenie - vyhladenie trendu - sezónne vyhladenie -predpoveď
Význam jednotlivých premenných -y pozorovanie -S vyhladené pozorovanie -b faktor trendu -I faktor sezónnych zmien -t čas -F predpoveď o m časových jednotiek
Modelovanie časových radov Všeobecný prístup: 1. Nakresliť priebeh radu 2. Nájsť trend, sezónne zmeny, zvyšok. 3. Spektrálna analýza - analýza radu vo frekvenčnej oblasti. 4. Nájsť vhodný model -dekompozičný prístup (modelovať trendy….) -Box-Jenkinsov prístup (sledovať koreláciu náhodných zložiek)
Spektrálna analýza radu - power spectrum Power spectrum (výkonové spektrum) súvisí s Fourierovou transformáciou autokorelačnej funkcie (ACF) časového radu. autokorelačná funkcia Fourierova tr. ACF Power spectrum
ACF čas Fyzikálny význam ACF
Tvorba modelu Box-Jenkinsovou metódou Výhody: a) modely sú adaptívne, preto široko použitelné b) sú vypracované dobré balíky programov c) pracujú s náhodnými zložkami radu , ktoré môžu byť korelované Nevýhody: a) Dĺžka časového radu musí byť aspoň 50 bodov merania (čo je ťažké ak nejakú veličinu meriame raz za rok). b) Obtiažna interpretácia modelu.
Autoregressive model (AR model) Je to lineárna regresia aktuálnej hodnoty radu voči jednej alebo niekoľkým predošlým hodnotám. - hodnoty radu p- rád modelu -biely šum , - stredná hodnota, ak model sa zjednoduší
Moving average model (MA model) -časový rad - biely šum - parametre modelu - rád modelu Je to vlastne lineárna regresia aktuálnej hodnoty radu voči náhodným chybám ovplyvňujúcim predošlé hodnoty radu.
Box - Jenkins ARMA model Kombinuje AR a MA modely.
1. Časový rad musí byť stacionárny. T.j. stredná hodnota, variácia a autokorelácia sa s časom nemení a teda rad nesmie mať trend ani priveľké sezónne zmeny. 2.Ak treba (kvôli použitému softwaru) získať rad s nulovou strednou hodnotou, odčítame strednú hodnotu. 3. K modelu možno pridať sezónne autoregresívne i moving average členy, poprípade iné členy, čo ale fitovanie modelu komplikuje.
Tvorba ARMA modelu 1. Identifikácia modelu. 2. Odhad parametrov modelu 3. Vyhodnotenie modelu
Identifikácia modelu A) Preskúmame , či model je stacionárny, nájdeme trend a sezónne komponenty. B)Ak rad nie je stacionárny, pomôže diferencovanie radu, alebo odčítanie trendu. C)Nájdenie rádu modelu pre AR aj MA členy (p,q), aj pre sezónne AR a MA členy. Robí sa to pomocou závislosti autokorelačného koeficientu a parciálneho autokorelačného koeficientu od časového intervalu (autokorelačná funkcia, parciálna autokorel. funkcia).
Parciálna autokorelačná funkcia Je to korelácia a po odstránení ich vzájomnej lineárnej závislosti na premenných, ktoré sú medzi nimi. Je to závislosť koeficientu od časového intervalu h. Kde je časový rad y s odčítanou strednou hodnotou.
C) Hľadanie rádu modelu (koeficienty p a q) I. Nakresliť autokorelačnú funkciu II. Nakreslit parciálnu autokorelačnú funkciu Príklad: Autokorelačná funkcia pre AR model prvého rádu je exponenciálne klesajúcou funkciou. Parciálna autokorelačná funkcia klesá na nulu pre časový interval . Rád AR modelu je p. Ako určit nulu PAF? Nakreslíme 95% -ný interval spoľahlivosti ( , N veľkosť vzorky).
MA model: Autokorelačná funkcia je nulová pre časový interval . Parciálna autokorelačná funkcia pre tento model nie je užitočná.
Identifikácia modelu pomocou tvaru autokorelačnej funkcie Tvar autokor. f Navrhovaný model AR model, jeho rád nájdeme pomocou parciálnej autokor. funkcie Exp. pokles k nule Striedanie poz. a neg. hodnôt, ide k 0 --------------//--------------------- 1 alebo niekolko peakov, inde 0 MA model , rád. podľa toho, kde AF ide k 0. Pokles k nule až o niekoľko čas. intervalov ARMA model Všade prakticky nula Neskorelované dáta, náhodné Nie je pokles k nule Rad je nestacionárny