170 likes | 509 Views
Analýza časových radov. Ivan Martoš, Kristína Mišíková, Andrej Štajer, Petra Vrablecová. Obsah. analýza trendov v časových radoch dekompozícia zložky čas. radu metódy na elimináciu zložiek predikcia spektrálna analýza Boxova-Jenkinsova metodológia analýza podobností v časových radoch.
E N D
Analýza časových radov Ivan Martoš, Kristína Mišíková, Andrej Štajer, Petra Vrablecová
Obsah • analýza trendov v časových radoch • dekompozícia • zložky čas. radu • metódy na elimináciu zložiek • predikcia • spektrálna analýza • Boxova-Jenkinsova metodológia • analýza podobností v časových radoch
Dekompozícia • trend (T) • sezónna zložka (S) • cyklická zložka (C) • náhodná zložka ( ) • rezíduum
Dekompozícia • aditívny rozklad • predpokladáme vzájomnú nezávislosť zložiek • multiplikatívny rozklad • predpokladáme vzájomnú závislosť zložiek • úprava aditívneho na multiplikatívny zlogaritmovaním:
Určenie trendovej zložky • nahradenie • radu pozorovaných hodnôt • radom teoretických hodnôt bez periodického a náhodného kĺzania ⇒vyrovnanie (vyhladenie) čas. radu • metódy • globálny prístup – regresná analýza • metóda najmenších štvorcov • lokálny prístup • metóda kĺzavých priemerov • exponenciálne vyrovnávanie
lineárna regresia najčastejšie používané modely trendov: lineárny kvadratický hyperbolický exponenciálny zvolenie tvaru regresnej funkcie musí rešpektovať logické a vecné súvislosti javu a ich zákonitosti zároveň regresná funkcia má byť podľa možností čo najjednoduchšia a má zaručiť čo najlepšiu aproximáciu (tesnosť) k pozorovaným hodnotám exponenciálny logistický Gompertzov Metóda najmenších štvorcov
Metóda kĺzavých priemerov • rad pozorovaní nahrádzame radom priemerov, ktoré sa robia postupne – kĺzavo zo skupiny údajov určeného rozsahu • strácame hodnoty na okrajoch radu
Exponenciálne vyrovnávanie • rad pozorovaní je nahradený hodnotami vypočítanými z predošlých pozorovaní • najnovšie pozorovania majú väčšiu váhu • α je vyrovnávací koeficient z (0,1), čím bližší k 1, tým majú najnovšie pozorovania väčšiu váhu
Eliminácia sezónnej zložky • metóda kĺzavých priemerov • rozsah je počet sezón p (4, 7, 12 a pod.) • regresia • sezónne indexy pre predikciu
Náhodná zložka • po eliminácii trendu, sezonnósti a cyklicity, ostanú len rezídua, tzv. biely šum • stacionárny časový rad • nezávislé rezíduá s identickým rozdelením • stredná hodnota okolo 0, nezáporná variancia (Normálne rozdelenie) • testy náhodnosti • testujú, či rezíduá sú nezávislé náhodné premenné s rovnakým rozdelením
Predpovede čas. radu • bodové vs. intervalové • kvalitatívne • založené na názore odborníkov, subjektívne • napr. panelová zhoda, Delphi • kvantitatívne • štatistická analýza – predpoveď podľa modelu
Vyhodnotenie predpovede • kvalita predpovede sa hodnotí najčastejšie metrikami: • súčet štvorcových chýb (SSE: sum of squared errors) • stredná štvorcová chyba (MSE: mean squared error) • stredná absolútna odchýlka (MAD: mean absolute deviation)
Spektrálna analýza • spektrálna analýza • slúži na vyhľadávanie periodicity • ak vieme, že rad obsahuje periodicitu, ale nevieme s akými frekvenciami (periódami) ω • pje počet sčítancov, max. možných rôznych frekvencií, kt. sa mohli prejaviťv celom priebehu radu
Boxova-Jenkinsova metodológia • základ konštrukcie modelu je reziduálna zložka • skúmajú sa korelácie medzi rezíduami narozdiel od predošlých metód, kde bola podmienka, aby rezídua boli nezávislé, t.j. nekorelované • potreba dostatočne dlhého radu • vysokofrekvenčné dáta • modely: • m. kĺzavých súčtov (MA), autoregresný m. (AR), zmiešaný (ARMA), integrovaný (ARIMA)
Literatúra • Han J.: Data Mining: Concepts and Techniques • Grinčová, A., Ižaríková, G., Pirč, V.: Časové rady, elektronická učebnica, http://web.tuke.sk/fei-km/content/elektronick%C3%A9-texty • Klicnarová, J.: Poznámky k predmetu SMAC,http://home.ef.jcu.cz/~janaklic/casovky/casovkyII.pdf