240 likes | 387 Views
Modely časových radov s dlhou pamäťou – ARFIMA modely.
E N D
V praxi sa môžeme stretnúť s časovými radmi tvorenými stacionárnymi procesmi, ktorých aj veľmi časovo vzdialené náhodné veličiny sú silno závislé. Na tento jav prvý krát poukázal na hydrologických časových radoch HURST (1951, 1957). Podobné vlastnosti boli neskôr potvrdené aj u ekonomických , najmä finančných časových radov. Časové rady s touto vlastnosťou sa označujú ako rady s dlhou pamäťou. Modely časových radov s dlhou pamäťou sa objavujú v literatúre od 80. – rokov minulého storočia a sú charakteristické okrem iného predovšetkým tým, že hodnoty ACF neklesajú s rastúcim oneskorením exponenciálne ale hyperbolicky.
Časové rady s touto vlastnosťou nazývame rady s dlhou pamäťou (generujú ich stochastické procesy, ktoré nazývame procesy s dlhou pamäťou). Ich charakteristickou vlastnosťou je, že hodnoty ACF neklesajú s rastúcim oneskorením exponenciálne, ale hyperbolicky. Frakcionálne integrované procesy rádu „d“ definovali a jeho vlastnosti odvodili GRANGER(1980), GRANGER JOYEX(1980) a HOSKING (1981), má formu (1.) kde at je proces bieleho šumu a d nemusí byť celé číslo, označuje sa ako frakcionálny parameter a symbol potom vyjadruje frakcionálnu diferenciu. Modely s neceločíselným dsanazývajúfrakcionálne integrované procesy rádu dautoregresnáreprezentácia nekonečného radu frakcionálne integrovaného procesu má tvar (2.) Kde parametre sú získané z binomického rozvoja (3) (3.)
pre akékoľvek reálne číslo Autoregresný koeficient v oneskorení k je možné vyjadriť: (4.) kde Γ(z) je gama funkcia: (5.) Vzhľadom k tomu, že pre gama funkciu platí: (k – d) = ((k – d – 1) (k – d – 2) …, (2 – d) (1 – d) (-d)) (– d) (6.) Je možné autoregresný koeficient vyjadriť takto: (7.)
Frakcionálne integrovaný proces je možné vyjadriť vo forme reprezentácie kĺzavých priemerov nekonečného rádu: (8.) Kde parametre sú získané z rovnice rozvoja: (9.) Pretože (10.) môžemepísať: (11.)
Ďalej je možné odvodiť autokorelačnú funkciu frakcionálne integrovaného procesu rádu d: (12.) Parciálna autokorelačnáfunkciafrakcionálne integrovaného procesu rádu d: (13.) Zaujímavé sú asymptotické aproximácie uvedených parametrov procesov s použitím STIRLINGOVEJ aproximácie pre vysoké k vo forme: (14.) Potom môžeme odvodiť parametre (15.)
Je teda možné zistiť, že pre je processtacionárny, pretpže platí: Pre je procesinvertibilny, pretože platí: Pre je proces nestacionárny a pre je proces neinvertibilny. Pre platí, že všetky autokorelácie sú kladné a: (16.) Proces (1.) sa označuje ako „perzistentný“ alebo „proces s dlhou pamäťou“ (longmemory proces). Pre platí, že súčet absolútnych hodnôt autokorelácií konverguje k nejakej konštante tzn. že (16.) je konečné číslo. V tom prípade sa proces označuje ako „antiperzistentný“ alebo proces so strednou pamäťou.
Uvažujme proces ARIMA(0, d, 0). Pre | d | < 0,5platí: • 1. {Yt} je processtacionárny a invertibilný • 2. ACF má tvar (17.) t. j. pre k , takže pre0 < d < 0,5 je (k) > 0 a s rastúcim posunutím k klesá ACF monotónne a hyperbolicky k 0 (tento pokles je omnoho pomalší ako pre d = 0). 3. PACF je daná vzťahom, k = 1, 2, .... Jej pokles je určený číslomk-1, ktoré nezávisí od d. (18.)
Proces ARIMA(0, d, 0) je pre: 0 < d < 0.5 process dlhou pamäťou ( |(k)| ) -0.5 < d < 0 proces so strednoupamäťou( |(k)| konšt.) d 0.5 nestacionárnyproces d -0.5 neinvertibilnýproces d < 0.5 stacionárnyproces d > -0.5 invertibilnýproces Kombináciou frakcionálneho diferencovania a procesu ARMA(p, q) sa získa trieda procesov ARFIMA(p, d, q). Dôležitou vlastnosťou týchto procesov je, ževplyv parametra d na vzdialené premennés rastúcim oneskorením klesá hyperbolicky, ale vplyv AR a MA parametrov klesá exponenciálne; d teda charakterizujekorelačnú štruktúru pre veľké oneskorenia, ostatné parametre charakterizujúkorelačnú štruktúru v malých oneskoreniach. Aj keď je ARFIMA(p, d, q) pre 0.5 < d < 1 nestacionárnyproces, vygenerované časové rady sú priťahované k strednej hodnote procesu.
Príklad 1: Časový rad dĺžky 3000 simulovaný na základe procesu ARFIMA(0; -0,4; 0) v tvare (1 – B)-0,4 = : Časový rad nemá žiadnu vývojovú tendenciu z hľadiska strednej hodnoty ani rozptylu, môžeme ho teda považovať za stacionárny. Odhad autokorelačnej funkcie je štatisticky nevýznamne rozdielny od 0 už pre posunutie k = 2. Súčet absolútnych hodnôt autokorelácií generujúceho procesu je konečné číslo. Ide teda o proces so strednou pamäťou.
Príklad 2: Časový rad dĺžky 3000 simulovaný na základe procesu ARFIMA(0; 0,45; 0) v tvare (1 – B)0,45Yt= t. Ani tento časový rad nemá žiadnu vývojovú tendenciu z hľadiska strednej hodnoty ani rozptylu, môžeme ho teda považovať za stacionárny. Hodnoty autokorelačnej funkcie klesajú k 0 veľmi pomaly a hyperbolicky, dá sa teda predpokladať, že súčet absolútnych hodnôt autokorelácií generujúceho procesu konverguje do nekonečna. Ide teda o proces s dlhou pamäťou.
Korelačná funkcia Parciálna korelačná funkcia Príklad 3: Časový rad dĺžky 3000 simulovaný na základe procesu ARFIMA(0; 0,75; 0) v tvare (1 – B)0,75Yt= t. Tento časový rad má už jasnú vývojovú tendenciu, nemôžeme ho teda považovať za stacionárny. Hodnoty autokorelačnej funkcie klesajú k 0 veľmi pomaly, ale už nie hyperbolicky (skôr lineárne).
Testovanie hypotézy pre modely s dlhou pamäťou Uvažujme proces Yt= + t, t = 1, …, n kde je ľubovoľný parameter t je stochastický proces s nulovou strednou hodnotou. Nulová hypotéza -- : je proces s krátkou pamäťou Ak proces Yspĺňa nasledujúce 4 podmienky: 1. E() = 0 2. 0 < D() < 3. E()k < ∞ pre k > 2 4. Korelácia medzi vzdialenými premennými je štatisticky nevýznamná potom pre daný proces nemôžeme zamietnuť. Zamietnutie ešte neznamená, že proces je s dlhou pamäťou, ale len to, že všetky 4 predchádzajúce podmienky nie sú splnené súčasne.
Používajú sa dve testovacie štatistiky. Pri prvej sa najprv vypočíta výraz: (19.) Kde a S(m) je aritmetický priemer a smerodajná odchýlka časového radu, t = 1, …, m, 1 m n. (odporúčaná hodnota je m = n/4, resp. m = n/2). Potom sa vypočítatestovacia štatistika Vm: (20.) Ak vypočítaná hodnota testovacej štatistiky patrí do intervalu (0.809; 1.862), na hladine významnosti = 0,05 nemôžeme zamietnuť nulovú hypotézu, že proces má len krátku pamäť. Ak je však hodnota mimo tohto intervalu, neznamená to ešte jednoznačne, že proces má dlhú pamäť. Potvrdíme (alebo vyvrátime) tento predpoklad použitím ďalšej testovacej štatistiky.
Najprv vypočítame výraz (odporúčané hodnoty q pre n > 125 sú n/10 a n/5) : (21.) kde je odhad výberového rozptylu a autokovariancie s posunutím j časového radu , t = 1, …, m, 1 m n. Opäť vypočítame hodnotu normovanej testovacej štatistiky číslo dva: Ak je vypočítaná hodnota testovacej štatistiky mimo intervalu (0,809; 1,862), na hladine významnosti α= 0,05 zamietame nulovú hypotézu, že proces má len krátku pamäť. (22.)
Príklad 1: Časový rad dĺžky 3000 simulovaný na základe procesu ARFIMA(0; -0,4; 0) v tvare (1 – B)-0,4 Yt= t. Prvá testovacia štatistika: Hodnota testovacej štatistiky je mimo (0,809; 1,862). Vypočítame preto aj druhú testovaciu štatistiku. Vypočítané hodnoty testovacej štatistiky sú (až na jednu) mimo (0.809; 1.862). Na hladine významnosti α= 0.05 zamietame nulovú hypotézu, že proces má len krátku pamäť.
Príklad 2: Časový rad dĺžky 3000 simulovaný na základe procesu ARFIMA(0; 0,45; 0) v tvare (1 – B)0,45Yt= t. Prvá testovacia štatistika: Hodnota testovacej štatistiky je mimo (0.809; 1.862). Vypočítame preto aj druhú testovaciu štatistiku. Vypočítané hodnoty testovacej štatistiky sú mimo (0.809; 1.862). Na hladine významnosti = 0.05 zamietame nulovú hypotézu, že proces má len krátku pamäť.
Príklad 3: Časový rad dĺžky 3000 simulovaný na základe procesu ARFIMA(0; 0,75; 0) v tvare (1 – B)0,75Yt= t. Prvá testovacia štatistika: Vypočítaná hodnota testovacej štatistiky je mimo (0.809; 1.862). Neznamená to jednoznačne, že proces má dlhú pamäť. Potvrdíme (alebo vyvrátime) tento predpoklad použitím druhej testovacej štatistiky. Dve hodnoty testovacej štatistiky sú mimo a dve v (0.809; 1.862). Na hladine významnosti = 0.05 nevieme rozhodnúť, či má proces len krátku pamäť.
Odhad parametrov modelov ARFIMA Odhad parametrov pri modeloch ARFIMA je podstatne komplikovanejší ako pri modeloch ARMA. Neceločíselný parameter d má v porovnaní s ostatnými parametrami špecifický význam, pretože podľa jeho hodnoty je možné určiť, či ide o proces s dlhou alebo krátkou pamäťou, stacionárny alebo nestacionárny. Existujú dve skupiny metód na odhad parametrov modelov ARFIMA. Prvú skupinu tvoria dvojkrokové metódy: najprv sa odhadne parameter d a potom sa odhadnú parametre modelu ARMA pre transformovaný časový rad (filtrovaný frakcionálnym diferencovaním pre vypočítaný parameter d). Tieto metódy sú použiteľné len pre dostatočne dlhé časové rady. Druhú skupinu tvoria jednokrokové metódy, v ktorých sa súčasne odhadnú všetky parametre modelu ARFIMA. Väčšina z nich je založená na rôznych variantoch metódy maximálnej vierohodnosti či už v časovej alebo vo frekvenčnej oblasti. Hlavným nedostatkom týchto metód je ich výpočtová zložitosť, nutnosť poznať počiatočné hodnoty pre jednotlivé parametre a možná existencia lokálneho extrému funkcie vierohodnosti.
1. Dvojkrokové metódy 1.1 Hurstovkoeficient. Najprv musíme rozdeliť časový rad do m spojitých úsekov dĺžky N, pričom m x N = n (celková dĺžka časového radu). Pre každý tento j-ty úsek (j = 1, …, m): 1. Vypočítame aritmetický priemer (označíme ho Ej) a smerodajnú odchýlku Sj 2. Centrujeme dáta odčítaním aritmetického priemeru Xi, j = Yi, j - Ej pre i = 1, …, N 3. Vytvoríme kumulatívny časový rad postupným sčítaním po sebe idúcich centrovaných premenných: (23.) (24.) 4. Určíme rozsah kumulatívneho časového radu odčítaním minimálnej hodnoty od maximálnej, čím získame štatistiku Rj: Rj = max (Z1, j, …, ZN, j) - min (Z1, j, …, ZN, j) 5. Vydelíme rozsah Rj smerodajnou odchýlkou Sj (reškálovaný rozsah) 6. Vypočítame priemer reškálovaných rozsahov pre všetky úseky dĺžky N: (25.)
7. Dĺžku úseku N zväčšíme na najbližšie číslo, pre ktoré existuje také celé číslo m, že m x N = n. Kroky 1 - 7 opakujeme, pokiaľ N n/2. 8. Hurstov koeficient H, pre ktorý platí H = d + 0.5 odhadneme ako regresný parameter v lineárnej regresii, kde závisle premenná je a nezávisle premenná je ln(N): Aby sme dostali korektný odhad Hurstovho koeficientu H, musí byť v regresii minimálne 10 bodov.
1.2 Semiparametrický odhad d Táto metóda je založená na odhade parametra d vo frekvenčnej oblasti. Vychádza z teórie lineárnych filtrov, ktorá umožní vyjadriť proces (1 - B)dYt= t v tvare fy() = | 1 - e-i | -2d f(), kde fy() a f() sú spektrálne hustoty procesov Yta t. Po úprave môžeme písať (v spojitom tvare): (26.) v diskrétnom tvare: (27.) Odhad parametra d sa získa z lineárnej regresie vychádzajúcej z predchádzajúcej rovnice pre rôzne frekvencie 1, 2, …, N: (28.) Predpokladá sa, že uj sú nezávislé rovnako rozdelené náhodné premenné s nulovou strednou hodnotou a rozptylom 2/6. Ak je {uj} proces bieleho šumu, regresiou sa získa dobrý odhad parametra d. Ak sú náhodné premenné autokorelované, platí vzťah regresie len pre frekvencie blízke 0 len v tomto prípade je odhad d konzistentný. Základnou otázkou v prípade korelovanýchuj je teda určenie čísla N(napr. N , resp. sa volí také N, aby bol reziduálny rozptyl regresie rovný približne 2/6).
Na testovanie parametra d sa používa štandardný t-test. Napriek tomu, že semiparametrický odhad parametra d je veľmi jednoduchý, nejasnosti spojené s určením čísla N pri silnej autokoreláciiprocesu {uj} znižujújehoatraktívnosť. Prinevhodnejvoľbe N môžemetotiž získať veľmi vychýlený odhad. Preto sa stále častejšie v praxi používajú jednokrokové metódy.
2. Jednokrokové metódy 2.1 Metóda maximálnej vierohodnosti Táto metóda je určená k odhadu parametrov modelu ARFIMA v tvare: p(B) (1 - B)d Yt = q(B) t za predpokladu, že t sú nezávislé náhodné premenné s rovnakým normálnym rozdelením pravdepodobnosti. Potom logaritmus presnej vierohodnostnej funkcie má po uprave tvar: (29.) kde je vektor parametrov modelu AR, je vektor parametrov modelu MA, Yje stĺpcovývektornáhodnýchpremenných typu n x 1. Maximalizáciou tejto funkcie získame maximálne vierohodné odhady parametrov d, , . Hlavným problémom pri tejto metóde je výpočet autokorelačnej matice Pn a jej invertovanie. Boli vyvinuté mnohé iteračné metódy, ktoré okrem odhadov počítajú aj ich smerodajné chyby, potrebné k t-testom.