290 likes | 664 Views
Idősorok elemzése. Determinisztikus és sztochasztikus komponensek, előrejelzés autoregresszív modellel. Forrás: Hidrológia II HEFOP oktatási segédanyag (www.vit.bme.hu). Idősorok felbontása:. Y(i) = T(i) + P(i) + A(i). T(i) trend komponens P(i) periodikus tag A(i) maradéktag.
E N D
Idősorok elemzése Determinisztikus és sztochasztikus komponensek, előrejelzés autoregresszív modellel Forrás: Hidrológia II HEFOP oktatási segédanyag (www.vit.bme.hu)
Idősorok felbontása: Y(i) = T(i) + P(i) + A(i) T(i) trend komponens P(i) periodikus tag A(i) maradéktag determinisztikus sztochasztikus (autoregresszív és véletlen)
Trendszámítás Lineáris: T(i)=a0 + a1 i Nem lineáris: T(i)=a0 + a1 i + a2 i2 + … + an in Lineáris trend:
Példa: vízminőségi trend számítás Segédtáblázat: A trendvonal egyenlete:
A trend mértéke: P < 3 %/év kismértékű 3 < P < 7 %/év nagymértékű 7 < P < 15 %/év igen nagymértékű P > 15 %/év rendkívül nagymértékű -1.8 % /év +1.6 % /év
Ellenőrzés (regresszió számításból): Reziduális szórás (abszolút hiba) kifejezi, hogy a regressziós becslések átlagosan mennyivel térnek el az y megfigyelt értékeitől. Relatív szórás (relatív hiba) kifejezi, hogy a regressziós becslések átlagosan hány %-al térnek el az y megfigyelt értékeitől. Pearson-féle lineáris korrelációs együttható: Kovariancia Determinációs együttható:
A trend mértéke: P < 3 %/év kismértékű 3 < P < 7 %/év nagymértékű 7 < P < 15 %/év igen nagymértékű P > 15 %/év rendkívül nagymértékű -1.8 % /év → dC = -0.82 / 10év +1.6 % /év → dC = 0.1 / 10év D = r2 = 0.25, Se = 0.46 (dC = -0.82) D = r2 = 0.12, Se = 0.16 (dC = 0.1)
Power trend Általános formula: Linearizált: Szórás (hiba):
Sztochasztikus összetevők Véletlen tag (zaj) Autoregresszív komponens
Egylépéses autokorrelációs tényező Egylépéses AR modell: Kétlépéses AR modell:
AR, MA és ARMA modellek Stacionárius folyamat (kritériumok: állandó átlag és szórás) leírására szolgálnak. Az idősorztaktuális eleme az előző elemek (AR) illetve az a normális eloszlású véletlen sorozat előző tagjainak (MA) lineáris kombinációjaként számítható ki. AR ( p ) : MA ( q ) : ARMA ( p, q ) : Az AR(0) modellt fehér zaj modellnek is nevezik :
Thomas-Fiering modell (Balaton természetes vízkészlet változásának előrejelzése)
Autokorreláció Egy idősor jelenlegi és későbbi értékei közötti kapcsolat mértékét fejezi ki, Idősoron belüli kapcsolat szorosságát jellemzi, Autokorrelációs tényező ( x(t) idősor, várható érték): Általános (k lépés): Autokorrelációs függvény: Egy idősor autokorreláció függvénye a = 0 .. n értékekhez tartozó r autokorreláció tényezőkből áll.
1 1 2 0.8 0.8 1.5 0.6 0.6 1 0.4 0.4 1 0.2 0.5 0.2 0.8 0 0 0.6 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -0.2 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -0.2 0.4 0.7 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 -0.5 -0.4 -0.4 0.2 0.6 -1 -0.6 -0.6 0 0.5 -0.8 -1.5 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -0.8 -0.2 0.4 -1 1.5 -1 -0.4 0.3 -2 -0.6 0.2 1 -0.8 0.1 -1 0 0.5 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 -0.1 0 -0.2 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 -0.3 -0.5 -1 -1.5 Tipikus autokorreláció függvények Véletlenszerű (normális eloszlású független sorozat) Autokorrelált (véletlen sorozat mozgóátlaga) Periodikus (szinusz függvény, zajmentes)
Autokorrelációs függvény
1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -0.2 -0.4 -0.6 -0.8 1 -1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -0.2 -0.4 -0.6 -0.8 -1 Fehérzaj: Az xt stacionárius sztochasztikus folyamat gaussi fehérzaj, ha minden t-re standard normális eloszlású. Az xt sztochasztikus folyamat akkor stacionárius, ha az xt ( t [ t1; t2 ] T ) eloszlása független a [ t1; t2] kiválasztásától. Fehér zaj autokorreláció függvénye: Egy xt gaussi fehérzaj folyamat autokorreláció függvénye a Dirac-féle egységugrás függvény. if(t==0) r[t]=1; else r[t]=0; Egy valós fehérzaj folyamat autokorreláció függvénye csak a 0 helyen lép ki az Anderson-féle konfidencia intervallumból.
Autokorreláció figyelembe vétele a mintavételezésnél Az idősor elemei nem függetlenek Az észlelési adatok száma (elemszám, N) helyettesítendő N*-gal: ahol r(t) a t eltolású autokorrelációs tényező A szórás számítása: Vagyis, az effektív mintaszám egymástól nem független megfigyelési adatok esetén (Bayley & Hammersley, 1946): N* = N σ / σ*
Lettenmaier (1976) egylépéses autoregresszív modellel meghatározta az n és n* közötti összefüggést: n* < n Ahol: n a mintaszám, k a mintavételek közti intervallum, ρ az autokorrelációs tényező Effektív mintaszám (n*) az autokorrelációtól függően:
Mintavételi gyakoriság megválasztása Ha a cél: Átlag (középérték meghatározása Trend detektálása Folytonos idősor visszaállítása
Átlag becslése Mintanagyság meghatározása átlagbecsléshez egyszerű véletlen mintánál: N = a sokaság elemszáma n = a minta elemszáma σ = sokasági szórás D: a maximális hiba (hibahatár) vagy Autokorrelált (nem független) mintáknál: N → N* és σ → σ*
Éves átlag becslésére vonatkozó standard hiba változása az effektív mintaszámtól függően, független és autokorrelált adatsor esetén n - mintaszám, n* - effektív mintaszám, ρ - autokorrelációs tényező, S1 – éves átlag standard hibája n=365 mérési adatból, Sn– éves átlag standard hibája n (n*) mérési adatból
Trend detektálásához szükséges adatszám (független minták száma az N0 időtartam alatt) autokorrelációs tényező lépésköz (intervallum) szórás Lettenmaier (1976), Somlyódy et al. (1986)
Folytonos idősor előállítása diszkrét észlelésekből Nyquist tétele: Egy adott, frekvenciakorlátos spektrumú, folytonos idősor, amely az fk határfrekvencián túl nem tartalmaz spekrtális összetevőket, egyértelműen visszaállítható a t=fk/2 intervallumnál kisebb mintavételezési idejű diszkrét idősorból (Szőlősi-Nagy, 1976). A határfrekvencia (spektrumfüggvény) az idősor autokorreláció függvényének Fourier transzformáltjából állítható elő. • Nyquist intervallum: • Maximális időintervallum, mely esetén egyenlő időközönkénti mintavétellel a jel meghatározható. • A mintában szereplő jel legmagasabb frekvenciájú összetevője kétszeresének a reciproka. • folytonos jel, a jel Fourier transzformáltja: • A jel sávszélessége (B), ahol • Mintavételi frekvencia (határfrekvencia): • Mintavételi időköz: