290 likes | 460 Views
Exponenciális szűrések. Statisztika II. VEGTGAM22S. Simító eljárások (exponenciális szűrés). A simító eljárások a determinisztikus modellezésnél már jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit is.
E N D
Exponenciális szűrések Statisztika II. VEGTGAM22S
Simító eljárások (exponenciális szűrés) • A simító eljárások a determinisztikus modellezésnél már jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit is. • Ugyanakkor a „valódi” sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. A véletlen hatását simítással (kiátlagolással) igyekeznek kisebbíteni, ezáltal a determinisztikus jelleget emelik ki. • Egyfajta „közbenső” pontosságú és komplexitású modell-családot alkotnak. • Ez a modell-család onnan kapta a nevét, hogy az idősor t-edik elemét a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával becsüli.
EXPONENCIÁLIS SZŰRÉS Az exponenciális szűrési eljárás keretében több különböző paraméter kombináció beállítása mellett kiszámoljuk a négyzetes eltérést, és azt a paraméter kombinációt választjuk ki, amely mellett ez az eltérés a legkisebb. jelöli a modell becslését a t-edik időpillanatban. A képletben
Simító eljárások (exponenciális szűrés) Ez a paraméter azt jelzi, hogy a t időpillanathoz tartozómegfigyelés milyen mélységig függ az előző időpontbeli megfigyelésektől, azaz az idősor „emlékezetével” kapcsolatos. Ha = 1, akkor a legutolsó elem korrelálatlan az előző megfigyelésekkel, azaz az idősor emlékezetnélküli. Az = 0 esetén viszont az összes megelőző megfigyelés azonos erősséggel korrelál Xt-vel. Akkor szerepel ez a paraméter, ha trenddel számolunk a modellben. Ha közel van 1-hez, a trendfüggvényben az Xt-közeli értékek nagyobb súllyal lesznek figyelembe véve, 0-közeli érték esetén pedig mindegyik érték közel azonos súllyal szerepel a trendfüggvény kiszámításában.
Simító eljárások (exponenciális szűrés) Szezonalitási paraméter. 1esetén a szezonalitást leíró függvény előállításában az Xt-közeli értékek nagyobb súllyal lesznek figyelembe véve, 0érték esetén pedig mindegyik érték közel azonos súllyal szerepel a szezonalitási függvény kiszámításában. A paraméter helyett használatos, amikor a trendfüggvény idővel lecseng. Ha 1a trend lecsengése gyors, 0esetén pedig lassú.
Az exponenciális szűrés lépései • Először felállítjuk a dekompozíciós modellt: • Ezután beállítjuk a modell-komponensek t=0 időponthoz tartozó becsléseit: Innen adódik a nulladik hibatag, amivel majd a következő lépésben fogunk korrigálni: • A korrekciót valamennyi modell-komponensre elvégezzük:
A második hibatag a következő lépésben játszik majd szerepet a • t=2 időpontbeli becslések korrigálásakor stb. A képletben szereplő korrekciós súlyfüggvények paraméterei a legkisebb négyzetek módszerével úgy lesznek meghatározva, hogy a négyzetes eltérés a lehető legkisebb legyen! Az exponenciális szűrés lépései
Példa exponenciális szűrésre Az egyszeres simítás a legegyszerűbb modellekben az alábbi rekurzív összefüggésekkel adható meg.A leírásban (pl. )
Példa exponenciális szűrésre Folytatva az eljárást, mindegyik időpontra adunk becslést: Az idősor t-edik eleme tehát a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával van megbecsülve! (Innen származik a módszer neve is.) A fenti utolsó összefüggést tömörebben is felírhatjuk: Ha most egy pillanatra feltesszük, hogy az idősornak negatív irányban végtelen a hosszúsága, akkor a fenti összefüggés az alábbi alakot veszi fel: , ahol Megmutatható, hogy:
A következőkben ismertetjük az SPSS-ben az exponenciális szűrés (ExponentialSmoothing: Custom Model) paranccsal megvalósítható illesztéseket. A leírásban megadjuk az illesztett modellt és a simítási eljárás rekurzív összefüggéseit is.
Nincs trend, nincs szezonális hatás (Trend Component: None, Seasonal Component: None) Modell: Becslés:
Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive) Modell: adott szezonális ismétlődések, p hosszú szakasz átlagok, i=1,…, k,
Nincs trend, additív szezonális hatás van (Trend Component: None, Seasonal Component: Additive) Becslés:
Nincs trend, multiplikatív szezonális hatás van (Trend Component: None, Seasonal Component: Multiplicative) Modell: adott szezonális ismétlődések, p hosszú szakasz átlagok, i=1,…, k,
Nincs trend, multiplikatív szezonális hatás van (Trend Component: None, Seasonal Component: Multiplicative) Becslés:
Lineáris trend, nincs szezonális hatás (Trend Component: Linear, Seasonal Component: None) Modell: Becslések:
Lineáris trend, additív szezonális hatás (Trend Component: Linear, Seasonal Component: Additive) Modell: Becslések: Stb.
Exponenciális trend, additív szezonális hatás (Trend Component: Exponential, Seasonal Component: Additive) Modell: Becslés: Stb.
Idővel gyengülő trend, nincs szezonális hatás (Trend Component: Damped, Seasonal Component: None) Modell: Becslés: Stb.
Idővel gyengülő trend, additív szezonális hatás (Trend Component: Damped, Seasonal Component: Additive) Modell: Becslés:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése A Trends chapter 4.sav állományban egy cég számítógépes nyomtatóinak napi energia-felvételei vannak rögzítve:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése • Az ábra megszemléléséből az alábbi következtetések vonhatók le: • ·A soron nem érzékelhető trendhatás, az értékek véletlenszerűen szóródnak az átlagérték körül. • ·Nem lehet kizárni a szezonális hatást, hiszen napi adatokról van szó. Elképzelhető, hogy 7, 30 vagy 365 hosszúságú ciklusok vannak a sorban, azaz számolni lehet heti, havi vagy esetleg éves ciklussal. • ·Az idősornak van emlékezete olyan értelemben, hogy mindegyik érték közel van az őt közvetlenül megelőző értékekhez. Ezt a jelenséget a matematikában úgy lehet kifejezni, hogy pozitív autókorrelációt várunk.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Hajtsunk végre exponenciális szűrést (simítást) a Analyze / Forecasting / Create Models Paranccsal! Először próbálkozzunk a Simple beállítással, amikor is sem trendet, sem szezonális hatást nem tételezünk fel. Dependent variable: amount, Method: Exponential Smoothing, Criteria: Model Type Nonseasonal: Simple. A Statistics és Plots füleknél a megadott összes lehetőség fakkját pipáljuk ki: , (OK).
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az paraméterre (ebben a modellben ez az egyetlen paraméter) a becslés 0,802-re adódott.Ez azt jelenti, hogy az Xt érték becsléséhez a hozzá közeli értékeket, tehát Xt-1 Xt-2-őt kell a legnagyobb súllyal figyelembe venni a becslő sor előállításakor.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése A hibatagok ACF és PACF értékeire egy grafikont is kapunk, amiről leolvasható, hogy az értékek a tűréshatáron belül esnek.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Az eredeti és a becsült idősorok együttes ábrája a konfidencia sávval együtt:
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Ellenőrizzük le a maradéksort is! Látható, hogy sem trend, sem szezonális hatás nem érzékelhető, vagyis megszemlélés alapján fehérzajnak látszik. A normalitást ellenőrző P-P grafikon pontjai gyakorlatilag az átló mentén helyezkednek el,
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Alkalmazzuk előrejelzésre a modellünket! Az =0,802 beállítás mellett, a 150-180 napokra kérjünk előrejelzést! Ehhez mégegyszer le kell futtatni a modellt, de most a következő plusz beállításokat is tegyük meg: Save/Variables Predicted values, Options: First case after end of estimation period through a specified date, Date: observation 180. Ennek hatására keletkezik egy új változó (neve: Predicted_amount_Model_1), ami a modell előrelelzett értékeit tartalmazza, de az esetszám nem 149 lesz, hanem 180.
Nyomtatók napi energia-felvételét tartalmazó idősor elemzése Rajzoltassuk ki az eredeti (amount) és az előre jelzett (Predicted_amount_Model_1) idősorokat a Analyze/Forecasting/Sequence Charts… paranccsal: Látható, hogy a jövőre vonatkozó előrejelzés egy konstans, hiszen a modellünkben sem trend, sem szezonális hatás nem szerepelt. Az alkalmazott modellben a becsült idősor lényegében az analizált idősor két nappal előre történő eltoltja lett. A maradéksor szórása elég jelentős (kb. kétharmada az eredeti sor szórásának), ami arra utal, hogy a becslés még nem magyarázza elég jól a jelenséget, azaz a predikció nem tűnik elég megbízhatónak.