270 likes | 524 Views
Gliederung. Zeitreihe - Dekomposition - Modelannahme Trendschätzung - linearer Trend Trendfunktion - Trendbestimmung - Freihandmethode - Methode der halben Durchschnitte - Methode der gleitenden Durchschnitte - Methode der kleinsten Quadrate. Gliederung.
E N D
Gliederung Zeitreihe - Dekomposition - Modelannahme Trendschätzung - linearer Trend Trendfunktion - Trendbestimmung - Freihandmethode - Methode der halben Durchschnitte - Methode der gleitenden Durchschnitte - Methode der kleinsten Quadrate
Gliederung Glättung von Zeitreihen - Einfache Glättung - Polynomiale Glättung - Exponentielle Glättung
Zeitreihe Eine Folge zahlenmäßiger Beobachtungsergebnisse eines stochastischen Vorganges in Abhängigkeit von der Zeit heißt Zeitreihe. So betrachtet ist eine Zeitreihe eine Realisierung eines diskreten stochastischen Prozesses mit endlich vielen Zeitpunkten. Ziele: - Bestimmung der Komponenten der Zeitreihe - Prognose zukünftiger Werte Zeitreihen
Dekomposition einer Zeitreihe Gegeben sind die Beobachtungen yt1,….ytn einer zeitabhängigen zufälligen Größe (Yt)t=t1,…,tN an den Zeitstellen t1,…,tN. Meist haben die Zeitpunkte gleichen Abstand, d.h. Dt = tn - tn-1 = konstant, i = 2,…,N. Für die Messwerte wird dann yn = ytn, n = 1,…,N geschrieben.
Modellannahme Yt = m(t) + s(t) + Zt unbekannte Funktion t -> m(t) beschreibt den langfristigen Verlauf der zufälligen Größe Yt m heißt Trend der Zeitreihe Funktion t -> s(t) beschreibt die periodische Schwankung die auf den Vorgang einwirken z.B.: die sogenannten Saisonschwankungen m und s bilden den deterministischen Anteil des Modells
Modellannahme Zt ist die Zeitabhängige zufällige Restkomponente mit den Eigenschaften: (1) E(Zt) = E(Yt - m(t) – s(t)) = 0 für t = t1,…,tN, d.h. die deterministischen Komponenten sind so zu bestimmen, dass die Restgröße im Mittel Null wird (2) Cov (Zt,Zt+k) = c(k), d.h. die Covarianz der Restgröße zu verschiedenen Zeitpunkten hängt nur von der Zeitdifferenz ab. (Covarianz, beschreibt die Abhängigkeit zwischen zwei verschiedenen Zufallsvariablen, die Autocovarianz beschreibt die Abhängigkeit zwischen zwei Zeitpunkten innerhalb einer Zeitreihe)
Trendschätzung/linearer Trend Ziel der Trendschätzung ist die Beschreibung des langfristigen Verlaufs durch eine möglichst einfache Funktion. Da jede stetige Funktion beliebig genau durch ein Polynom L-ten Grades m(t) = b0+ b1t + b2t2 + .. + bLtL approximiert werden kann, ist diese Funktionsklasse zur Anpassung an vorgegebene Messwerte besonders geeignet. Die Bestimmung der Koeffizienten b0,..,bL erfolgt durch die Methode der kleinsten Quadrate (MkQ). Spezialfall: m(t) = b0 + b1t
Schätzung des periodischen Verlaufs I Wir gehen von folgenden Voraussetzungen aus: (1) Die Zeitreihe ist trendreduziert (2) Die Periodizität der Zeitreihe ist nur von einer harmonischen Schwingung bekannter Periodenlänge abhängig
Schätzung des Periodischen Verlaufs II Damit hat das Modell die Form yt = s(t) + zt = y0 +acos(wt+j) + zt yt=(Yt-m(t)) durch Anwendung eines Additionstheorems erhalten wir yt = y0 +acosjcoswt - asinjsinwt + zt und durch Substitution von g1 = acosj , g2 = -asinj, ut = coswt und vt = sinwt yt = g0 + g1ut + g2vt +zt
Schätzung des periodischen Verlaufs III liegen äquidistante Zeitschritte vor berechnen sich die unbekannten Parameter wie folgt: damit erhalten wir die Schätzungen für Amplitude und Phase:
linearer Trend wobei ist und c und (signum = Vorzeichen) der Tabelle entnommen wird:
Trendfunktionen Zur Trendbestimmung eignen sich im allgemeinen glatte mathematische Funktionen, die nicht periodisch sind oder eine Periodenlänge von mehr als 12 Monaten besitzen. Es gibt (mindestens vier verschiedene) Methoden, eine Trendlinie zu ermitteln. 1. Freihandmethode 2. Methode der halben Durchschnitte 3. Methode der gleitenden Durchschnitte 4. Methode der kleinsten Quadrate
Trendbestimmung Die Spezifizierung der Trendkomponente m(t) wird als Trendbestimmung einer Zeitreihe bezeichnet. Sie hat zwei Ziele: 1.) Trendisolierung soll eine sich vollziehende Trendwende der Trendkomponentenentwicklung erkennbar machen und für die Einschätzung der zukünftigen Tendenz verwendet werden 2.) zum anderen geht es um Trendausschaltung bzw. Trendbereinigung ( welchen Verlauf hätte die Zeitreihe genommen, falls die Trendfaktoren nicht wirksam gewesen wären?)
Freihandmethode Freihandmethode ist trivial. Man zieht nach Augenmaß eine „Trendlinie“ durch die Punktwolke.
Methode der halben Durchschnitte • einfachste Form der Trendberechnung für eine Gerade • dabei wird die Zeitreihe in zwei gleiche Hälften unterteilt • aus den jeweiligen Werten der beiden Hälften wird das arithmetische Mittel bestimmt und der Mitte der jeweiligen Hälfte zugeordnet • es entstehen zwei Punkte im Koordinatensystem durch die Trendgerade eindeutig definiert ist und somit Trendwerte bestimmt werden können • diese Methode kann nur angewandt werden wenn ein linearer oder fast linearer Trend vorliegt
Methode der gleitenden Durchschnitte • Methode der gleitenden Durchschnitte (GD) ist ein Verfahren zur Glättung von Zeitreihen • sie setzt voraus das innerhalb der Zeitreihe (kurzfristige) Schwankungen zyklisch auftreten und das die Werte äquidistant sind • GD ist eine Folge von arithmetischen Mitteln, die aus beobachteten Werten Y gebildet werden • wird aus Gleichbleibenden Anzahl zeitlich benachbarter Beobachtungswerte berechnet und dem in der Mitte des jeweiligen Zeitintervall liegendem Zeitpunkt t zugeordnet • das Zeitintervall kann aus gerader/ungerader Zahl von Werten bestehen • - wichtig ist das das Zeitintervall mit dem zugrunde liegenden Intervall übereinstimmt
Methode der gleitenden Durchschnitte • - Vorteil gegenüber der Regressionsmethode liegt darin das man keinerlei Vorwissen über den Funktionstyp des Trends besitzen muss • größte Schwierigkeit liegt in der richtigen Auswahl des Zyklusses • bei Zeitreihen ohne saisonale Schwankungen stellt sich die Frage wie groß man die Ordnung der GD wählen soll, da durch GD starke Krümmungen der „glatten Komponente“ abgeschliffen werden • Glättungseffekt der Methode kann verstärkt werden, indem man mehrere Glättungsfaktoren übereinanderschachtelt (Nachteil: Linie wird immer kürzer)
Methode der kleinsten Quadrate • wird in der Praxis am häufigsten benutzt, um eine Trendlinie zu benutzen • stellt keine Anforderung an die Ursprungsreihendaten • - wendet man die Methode der kleinsten Quadrate auf Zeitreihen an, so bezeichnet X die Zeit und die Daten der Werte von Y zu unterschiedlichen Zeitpunkten • die so entstehende Regressionsgerade/-kurve Y wird zum Zweck der Schätzung, Vorhersage verwendet • ist auch ein Mittel zur Festlegung der Regressionskoeffizienten in der Stichprobe • Regressionsgerade wird so in die Punktwolke gelegt, das die Summe der quadrierten vertikalen Abstände zwischen den beobachteten Werten und der Regressionsgerade minimal ist
Methode der kleinsten Quadrate Rechenformel:
Glättung von Zeitreihen Bei langen komplexen Zeitreihen ist die Angabe einer Trendfunktion oft unmöglich. In solchen Fällen werden Messwerte in kleinen Bereichen der Zeitmenge durch eine Funktion angepasst. Sind y1,..,yn die Beobachtungen zu den äquidistanten Zeitpunkten t1,..,tn, so ist die allgemeine Form des Glättungsprozesses durch: gegeben. Dabei werden die 2k+1 Messwerte yn+i mit dem Gewichtungsfakotr wi, i = -k,..,k einbezogen.
Einfache Glättung Merkmal: konstante Gewichtungsfaktoren Gleichung: Anwendung: Eliminierung fester Periodizitäten
Polynomiale Glättung Den Beobachtungen yn werden in einer bestimmten Umgebung Polynome vom Grad L angepasst und dann yn durch den Wert des Polynomes an der stelle tn ersetzt. Die polynomiale Glättung reduziert die Fehlervarianz und hebt den Trendverlauf der Zeitreihe deutlich hervor.
Exponentielle Glättung I Mit Hilfe der Exponentiellen Glättung lassen sich Vorhersagen (Prognosen) über die Entwicklung der Zeitreihe treffen. Ein Verfahren hierzu ist das gleitende Mittel (moving average, MA) mit exponentiellen Gewichtungsfaktoren. , , ,… sei eine Zeitreihe, deren Trend sich stetig gemäß einer unbekannten Funktion ändert. Aus den Beobachtungswerten soll der erwartete Wert yn+1im Zeitpunkt tn+1geschätzt werden. Konstante c mit 0<c<1 wird festgelegt und der Vorhersagewert als gewichtetes arithmetisches Mittel bestimmt.
Exponentielle Glättung II Je näher die frei wählbare Konstante c bei 1 liegt, desto größer ist der Einfluss vergangener Werte auf die Vorhersage. Die exponentielle Glättung erlaubt eine einfache rekursive Berechnung des Prognosewertes. Setzen wir Zn für den Zähler und Nn für den Nenner in , so erhalten wir folgende Rekursionsformel: