310 likes | 412 Views
Zeitreihenanalyse WS 2004/2005. Michael Hauhs / Gunnar Lischeid. Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Beispiele (ACF, Tests), Fouriertransformationen , Powerspektrum Zeitreihenmodellierung der ARMA-Klasse
E N D
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid • Definition einer Zeitreihe, Eigenschaften • Tests und Trenderkennung bei Zeitreihen • Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum • Zeitreihenmodellierung der ARMA-Klasse • Modellierung von Zeitreihen mit langem Gedächtnis • Kausalität, Transferfunktionen, multivariate Methoden • Skalierung, (Multi-)Fraktale • Komplexität und Information von Zeitreihen • Wavelets
Trendanalyse Zugrundeliegendes Modell (additives Komponentenmodell): Globaler monotoner Trend: "im Mittel wächst X(t) an / fällt ab" => Trend des Mittelwerts (= 1. Moment der Verteilung)
Der Mann-Kendall Test Anwendung des Kendall-Tests auf Zeitreihen (d.h., sortiert nach Zeit, ohne doppelte Einträge) => Trendtest: Für die H0-Hypothese (= "es gibt keinen Trend") gilt dann: => normalverteilt => Ableitung der Testgröße: Abweichung der beobachteten (normierten) S von den laut H0 erwarteten
Der Mann-Kendall Test beachte: Korrektur für verbundene Ränge (Ranggleichheit) notwendig => statt wobei tj = Anzahl der verbundenen Ränge (ties) => Teststatistik: , wobei D = maximal mögliche Anzahl der Konkordanzen:
n Beobachtungen pro Saisonteil (z.B. fester Tag im Jahr), m Saisonteile pro Saison (z.B. 365 Tage/Jahr) i-te Beobachtung im g-ten Saisonteil Erweiterung auf saisonale Daten: saisonaler Mann-Kendall Test • Entmaskierung von Gesamttrends • Trends in einzelnen Saisonteilen (z.B. Monaten)
Regressionsanalyse zur Trendbeseitigung ) beliebig, aber bekannt (z.B. Methode der kleinsten Quadrate: minimieren! Normalgleichungen Fehler der Schätzwerte:
r-te Messung der m-ten Stelle Unnormierte Desaisonalisierung: Normierte Desaisonalisierung: Desaisonalisierung Vermutet wird eine (natürliche) Periode s in den Daten.
Additive Modelle zur Darstellung einer Zeitreihe Zugrundeliegendes Modell (additives Komponentenmodell): Globaler monotoner Trend: „im Mittel wächst X(t) an / fällt ab“
Frequenzraumdarstellung von Zeitreihen • bisher: Zeitreihen wurden durch ihre Werte dargestellt (Zeitdomäne): x = x(t) • alternativ: Darstellung in einem Funktionenraum - möglich für jede Funktion in einem n-dimensionalen Vektorraum: : Koeffizienten : Basisfunktionen • sinnvolle Wahl des Funktionenraums: • additiv (Superposition) => orthogonale Funktionen
Orthogonalsysteme • Zwei Vektoren und heißen orthogonal wenn: • vergleiche: Orthogonalität = "Unabhängigkeit", "Unkorreliertheit" im statistischen Sinne • => Veränderung eines Vektor hat keine Auswirkungen auf den anderen Vektor: Superposition (kontinuierlicher Fall) (diskreter Fall)
Orthogonalsystem: sin(x), cos(x) • Wahl vonsin(x) und cos(x) als Basisfunktionen bzw. Darstellung als komplexe Zahl:
Wiederholung: Komplexe Zahlen alternative Darstellung in Polarkoordinaten (φ, ρ): Eulersche Gleichung:
=> Exponent n 0 1 2 3 4 5 6 7 8 in = 1 i -1 -i 1 i -1 -i 1 Taylorreihendarstellung der trigonometrischen Funktionen • generell: • für f(x) = ex und a = 0 : • analog für f(x) = eix : • für a = 0 : • =>
P Frequenzen, Zeiten, Längen, Perioden, ... Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem
Frequenzen, Zeiten, Längen, Perioden, ... Eine äquidistante Zeitreihe mit Messintervall (Zeitauflösung) und N Werten Länge der Messperiode Anzahl der Perioden im Datensatz Periodenlänge Frequenz Kreisfrequenz harmonische Frequenz Grundfrequenz, Frequenzauflösung Nyquist-Theorem, Abtasttheorem
Fourieranalyse = harmonische Analyse J.B.J. Fourier (1807): Jede stetige und periodische Funktion kann (beliebig genau) dargestellt werden als Superposition einer Serie harmonischer Schwingungen unterschiedlicher Frequenzen. => Entwicklung in eine unendliche trigonometrische Reihe: • Voraussetzungen (= Dirichletsche Bedingungen): • Die Funktion muss sich in endlich viele Teilintervalle zerlegen lassen können, in denen jeweils x stetig und monoton ist. • In den Unstetigkeitsstellen (Sprungstellen) existiert jeweils der links- und der rechtsseitige Grenzwert.
Fourierkoeffizienten • hier: für periodische, diskrete, äquidistante Zeitreihen mit N Werten • Schätzung der Koeffizienten für die kte harmonische Frequenz: • Ausnahme für k = N/2:
Fouriertransformation Für unendlich lange Zeitreihen gibt es alle Frequenzen Spektrum von • Merkmale: • umkehrbar • existiert für absolut integrierbare Funktionen • zeitglobal • Stationarität prinzipiell erforderlich
Aliasing • = "Frequenzmissdeutung" • = "Einstrahlen" höherer Frequenzen in den niedrigen Bereich aufgrund der endlichen Länge/Auflösung des Datensatzes:
Parsevalsches Theorem Die totale Varianz der Werte ist gleich der Summe der Varianzen der einzelnen Frequenzen: Energie ist im Zeit- und Frequenzraum gleich Def.: Energie eines Signals:
Periodogramm • Aufteilung der Varianz auf die einzelnen Frequenzen: • s2(k) (= spektrale Varianz) gegen k aufgetragen • Berechnung anhand der Fourier-Koeffizienten:
Periodogramm = Darstellung der Varianzanteile für die einzelnen Frequenzen bzw. Phasenlängen
Aufgabe • Berechnen Sie in Excel die Fourierkoeffizienten für den Datensatz in Aufgabe_Fourieranalyse.xls. • Erstellen Sie anhand der Fourierkoeffizienten ein Periodogramm. • Rekonstruieren Sie die Zeitreihe als Superposition der entsprechenden sin- und cos- Funktionen. • Führen Sie mit den Daten eine Fourieranalyse in Statistica durch und vergleichen Sie die Ergebnisse.