270 likes | 394 Views
Zeitreihenanalyse WS 2003/2004. Michael Hauhs/ Holger Lange. http://www.bitoek.uni-bayreuth.de/mod/html/ws0204/geooekologie/zeitreihenanalyse/. Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Fouriertransformationen, Powerspektrum, Lomb-Scargle Methode
E N D
Zeitreihenanalyse WS 2003/2004 Michael Hauhs/ Holger Lange http://www.bitoek.uni-bayreuth.de/mod/html/ws0204/geooekologie/zeitreihenanalyse/ • Definition einer Zeitreihe, Eigenschaften • Tests und Trenderkennung bei Zeitreihen • Fouriertransformationen, Powerspektrum, Lomb-Scargle Methode • Zeitreihenmodellierung der ARMA-Klasse • Modellierung von Zeitreihen mit langem Gedächtnis • Kausalität, Transferfunktionen, multivariate Methoden • Skalierung, (Multi-)Fraktale • Komplexität und Information von Zeitreihen • Wavelets
Kontexte der Veranstaltung • Wissenschaften komplexer Systeme • Biologie • Ökologie • Sozial- • Wirtschaftswissenschaften • Wissenschaften einfacher Systeme • Physik • Chemie • Mathematik Analyse von Strukturen Ökosystem Realisation & Kontrolle von Verhalten • Ingenieur-Wissenschaften • Informatik • Umwelttechnik • Kreislaufwirtschaft • Nutzungstraditionen • Land- • Forstwirtschaft • Wasserwirtschaft • Naturschutz
Kontexte der Veranstaltung Das Lehrangebot der Ökologischen Modellbildung Wissenschaften einfacher Systeme Wissenschaften komplexer Systeme Modellbildung in der Geoökologie G5 Einführung Ökologie G5 Zeitreihenanalyse M103, 409, 509 Ökologische Modellbildung M103 • Spezial-Wissenschaften: • Biogeografie • Bodenkunde • Geologie • Hydrologie • Meteorologie • Toxikologie • ... Entwicklung von Simulations- ModellenM103 Ingenieur-Wissenschaften Nutzungstraditionen
Lehrveranstaltungen im WS 04/05 • Zeitreihenanalyse (Do 11-13): • Methoden Auswertung von Monitoringdaten, die internen Prozesse der zugehörigen Systeme sind unbekannt. • Praktikum am Ende des Semesters • Umweltinformationssysteme (Mi 8-10) • Methoden zu Organisation und Bewertung von Daten und Abläufen im Umweltbereich • Simulation von sozialen und ökologischen Systemen (28-30.1.05 Wallenfels) • Agentensimulationen, zusammen mit P&E (Hegselmann) • Mustererkennung in der Fernerkundung terrestrischer Ökosysteme (Lange/Lischeid) • Blockseminar, nach Vereinbarung • Entwicklung von Simulationsmodellen (M103) (Knauft) (Di 12-13, Mi 14-17) • Vorlesung (1) mit Praktikum (3) zum Erlernen einer Simulationssprache (Vensim)
Literatur zum Thema • K.W. Hipel und A.I. McLeod: Time Series Modelling of Water Resources and Environmental Systems, Elsevier 1994 • H. Tong: Non-linear Time Series, Oxford Science Publ. 1990 • R. Schlittgen: Angewandte Zeitreihenanalyse, Oldenbourg 2001 • Brillinger, D.R. (1981): Time Series. Data Analysis and Theory. • J. Honerkamp: Stochastic Dynamical Systems, VCH 1994
Wozu Zeitreihenanalyse ? • Direkteste Verbindung zur experimentellen Beschreibung von Systemen (Datenerhebung) • kommt (i.d.R.) ohne Annahme von Prozessen aus • kommt mit gar keinem bis wenigen Parametern aus • konkrete empirische Beschreibung des zeitlich variablen (dynamischen) Verhaltens • Vorhersage oft erfolgreicher als bei Prozessmodellen • Klassifikation von Modellen nach ihrer Erklärungsleistung • Sensibler Test von Modellen ("mehr als r2")
Zugänge • aus der Physik: • Suche nach der Dynamik des erzeugenden Systems (z.B. Geophysik, Meteorologie) • der typische Zugang in den Geowissenschaften • aus der Mathematik: • als Beispiel für geordnete (oder partiell geordnete) Mengen • aus den Ingenieurwissenschaften (z.B. Hydrologie): • als Ausdruck des empirischen Wissens (Abflüsse) • aus der Modellbildung: • als wichtiges Beispiel zur Demonstration der heutigen technischen Möglichkeiten • gibt es einen typischen Zugang für Ökosysteme ?
Was ist eine Zeitreihe? Definition: Eine Zeitreihe ist eine Menge von Werten, die in einer festgelegten (und bekannten!) Reihenfolge vorliegen: • Die Zuordnung der Werteposition zum Referenzzeitpunkt ist einemonotone Funktion • Ist der zeitliche Abstand zweier Messungen konstant: heißt die Zeitreihe äquidistant. Es gilt dann • Fehlt ein i in dieser Liste, hat die Zeitreihe eine Lücke. Wie behandelt man Lücken? Was ist eine Lücke bei Nicht-Äquidistanz?
Eigenschaften und Bezeichnungen bei Zeitreihen • Univariate Zeitreihe: Eine (reellwertige) Variable an einem Ort gemessen • Multivariate Zeitreihe: mehrere Variablen am selben Ort • Mehrdimensionale Zeitreihe: eine Variable an verschiedenen Orten zu jeweils gleichen Zeitpunkten • Äquidistante Zeitreihe • Lückenfreiheit • Homogenität: pdf ändert sich nicht mit der Zeit • Generelles Problem: viele Eigenschaften beziehen sich auf / sind nur definiert für unendlich lange Zeitreihen • In der Mathematik werden Zeitreihen oft als Realisation eines stochastischen Prozesses definiert (oft unbrauchbar...)
liegt vor. Eine Datenreihe • Mittelwert: • Varianz (Standardabweichung: ) • Variationskoeffizient: • q-tes zentrales Moment: Grundlegende Definitionen I Faustregel : Zur Berechnung des q-ten Moments benötig man mind. 2q Datenpunkte
Binbreite: Grundlegende Definitionen II Häufigkeitsverteilung: Histogramme Faustregel : 95% der Bins sollten je mind. 5 Datenpunkte enthalten Häufigkeitsverteilungen Wahrscheinlichkeitsverteilungen (pdf´s) • Median: 50% der Werte sind kleiner • Modus/Modalwert: Position des Maximums der pdf • x%-Quantil: x % der Werte sind kleiner
Grundlegende Definitionen III Autokovarianz: Autokorrelationsfunktion: • Faustregeln: • Mindestens 30 Datenpunkte • Nur Lags k < N/4 (Puristen) bzw. k < N/2 (Pragmatiker) vertrauen • Daten müssen „im Prinzip“ äquidistant vorliegen; Lücken sind ein echtes Problem!
Wann ist eine Zeitreihe eine Zeitreihe? Gibt es signifikante Autokorrelationen, ist die zeitliche Reihenfolge wichtig. Die einzelnen Werte sind dann nicht unabhängig. • Unabhängigkeit erreicht man durch • Aggregation • Wahl einer gröberen Messauflösung Falls unabhängig: Zeitreihen als Realisationen eines stochastischen Prozesses I.a. liegen Mischtypen vor (z.B. additives Rauschen)
Berechnung der Autokorrelation. Für unkorrelierte Daten gilt: (normalverteilt) Daher sind die 95%-Signifikanzlinien (evtl. Verbesserungen für kleine n) Test für (lineare) Unkorreliertheit Liegen weniger als 5% der Werte ausserhalb des Intervalls, liegen keine signifikanten Korrelationen vor Autokorrelationslänge • Partielle Autokorrelation (PACF) später (AR-Modellierung)
Lang- und Kurzzeitgedächtnis Definition: Gedächtnis einer Zeitreihe Eine Zeitreihe hat kurzes Gedächtnis
Autokovarianzmatrix (Mittel über alle Fenster) • symmetrisch • positiv definit für stationäre Zufallsprozesse • für multivariates Gaußsches Rauschen ausreichend zur vollständigen Charakterisierung
ist nicht symmetrisch: 95% Signifikanz: Lag-Beschränkung: Eigenschaften der Kreuzkorrelation
Kreuzkorrelation: RP Trend gegen Sonnenflecken 0.6 0.4 0.2 CCF 0 -0.2 -0.4 -0.6 -20 -15 -10 -5 0 5 10 15 20 Abstand (Jahre)
und eine Informationsmenge Gegeben zwei Zeitreihen die mindestens enthält. Ein-Schritt-Vorwärts-Prädiktor für mit minimalem mittleren quadratischen Fehler Def.: X verursacht Y X beeinflusst Yinstantan X und Y sind rückgekoppelt X verursacht Y und Y verursacht X Kausalität für Zeitreihen nach Granger
ist t-verteilt mit n-2 Freiheitsgraden Bei 95% Signifikanz: Spezialfall: Korrelationskoeffizient • mindestens 4 gemeinsame Datenpunkte (evtl. Ausdünnen) • sehr robust gegen Nicht-Normalität
Tests und Trenderkennung bei Zeitreihen Problem vieler Zeitreihen-Modelle und Analysemethoden: u.a. Stationarität vorausgesetzt • Zwei Auswege: • Geeignete Modellklasse wählen • Vorbehandlung der Zeitreihen • (Ggf. wünschenswerte) Eigenschaften von Zeitreihen: • Ergodizität • Stationarität • Linearität • Homoskedastizität • Normalität • Trendfreiheit (deterministisch/stochastisch) • Unkorreliertheit (Identically Independently Distributed, IID)