1 / 27

Zeitreihenanalyse WS 2003/2004

Zeitreihenanalyse WS 2003/2004. Michael Hauhs/ Holger Lange. http://www.bitoek.uni-bayreuth.de/mod/html/ws0204/geooekologie/zeitreihenanalyse/. Definition einer Zeitreihe, Eigenschaften Tests und Trenderkennung bei Zeitreihen Fouriertransformationen, Powerspektrum, Lomb-Scargle Methode

anitra
Download Presentation

Zeitreihenanalyse WS 2003/2004

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Zeitreihenanalyse WS 2003/2004 Michael Hauhs/ Holger Lange http://www.bitoek.uni-bayreuth.de/mod/html/ws0204/geooekologie/zeitreihenanalyse/ • Definition einer Zeitreihe, Eigenschaften • Tests und Trenderkennung bei Zeitreihen • Fouriertransformationen, Powerspektrum, Lomb-Scargle Methode • Zeitreihenmodellierung der ARMA-Klasse • Modellierung von Zeitreihen mit langem Gedächtnis • Kausalität, Transferfunktionen, multivariate Methoden • Skalierung, (Multi-)Fraktale • Komplexität und Information von Zeitreihen • Wavelets

  2. Kontexte der Veranstaltung • Wissenschaften komplexer Systeme • Biologie • Ökologie • Sozial- • Wirtschaftswissenschaften • Wissenschaften einfacher Systeme • Physik • Chemie • Mathematik Analyse von Strukturen Ökosystem Realisation & Kontrolle von Verhalten • Ingenieur-Wissenschaften • Informatik • Umwelttechnik • Kreislaufwirtschaft • Nutzungstraditionen • Land- • Forstwirtschaft • Wasserwirtschaft • Naturschutz

  3. Kontexte der Veranstaltung Das Lehrangebot der Ökologischen Modellbildung Wissenschaften einfacher Systeme Wissenschaften komplexer Systeme Modellbildung in der Geoökologie G5 Einführung Ökologie G5 Zeitreihenanalyse M103, 409, 509 Ökologische Modellbildung M103 • Spezial-Wissenschaften: • Biogeografie • Bodenkunde • Geologie • Hydrologie • Meteorologie • Toxikologie • ... Entwicklung von Simulations- ModellenM103 Ingenieur-Wissenschaften Nutzungstraditionen

  4. Lehrveranstaltungen im WS 04/05 • Zeitreihenanalyse (Do 11-13): • Methoden Auswertung von Monitoringdaten, die internen Prozesse der zugehörigen Systeme sind unbekannt. • Praktikum am Ende des Semesters • Umweltinformationssysteme (Mi 8-10) • Methoden zu Organisation und Bewertung von Daten und Abläufen im Umweltbereich • Simulation von sozialen und ökologischen Systemen (28-30.1.05 Wallenfels) • Agentensimulationen, zusammen mit P&E (Hegselmann) • Mustererkennung in der Fernerkundung terrestrischer Ökosysteme (Lange/Lischeid) • Blockseminar, nach Vereinbarung • Entwicklung von Simulationsmodellen (M103) (Knauft) (Di 12-13, Mi 14-17) • Vorlesung (1) mit Praktikum (3) zum Erlernen einer Simulationssprache (Vensim)

  5. Literatur zum Thema • K.W. Hipel und A.I. McLeod: Time Series Modelling of Water Resources and Environmental Systems, Elsevier 1994 • H. Tong: Non-linear Time Series, Oxford Science Publ. 1990 • R. Schlittgen: Angewandte Zeitreihenanalyse, Oldenbourg 2001 • Brillinger, D.R. (1981): Time Series. Data Analysis and Theory. • J. Honerkamp: Stochastic Dynamical Systems, VCH 1994

  6. Wozu Zeitreihenanalyse ? • Direkteste Verbindung zur experimentellen Beschreibung von Systemen (Datenerhebung) • kommt (i.d.R.) ohne Annahme von Prozessen aus • kommt mit gar keinem bis wenigen Parametern aus • konkrete empirische Beschreibung des zeitlich variablen (dynamischen) Verhaltens • Vorhersage oft erfolgreicher als bei Prozessmodellen • Klassifikation von Modellen nach ihrer Erklärungsleistung • Sensibler Test von Modellen ("mehr als r2")

  7. Zugänge • aus der Physik: • Suche nach der Dynamik des erzeugenden Systems (z.B. Geophysik, Meteorologie) • der typische Zugang in den Geowissenschaften • aus der Mathematik: • als Beispiel für geordnete (oder partiell geordnete) Mengen • aus den Ingenieurwissenschaften (z.B. Hydrologie): • als Ausdruck des empirischen Wissens (Abflüsse) • aus der Modellbildung: • als wichtiges Beispiel zur Demonstration der heutigen technischen Möglichkeiten • gibt es einen typischen Zugang für Ökosysteme ?

  8. Was ist eine Zeitreihe? Definition: Eine Zeitreihe ist eine Menge von Werten, die in einer festgelegten (und bekannten!) Reihenfolge vorliegen: • Die Zuordnung der Werteposition zum Referenzzeitpunkt ist einemonotone Funktion • Ist der zeitliche Abstand zweier Messungen konstant: heißt die Zeitreihe äquidistant. Es gilt dann • Fehlt ein i in dieser Liste, hat die Zeitreihe eine Lücke. Wie behandelt man Lücken? Was ist eine Lücke bei Nicht-Äquidistanz?

  9. Eigenschaften und Bezeichnungen bei Zeitreihen • Univariate Zeitreihe: Eine (reellwertige) Variable an einem Ort gemessen • Multivariate Zeitreihe: mehrere Variablen am selben Ort • Mehrdimensionale Zeitreihe: eine Variable an verschiedenen Orten zu jeweils gleichen Zeitpunkten • Äquidistante Zeitreihe • Lückenfreiheit • Homogenität: pdf ändert sich nicht mit der Zeit • Generelles Problem: viele Eigenschaften beziehen sich auf / sind nur definiert für unendlich lange Zeitreihen • In der Mathematik werden Zeitreihen oft als Realisation eines stochastischen Prozesses definiert (oft unbrauchbar...)

  10. Zeitreihen(ein Wettbewerb)

  11. Zeitreihen: Eigenschaften

  12. liegt vor. Eine Datenreihe • Mittelwert: • Varianz (Standardabweichung: ) • Variationskoeffizient: • q-tes zentrales Moment: Grundlegende Definitionen I Faustregel : Zur Berechnung des q-ten Moments benötig man mind. 2q Datenpunkte

  13. Binbreite: Grundlegende Definitionen II Häufigkeitsverteilung: Histogramme Faustregel : 95% der Bins sollten je mind. 5 Datenpunkte enthalten Häufigkeitsverteilungen  Wahrscheinlichkeitsverteilungen (pdf´s) • Median: 50% der Werte sind kleiner • Modus/Modalwert: Position des Maximums der pdf • x%-Quantil: x % der Werte sind kleiner

  14. Grundlegende Definitionen III Autokovarianz: Autokorrelationsfunktion: • Faustregeln: • Mindestens 30 Datenpunkte • Nur Lags k < N/4 (Puristen) bzw. k < N/2 (Pragmatiker) vertrauen • Daten müssen „im Prinzip“ äquidistant vorliegen; Lücken sind ein echtes Problem!

  15. Wann ist eine Zeitreihe eine Zeitreihe? Gibt es signifikante Autokorrelationen, ist die zeitliche Reihenfolge wichtig. Die einzelnen Werte sind dann nicht unabhängig. • Unabhängigkeit erreicht man durch • Aggregation • Wahl einer gröberen Messauflösung Falls unabhängig: Zeitreihen als Realisationen eines stochastischen Prozesses I.a. liegen Mischtypen vor (z.B. additives Rauschen)

  16. Berechnung der Autokorrelation. Für unkorrelierte Daten gilt: (normalverteilt) Daher sind die 95%-Signifikanzlinien (evtl. Verbesserungen für kleine n) Test für (lineare) Unkorreliertheit Liegen weniger als 5% der Werte ausserhalb des Intervalls, liegen keine signifikanten Korrelationen vor  Autokorrelationslänge • Partielle Autokorrelation (PACF) später (AR-Modellierung)

  17. Beispiel: Wolfers Sonnenfleckenrelativzahlen

  18. Autokorrelation der Sonnenflecken

  19. Lang- und Kurzzeitgedächtnis Definition: Gedächtnis einer Zeitreihe Eine Zeitreihe hat kurzes Gedächtnis

  20. Autokovarianzmatrix (Mittel über alle Fenster) • symmetrisch • positiv definit für stationäre Zufallsprozesse • für multivariates Gaußsches Rauschen ausreichend zur vollständigen Charakterisierung

  21. Kreuzkorrelation zweier Zeitreihen

  22. ist nicht symmetrisch: 95% Signifikanz: Lag-Beschränkung: Eigenschaften der Kreuzkorrelation

  23. Kreuzkorrelation: RP Trend gegen Sonnenflecken 0.6 0.4 0.2 CCF 0 -0.2 -0.4 -0.6 -20 -15 -10 -5 0 5 10 15 20 Abstand (Jahre)

  24. Arten von Kausalitätsbeziehungen

  25. und eine Informationsmenge Gegeben zwei Zeitreihen die mindestens enthält. Ein-Schritt-Vorwärts-Prädiktor für mit minimalem mittleren quadratischen Fehler Def.: X verursacht Y X beeinflusst Yinstantan X und Y sind rückgekoppelt X verursacht Y und Y verursacht X Kausalität für Zeitreihen nach Granger

  26. ist t-verteilt mit n-2 Freiheitsgraden Bei 95% Signifikanz: Spezialfall: Korrelationskoeffizient • mindestens 4 gemeinsame Datenpunkte (evtl. Ausdünnen) • sehr robust gegen Nicht-Normalität

  27. Tests und Trenderkennung bei Zeitreihen Problem vieler Zeitreihen-Modelle und Analysemethoden: u.a. Stationarität vorausgesetzt • Zwei Auswege: • Geeignete Modellklasse wählen • Vorbehandlung der Zeitreihen • (Ggf. wünschenswerte) Eigenschaften von Zeitreihen: • Ergodizität • Stationarität • Linearität • Homoskedastizität • Normalität • Trendfreiheit (deterministisch/stochastisch) • Unkorreliertheit (Identically Independently Distributed, IID)

More Related