470 likes | 633 Views
Multivariate Statistische Verfahren. Logistische Funktion, Logistische Regression und Klassifikation Poisson-Regression Psychologisches Institut der Universität Mainz SS 2012 U. Mortensen. Überblick. Grundbegriffe der Dynamik.
E N D
Multivariate Statistische Verfahren Logistische Funktion, Logistische Regression und Klassifikation Poisson-Regression Psychologisches Institut der Universität Mainz SS 2012 U. Mortensen
Überblick Grundbegriffe der Dynamik Logistische Funktionen, logistische Regression und Klassifikation Weitere Analysen von Häufigkeiten: Poisson-Regression, loglineare Analysen Zeitliche Entwicklungen: Ereignisanalyse (Analyse von ‚Wartezeiten‘)
Vorbemerkungen: Exponentielles und logistisches Wachstum Funktionen und ihre Ableitungen
Differential und Integral Die Umkehrung der Differentiation ist die Integration:
Differentialgleichungen Ausgangspunkt: ist die Funktion f(x) gegeben, so liegt die Ableitung f‘(x) fest, und umgekehrt: ist f‘(x) gegeben, so ist auch f(x) bestimmt (bis auf additive Konstante beim unbestimmten Integral) Oft sucht man eine Funktion, von der man nur weiß, wie sie sich mit x Verändert, d.h. man hat eine Differentialgleichung, deren Lösung die gesuchte Funktion ist: Das Differential (die Ableitung) der gesuchten Funktion sei proportional zur Funktion.
Differentialgleichungen Auf diese Differentialgleichung wird man geführt, wenn man den Fall betrachtet, dass eine Größe stets um einen bestimmten Anteil ihres Wertes wächst: Exponentielles Wachstum einer Population: Zeiten mit Quadraten sind „Verdoppelungszeiten“, dh Zeiten, zu denen sich die Population jeweils verdoppelt hat.
Differentialgleichungen Verdoppelungszeiten:
Differentialgleichungen Exponentielles Wachstum der Weltbevölkerung
Differentialgleichungen Ist die Wachstumsrate konstant, so ist das Wachstum exponentiell. Wie ist Das Wachstum, wenn die Rate nicht konstant ist, es zB Sättigung im Wachstum gibt? Logistisches Wachstum Verhulst bekam 1838 den Auftrag, das Wachstum der Stadt Paris vorherzusagen – die Vorhersage wurde für die Planung neuer Wohnungen (frz logis), Strassen, zugehöriger Kanalisation benötigt. Verhulst nahm an, dass es für eine Stadt eine maximale Größe K (Trägerkonstante) geben müsse, da die Stadt aus dem Umland mit Wasser und Nahrung versorgt werden muß. Pierre Verhulst (1804- 1849), belgischer Mathematiker
Differentialgleichungen Logistisches Wachstum der Lebenserwartung in Norwegen
Differentialgleichungen Das klassische Modell der Epidemiologie
Differentialgleichungen – Interaktion von Emotionen Dollard & Miller 1939: Frustration erzeugt Aggression Einmal so… Und das nächste Mal so: Existiert ein überhaupt ein Zusammenhang?
Differentialgleichungen – Interaktion von Emotionen Reaktionen auf einen frustrierenden „Stoß“: Keine Regression im üblichen Sinn! Keine Regression im üblichen Sinn – Oszillation bis zur Gleichgewichtslage!
Differentialgleichungen – Interaktion von Emotionen Keine Regression im üblichen Sinn – eher eine Explosion! Keine Regression im üblichen Sinn – eher ein permanentes Pendeln! Untersuchungen im Rahmen des Allgemeinen Linearen Modells (ANOVA, Regressionsanalyse etc) erfassen die Dynamik grundsätzlich nicht!
Logistische Verteilung, Regression und Klassifikation Die logistische Verteilung
Logistische Verteilung, Regression und Klassifikation Vergleich logistische Verteilung – Gauss-Verteilung
Logistische Verteilung, Regression und Klassifikation Gauss-Verteilungen mit identischen Varianz-Kovarianz-Matrizen führen auf die logistische Funktion!
Logistische Regression Wahrscheinlich- keit Wie multiple Regression – Kein Fehlerterm! Nichtlineare Beziehung zwischen den unabhängigen Variablen und der Wahrscheinlichkeit! Wettchance Lineare Beziehung zwischen Prädiktoren und Logit!
Logistische Verteilung, Regression und Klassifikation Wahrscheinlichkeit einer Koronarerkrankung in Abhängigkeit vom Blutdruck
Logistische Regression • Wie werden die Koeffizienten geschätzt? • Wie werden sie interpretiert? Schätzung:
Logistische Regression -- Interpretation Wettchance (Odds) und Wahrscheinlichkeit Odds als Funktion der Wahrscheinlichkeit wird auf (0, unendlich) abgebildet. Wahrscheinlichkeit als Funktion der Odds wird auf (0, 1) abgebildet
Logistische Regression – Odds, relatives Risiko, etc Einige grundlegende Begriffe lassen sich anhand eines dichotomen Merkmals erläutern.
Logistische Regression – Infektionsrisiko Infektionsrisiko bei Kaiserschnittgeburten
Poisson-Verteilungen (lb = lambda) lb = 5 lb = 3 lb = 10
Poisson-Verteilungen - Beispiele Generell: „Kleine“ Anzahlen Poisson-verteilte Häufigkeiten zeigen „Cluster“ – das sind Anhäufungen von Ereignissen. Diese Anhäufungen resultieren aus der Zufälligkeit der Ereignisse und sind nicht notwendig Ausdruck irgendwelcher systematischer Tendenzen. Systematische Tendenzen kann es ebenfalls geben – aber man muß prüfen, ob die Clusterings solche Tendenzen enthalten. • Beispiele: • Verletzungen von Kindern in einem Distrikt (http://www.ij-healthgeographics.com/content/7/1/51 ) • Trauma-Forschung – domestic violence (Gagnon et al 2008) • Häufung von Galaxien (Saslaw, W. C. "Some Properties of a Statistical Distribution Function for Galaxy Clustering." Astrophys. J.341, 588-598, 1989. ) • Häufigkeit epileptischer Anfälle in einer Gruppe von Patienten im Laufe eines Jahres • Häufigkeit von Arrythmien in 24-Stunden EEGs • Häufigkeiten von Infektionen in einer Stadt (existiert „infective agent“?)