770 likes | 944 Views
Seminar SE 2 st. Uni Klagenfurt: 814.515 und Uni Wien: 562.430 Mathematische Modellbildung und Simulation Ökonometrische, systemdynamische, Input-Output Modelle sowie agent-based systems Peter Fleissner Institut für Gestaltungs- und Wirkungsforschung. websites. Allgemeines
E N D
Seminar SE 2 st.Uni Klagenfurt: 814.515 und Uni Wien: 562.430Mathematische Modellbildung und SimulationÖkonometrische, systemdynamische, Input-Output Modelle sowie agent-based systemsPeter FleissnerInstitut für Gestaltungs- und Wirkungsforschung
websites Allgemeines • http://www.iff.ac.at/socec/lehre/lehre_aktuell.php Laufende Ereignisse, Skripten, Termine • http://cartoon.iguw.tuwien.ac.at/zope/lvas/MathMod
Termine • Vorbespr: Donnerstag; 3. März 2005, 17 Uhr • 1. Block: Montag, 7. März (9 -17 Uhr) • 2. Block: Donnerstag, 17. März (9 Uhr) • Vortrag ANYLOGIC TEAM (Ort: Kontaktraum der TU, Gusshausstrasse 25-29, 6. Stock) • 3. Block: Montag, 4. April (9 -17 Uhr) • 4. Block: Montag, 11. April (9 -17 Uhr) • 5. Block: Montag, 2. Mai (9 -17 Uhr) • Ab 15:30 Uhr: Vortrag DI Klug, Seibersdorf • Die ganztägigen Termine finden im Seminarraum 187-2 bzw. im Computerlabor des IGW statt
Ausblick Teil 4 (Montag, 11. April, ganzer Tag) • Grundzüge der Input-Output-Analyse, Mehrebenenökonomie • Anwendungen auf volkswirtschaftliche Modelle, Stoffstromrechnung Teil 5 (Montag, 2. Mai, ganzer Tag) • Agent-based modelling • Praktische Beispiele, Vortrag DI Klug ab 15:30 Uhr
Teil 3 Montag, 4. April, ganzer Tag • Ökonometrische Modelle: Parameterschätzung • Ökonometrie • neuronale Netze • Praktische Übungen anhand mitgebrachter Daten
Ökonometrische Modelle Definitionen • „tools for measurement used in forecasting, which extrapolate from statistics.“ • workinfonet.bc.ca/lmisi/Making/APPEND/APPENDB.HTM • „a probabilistic model consisting of a system of one or more equations that describe the relationship among a number of economic and time series variables.“ • www.pestmanagement.co.uk/library/gloss_e1.html • A model whose equations are estimated using statistical procedures • wps.aw.com/aw_mishkin_finmkts_4/0,6251,226589-,00.html • Vergegenständlichung einer Widerspiegelung ökonomischer Aktivitäten auf einer speziellen Aggregationsebenen und ihrer Ursache-Wirkungs- und Bilanzbeziehungen mittels mathematischer und statistischer Methoden • eigene Definition
Ökonometrische Modelle Mathematische Form: Lineare oder nicht-lineare Gleichung bzw. Gleichungssystem y1 = f1(x1, x2, …. xk;y1, y2, …. yn ), y2 = f2(x1, x2, …. xk;y1, y2, …. yn ), …. yn = fn (x1, x2, …. xk;y1, y2, …. yn ), wobei yi…endogene Variablen, i = 1…n xj…exogene Variablen, j = 1…k Jede Variable besitzt eine bestimmte Bedeutung/Qualität, die durch eine Definition beschrieben/festgelegt wird. Die quantitativen Werte der endogene Variablen werden im Modell berechnet Die quantitativen Werte der exogenen Variablen werden extern vorgegeben Man sagt: endogene Variablen werden durch das Modell „erklärt“ Günstig wäre eine kausale Erklärung, ist aber nicht immer gegeben Strukturell/ontologisch gesprochen enthalten ökonometrische Modelle neben definitorischen Zusammenhängen Kausal- und Bilanzbeziehungen
Ökonometrische Modelle Welche Funktionen werden verwendet? • Lineare Modelle (Typ des „stochastischen Gesetzes“) Einzelgleichung, n Beobachtungen (Zeitpunkte oder Querschnittsdaten) Idealisierte Sicht der „Wirklichkeit“: y1 = x11 b1 + x12b2 + … + x1kbk + u1 y2 = x21 b1 + x22b2 + … + x2kbk + u2 y = f(x1, x2, …. xk) … yn-1 = xn-1,1 b1 + xn-1,2b2 + … + xn-1,kbk + un-1 yn = xn1 b1 + xn2b2 + … + xnkbk + un wobei ui…Störglieder, i = 1…n bj…Parameter, j = 1…k y = X b + u in Matrixschreibweise y1 x11 x12 … x1kb1 u1 y2 x21 x22 … x2kb2 u2 y = … , X = … , b = … , u = … . yn-1 xn-1, xn-1,2 … xn-1,k bk-1 un-1 yn xn1 xn2 … xnk bk un
Ökonometrische Modelle Welche Funktionen werden verwendet? b. Linearisierte Modelle Nichtlineare Gleichungen werden so transformiert, dass lineare Strukturen herauskommen Besipiel 1: Trend mit konstanter Wachstumsrate g, (b = 1+ g) Yt = a . bt . vt Transformation durch Logarithmieren und Substituieren log (Yt) =log ( a . bt . vt) -> log (Yt) = log (a) + t . log (b) + log (vt) = 1. b1 + xt .b2 + ut = yt Beispiel 2: halblogarithmische Transformation (Störglied u bzw. v weggelassen) Ergebnis der Differenzialgleichung dY/dX=b/X Yt = a . bXt yt = log (Yt) = log (a) + Xt log (b) + log (vt) = 1. b1 + xt .b2
Ökonometrische Modelle Beispiel 3: Veränderungsraten g in Zeitreihen mit äqudistanten Punkten g(Yt) = Yt / Yt-1 – 1 = (Yt - Yt-1) / Yt-1 =~ dY/dt . 1/Y =~ d( log(Y) ) / dt =~ log(Yt) - log(Yt-1) d.h. Lineare Gleichungen in Veränderungsraten sind auf der Ebene der Originalzeitreihe doppeltlogarithmische Funktionen: g(Yt) = a + b. g(Xt) = d( log(Yt) ) / dt = a + b.d( log(Xt) ) / dt Integration über die Zeit ergibt log(Yt)= a.t + b.log(Xt) + c Exponentieren führt zu Yt = exp(c). exp(a.t) . Xtb (Produkt aus einer Konstanten, einem exponentiellen Trend und der potenzierten Variablen) Dies ist eine typische Transformation von Zeitreihen in Veränderungsraten, die in der Ökonometrie häufig angewendet wird, um den gemeinsamen Trend herauszufiltern, der Scheinkorrelation erzeugt.
Exkurs: Parameterschätzung Ökonometrische Verfahren: nichtlinear, mit Polynom in xBeispiel Parabel: y = a + b.x + c. x2
Exkurs: Parameterschätzung Ökonometrische Verfahren: linear
Exkurs: Parameterschätzung Ökonometrische Verfahren: linear y y = alfa + beta.x j beta = tan(j) alfa x
Kriterium für optimale Lage der Geraden gesucht.3 Möglichkeiten: Distanz senkrecht, waagrecht oder normal zur Gerade gemessenBest Fit Kriterium: Summe der Absolutbeträge oderSumme der Quadrate der Abweichungen = Methode der kleinsten Quadrate y = alfa + beta.x y j beta = tan(j) alfa x
Wenn wir die senkrechte Distanz wählen:Gleichung für jeden einzelnen Punkt mit den Koordinaten (xi , yi): yi = alfa + beta xi + eiMinimierung der Summe der Quadrate der Fehler y = alfa + beta.x yi= (xi , yi) ei j beta = tan(j) beta.xi alfa x xi
Bestimmung der Parameter der Geraden durch Minimierung der Fehlerquadratensumme ? ? Notwendige Bedingung für Minimum: Partielle Ableitungen nach den Parametern = Null ? ?
2 Gleichungen in 2 Unbekannten, alfa und beta Aus Gleichung 1 erhält man nach Division durch n eine Beziehung zwischen den Mittelwerten von y und x Regressionsgerade geht durch die Mittelwerte von y und x ? Aus Gleichung 2 erhält man nach Einsetzen von alfa in Gleichung 1 den Wert für beta.
Kleiner Ausflug in die empirische Statistik+ Neuinterpretation der Kleinstquadratenmethode Mittelwert (ar. Mittel von x) Standardabweichung s Was bedeuten diese Kenngrößen? Dazu müssen wir eine Blickwechselübung machen… Varianz var(x) = s2 Kovarianz cov(x,y) Korrelationskoeffizient r Bestimmtheitsmaß r2
Alternative Interpretation einer Zeitreihe oder von Querschnittsdaten
Die ganze Zeitreihe wird als Punkt im n-dimensionalen Raum betrachtet, t=3 t=2 Was bedeutet die Länge l des Vektors in statistischen Begriffen? wobei der Ursprung des Koordinatensystems in den Punkt gelegt wird t=1 O Alternative Interpretation einer Zeitreihe oder von Querschnittsdaten ? l ist proportional der Standard-Abweichung s
Lineares Regressionsmodell Matrixschreibweise
Verallgemeinertes lineares Modell in Matrixschreibweise k Parameter, k-1 exogene Variablen, n Zeitpunkte, i = 1 … n, Üblicherweise wird die erste exogene Zeitreihe als Vektor angenommen, der aus n Einsen besteht. Warum? y1 = x11 b1 + x12b2 + … + x1kbk + u1 y2 = x21 b1 + x22b2 + … + x2kbk + u2 ….. ….. yn-1 = xn-1,1 b1 + xn-1,2b2 + … + xn-1,kbk + un-1 yn = xn1 b1 + xn2b2 + … + xnkbk + un y = Xb + u Schreibweise: Matrizen als fettgedruckte GroßbuchstabenVektoren als fettgedruckte Kleinbuchstaben
Matrixalgebra im Schnellverfahren • Eine Matrix ist eine rechteckige Anordnung von Elementen. • Sie kann als Verallgemeinerung einer einzelnen Zahl aufgefasst werden. • Ihre Elemente sind in Reihen, in • Zeilen[rows] (horizontal) oder • Spalten[columns] (vertikal) • angeordnet. • Besitzt eine Matrix n Zeilen und k Spalten, besitzt sie n.k Elemente. • Man sagt, sie ist von der Ordnung (oder Dimension) n mal k, n x k. • Das Element am Kreuzungspunkt der i-ten Zeile und der j-ten Spalte der Matrix A wird repräsentiert durch aij • Will man Zugriff auf die Indizes, kann man schreiben: • A = { aij } • Aus Konvention wird der erste Index als Zeilenindex, • der zweite als Spaltenindex angesehen
Matrixalgebra im Schnellverfahren Eine Matrix der Ordnung 1 x k besteht aus einer einzigen Zeile von Elementen. Wir nennen eine solche Matrix einen Zeilenvektor Beispiel: p = [ p1, p2, … pk-1, pk ] = { pj }, j = 1 … k Eine Matrix der Ordnung n x 1 besteht aus einer einzigen Spalte von Elementen. Wir nennen eine solche Matrix einen Spaltenvektor Beispiel:
Matrixoperationen im Schnellverfahren Wir gehen von den Matrizen A = { aij }, B = { bij } und C = { cij } aus. Gestürzte (transponierte) Matrix [transposed matrix]: (Zeilen und Spalten werden vertauscht) A‘ = AT={ aji } Addition/Subtraktion zweier Matrizen A + B = { aij } + { bij } = { aij + bij } = { cij } = C A - B = { aij } - { bij } = { aji - bij } = { cij } = C Gleichheit zweiter Matrizen Zwei Matrizen sind gleich, wenn sie von der selben Ordnung sind und in allen ihren Elementen übereinstimmen. A = B aij = bij für alle i,j, wobei i = 1 … n, j = 1 … k
Matrixoperationen im Schnellverfahren Wir gehen von den Matrizen A = { aij }, B = { bij } und C = { cij } aus. Multiplikation zweier Matrizen: A ist von der Ordnung n x q B von der Ordnung q x m Ergebnis: Matrix C von der Ordnung n x m Achtung: Im Allgemeinen nicht kommutativ (vertauschbar). A B ungleich B A. Spaltenzahl der ersten Matrix muss gleich der Zeilenzahl der zweiten sein! Faustregel: Gliedweise Multiplikation der Zeilenelemente der ersten Matrix mit den Spaltenelementen der zweiten Matrix mit nachfolgender Summierung
Matrixoperationen im Schnellverfahren Beispiel 1: Beispiel 2: ? ? ?
Spezielle Matrizen DiagonalmatrixD besitzt nur Elemente ≠ 0 in der Hauptdiagonale (von links oben nach rechts unten), sonst Nullen EinheitsmatrixI besitzt nur Einsen in der Hauptdiagonale sonst Nullen I = { eij }, eij = 1 für i = j; eij = 0 für i ≠ j (Andere Schreibweise mit Deltafunktion: eij = dij ) Skalarmatrix besitzt einen Skalar l in der Hauptdiagonale, sonst nur Nullen S = { sij }, sij = l. dij Vektory als Diagonalmatrix ŷ ŷ = { yij }, yij = yi . dij
Spezielle Matrizen bzw. Kenngrößen Einsvektoren (hilfreich zur Summierung von Reihen): Eins-Zeilenvektor (nur von links in Multiplikation) 1 = [ 1, 1, ….1, 1 ] Eins-Spaltenvektor (nur von rechts in Multiplikation) 1T Symmetrische Matrix Y = { yij }, wenn yij = yji Schiefsymmetrische Matrix Z = { zij }, wenn zij = -zij für i ≠ j Inverse MatrixA-1 als Lösung der Gleichung A-1A = I oder AA-1 = I, A muss quadratisch sein Spur [trace] ist die Summe aller Hauptdiagonalelemente Zu beweisen: tr(AB) = tr(BA) Wie geht das?
Skalarprodukt zweier Vektoren x´y = x1y1+ x2y2 + … + xn-1yn-1+ xnyn Gehen wir zunächst nur von einem Vektor x aus.Die Länge l eines Vektors haben wir schon berechnet. Zur Erinnerung Dies ist nichts anderes als die Wurzel aus dem Skalarprodukt x´x des Vektors x mit sich selbst. Was geschieht, wenn wir den Vektor x skalar durch seine Länge dividieren? Länge des neuen Vektors x* = x /l?
t=3 z y x t=2 j t=1 Was bedeutet das Skalarprodukt räumlich? x = y + z z = x – y z´z = (x – y)´(x – y) = x´x + yý – 2 xý Nach dem Kosinussatz gilt (http://www.mathewissen.de/klasse10/kosinus.php) z´z = x´x + yý – 2 l(x) l(y) cos j Also gilt cos j= x´y / ( l(x) l(y) ) Anmerkung 1: Diese Formel kennen wir schon. Was bedeutet sie? Anmerkung 2:für x‘y = 0 x und y stehen zueinander rechtwinkelig
t=3 x t=2 j y t=1 Der cos des Winkels j zwischen x und y ist nichts anderes als der Korrelationskoeffizient r Zur Erinnerung: Ursprung des Koordinatensystems liegt im Punkt r (x,y) = cos j
Partielle Ableitung nach den Komponenten eines Vektors Partielle Ableitung des Skalarprodukts a‘x nach den xi (a und x sind Spaltenvektoren) ∂(a‘x)/ ∂x = a Partielle Ableitung der „quadratischen Form“ x‘Ax nach den x i ∂(x‘Ax)/ ∂x = 2Ax (Spaltenvektor) oder (!) ∂(x‘Ax)/ ∂x = 2x‘A (Zeilenvektor) je nach Kontext
Das allgemeine lineare Modell Es geht wieder um die Minimierung der Summe der Fehlerquadrate, diesmal in Matrixschreibweise, zur Bestimmung der k Parameter y1 = x11 b1 + x12b2 + … + x1kbk + u1 y2 = x21 b1 + x22b2 + … + x2kbk + u2 ….. yn-1 = xn-1,1 b1 + xn-1,2b2 + … + xn-1,kbk + un-1 yn = xn1 b1 + xn2b2 + … + xnkbk + un Konvention: Variablen, die empirisch bestimmt werden, tragen ein Dach („Schätzwerte“) y = Xb + u
Idealtypisches Modell • y = Xb + u • u ist eine (vektorielle) Zufallsvariable mit Erwartungswert 0 • E(u)= 0 • mit statistisch unabhängigen Elementen und mit gleicher Varianz für alle Zeitpunkte • E(u.u´) = s2In • Die Elemente von X sind fixe Zahlen • Der Rang der Matrix ist k<n (bleibt unerklärt)
Schätzverfahren für die Parameter Kleinstquadratensumme e´e -> Minimum ? ? ?
Konsequenzen Heben wir 2X‘ heraus und fassen zusammen, ergibt sich X´e = 0 d.h. der Fehlervektor e ist zu allen Vektoren der exogenen Variablen x orthogonal. Ist (wie üblich) die erste Spalte von X, x1 = 1, ergibt sich
Einsetzen des idealtypischen Modells in die Schätzformel für die Parameter Berechnung der Erwartungswerte ergibt, dass die Schätzfunktion „unverzerrt“ [unbiased] ist, also im Mittel genau den „wahren“ Parameter ergibt, denn
Einsetzen des idealtypischen Modells in die Schätzformel für die Parameter Berechnung der Varianz-Kovarianz-Matrix Schätzfunktion ist die bestmögliche mit kleinsten (Co-)varianzen [best estimator], aber auch erwartungstreu: best linear unbiased estimator = BLUE estimator
Schätzung der Residuen u und σ2 durch e Der Schätzer der Residuen ist erwartungstreu. A ist symmetrisch: A‘ = A und idempotent: A2 = A Wie = kommen wir zu einer Schätzung für σ2 ? E(e‘e) = E(u‘A‘Au) = E(u‘Au) =σ2 Spur [In-X(X‘X)-1X‘] = σ2 (n - k)
Bestimmtheitsmaß r2 und Varianzanalyse Varianz der Schätzungen (erklärter Teil) r2 = Varianz der Beobachtungen Das Bestimmtheitsmaß drückt den Anteil der erklärten Varianz an der Gesamtvarianz aus Es gilt weiters: 0 <= r2 <= 1 und für die Berechnung in Excel (Beweis?)
> > y e y = y + > x1 > var(y) >= var(y) e Korrelations- Koeffizient r = cos(j) > > > b1 x1 + b2 x2 y = j > b2 x2 x2 > Intuitive Interpretation im n-dimensionalen Raum Klassische ökonometrische Parameterschätzung • b = (X‘X)-1 X‘y : b1 x1
y j e ^ y Intuitive Interpretation im n-dimensionalen Raum ^ y = y + e Nach Pythagoras ist l2(y) = l2(y) + l2(e) var(y) = var(y) + var(e) y ist die orthogonale Projektion von y auf die Ebene, die von den exogenen Vektoren aufgespannt wird e steht auf alle xisenkrecht und auf y r2 = (cosj)2 = l2(y) / l2(y) = var(y) / var(y) ^ ^ ^ ^ ^ ^
Varianzanalyse Nach Pythagoras gilt im rechtwinkeligen Dreieck: Die Varianz der Beobachtungen = Summe aus Varianz der Schätzungen (erklärter Teil der Varianz) und Varianz der Residuen (nicht erklärter Teil der Varianz) Es gilt aber auch für die Quadratsummen: (Beweis nachstehend)
Regressionsanalyse Testen von Hypothesen T-Test und F-Test
Testen von Hypothesen Bisher keine Annahme über spezielle Verteilungsform der Zufallsvariablen Nun wird Normalverteilung angenommen u ist N(0, σ2In) Wahrscheinlichkeit für die Stichprobenwerte ist:
Testen von Hypothesen Verteilung der Schätzfunktionen von β und von u? Als lineare Funktionen von normalverteilten Zufallsvariablen sind sie ebenfalls normalverteilt. Ihre Kovarianz ist Null, daher sind sie ebenfalls unabhängig voneinander verteilt. Anders ist es für die Schätzfunktion von σ2. Ohne Beweis stellen wir fest, dass dieser Schätzer χ2-verteilt ist, mit (n-k) Freiheitsgraden. Die Student‘sche t-Verteilung ist eine Verteilung, die – salopp gesprochen – aus dem Quotienten einer normalverteilten Variablen (u) und der Quadratwurzel einer χ2-verteilten Zufallsvariablen gebildet wird / ist also t-verteilt
Testen von Hypothesen t-Verteilung mit n-k Freiheitsgraden aii ist das i-te Diagonal- element von (X‘X)-1 Zum Testen der Hypothese, dass βi = 0 ist (dies ist gleichbedeutend mit der Annahme, dass von der Variablen von xi kein linearer Einfluss auf y ausgeht), substituieren wir den Wert von βi in die obige Formel. Wir verwerfen die Hypothese βi = 0, wenn t größer („überkritisch“) ist als der Wert, der für ein bestimmtes Sicherheitsniveau (z.B. 95%) und für eine bestimmte Zahl von Freiheitsgraden in der t-Tabelle steht.
Testen von Hypothesen: Konfidenzintervall Eine andere Art von Test geht über das Konfidenzintervall, das mit einer bestimmten Sicherheitswahrscheinlichkeit den unbekannten Parameter Überdeckt aii ist das i-te Diagonal- element von (X‘X)-1 Als Sicherheitswahrscheinlichkeit wählt man üblicherweise 95% oder 99% (in der obigen Formel bedeutet є = 1-Sicherheitswahrscheinlichkeit resp. 5% bzw. 1%). Da die Verteilung zwei Schwänze besitzt, wird Є durch 2 dividiert. Übliche Werte aus der Tabelle von tє/2 für 20 Freiheitsgrade sind 2.086 (95%) bzw. 2.845 (99%).