520 likes | 653 Views
ZEW - Expertenseminar: „Einführung in die Ökonometrie“. WS 2007/2008 Alexander Spermann Universität Freiburg. Agenda. Grundlagen: Varianz, Kovarianz; Erwartungswert, Korrelationskoeffizient Einfache Regressionsanalyse: Methode der Kleinsten Quadrate
E N D
ZEW - Expertenseminar: „Einführung in die Ökonometrie“ WS 2007/2008 Alexander Spermann Universität Freiburg
Agenda • Grundlagen: Varianz, Kovarianz; Erwartungswert, Korrelationskoeffizient • Einfache Regressionsanalyse: Methode der Kleinsten Quadrate • Gauss-Markov-Bedingungen: unverzerrter, konsistenter und effizienter Schätzer • Hypothesentests: Signifikanzniveau, Konfidenzintervall, t-Test, F-Test, Bestimmtheitsmaß, Standardfehler, Fehler vom Typ 1 und 2, einseitiger und zweiseitiger Test • Multiple Regressionsanalyse • Dummy-Variablen • Problem fehlender Variablen • Multikollinearität Alexander Spermann WS 2007/2008
Grundgesamtheit und Stichprobe 1 Fragestellung: Wie hoch ist das durchschnittliche Nettoeinkommen eines Haushaltes einer Stadt? • Möglichkeit: Nettoeinkommen aller Haushalte dieser Stadt (Grundgesamtheit) wird in die Berechnung miteinbezogen. Durchschnitt wird ausgerechnet. PROBLEM: eine Erhebung ist zu teuer. 2. Möglichkeit: Stichprobe wird gezogen. Alexander Spermann WS 2007/2008
Grundgesamtheit und Stichprobe 2 Grundgesamtheit: Gesamte Menge numerischer Informationen einer (population) bestimmten Größe, die der Wissenschaftler beobachtet. Beispiel: Nettoeinkommen aller Haushalte. Stichprobe: Beobachtete Teilmenge der Werte einer (sample) Grundgesamtheit. Beispiel: Nettoeinkommen von z.B. 1% aller Haushalte wird beobachtet. Diese Haushalte werden zufällig gezogen. Alexander Spermann WS 2007/2008
Mittelwert (1) Mittelwert Summe der numerischen Werte der (= Durchschnittswert) : Beobachtungen geteilt durch die Anzahl der (mean) Beobachtungen. Alexander Spermann WS 2007/2008
3200€ 3000€ 3600€ Mittelwert (2) Notation: N = Anzahl der Beobachtungen x1, x2, x3,…,xn – Beobachtungen der Grundgesamtheit Beispiel: Gegeben sind 7 Monatsgehälter von Geschäftsführern in Euro: 3400€ Alexander Spermann WS 2007/2008
Mittelwert (3) Durchschnittswert der Grundgesamtheit ist: Im Beispiel: Alexander Spermann WS 2007/2008
Mittelwert (4) Notation: n – Anzahl der Beobachtungen x1, x2, …, xn – Beobachtungen der Stichprobe Durchschnittswert der Stichprobe ist: Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie folgt aus : 13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3% Alexander Spermann WS 2007/2008
Median 1 Median (median): mittlerer Wert einer geordneten Datenreihe Beispiel: Gehälter der 7 Geschäftsführer sind nach der Größe wie folgt geordnet:: Median = Wert in der „Mitte“ rechts und links davon sind jeweils 3 Werte Median: N ungerade: der mittlere Wert bei einer Reihe nach der Größe geordneten Beobachtungen N gerade: Durchschnitt der 2 mittleren Werte bei einer Reihe der Größe nach geordneten Beobachtungen Alexander Spermann WS 2007/2008
3200€ 3400€ 3000€ 3600€ Median 2 Berechnung des Median: Fall 1: N ungerade: Im Beispiel: Fall 2: N gerade: Im Beispiel: VierterbeobachteterWert Median Durchschnittswert der Grundgesamtheit, 3350€ = µ Alexander Spermann WS 2007/2008
Median 3 Wann Median und wann Mittelwert? Sollen die Ausreißer einer Stichprobe automatisch aus der Mittelwertberechnung eliminiert werden, ist die Anwendung des Median eine gute Alternative. Beispiel: Ermittlung der durchschnittlichen Einkommens- bzw. Vermögenssituation in einer Stadt. Einbeziehung der extrem Vermögenden würde das tatsächliche Einkommensbild verzerren! Alexander Spermann WS 2007/2008
Streuungsmaße Neues Beispiel: 7 Geschäftsführer eines zweiten Unternehmens haben folgende Monatsgehälter: Mittelwert und Median des 1. Unternehmens = Mittelwert und Median des 2. Unternehmens Die Streuung ist jedoch unterschiedlich: Unt. 1 3100€ 3500€ 2700€ 3900€ Unt. 2 3100€ 3500€ 2700€ 3900€ Alexander Spermann WS 2007/2008
Varianz Streuung: Abweichungen der Beobachtungen vom Durchschnittswert. (dispersion) x 1- μ, x2 – μ, …,xN- μ Da manche der Werte kleiner bzw. größer als μ sind, ist Da das Vorzeichen der Abweichung unwichtig ist und alle Werte gleich behandelt werden Betrachtung der quadrierten Werte Varianz: Durchschnitt der quadrierten Abweichungen (variance) der beobachteten Werte von ihrem Mittelwert. Varianz ist für den Vergleich zweier oder mehrerer Mengen der Beobachtungen nützlich. Alexander Spermann WS 2007/2008
Varianz der Grundgesamtheit Formel für Varianz: Im Beispiel: Unternehmen 2 Unternehmen 1 Alexander Spermann WS 2007/2008
Standardabweichung der Grundgesamtheit Mit der Standardabweichung (standard deviation) kann man interpretieren, wie weit die beobachteten Werte vom Mittelwert tatsächlich entfernt sind. Beispiel: Alexander Spermann WS 2007/2008
Varianz der Stichprobe 1 Die Abweichungen der beobachteten Werte vom Mittelwert einerStichprobesind: und die quadrierten Werte entsprechend: Die Varianz der Stichprobe ist dann: • Da bei der Berechnung der Stichprobenvarianz nicht der Mittelwert der Grundgesamtheit µ, sondern der Mittelwert der Stichprobe als Schätzer (proxy) verwendet wird, dividiert man als „Kompensation“ durch (n -1), anstatt durch n. Alexander Spermann WS 2007/2008
Varianz der Stichprobe 2 Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie folgt aus : 13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3% Die Summe der Quadrate der beobachteten Werte ist: Die Varianz der Stichprobe: Alexander Spermann WS 2007/2008
Standardabweichung der Stichprobe Notation: Standardabweichung der Stichprobe aus dem Beispiel ist: Alexander Spermann WS 2007/2008
Zufallsexperiment 1 Zufallsexperiment: Vorgang, der zu einer von (random experiment) mindestens 2 möglichen Ausprägungen führt, wobei es unbekannt ist, zu welcher. Stichprobenraum S: Menge aller möglichen (sample space) Ausprägungen. Es können nicht gleichzeitig zwei Ausprägungen auftreten, aber eine muss auftreten. Alexander Spermann WS 2007/2008
Zufallsexperiment 2 Beispiele: Ein Vorgang wird beobachtet: • Werfen einer Münze • Werfen eines Würfels Mögliche Ausprägungen: • entweder Kopf oder Zahl • 1,2,3,4,5,6 Stichprobenraum: • S=(Kopf, Zahl) • S=(1,2,3,4,5,6) Alexander Spermann WS 2007/2008
Zufallsexperiment 3 Ereignis: Eine Teilmenge möglicher Ausprägungen mit dem (event) gleichen Merkmal. Notation: Großbuchstaben, z.B. A, B,...,Z Beispiel: Ereignis A/B: Eintreten einer ungeraden /geraden Zahl beim Werfen eines Würfels. Ergebnis eines Würfelwurfs z.B. 3 Ereignis A eingetreten. Alexander Spermann WS 2007/2008
Wahrscheinlichkeit Bezeichnung: P (probability) Ein Zufallsexperiment soll stattfinden. Wie groß ist die Wahrscheinlichkeit P bzw. die Chance, dass ein Ereignis eintritt? 1. Wahrscheinlichkeit als relative Häufigkeit : P liegt immer zwischen 0 und 1: 0: ein Ereignis tritt auf keinen Fall ein 1: ein Ereignis tritt sicher ein Beispiel: Münze wird geworfen. Ereignis A: Kopf, zu 50% Ereignis B: Zahl, zu 50% In beiden Fällen P=0,5 0£ P £1 Alexander Spermann WS 2007/2008
Subjektive Wahrscheinlichkeit Was tun, wenn ein Experiment gar nicht oder zumindest nicht unter gleichen Umweltbedingungen wiederholt werden kann – Bsp. Konjunktur? 2. Wahrscheinlichkeit als subjektive Wahrscheinlichkeit : Bezeichnung: Psubj Die subjektive Wahrscheinlichkeit beschreibt den rein individuellen Glauben über die Chance, dass ein bestimmtes Ereignis bei begrenzter Anzahl der Experiment eintritt. Zudem hängt sie von den gegebenen Informationen sowie ihrer persönlichen Interpretation ab. Gutes Bsp. sind Investitionsentscheidungen bezüglich entsprechender Gewinnerwartungen. Alexander Spermann WS 2007/2008
Zufallsvariable 1 Zufallsvariablen: Ausprägungen eines Zufallsexperimentes: (random variable) 1. diskret: gutes / defektes Produkt (gut = 1, defekt = 2) 2. stetig: Familieneinkommen Wichtige Unterscheidung zwischen: einer Zufallsvariable X und dem Wert x, den sie annimmt. Alexander Spermann WS 2007/2008
Zufallsvariable 2 Beispiel 1:Beispiel 2: Werfen eines Würfels Produktion Zufallsvariable X = Augenzahl Zufallsvariable X = Qualität des Produktes 6 Ausprägungen x = 1, x = 2, ..., x =6 2 Ausprägungen: x = 1, x = 2 wobei 1=gut, 2=defekt Diskrete Zufallsvariable: Nimmt nur eine abzählbare Anzahl an Ausprägungen an. Alexander Spermann WS 2007/2008
Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable Wahrscheinlichkeitsfunktion: gibt die Wahrscheinlichkeit wieder, dass eine =Dichtefunktion diskrete Zufallsvariable X die Ausprägung x (probability function) annimmt: Px ( x ) = P( X = x ) Die Wahrscheinlichkeiten aller Ausprägungen summieren sich auf 1: Beispiel: X = Augenzahl bei geworfenem Würfel 1/6 Wahrscheinlichkeits-/ Dichtefunktion für das Bsp. mit unabhängigen Ereignissen 0 1 2 3 4 5 6 Alexander Spermann WS 2007/2008
Kumulierte Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen 1 Beziehung zwischen Wahrscheinlichkeitsfunktion und kumulierter Wahrscheinlichkeitsfunktion (cumulative probability function) ist gegeben als: Die kumulierte Wahrscheinlichkeitsfunktion des Würfelbeispiels: 1 Grafik der kumulierten Wahrscheinlichkeitsfunktion aus dem Beispiel: 1/2 Für P(X3) = Px(X=1)+Px(X=2)+Px(X=3)= 0,5 1 2 3 4 5 6 0 Alexander Spermann WS 2007/2008
Erwartungswert einer diskreten Zufallsvariable 1 Beispiel: Korrektur einer Stichprobe von Büchern, Zufallsvariable X =Tippfehler auf einer Seite • 81% der Seiten hatten keinen Tippfehler der Wert der Zufallsvariable x = 0 • 17% hatten einen Tippfehler x = 1 • 2% hatten zwei Tippfehler x = 2 Dies kann man schreiben als: Px (0) = 0,81 Px (1) = 0,17 Px (2) = 0,02 Um einen repräsentativen Mittelwert zu bekommen, müssen die jeweiligen Werte mit ihren Wahrscheinlichkeiten gewichtet werden Erwartungswert (expected value) Alexander Spermann WS 2007/2008
Erwartungswert einer diskreten Zufallsvariable 2 Durch das Berechnen des Erwartungswertes erhalten wir den mittleren Wert einer diskreten Zufallsvariable. E(X) wird dann der Mittelwert der diskreten Zufallsvariable genannt. Notation: Beispiel: d.h. dass im Mittel auf jeder Seite 0,21 Tippfehler bzw. auf etwa jeder 5. Seite ein Tippfehler zu erwarten ist Alexander Spermann WS 2007/2008
Erwartungswert, Varianz und Standardabweichung 1 Varianz: Der Erwartungswert der quadrierten Streuung (X – μx)² gewichtet mit der Wahrscheinlichkeit Notation: Standardabweichung: Quadratwurzel der Varianz Notation: σx Alexander Spermann WS 2007/2008
Erwartungswert, Varianz und Standardabweichung 2 Beispiel: Tippfehler Um die Varianz zu finden, muss zuerst der Erwartungswert gefunden werden: Varianz: und die Standardabweichung entsprechend: Alexander Spermann WS 2007/2008
Verteilungsfunktion einer stetigen Zufallsvariable 1 Stetige Zufallsvariablen: Nicht abzählbare Anzahl an Werten (continuous random variable) auf einem ‚Wertestrahl‘ (Kontinuum). Beispiele: Zeit, Entfernung, Temperatur. Verteilungsfunktion einer stetigen Zufallsvariable: Wahrscheinlichkeit, dass X den Wert x nicht übersteigt. Notation: Verteilungsfunktion einer stetigen Zufallsvariable entspricht der kumulierten Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable. Alexander Spermann WS 2007/2008
Verteilungsfunktion einer stetigen Zufallsvariable 2 Beispiel: Nehmen wir an, dass ein Tunnel genau 1 km lang ist. Es werden die Unfälle im Tunnel beobachtet. Zufallsvariable: X = Entfernung vom Eingang des Tunnels zum Zeitpunkt des Unfalls. Die Wahrscheinlichkeit, dass ein Unfall passiert, ist für jede Teilstrecke gleich. Verteilungsfunktion dieser Grafik zum Beispiel: Zufallsvariable ist: 1 Alexander Spermann WS 2007/2008
Verteilungsfunktion einer stetigen Zufallsvariable 3 Es ist unmöglich, die Wahrscheinlichkeit für einen bestimmten Wert, den die Zufallsvariable annimmt, zu berechnen. Es kann nur die Wahrscheinlichkeit berechnet werden, dass die Zufallsvariable einen Wert zwischen den Werten a und b annimmt. Diese Wahrscheinlichkeit ist: P (a < x < b) = Fx (b) – Fx (a) Im Beispiel: Da die Zufallsvariable zwischen 0 und 1 einheitlich verteilt ist, ist die Verteilungsfunktion in diesem Bereich: F x(x) = x Für a=1/4 und b=3/4 ist die Wahrscheinlichkeit, dass ein Unfall in diesem Bereich liegt: P (1/4< x < 3/4) = Fx (3/4) – Fx (1/4) = 3/4 – 1/4= 1/2 Alexander Spermann WS 2007/2008
Dichtefunktion einer stetigen Zufallsvariable 1 Die Dichtefunktion für eine stetige Zufallsvariable X ist eine Funktion mit folgenden Eigenschaften: fX (x) ≥ 0 für alle x - Werte Grafik der Dichtefunktion: a und b sind Werte der Zufallsvariable X, wobei a<b. Die Wahrscheinlichkeit, dass x zwischen a und b liegt, ist der Bereich unter der Kurve zwischen diesen zwei Werten. Beispiel: x a b Alexander Spermann WS 2007/2008
Dichtefunktion einer stetigen Zufallsvariable 2 Eigenschaften der Dichtefunktion: • Die Fläche unter der Dichtefunktion entspricht dem Wert 1. • Die Fläche unter der Kurve der Dichtefunktion, fX (x) , links von dem Wert x0 ist F x(x0) , wobei x0 irgendein Wert ist, den die Zufallsvariable annehmen kann. Alexander Spermann WS 2007/2008
Dichte- und Verteilungsfunktion einer stetigen Zufallsvariable 3 – laut Beispiel Gesamtfläche = 1 Gesamtfläche = 1 Fx(x) F(b)=3/4 =0,5 (50%) = 0,5 F(a)=1/4 0 1 a ¼*1km=250m b ¾*1km=750m Alexander Spermann WS 2007/2008
Die Normalverteilung 1 Stetige Verteilung, die in der Statistik eine zentrale Rolle spielt. Eine Zufallsvariable X ist normalverteilt wenn ihre Dichtefunktion wie folgt aussieht: Und: µ x , wobei die Varianz immer positiv ist. Alexander Spermann WS 2007/2008
Die Normalverteilung 2 Eigenschaften: • Der Mittelwert der Zufallsvariable ist µ, also: E (X) = μ • Die Varianz der Zufallsvariable ist σ²also: • mit Standardabweichung: = σ wobei gilt: je kleiner σ² , desto „enger“ liegt die Verteilung um den wahren Wert • Die Form der Dichtefunktion ist eine symmetrische Glockenkurve mit dem Zentrum im Mittelwert µ. Notation: X~ N (µ ,σ²) Alexander Spermann WS 2007/2008
Die Normalverteilung 3 Standardnormalverteilung mit=1 und =0 2=2,25 und =3 =2,25 und =1 2=1,44 und =0 2=4 und =0 Alexander Spermann WS 2007/2008
Stichprobe und Grundgesamtheit:Erwartungswert 1 Gezogene Zufallsstichproben der Grundgesamtheit sind: X1,X2,X3,…,Xn Der Stichprobenmittelwert ist dann: Es gilt, dass der Erwartungswert der Summe der Stichprobe gleich der Summe der Erwartungswerte ist: Da jede Zufallsstichprobe Xi den Mittelwert μX hat, können wir schreiben: Alexander Spermann WS 2007/2008
Stichprobe und Grundgesamtheit:Erwartungswert 2 Der Erwartungswert des Mittelwertes der Stichprobe ist dann: Also entspricht der Erwartungswert des Mittelwertes der Stichprobe dem Mittelwert der Grundgesamtheit. Das heißt, dass der Mittelwert der Stichprobe ein erwartungstreuer Schätzer für den Mittelwert der Grundgesamtheit ist. Alexander Spermann WS 2007/2008
Stichprobe und Grundgesamtheit:Erwartungswert 3 Erwartungswert des Schätzers = wahrer Wert, d.h. unverzerrt (unbiased). n = 100 Dichtefunktionen der Normalverteilung für wahre Stichprobenmittelwerte vom Umfang n=25 und n=100 Beobachtungen, mit der Standardabweichung=5. n=25 100 Alexander Spermann WS 2007/2008
Stichprobe und Grundgesamtheit:Erwartungswert 4 Beispiel: Es sollen Arbeitsteams aus jeweils 4 Beschäftigten mit Berufserfahrung von 2 bis 8 Jahren zusammengestellt werden. Es werden fünfzehn Stichproben von vier Beobachtungswerten aus einer Grundgesamtheit von sechs „Werten“: 2,4,6,6,7,8, gezogen. Der wahre Mittelwert (sample mean) dieser Grundgesamtheit ist der Durchschnitt dieser sechs Werte: μX =5,5 Alexander Spermann WS 2007/2008
Stichprobe und Grundgesamtheit:Erwartungswert 5 Die Häufigkeitsverteilung der Wahrscheinlichkeiten von Mittelwerten der Stichproben (sampling distribution of the sample mean) ist: Der Erwartungswert des Mittelwertes der Stichprobe entspricht dem Mittelwert der Grundgesamtheit: Alexander Spermann WS 2007/2008
Stichprobe und Grundgesamtheit:Varianz 1 Es werden n Beobachtungen X1,X2,X3,…,Xn aus der Grundgesamtheit zufällig gezogen, wobei der wahre Mittelwert und die wahre Varianz unbekannt sind. Die Varianz der Grundgesamtheit ist: Da aber μX unbekannt ist, wird es durch (= Mittelwert der Stichprobe) geschätzt. Die Varianz der Stichprobe lautet: Mit Hilfe dieser Definition der SXX² kann gezeigt werden, dass Das bedeutet, dass der erwartete Wert der Stichprobenvarianz der Varianz der Grundgesamtheit entspricht. Man sagt dann, dass der Schätzer für die Varianz erwartungstreu ist. Alexander Spermann WS 2007/2008
Kovarianz Kovarianz einer Stichprobe: • wegen der Approximation von µ durch und ŷ wird als „Kompensation“ durch (n-1), anstatt durch n dividiert, d.h es wird ein Freiheitsgrad „aufgegeben“. Alexander Spermann WS 2007/2008
Kovarianz einer Stichprobe – ein Beispiel Erläuterung: S : Anzahl der Jahre in Ausbildung Y : Stundenlohn in Dollar (1992) Quelle:Dougherty Alexander Spermann WS 2007/2008
Kovarianz einer Stichprobe – ein Beispiel Illustration der Kovarianz: Y S Quelle:Dougherty Interpretation von SSY2 = 15,294 : es liegt positiver Zusammenhang vor = 13,250 = 14,225 und Alexander Spermann WS 2007/2008
Vergleich Kovarianz und Korrelationskoeffizient – ein Beispiel Nach Multiplikation von Y mit 100, SSY‘2 = 1529,4 d.h. trotz Änderung der Dimension bleibt der Zusammenhang unverändert und wird lediglich in eine andere Größenordnung (*100) transformiert. Quelle: Dougherty Alexander Spermann WS 2007/2008