640 likes | 816 Views
Rechenregeln für Mittelwert, Varianz und Streuung. Rechenregeln für Mittelwert, Varianz und Streuung. Berechnung von Streuungsparametern an einem einfachen Beispiel. Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve). Konzentrationsmaße. Kennwert für die wirtschaftliche Konzentration.
E N D
Berechnung von Streuungsparametern an einem einfachen Beispiel
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des Geldvermögens unter den einzelnen Bevölkerungsgruppen Verteilung von Marktanteilen Aufteilung der landwirtschaftlichen Nutzflächen in einer Region
Ein Markt wird von 5 Unternehmen beliefert. Die folgende Tabelle beschreibt die Aufteilung der Marktanteile:
Daraus ergeben sich die folgenden Werte für die Punkte auf der Lorenz-Kurve:
Die Punkte auf der Lorenz-Kurve sind (0,2;0,04), (0,4;0,10), (0,6;0,20),(0,8;0,40) (0,2;0,05), (0,4;0,10), (0,6;0,20),(0,8;0,40) (0,2;0,04), (0,4;0,15), (0,6;0,20),(0,8;0,40) (0,2;0,04), (0,4;0,10), (0,6;0,20),(0,8;0,45)
Der Gini-Koeffizient in (a) beträgt G = 0,304 G = 0,504 G = 0,604 G = 0,496
Die Punkte auf der Lorenz-Kurve (gerundet) sind (0,1667;0,0278), (0,3333;0,0741), (0,5;0,2667); (0,6667;0,4982), (0,8533;0,6297) (0,1667;0,0278), (0,3333;0,0741), (0,5;0,1667); (0,6667;0,3982), (0,8333;0,6297) (0,1667;0,3278), (0,3333;0,0741), (0,5;0,1667); (0,6667;0,3982), (0,9333;0,6297) (0,1667;0,0278), (0,5333;0,0741), (0,5;0,3667); (0,6667;0,3982), (0,8333;0,7297)
Der Gini-Koeffizient beträgt rund G = 0,841 G = 0,401 G = 0,600 G = 0,499
Betriebe und hinterzogene Steuer Kontingenztabelle Y: Art der hinterzogenen Steuer 1 = Lohnsteuer 2 = Einkommenssteuer 3 = Umsatzsteuer 4 = Sonstiges X: Art des Betriebes 1 = Handelsbetriebe 2 = Freie Berufe (Leistungsbetriebe) 3 = Fertigungsbetriebe
Kovarianz Merkmal Datensatz Merkmal Datensatz
Korrelationskoeffizient nach Bravais-Pearson Kovarianz (X,Y) (Streuung X) (Streuung Y)
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig
X größer Y größer X größer Y kleiner
Positiverstrikter Zusammenhang Negativerstrikter Zusammenhang
Korrelationskoeffizient bei verschiedenen Konstellationen von Ausprägungen
Korrelationskoeffizient: 0.905 Korrelationskoeffizient: 1.00
Korrelationskoeffizient: 0.19 Korrelationskoeffizient: 0.52
Korrelationskoeffizient: -0.14 Korrelationskoeffizient: 0.00
Korrelationskoeffizient: -1.00 Korrelationskoeffizient: -0.62
Es ergibt sich ein Korrelationskoeffizient von rund r = 0,978 r = 0,798 r = 0,879 r = 0,987
Mögliche Funktionenklassen für die Regressionsrechnung
Lineare Funktionen Polynome Exponentialfunktionen (Exponentielles Wachstum; x ist die Zeit) Gompertz-Kurven Logistische Funktionen
Prinzip der kleinsten Quadrate (Kleinst-Quadrat-Schätzung) Man sucht in der betrachteten Klasse diejenige Funktion f, so dass die Summe der Abweichungsquadrateminimiert wird: Bestimme f, so dass minimal !!
Aufgaben der Regressionsrechnung 1. Extrapolation Stellt man sich für den Moment x als die Zeit vor, so möchte man die beobachteten Werte auf die „Zukunft“ extrapolieren. Man erstellt eine „Prognose“. Dazu bedient man sich der gefundenen Funktion f, um für eine „Zeit“ x der „Zukunft“ den Wert y = f(x) zu schätzen.
2. Interpolation Man interessiert sich für den Wert von y = f(x) Für Zwischenwerte von x, d. h. für Werte x, die zwischen 2 beobachteten Werten liegen: Wieder bedient man sich der Funktion f, um eine Interpolation der Werte durchzuführen.
Lineare Regression Finde reelle Zahlen a und b, so dass der Wert von minimal wird! Mit anderen Worten: Finde den „Punkt“ (a ,b), an dem die Funktion ihr Minimum annimmt!
Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei
Bestimmtheitsmaß Maß für die Güte der Anpassung der Daten an die Regressionsfunktion Dabei ist
Im Falle linearer Regression ist das Bestimmtheitsmaß gleich dem Quadrat des Korrelationskoeffizienten nach Bravais-Pearson!
In einem Kaufhauskonzern mit 10 Filialen soll die Wirkung von Werbeausgaben auf die Umsatzsteigerung untersucht werden. Die Daten sind: X: Werbeausgaben in 1000 Euro Y: Umsatzsteigerung in 10 000 Euro
Demonstrationsbeispiel Lineare Regression Varianzen Mittelwerte Kovarianz
Steigung der Regressionsgeraden Schnitt der Regressionsgeraden mit der y-Achse bei
Die Regressinsgerade wird durch die folgende Geradengleichung wiedergegeben y = 3,45 x + 4,7 y = 2,3 x + 2,6 y = 0,651 x + 62,66 y = 2,422 x + 7,67
Das Bestimmtheitsmaß der linearen Regression ergibt sich zu ca. 0,48 1,67 0,89 0,21