480 likes | 624 Views
STATISIK. LV Nr.: 1375 SS 2005 3.März 2005. Streuungsmaße. Varianz Standardabweichung Variationskoeffizient Mittlere absolute Abweichung Spannweite Quartilsabstand Schiefe Wölbung. Varianz. Beobachtungswerte a 1 ,...,a n (metrisch skaliert)
E N D
STATISIK LV Nr.: 1375 SS 2005 3.März 2005
Streuungsmaße • Varianz • Standardabweichung • Variationskoeffizient • Mittlere absolute Abweichung • Spannweite • Quartilsabstand • Schiefe • Wölbung
Varianz • Beobachtungswerte a1,...,an (metrisch skaliert) • Streuungsmaß: Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel • Varianz (Mittlere quadratische Abweichung)
Varianz • Nicht Summe der Abweichungen von ai von ihrem arithm. Mittel, da gilt: • Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
Varianz • Verschiebungssatz (Beziehung zw. MQ(M) und Varianz): • Das bedeutet: • MQ(M) Varianz • MQ(M) = σ² wenn M = arithm. Mittel • Minimumeigenschaft des arithm. Mittels.
Varianz • Rechenvereinfachung: • Liegt eine Häufigkeitsverteilung vor: k Merkmalswerte x1,...,xk mit abs. Häufigkeiten hi bzw. rel. Häufigkeiten fi (i=1,...,k) • Varianz:
Varianz • Klassifizierte Daten: Häufigkeitsverteilung • Varianz näherungsweise berechnen, statt der Merkmalswerte xi werden die Klassenmitten xi´ verwendet:
Varianz • Bei unimodalen Verteilungen, ist die Varianz, die aus den klassifizierten Daten berechnet wird, größer als die Varianz, die aus den Einzelwerten berechnet wird. • Bei konstanten Klasseneinteilungen (Δx): Sheppardsche Korrektur: σ² ... die aus den klassifizierten Daten näherungsweise bestimmte Varianz
Varianz • Dimension: Quadrat der Dimension der einzelnen Beobachtungen • Eigenschaft: Varianz immer 0 • Ist Varianz = 0, liegt keine Streuung vor, alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel.
Standardabweichung • Quadratwurzel der Varianz
Varianz & Standardabweichung Eigenschaften: • Lineare Transformation der Einzelwerte ai: ai*=α+βai (i=1,...,n) • Dann: Varianz: Standardabweichung: • Sonderfall: β=1 (Transformation ai*=α+ai) σ*² = σ² und σ* = σ
Varianz & Standardabweichung • Eigenschaften: • Varianz einer Grundgesamtheit, die aus 2 Teilgesamtheiten (n1, n2) besteht: mit
Varianz & Standardabweichung • Standardisierung: • Spezielle lineare Transformation • Bildet aus Einzelwerten ai standardisierte Werte zi, indem von jedem ai das arithm. Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird. • Arithm. Mittel der zi immer 0, • Varianz der zi immer 1.
Variationskoeffizient • Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen • Relatives Streuungsmaß (für verhältnis-skalierte Merkmale mit ausschließlich positiven Merkmalswerten), bezieht die Standardabweichung σ (absolutes Streuungsmaß) auf das arithm. Mittel μ.
MAD Mittlere absolute Abw. • Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (z.B. arithm. Mittel oder Median) • Minimumeigenschaft des Medians: M beliebiger Wert
MAD • Häufigkeitsverteilung der Daten • MAD bezogen auf Mittelwert μ • MAD aus Häufigkeitsverteilung von klassifizierte Daten: Merkmalswerte xi durch Klassenmitten xi´ ersetzen.
Spannweite (Range) • Abstand zw. dem größten und dem kleinsten Wert. • Einzelwerte der Größe nach ordnen: a[1],…,a[n] R = a[n] - a[1] • Häufigkeitsverteilung von k Merkmalsausprägungen: R = xk - x1 • Häufigkeitsverteilung von klassifizierten Daten: R = xko - x1u • Spannweite ist instabil gegenüber Ausreißern
Quartilsabstand • Quartile Q1, Q2 (=Median), Q3 teilen die Gesamtheit in 4 gleich große Teile. • α-Quantil: a(k) falls n·α keine ganze Zahl (k die auf n·α folgende ganze Zahl) ãα= 1/2 (a(k)+a(k+1)) falls n·α ganze Zahl k=n·α • Quartilsabstand (Interquartile Range) definiert als Spannweite der 50% mittleren Werte: QA = Q3 – Q1 • Eigenschaft: stabil gegenüber Ausreißern
Schiefe • Gibt Richtung (rechts- oder linksschief) und Größenordnung der Schiefe einer eingipfligen Häufigkeitsverteilung an. < 0 linksschiefe g1 = 0 symmetrisch > 0 rechtsschiefe • Kein direkter Streuungsparameter
Schiefe • Schiefe einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten • Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen führen.
Wölbung • Wölbung od. Kurtosis od. Exzeß: Maßzahl für eingipflige Häufigkeitsvt. • Gibt an, ob (bei gleicher Varianz) das absolute Maximum der Häufigkeitsvt. größer als bei der Dichte der Normalvt. ist.
Wölbung < 0 abs. Max. kleiner als bei N-Vt. g2 = 0 Normalverteilung > 0 abs. Max. größer als bei N-Vt. • Wölbung einer Häufigkeitsverteilung aus gruppierten Daten (k Klassen): Verwendung der Klassenmittel od. der Klassenmitten
Konzentrationsmaße • Metrisch skaliertes Merkmal X mit nur positiven Ausprägungen • Frage: Wie teilt sich die Summe der Merkmalswerte x1,…,xn in der Beobachtungsreihe auf die Untersuchungs-einheiten auf? • Bsp: n landwirtschaftliche Betriebe, Größe der Nutzflächen: x1,...,xn. Wie teilt sich die gesamte Nutzfläche auf die einzelnen Betriebe auf?
Konzentrationsmaße • n Merkmalswerte werden durch q Merkmalsausprägungen a1<...<aq mit absoluten- und relativen Häufigkeiten hi bzw. fi bestimmt. • Gesamtbetrag der Merkmalswerte in der Beobachtungsreihe:
Konzentrationsmaße • Lorenzkurve: Grafische Darstellung der Konzentration der Merkmalswerte • Koordinatenkreuz: • Abszisse: es werden die nach der Größe der Merkmals-ausprägung geordneten relativen Häufigkeiten aufsummiert • Ordinate: Ausprägungen werden der Größe nach aufsummiert und auf Summe aller Ausprägungen bezogen
Konzentrationsmaße • Bsp: landwirtschaftliche Betriebe • Abszisse: Es wird der Prozentsatz der Betriebe mit der kleinsten Fläche bestimmt, dann wird der Prozentsatz der Betriebe mit der zweit-kleinsten Fläche bestimmt und zum Prozentsatz der Betriebe mit der kleinsten Fläche addiert, usw. • Ordinate: Flächenanteile der Betriebe bzgl. der Gesamtfläche werden der Flächengröße nach aufsummiert.
Konzentrationsmaße • Verbinden der Punkte (ki,li) ergibt die Lorenzkurve, wobei immer k0=l0=0 und kq=lq=1 gilt. 1 li 0 1 ki
Konzentrationsmaße • Interpretation: ein Punkt (ki,li) der Lorenz-kurve gibt an, dass auf ki · 100% der Untersuchungseinheiten li · 100% des Gesamtbetrages aller Merkmalsaus-prägungen entfallen. • Bsp: auf ki · 100% der landwirtschaftlichen Betriebe entfallen li · 100% der gesamten Nutzfläche
Konzentrationsmaße Extremfälle: • Keine Konzentration, alle Untersuchungs-einheiten haben den gleichen Anteil am Gesamtbetrag. Lorenzkurve ist Diagonale. • Gesamtbetrag konzentriert sich (fast) vollständig auf eine Untersuchungseinheit. Lorenzkurve liegt (fast) auf Abszisse, ist also (fast) senkrecht.
Konzentrationsmaße • Gini-Koeffizient od. Lorenzsche Konzentrationsmaß (LKM): Maßzahl für die Konzentration. • Definiert als das 2-fache der Fläche F zw. Diagonale und Lorenzkurve. LKM = 2F. • Es gilt immer: 0 LKM(n-1)/n • Standardisierter Gini-Koeffizient: LKMnor = n/(n-1) LKM
Verhältniszahlen • Quotient zweier Maßzahlen: Verhältniszahl • Gliederungszahlen • Man bezieht eine Teilgröße auf eine ihr übergeordnete Gesamtgröße • Beziehungszahlen • Quotient zweier sachlich sinnvoll in Verbindung stehender Maßzahlen • Index-Zahlen • Quotient zweier Maßzahlen gleicher Art
Gliederungszahlen • Gliederungszahlen • Bsp: Tagesproduktion 1500 Teile, davon 300 fehlerhaft. Dann sind 20% der Tagesproduktion Ausschuss (300/1500·100). Ausschussanteil ist eine Gliederungszahl
Beziehungszahlen • Beziehungszahlen: • Verursachungszahlen: Bezieht Bewegungsmassen auf die zugehörigen Bestandsmassen. • Entsprechungszahlen: Alle Beziehungszahlen, bei denen man Ereignisse nicht auf ihren Bestand beziehen kann.
Beziehungszahlen • Bsp Verursachungszahlen: Geburtenziffer Bestandsmasse: Einwohner einer Stadt (E) Bewegungsmasse: Zahl der Lebend-geborenen (L) G = (L/E)*1000 Sagt, wie viele Geburten auf 1000 Einwohner einer Stadt entfallen.
Beziehungszahlen • Bsp Entsprechungszahlen: Schüler-Lehrer-Verhältnis (Zahl der Schüler) / (Zahl der Lehrer) Sagt, wie viele Schüler (ungefähr) auf eine Lehrer entfallen. Dies entspricht aber i.A. nicht der durchschnittlichen Klassengröße.
Indexzahlen • Indexzahlen: Es werden zwei Maßzahlen der gleichen Art in Beziehung gesetzt. • Messzahlen oder Einfache Indizes • Die zugehörigen Maßzahlen beschreiben eine realen Sachverhalt. • (Zusammengesetzte) Indexzahlen • Eine der Maßzahlen ist eine Zahl, die einen fiktiven Zustand beschreibt.
Indexzahlen • Einfache Indizes: • Reihe von Maßzahlen, die man in Beziehung zueinander setzen will. x0,...,xt Maßzahlen zu Zeitpunkten t, x0 Maßzahl zum Basiszeitpunkt 0. Dann ist I0t = xt / x0 für t = 0, 1, 2, ... eine Zeitreihe einfacher Indizes
Indexzahlen • Messzahlen werden oftmals mit 100 multipliziert. • Bsp: Umsatz im Jahr 5, bezogen auf Jahr 0: I05·100 = x5/x0· 100 = 87 D.h. dass 87% des Umsatzes im Basisjahr im Jahr 5 umgesetzt werden. Oder: Es liegt eine Minderung des Umsatzes um 13% vor. • Vergleich von I05·100=87 mit I06·100=90: Der Umsatz ist um 3 Prozentpunkte gestiegen.
Indexzahlen • Umbasieren: Gegeben: Indizes I0t zur Basisperiode 0 Gesucht: Indizes Ikt zur Basisperiode k Berechung ohne Ursprungsdaten: • Verkettung: Wenn für xt I0t berechnet werden soll, und x0 nicht bekannt ist. I0t = I0k· Ikt
Indexzahlen • Zusammengesetzte Indexzahlen (Indizes): • Betrachte Warenkorb: n Waren zu einem Zeitpunkt t Mengen qt1,...,qtn Preise pt1,...,ptn Wert des Warenkorbes in Periode t:
Indexzahlen • Wertindex: Vergleich Wert eines Warenkorbes zur Berichtsperiode t mit dem zur Basisperiode 0
Indexzahlen • Preisindizes: • Aussagen über die Preisentwicklung • Für verschiedene Perioden das gleiche Mengenschema verwenden
Indexzahlen • Preisindex nach Paasche • Man vergleicht den Wert eines Warenkorbes qt1,...,qtn zur jeweiligen Berichtsperiode t mit dem Wert, den dieser unter der Preissituation zur Basisperiode gehabt hätte.
Indexzahlen • Preisindex nach Laspeyres • Der Warenkorb q01,...,q0n der Basisperiode 0 wird für alle Berichtsperioden zugrundegelegt und ihr fiktiver Wert zur Berichtsperiode t wird mit seinem Wert zur Basisperiode verglichen.
Indexzahlen • Vergleich Preisindizes nach Paasche und Laspeyres: • L: Warenkorb muss nur für Basisperiode bestimmt werden, Kosten (+) Aktualität (-) • P: Warenkorb muss für Berichtsperioden bestimmt werden, Kosten (-) Aktualität (+) • Vergleich. Sind Abweichungen groß, muss der Warenkorb neu festgelegt werden. • Fishersche Idealindex:
Indexzahlen • Mengenindizes: • Aussagen über Mengenentwicklung (unabhängig von der Preisentwicklung)
Indexzahlen • Mengenindex nach Paasche • Standardisierung nach den Preisen zur Berichtsperiode
Indexzahlen • Mengenindex nach Laspeyres • Standardisierung nach den Preisen zur Basisperiode