1 / 45

STATISIK

STATISIK. LV Nr.: 1375 SS 2005 1.März 2005. Literatur. Bleymüller, Gehlert, Gülicher: „Statistik für Wirtschaftswissenschaftler“, Verlag Vahlen Hartung: „Statistik. Lehr- und Handbuch der angewandten Statistik“, Oldenburg Verlag München Wien. Einführung .

dara
Download Presentation

STATISIK

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISIK LV Nr.: 1375 SS 2005 1.März 2005

  2. Literatur • Bleymüller, Gehlert, Gülicher: „Statistik für Wirtschaftswissenschaftler“, Verlag Vahlen • Hartung: „Statistik. Lehr- und Handbuch der angewandten Statistik“, Oldenburg Verlag München Wien

  3. Einführung • „Statistik“: Abgeleitet vom neulateinischen Begriff „status“ (Bed.: „Staat“, „Zustand“) • 18. und 19. Jhdt: „Lehre von der Zustandsbeschreibung des Staates“ (Sammeln und verbales oder numerisches Beschreiben von Daten) • Heute: im doppelten Sinne gebraucht • Quantitative Informationen (z.B. Bevölkerungsstatistik) • Formale Wissenschaft

  4. Einführung Statistik befasst sich mit • Erhebung (Sammeln von Daten. Wie kommt man zu der benötigten Information?) • Aufbereitung (Präsentation; Reduktion von Daten, wobei ein Großteil der Information erhalten bleiben soll; wenige Kenngrößen; einfache Grafiken) • Analyse (Welche Schlüsse kann man ziehen? Allgemeine Aussagen basierend auf Stichproben?) von (numerischen) Daten.

  5. Einführung • Warum Statistik? • Entscheidungshilfe z.B. 2 verschiedene Produkte – welches soll am Markt eingeführt werden? • Tieferes Verständnis bei Problemen z.B. Welche Faktoren beeinflussen die Kaufentscheidung? Richtung des Einflusses?

  6. Einführung • Wie Statistik? • Planung (Untersuchungsziel, Organisation, ...) • Erhebung • Befragung (schriftlich, mündlich) • Beobachtung (in Wirtschaftswissenschaften selten) • Experiment (v.a. Naturwissenschaften) • Automatische Erfassung (z.B. Scannerkassen) • Aufbereitung (Verdichtung der Daten) • Analyse (deskriptive u. induktive Methoden) • Interpretation

  7. Deskriptive Statistik beschreibende Statistik Beschreibung und Zusammenfassung Darstellung von Daten (Tabellen u. Grafiken) Kennzahlen (z.B. Mittelwerte, Streuungs-maße) Induktive Statistik schließende Statistik Von Stichproben auf Grundgesamtheiten Schätzer Tests Entscheidungstheorie Multivariate Methoden Deskriptiv - Induktiv

  8. Statistische Daten • Von Interesse sind nie einzelne elementare Objekte (statistische Einheiten, Elemente) sondern immer Mengen von Elementen (statistische Gesamtheiten, statistische Massen). • Reale und hypothetische Gesamtheiten z.B. Bevölkerung eines Staates, Menge der Ergebnisse eines theoretisch fortlaufend ausgespielten Würfels • Endliche und unendliche Gesamtheiten

  9. Statistische Daten • Bestandsmassen (Streckenmassen): • Objekte mit Lebensdauer • Werden zu einem Zeitpunkt erfasst • z.B. Einwohner Österreichs am 1.1.2005, Lagerbestand am 31.12.2004 • Bewegungs- oder Ereignismassen (Punktmassen) • Ereignisse • Werden innerhalb einer Zeitspanne erfasst • z.B. Geburten in Österreich im Jahr 2004, bei einer Bank eingegangene Schecks im April 2004

  10. Statistische Daten • Beziehung Bestands- und Bewegungsmasse: Für jedes Element einer Bestandsmasse stellt der Beginn und das Ende der Existenz ein Ereignis dar • Fortschreibungsformel: Anfangsbestand + Zugang – Abgang = Endbestand Bestandsmasse Bewegungsmasse

  11. Statistische Daten • Angehörige der Massen: Merkmalsträger / Beobachtungseinheit (Personen, Objekte) • Erhoben werden Werte von Merkmalen / Variablen (Merkmalsausprägungen) der Merkmalsträger • (statistische) Population: Gesamtheit aller Beobachtungseinheiten Bsp: Haarfarbe = Merkmal, Person X = Merkmalsträger, blond = Merkmalsausprägung des Merkmals Haarfarbe des Merkmalsträgers X

  12. Datenerhebung • Vollerhebung Es werden Daten von allen Elementen der Population erhoben. • Stichprobenerhebung Es werden Daten von einer Teilmenge (Stichprobe) der Population erhoben.

  13. Datenerhebung • Messen von Merkmalsausprägungen • Kriterien für Messungen: • Objektivität das zu ermittelnde Merkmal wird eindeutig festgestellt, Ergebnis ist unabhängig von der Person die misst • Validität (Gültigkeit) Messinstrument misst was es messen soll • Reliabilität (Zuverlässigkeit) Ergebnis der Messung wird exakt festgestellt, bei mehrmaligem Messen (approximativ) gleiches Ergebnis

  14. Statistische Merkmale • Qualitative Merkmale • Messen durch Klassifikation (z.B. Geschlecht) • Quantitative Merkmale • Messen durch Zählen (z.B. Alter, Körpergröße) • Diskrete Merkmale • Messen mit ganzen Zahlen (z.B. Anzahl Familienmitglieder) • Stetige Merkmale • Messen mit reellen Zahlen (z.B. Körpergröße)

  15. Merkmalsskalen • Nominalskala • Werte unterliegen keiner Rangfolge und sind nicht vergleichbar (z.B. Farbe, Geschlecht, ...) • Ordinalskala • Werte unterliegen einer Rangfolge, Abstände zw. verschiedenen Ausprägungen lassen sich nicht interpretieren (z.B. Schulnoten, Güteklassen, ...) • Intervallskala • Rangfolge, Abstände zw. verschiedenen Ausprägungen sind interpretierbar (z.B. Temperatur in Grad Celsius, Kalenderzeitrechung, ...) • Verhältnisskala • Rangfolge, interpretierbare Abstände, absoluter Nullpunkt (z.B. Körpergröße, Alter)

  16. Merkmalsskalen Zulässige Transformationen (informationserhaltend) • Nominalskala: symmetrische Transformationen nur Änderung der Klassenbezeichnungen • Ordinalskala: streng monotone Transformationen x*=f(x) so dass für x1< x2 auch x1*< x2* • Intervallskala: lineare Transformationen x*=ax + b (a > 0) • Verhältnisskala: Ähnlichkeitstransformationen x*=ax (a > 0)

  17. Empirische Verteilungen Häufigkeitsverteilung • Beobachtete Daten, n Untersuchungseinheiten, Merkmal X • k Merkmalsausprägungen (x1, ..., xk) • j-te Untersuchungseinheit (j=1,...,n), Ausprägung xi (i=1,...,k) • Liste der beobachteten Merkmalsaus-prägungen: Beobachtungsreihe oder Urliste

  18. Empirische Verteilungen • Absolute Häufigkeiten: hi = „Anzahl der Elemente, welche Merkmalsausprägung xi besitzen“, i=1,...,k hi [0,n] und Σi hi = n (i=1,...,k) • Relative Häufigkeit: fi = 1/n·hi fi [0,1] und Σi fi = 1 (i=1,...,k) • Vorsicht: Anzahl der möglichen Werte oft  Anzahl der tatsächlichen Werte

  19. Empirische Verteilungen • Diskrete Merkmale: Einzelwerte • Stetige Merkmale: Klasseneinteilung • In beiden Fällen werden Häufigkeiten gezählt. • Sind xi Zahlen, werden sie ansteigend geordnet.

  20. Darstellungsformen • Tabelle Häufigkeitsverteilung

  21. Darstellungsformen • Grafik: Balkendiagramm für absolute und relative Häufigkeiten gleich – Skalierung der y-Achse

  22. Darstellungsformen • Grafik: Histogramm

  23. Darstellungsformen • Balkendiagramm: Abstand zwischen den Balken. Die Höhe stellt die Häufigkeit dar. • Histogramm: Kein Abstand zwischen den Balken. Bei ungleich breiten Klassen ist die Fläche – nicht die Höhe – Maß für die Häufigkeit. Die Balkenhöhe entsteht durch Division von Häufigkeit und Klassenbreite (Höhe=hi/bi).

  24. Darstellungsformen • Tortendiagramm

  25. Darstellungsformen Stetige Merkmale: • Klassen bilden • Klassengrenzen: x0, x1, ..., xk • Häufigkeiten hi: Anzahl der Werte zwischen xi-1 und xi. Liegt ein Wert genau auf der Klassengrenze, wird er üblicherweise der unteren Klasse zugerechnet

  26. Summenhäufigkeitsfunktion • Absoluten Summenhäufigkeiten Hi: • Fortlaufende Summierung (Kumulierung) der absoluten Häufigkeiten. • Hi Anzahl der Elemente mit Merkmalswert  xi. • Hi = h1+h2+...+hi = Σj hj für j=1,...,i und i=1,...,k • Relative Summenhäufigkeiten Fi: • Fortlaufende Summierung der relativen Häufigkeiten. • Fi = f1+f2+...+fi = Σj fj für j=1,...,i und i=1,...,k • Fi = Hi/n für i=1,...,k

  27. Summenhäufigkeitsfunktion • Häufigkeiten aus Summenhäufigkeiten berechnen: hi = Hi – Hi-1 (i=1,...,k) fi = Fi – Fi-1 (i=1,...,k) wobei H0 = F0 = 0

  28. Summenhäufigkeitsfunktion • Summenhäufigkeitsfunktion - empirische Verteilungsfunktion F(x) - wird aus Summenhäufigkeiten bestimmt. F(x) gibt den Anteil der Elemente mit einem Merkmalswert  x an. 0 für x < x1 F(x) = Fi für xi  x < xi+1 (i=1,...,k-1) 1 für x  xk

  29. Summenhäufigkeitsfunktion • Diskrete Merkmale

  30. Summenhäufigkeitsfunktion • Stetige Merkmale

  31. Maßzahlen • Parameter, Kollektivmaßzahlen • Lageparameter (Mittelwerte) • Streuungsparameter (Variabilitätsmaße, Variationsmaße) • Schiefe • Wölbung

  32. Lagemaße und Mittelwerte • Eigenschaften: • Liegen zwischen Minimum und Maximum der Daten • Wenn alle Daten derselben linearen Transformation unterworfen werden, macht auch das Lagemaß diese Transformation mit • Harmonisches und geometrisches Mittel sind keine Lagemaße im strengen Sinn

  33. Lagemaße und Mittelwerte • Arithmetisches Mittel • Median • Modus • Geometrisches Mittel • Harmonisches Mittel • Quantile

  34. Arithmetisches Mittel • Mittelwert, durchschnittlicher Wert. • Für metrisch skalierte Merkmale. • a1,...,an beobachtete Merkmalswerte eines Merkmals X

  35. Arithmetisches Mittel Eigenschaften (Betrachte Einzelwerte ai (i=1,...,n)): • Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0 • Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

  36. Arithmetisches Mittel • Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte Lineare Transformation: • Arithmetische Mittel von zwei oder mehr Teilgesamtheiten:

  37. Arithmetisches Mittel • Gewogenes (gewichtetes) arithmetische Mittel • Gewichte w1, ..., wn mit 0wi1 und Σiwi=1 • Für w1=...= wn=1/n ergibt sich das gewöhnliche arithmetische Mittel

  38. Median • Median (Zentralwert): mindestens 50% der Beobachtungen ai nehmen eine Wert größer oder gleich bzw. kleiner oder gleich dem Median an. • Sind a1... an der Größe nach geordnet, ist der Median x̃0,5: x((n+1)/2) n ungerade x̃0,5 = ½(x(n/2)+x(n/2+1)) n gerade

  39. Median • Häufigkeitsverteilung: Median ist diejenige Merkmalsausprägung, bei der die Summenhäufigkeitsfunktion den Wert 0,5 überschreitet. • Klassifizierte Daten: Der Median liegt in der Klasse, in der die Summenhäufigkeitsfunktion den Wert 0,5 erreicht.

  40. Modalwert • Modalwert (Modus, häufigster Wert, dichtester Wert): Gibt die Ausprägung an, die die größte Häufigkeit in der Beobachtungsreihe besitzt. • Für nominal skalierte Daten geeignet. • Es gilt: h(xmod)  h(xi) für alle Merkmalsausprägungen xi,...,xk. • Klassifizierte Daten: Modalwert ist definiert als Klassenmitte der am dichtesten besetzten Klasse.

  41. Geometrisches Mittel • Voraussetzung: Daten verhältnisskaliert • n Einzelwerte a1, ..., an • Merkmalsausprägungen relative Änderungen (z.B. Lohnerhöhung in %) • Geometrisches Mittel:

  42. Geometrisches Mittel • Gewogenes (gewichtetes) geometrische Mittel • Gewichte w1, ..., wn mit 0wi1 und Σiwi=1 • Für w1=...= wn=1/n ergibt sich das gewöhnliche geometrische Mittel

  43. Harmonisches Mittel • Beobachtungswerte a1,...,an • Gewogenes harmonisches Mittel • Gewichte w1, ..., wn mit 0wi1 und Σiwi=1 • Für w1=...= wn=1/n ergibt sich das gewöhnliche harmonische Mittel

  44. Mittel • Vergleich arithmetische- geometrisches- und harmonisches Mittel: • Bei positiven Beobachtungswerten a1,...,an gilt stets die Beziehung • Bei identischen Beobachtungen a1=...=an sind die Mittel gleich.

  45. Quantile • Geordnete Beobachtungsreihe a(1)...a(n) • α-Quantil a(k) falls n·α keine ganze Zahl (k ist die auf n·α folgende ganze Zahl) ãα= 1/2 (a(k)+a(k+1)) falls n·α ganze Zahl k=n·α • Spezielle Quantile: • Median = 0,5-Quantil • Unteres Quartil = 0,25-Quantil • Oberes Quartil = 0,75-Quantil

More Related