300 likes | 522 Views
Univariate Statistik. Graphische Darstellung. Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm. Häufigkeit des Geschlechts für n =55 Probanden. Kreisdiagramm. Häufigkeit der Geschwisterkinder bei n =55 Probanden. Stabdiagramm. Histogramm.
E N D
Graphische Darstellung • Kreisdiagramm • Stabdiagramm(Säulen-, Balkendiagramm) • Histogramm
Histogramm • Zur Darstellung eines stetigen (auf einer metrischen Skala gemessenen) Merkmals • Dazu wird die Messskala in Bereiche, die sogenannten Klassen, aufgeteilt. • Klassen müssen den gesamten Wertevorrat überdecken (Vollständigkeit). • Klassen dürfen sich nicht überschneiden (Disjunktheit). • Insbesondere ist festzulegen, zu welcher Klasse die einzelnen Klassengrenzen gehören.
Histogramm • Wird die untere Klasse zugeordnet linksgeschlossen Darstellung: [a1, a2) zur Klasse gehören alle Werte ab a1 bis unterhalb a2 • Wird die obere Klasse zugeordnet rechtsgeschlossen Darstellung: (a1, a2] zur Klasse gehören alle Werte oberhalb von a1 bis einschließlich a2
Empirische Verteilungsfunktion • Die Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über den konkreten Daten. • Eine graphische Veranschaulichung der Orginal-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion. • Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf der Ordinate angetragen. • Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.
Kenngrößen • Ziel ist es, typische Eigenschaften einer Messreihe mit wenigen Zahlen zu beschreiben. • Dadurch wird bewusst eine radikale Reduktion der in den konkreten Daten enthaltenen Information angestrebt. • Zur Beschreibung der Verteilung von Messwerten sollte immer ein Lagemaß und ein Streuungsmaß angegeben werden.
Lagemaße • Lagemaße • Mittelwert • Quantile • Median • Modalwert • Streuungsmaße • Spannweite • Standardabweichung/Varianz • Quartilsabstand • Variationskoeffizient Box-Whisker Plot
Lagemaße (Lageparameter) • Beschreiben die zentrale Tendenz der Daten
Mittelwert Mittelwerte
n 1 xj n j=1 _ x1 + x2 + ... + xn x = = n Mittelwert • Beschreibt den Schwerpunkt der Messwerte, wobei jeder einzelnen Beobachtung das gleiche Gewicht 1/n zukommt. Arithmetischer Mittelwert
_ 62 + 75 + ... + 125 x = = 92,4 52 Mittelwert • Mittelwert der Blutzuckerkonzentrationen von n = 52 Probanden • Berechnung des Mittelwertes: Arithmetischer Mittelwert
Mittelwert • Geometrischer Mittelwert: • Werte: 0,25, 0,5, 1, 2, 4, 8, 16
Mittelwert • Geometrischer Mittelwert: • Transformierte Werte (log2x + 9): 7, 8, 9, 10, 11, 12, 13 _ 7 + 8 + 9 + 10 + 11 + 12 + 13 x = = 10 7 Rücktransformation: 10 – 9 = 1 1 = log2 2 21 = 2 Mittelwert: 2
Quantile, Median • Ein p-Quantil ist dadurch gekennzeichnet, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert ist. • x, das 0,5-Quantil, Median genannt • Q1, das 0,25-Quantil, unteres Quartil genannt • Q3, das 0,75-Quantil, oberes Quartil genannt • Die 0,1-, 0,2 .... 0,9-Quantile heißen Dezile. • Die 0,01-, 0,02 .... 0,09-Quantile heißen Percentile. ~
(x (n x p) + x (n x p + 1) ) 1 2 Quantile, Median • Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen. • Zunächst wird das Produkt n x p berechnet. • Ist n x pkeine ganze Zahl, so ist das p-Quantil der k-te Wert x (k) der Rangliste, wobei k die auf n x p folgende ganze Zahl ist. • Falls n x peine ganze Zahl ist, so wird zur Bestimmung des p-Quantils zwischen den Werten x (n x p) und x (n x p + 1) interpoliert.
Quantile, Median • Median und Quartile derBlutzuckerkonzentrationen von n = 52 Probanden • Berechnung des Medians: • Position in der Rangliste n x p = 52 x 0,5 = 26 • Da 26 eine ganze Zahl ist, errechnet man den Median als den mittleren Messwert zwischen dem 26. und 27. Messwert der Rangliste. • Der mediane Blutzuckerwert beträgt (90 + 92) / 2 [mg/100 ml] = 91 [mg/100 ml]
Quantile, Median • Median und Quartile derBlutzuckerkonzentrationen von n = 52 Probanden • Berechnung des unteren Quartils: • Position in der Rangliste n x p = 52 x 0,25 = 13 • Da 13 eine ganze Zahl ist, errechnet man das untere Quartil als den mittleren Messwert zwischen dem 13. und 14. Messwert der Rangliste. • Q1 = (86 + 86) / 2 [mg/100 ml] = 86 [mg/100 ml] • Berechnung des oberen Quartils: • Q3 = (96 + 96) / 2 [mg/100 ml] = 96 [mg/100 ml]
Quantile, Median • Median derKörpergrößevon n = 53 Probanden • Berechnung des Medians: • Position in der Rangliste n x p = 53 x 0,5 = 26,5 • Da 26,5 keine ganze Zahl ist, ist der 27. Messwert der Rangliste der Median • Der mediane Körpergröße beträgt 172 cm
Modalwert • Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. • Er ist nur sinnvoll, wenn er eindeutig ist. • Modalwertder Blutzuckerkonzentrationen von n = 52 Probanden: • Die Werte 84 und 92 wurden jeweils sechs mal bestimmt. • Der häufigste Messwert ist nicht eindeutig und der Modalwert damit nicht bestimmbar.
Modalwert, Median, Mittelwert • Der Modalwert ist ein sehr einfach bestimmbares Lagemaß. • Der Vorteil des Medians gegenüber dem Mittelwert liegt vor allem darin, dass er durch einzelne „Ausreißer“ nicht beeinflusst wird. • Insofern ist der Median ein robustes Maß. • Ein Vorteil des Mittelwertes besteht darin, dass mit ihm Rechenoperationen durchgeführt werden können.