1 / 28

Univariate Statistik

Univariate Statistik. Graphische Darstellung. Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm. Häufigkeit des Geschlechts für n =55 Probanden. Kreisdiagramm. Häufigkeit der Geschwisterkinder bei n =55 Probanden. Stabdiagramm. Histogramm.

desma
Download Presentation

Univariate Statistik

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Univariate Statistik

  2. Graphische Darstellung • Kreisdiagramm • Stabdiagramm(Säulen-, Balkendiagramm) • Histogramm

  3. Häufigkeit des Geschlechtsfür n=55 Probanden

  4. Kreisdiagramm

  5. Häufigkeit der Geschwisterkinderbei n=55 Probanden

  6. Stabdiagramm

  7. Histogramm • Zur Darstellung eines stetigen (auf einer metrischen Skala gemessenen) Merkmals • Dazu wird die Messskala in Bereiche, die sogenannten Klassen, aufgeteilt. • Klassen müssen den gesamten Wertevorrat überdecken (Vollständigkeit). • Klassen dürfen sich nicht überschneiden (Disjunktheit). • Insbesondere ist festzulegen, zu welcher Klasse die einzelnen Klassengrenzen gehören.

  8. Histogramm • Wird die untere Klasse zugeordnet linksgeschlossen Darstellung: [a1, a2) zur Klasse gehören alle Werte ab a1 bis unterhalb a2 • Wird die obere Klasse zugeordnet  rechtsgeschlossen Darstellung: (a1, a2] zur Klasse gehören alle Werte oberhalb von a1 bis einschließlich a2

  9. Häufigkeiten des systolischen Blutdrucks der n=55 Probanden

  10. Histogramm

  11. Empirische Verteilungsfunktion • Die Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über den konkreten Daten. • Eine graphische Veranschaulichung der Orginal-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion. • Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf der Ordinate angetragen. • Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.

  12. Empirische Verteilungsfunktion

  13. Kenngrößen

  14. Kenngrößen • Ziel ist es, typische Eigenschaften einer Messreihe mit wenigen Zahlen zu beschreiben. • Dadurch wird bewusst eine radikale Reduktion der in den konkreten Daten enthaltenen Information angestrebt. • Zur Beschreibung der Verteilung von Messwerten sollte immer ein Lagemaß und ein Streuungsmaß angegeben werden.

  15. Lagemaße • Lagemaße • Mittelwert • Quantile • Median • Modalwert • Streuungsmaße • Spannweite • Standardabweichung/Varianz • Quartilsabstand • Variationskoeffizient Box-Whisker Plot

  16. Lagemaße (Lageparameter) • Beschreiben die zentrale Tendenz der Daten

  17. Mittelwert Mittelwerte

  18. n 1  xj n j=1 _ x1 + x2 + ... + xn x = = n Mittelwert • Beschreibt den Schwerpunkt der Messwerte, wobei jeder einzelnen Beobachtung das gleiche Gewicht 1/n zukommt. Arithmetischer Mittelwert

  19. _ 62 + 75 + ... + 125 x = = 92,4 52 Mittelwert • Mittelwert der Blutzuckerkonzentrationen von n = 52 Probanden • Berechnung des Mittelwertes: Arithmetischer Mittelwert

  20. Mittelwert • Geometrischer Mittelwert: • Werte: 0,25, 0,5, 1, 2, 4, 8, 16

  21. Mittelwert • Geometrischer Mittelwert: • Transformierte Werte (log2x + 9): 7, 8, 9, 10, 11, 12, 13 _ 7 + 8 + 9 + 10 + 11 + 12 + 13 x = = 10 7 Rücktransformation: 10 – 9 = 1 1 = log2 2 21 = 2 Mittelwert: 2

  22. Quantile, Median • Ein p-Quantil ist dadurch gekennzeichnet, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert ist. • x, das 0,5-Quantil, Median genannt • Q1, das 0,25-Quantil, unteres Quartil genannt • Q3, das 0,75-Quantil, oberes Quartil genannt • Die 0,1-, 0,2 .... 0,9-Quantile heißen Dezile. • Die 0,01-, 0,02 .... 0,09-Quantile heißen Percentile. ~

  23. (x (n x p) + x (n x p + 1) ) 1 2 Quantile, Median • Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen. • Zunächst wird das Produkt n x p berechnet. • Ist n x pkeine ganze Zahl, so ist das p-Quantil der k-te Wert x (k) der Rangliste, wobei k die auf n x p folgende ganze Zahl ist. • Falls n x peine ganze Zahl ist, so wird zur Bestimmung des p-Quantils zwischen den Werten x (n x p) und x (n x p + 1) interpoliert.

  24. Quantile, Median • Median und Quartile derBlutzuckerkonzentrationen von n = 52 Probanden • Berechnung des Medians: • Position in der Rangliste n x p = 52 x 0,5 = 26 • Da 26 eine ganze Zahl ist, errechnet man den Median als den mittleren Messwert zwischen dem 26. und 27. Messwert der Rangliste. • Der mediane Blutzuckerwert beträgt (90 + 92) / 2 [mg/100 ml] = 91 [mg/100 ml]

  25. Quantile, Median • Median und Quartile derBlutzuckerkonzentrationen von n = 52 Probanden • Berechnung des unteren Quartils: • Position in der Rangliste n x p = 52 x 0,25 = 13 • Da 13 eine ganze Zahl ist, errechnet man das untere Quartil als den mittleren Messwert zwischen dem 13. und 14. Messwert der Rangliste. • Q1 = (86 + 86) / 2 [mg/100 ml] = 86 [mg/100 ml] • Berechnung des oberen Quartils: • Q3 = (96 + 96) / 2 [mg/100 ml] = 96 [mg/100 ml]

  26. Quantile, Median • Median derKörpergrößevon n = 53 Probanden • Berechnung des Medians: • Position in der Rangliste n x p = 53 x 0,5 = 26,5 • Da 26,5 keine ganze Zahl ist, ist der 27. Messwert der Rangliste der Median • Der mediane Körpergröße beträgt 172 cm

  27. Modalwert • Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit. • Er ist nur sinnvoll, wenn er eindeutig ist. • Modalwertder Blutzuckerkonzentrationen von n = 52 Probanden: • Die Werte 84 und 92 wurden jeweils sechs mal bestimmt. • Der häufigste Messwert ist nicht eindeutig und der Modalwert damit nicht bestimmbar.

  28. Modalwert, Median, Mittelwert • Der Modalwert ist ein sehr einfach bestimmbares Lagemaß. • Der Vorteil des Medians gegenüber dem Mittelwert liegt vor allem darin, dass er durch einzelne „Ausreißer“ nicht beeinflusst wird. • Insofern ist der Median ein robustes Maß. • Ein Vorteil des Mittelwertes besteht darin, dass mit ihm Rechenoperationen durchgeführt werden können.

More Related