250 likes | 388 Views
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT. Übersetzung: / Tradotto da:. Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4. VARIABILITÄT. Was ist die VARIABILITÄT? Wie misst man die Variabilität?
E N D
Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT Übersetzung: / Tradotto da: Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4
VARIABILITÄT Was ist die VARIABILITÄT? Wie misst man die Variabilität? Die Variabilität als Distanzmaß Die Variabilität als Distanzmaß von einem Zentrum Varianz Standardabweichung Relative Streuungsmaße
Was ist die VARIABILITÄT? Darunter versteht man, dass ein Phänomen bei den einzelnen Erhebungseinheiten der Grundgesamtheit verschiedene Ausprägungen annehmen kann. Die Variabilität ist umso größer, je größer die Unterschiede zwischen den einzelnen Fällen sind. Die Lagemaße wie Mittelwert, Median oder Modus geben keine Auskunft darüber, wie die Einheiten dazu tendieren, unterschiedliche Werte anzunehmen.
Reicht der Mittelwert, um die Daten darzustellen? Semesterende – um die schulischen Leistungen einzuschätzen, berechnen wir den Mittelwert der Noten in Mathematik. Das sind die Noten, die drei Schüler bekommen haben: Die Schüler haben den gleichen Durchschnitt, aber die Noten sind sehr… UNTERSCHIEDLICH
Wie misst man die Variabilität? Der Mittelwert sagt nichts über die Variabilität der Daten aus. Dazu müssen wir ein STREUUNGSMASS verwenden. Nehmen wir an, dass jede Kugel eine Erhebungseinheit ist…
Die Variabilität als Distanzmaß Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen zunimmt. SPANNWEITE=MAX-min Das ist das einfachste Maß, da es nur die Positionen von zwei Erhebungseinheiten berücksichtigt. Sie ist die Differenz zwischen dem beobachteten Maximum und Minimum.
Welcher unserer Schüler hat die größte Variabilität? Wir berechnen die SPANNWEITE, indem wir das Maximum heranziehen und das Minimum davon abziehen. Luigi hat die unterschiedlichsten Noten, während Lucas Noten überhaupt nicht variieren.
Die SPANNWEITE ist ein unmittelbares Maß, aber… …es ist sensibel: es berücksichtigt nur die Extremwerte, die durch außergewöhnliche und unnormale Werte beeinflusst sein können, während alle anderen beobachteten Werte außer Acht gelassen werden. Ein besser geeignetes Maß muss ALLE ERHEBUNGSEINHEITEN BERÜCKSICHTIGEN! Aber alle möglichen Unterschiede zwischen allen Erhebungseinheiten zu berücksichtigen ist zu aufwändig! Eine Lösung ist…
Die Variabilität als Distanzmaß von einem Zentrum Ein besser geeignetes Streuungsmaß muss also als Distanzmaß jeder Beobachtung vom Mittelwert der Daten funktionieren. Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen und dem Zentrum der Beobachtungen steigt.
Lasst uns versuchen, ein Streuungsmaß zu erstellen! Um die Distanz jeder Beobachtung vom Mittelwert zu messen, können wir die Operation Differenz verwenden! Wir definieren unsere Daten X ist das beobachtete Phänomen (statistische Variable) x1,x2,x3,…,xi,…,xn sind die beobachteten Werte der n Erhebungseinheiten x3 ist der arithmetische Mittelwert von n beobachteten Werten x1 x2 M x4 x6 x8 x8 x7 x5
Abweichungen oder Differenzen vom Mittelwert Mit welcher mathematischen Formel kann ich die Distanz zwischen zwei beobachteten Werten messen? Mit der Differenz! Wenn wir alle Differenzen (auch ABWEICHUNGEN genannt) nehmen und die Summe bilden erhalten wir jedoch… Der arithmetische Mittelwert ist der Punkt, an dem die Daten im Gleichgewicht sind. Der Mittelwert gleicht die niedrigsten und die höchsten Werte aus und genau deshalb ist dieSumme der Abweichungen vom Mittelwert gleich NULL.
Die kleinsten Quadrate!!! Von den verschiedenen Eigenschaften des arithmetischen Mittelwerts könnten wir jene der kleinsten Quadrate nutzen. Diese besagt, dass die Summe der Quadrate der Abweichungen vom arithmetischen Mittelwert das Minimum der Summe der Abweichungen von jedem anderen Wert ist.
Die Summe der Quadrate der Abweichungen… ist immer größer als null ist nur dann gleich null, wenn die Variable nicht variiert steigt mit der Zunahme der Dispersion der Beobachtungen vom Mittelwert steigt auch mit der Zunahme der Anzahl der Beobachtungen (n) wird als Quadrat der Maßeinheit der Variablen ausgedrückt
Varianz • Teilt man die Summe der Abweichungen zum Quadrat durch n, um die Auswirkung aufgrund der Anzahl der Beobachtungen auszuschalten, • erhält man die VARIANZ. Sie wird allgemein mit s2 („Sigma hoch 2“) angegeben. • Um ein Streuungsmaß in derselben Maßeinheit der beobachteten Daten zu erhalten, müssen wir die Quadratwurzel der Varianz ziehen!
Standardabweichung Die Varianz wird als Quadrat der Maßeinheit der beobachteten Variablen ausgedrückt. Ihr Wert ist also nicht unmittelbar verständlich. Häufiger wird die Standardabweichung verwendet. Eigenschaften: • Gleiche Maßeinheit wie beim Merkmal • Definiert die durchschnittliche Distanz der Beobachtungen vom arithmetischen Mittelwert Bei n Beobachtungen x1,x2,…,xn lautet die Formel
Wir rechnen mit Marcos Noten Im Falle von Daten in einer REIHE
Und jetzt auch für Luca und Luigi! Luigis Noten sind am unterschiedlichsten – wir bestätigen das, was wir bereits mit der SPANNWEITE erkannt haben!
Standardabweichung Wenn die Daten in einer Häufigkeitstabelle zusammengefasst sind, wird jede Abweichung mit der entsprechenden absoluten Häufigkeit gewichtet. • Wir erstellen eine Häufigkeitstabelle mit den Daten der drei Schüler und berechnen den Mittelwert und die Standardabweichung. Insgesamt haben wir n=12 Beobachtungen.
Streuungsmaße Sie messen die Variabilität eines Phänomens, einer Variablen, einer Verteilung. Man unterscheidet zwischen: • absoluten Maßen, die in derselben Maßeinheit ausgedrückt werden wie das untersuchte Phänomen: • Spannweite • Standardabweichung … • relativen Maßen,die unabhängig von der Maßeinheit sind und sich deshalb dazu eignen, unterschiedliche Phänomene zu vergleichen. Man erhält sie, indem man ein absolutes Maß mit einem Mittelwert oder mit dem Maximum in Beziehung setzt.
Relative Streuungsmaße Sie erlauben Vergleiche der Variabilität von Verteilungen, die mit unterschiedlichen Maßeinheiten dargestellt werden (z.B. Gewicht und Größe) von Verteilungen, die mit derselben Maßeinheit dargestellt werden, aber von der unterschiedlichen Intensität desselben Phänomens beeinflusst werden (z.B. Gewicht der Neugeborenen und Gewicht der Mütter). Das bekannteste Streuungsmaß ist der Variationskoeffizient.
Marco vergleicht sich mit seinem Bruder! Sein Bruder besucht die Universität und hat im letzten Semester die folgenden Noten (in Dreißigsteln) bekommen.
Fassen wir alles in einer Tabelle zusammen! Wer weist die größere Variabilität auf? Die größere Variabilität hat derjenige, der den höheren Variationskoeffizienten hat: Marco!
Versuchen wir es nun mit realen Daten! Welche der drei Getreideproduktionen (Weizen, Reis oder Mais) ist am variabelsten? Produktion einiger Getreidearten - Jahre 1921-2011 (Zentner je Hektar) Die Produktion von Mais hat die größte Spannweite. Die Produktion von Weizen hingegen schwankt am wenigsten!
…und jetzt… Gute Arbeit! Rete per la promozione della cultura statistica Übersetzung: / Tradotto da: