330 likes | 566 Views
Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe. Dem ersten Eindruck nicht bedingungslos trauen!.
E N D
Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe
Dem ersten Eindruck nicht bedingungslos trauen! Untersuchung von Datenmengen geeignete (= aussagekräftige und intuitive) Darstellung finden Aber: Vorsicht beim Lesen von Diagrammen
Beeindruckende Ergebnisse – oder? Tipp: Achten Sie auf die Achsen-beschriftung!
Eine gute graphische Darstellung von statistischen Daten?Vorsicht beim Lesen!
Lage- und Streuungsparameter für eine gegebene Stichprobe Beispiel: Clownspiel meine Würfelserie: 5 3 1 2 2 5 6 3 5 6 1 2 5 2 4 StichprobenumfangHier: Länge der Würfelserie = 15 Arithmetisches Mittel
1 2 3 4 5 6 Arithmetisches Mittel =Schwerpunkt=Unterstützungspunkt für das Gleichgewicht unserer Waage Frage: Wie schwanken, wie streuen die Ausprägungen um den „zentralen Wert“ , d. h. um das arithmetische Mittel? Berechnung der Standardabweichung
Berechnen der Stichprobenvarianz und der Standardabweichung für meine Würfelserie: Würfelserie: 5 3 1 2 2 5 6 3 5 6 1 2 5 2 4 Für meine Serie: Übergang zur Standardabweichung: Die gewürfelten Augenzahlen streuen im Bereich(3,46-1,6847 , 3,46 + 1,6847) = (1,7753 , 5,1447)
1 2 3 4 5 6 Standardabweichung (durchschnittliche Streuung) Streubereich um den Mittelwert 3,46 ,in dem die meisten der Ausprägungen der (= meiner konkreten) Stichprobe liegen.
Gleichzeitige Untersuchung von zwei Merkmalen Vorgegeben: eine Gruppe von Merkmalsträgern Wir betrachten für diese Merkmalsträger gleichzeitig zwei Merkmale: Jedem Merkmalsträger werden gleichzeitig zwei Ausprägungen zugeordnet:seine Ausprägung bezüglich des 1. Merkmals undseine Ausprägung bezüglich des 2. Merkmals Merkmalsträger Nr. j Zuordnung (x(j), y(j))
Datenmatrix: tabellarische Darstellung, die für jeden Merkmals- träger der untersuchten Gruppedie zu ihm gehörigen Merkmalsausprägungen enthält Beispiel: Erfassung von Geburtstagsdaten für eine Gruppe von 49Studierenden
Aus der Datenmatrix kann die Tabelle der zugehörigen absoluten (oder relativen ) Häufigkeitenabgelesen werden. Tabelle der absoluten Häufigkeiten
1 Geb. 11 Geb. Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm: Achtung: Für die Monate ist die (willkürliche) Kodierung durch die Zahlen 1,2,…,12 gewählt, für die Jahre die (willkürliche) Kodierung durch 85,86,87. Achtung: hinter manchen dieser Punkte stehen mehrere Merkmalsträger!
Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix: für jede Ausprägungskombination wird die zugehörige absolute (oder relative) Auftrittshäufigkeit aufgetragen Hier: Verteilung derabsoluten Häufigkeiten der Ausprägungskombinationen (Geburtsmonat, Geburtsjahr)
Frage: Bestehen Zusammenhänge zwischen den beiden uns interessierenden Merkmalen? Lassen sich aus unseren Daten statistische Zusammenhänge zwischen den beiden Merkmalen vermuten? Vorgehen: n Merkmalsträger, jeweils bezüglich beider Merkmale befragt Merkmal 1: Merkmalsausprägungen x1, … , xn werden notiert, Merkmal 2: Merkmalsausprägungen y1, … , yn werden notiert, Die arithmetischen Mittel und werden berechnet, die Stichprobenvarianzen s2(Merkmal 1) und s2(Merkmal 2) werden berechnet.
Korrelationskoeffizient der beiden Merkmale bezüglich der untersuchten Stichprobe EXCEL-Befehle zur Berechnung der Standardabweichung und des Korrelationskoeffizienten für Datenreihen von Merkmalsausprägungspaaren: STABWN(A1:A49) , STABWN(B1:B49) KORREL(A1:A49;B1:B49)
Berechnung von Zähler und Nenner der Formel für den Korrelationskoeffizienten Achtung: Unter den 49 Merkmalsträgern kommen manche xj-Werte mehrmals vor!
Entsprechend für das 2. Merkmal: Achtung: Die 3 Ausprägungen treten sämtlich mehrmals für die Gruppe unserer 49 Merkmalsträger auf!
Daraus Berechnung des Korrelationskoeffizienten für unsere Stichprobe: . . . Interpretation: Es gilt für unsere Stichprobe r= 0,396925 Also besteht - gemäß unserer Stichprobe - nur ein niedriger Zusammenhang zwischen den beiden Merkmalen.
r = 0 kein (linearer ) Zusammenhang 0 < 0,4 niedriger Zusammenhang 0,4 < 0,7 mittlerer Zusammenhang 0,7 < < 1 starker Zusammenhang = 1 linearer Zusammenhang
Eigenschaften:Der Korrelationskoeffizient stellt ein Maß für die Abweichung des Zusammenhangs der beiden Merkmale vom strikt linearen Zusammenhang dar: • r nimmt nur Werte zwischen -1 und +1 (jeweils einschließlilch) an. • r=-1 oder r=+1 bedeutet, dass die beiden Merkmale linear voneinander abhängen. • r nahe bei -1 oder nahe bei +1 bedeutet annähernd linearen Zusammenhang. • Wenn beide Merkmale sich im gleichen Sinn verändern, ist r positiv. • Wenn beide Merkmale sich im entgegengesetzten Sinn verändern, ist r negativ. • Achtung: r = 0 bedeutet nicht, dass gar kein Zusammenhang zwischen den beiden Merkmalen besteht! Wir können ihn nur nicht mit unserer Datenmenge nachweisen!
Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm Versuch, eine „möglichst gut passende“ Gerade durch die Wolke zu legen: Also: Niedriger Zusammenhang! Die Geraden „passen nicht richtig“: viele Punkte liegen ober- und unterhalb.
Wichtige Grundbegriffe der Mengentheorie Die Sprache der Mathematik ist wie ein Code. Auf diese Weise kann man mathematische Gedanken sehr kurz fassen. Aus: K. Dahl, S. Nordquist: Zahlen, Spiralen und magische Quadrate
Menge: Familie von Objekten, Zusammenstellung bestimmter Objekte, Familie von Objekten, die eine bestimmte gemeinsame Eigenschaft haben Menge der Merkmalsträger = Grundgesamtheit Menge aller Studierenden, die jetzt in diesem Hörsaal sind Teilmenge Menge der Merkmalsträger, die für eine bestimmter Stichprobe herangezogen werden Element einer Menge:jedes einzelne Objekt der Menge jeder einzelne Merkmalsträger Das Element x ist enthalten in der Teilmenge A der Menge G.
A B Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die weiblich sind oder im Jahr 1985 geboren wurden Vereinigungsmenge, Vereinigung von zwei Mengen: Menge aller Objekte, die zu A oder zu B gehören Die Elemente aus der Vereinigungsmenge von A und B gehören jeweils zu mindestens einer der beiden Mengen A oder B.
A B Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die sowohl weiblich sind als auch im Jahr 1985 geboren wurden Durchschnittsmenge, Durchschnitt von zwei Mengen: Menge aller Objekte, die zu A und zu B gehören Die Elemente aus der Durchschnittsmenge von A und B gehören sowohl zu der beiden Menge A als auch zu der Menge B.
Rein grüner Bereich: B-A Rein gelber Bereich: A-B Differenzmengemenge, Differenz A - B: Menge aller Objekte, die zu A, aber nicht gleichzeitig auch zu B gehören Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A-B: Menge aller Studierenden im Hörsaal, die weiblich sind, aber nicht im Jahr 1985 geboren wurden B-A: Menge aller Studierenden im Hörsaal, die im Jahr 1985 geboren wurden, aber nichtweiblich (also männlich) sind.
Zum kommenden Montag zu lösende Übungsaufgaben: Aufgabe Nr. 13 und Aufgabe Nr. 16 aus dem Skript
1 2 3 4 5 6 Wichtige Begriffe aus der heutigen Vorlesung: Arithmetisches Mittel (= „Durchschnittswert“ = erwarteter Wert einer Stichprobe) Standardabweichung vom erwarteten Wert einer Stichprobe Zwei Merkmale für ein und dieselbe Klasse von Merkmalsträgern Korrelationskoeffizient: Stärke (Ausmaß) des Zusammenhangs zwischen zwei Merkmalen Mengentheoretische Grundbegriffe: Menge, Element, Teilmenge, Vereinigung, Durchschnitt, Differenz