1 / 33

Vorlesung 23.10.2006:

Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe. Dem ersten Eindruck nicht bedingungslos trauen!.

alec-wilson
Download Presentation

Vorlesung 23.10.2006:

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Vorlesung 23.10.2006: Erste Auswertungen von erfassten Daten: absolute und relative Häufigkeiten; Lage- und Streuungsmaße Vorlesung 30.10.2006: Gleichzeitige Untersuchung von 2 Merkmalen Mengentheoretische Grundbegriffe

  2. Dem ersten Eindruck nicht bedingungslos trauen! Untersuchung von Datenmengen  geeignete (= aussagekräftige und intuitive) Darstellung finden Aber: Vorsicht beim Lesen von Diagrammen

  3. Beeindruckende Ergebnisse – oder? Tipp: Achten Sie auf die Achsen-beschriftung!

  4. Eine gute graphische Darstellung von statistischen Daten?Vorsicht beim Lesen!

  5. Lage- und Streuungsparameter für eine gegebene Stichprobe Beispiel: Clownspiel  meine Würfelserie: 5 3 1 2 2 5 6 3 5 6 1 2 5 2 4 StichprobenumfangHier: Länge der Würfelserie = 15 Arithmetisches Mittel

  6. 1 2 3 4 5 6 Arithmetisches Mittel =Schwerpunkt=Unterstützungspunkt für das Gleichgewicht unserer Waage Frage: Wie schwanken, wie streuen die Ausprägungen um den „zentralen Wert“ , d. h. um das arithmetische Mittel? Berechnung der Standardabweichung

  7. Berechnen der Stichprobenvarianz und der Standardabweichung für meine Würfelserie: Würfelserie: 5 3 1 2 2 5 6 3 5 6 1 2 5 2 4  Für meine Serie:  Übergang zur Standardabweichung:  Die gewürfelten Augenzahlen streuen im Bereich(3,46-1,6847 , 3,46 + 1,6847) = (1,7753 , 5,1447)

  8. 1 2 3 4 5 6 Standardabweichung (durchschnittliche Streuung) Streubereich um den Mittelwert 3,46 ,in dem die meisten der Ausprägungen der (= meiner konkreten) Stichprobe liegen.

  9. Gleichzeitige Untersuchung von zwei Merkmalen Vorgegeben: eine Gruppe von Merkmalsträgern Wir betrachten für diese Merkmalsträger gleichzeitig zwei Merkmale:  Jedem Merkmalsträger werden gleichzeitig zwei Ausprägungen zugeordnet:seine Ausprägung bezüglich des 1. Merkmals undseine Ausprägung bezüglich des 2. Merkmals Merkmalsträger Nr. j  Zuordnung (x(j), y(j))

  10. Datenmatrix: tabellarische Darstellung, die für jeden Merkmals- träger der untersuchten Gruppedie zu ihm gehörigen Merkmalsausprägungen enthält Beispiel: Erfassung von Geburtstagsdaten für eine Gruppe von 49Studierenden

  11. Aus der Datenmatrix kann die Tabelle der zugehörigen absoluten (oder relativen ) Häufigkeitenabgelesen werden. Tabelle der absoluten Häufigkeiten

  12. 1 Geb. 11 Geb. Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm: Achtung: Für die Monate ist die (willkürliche) Kodierung durch die Zahlen 1,2,…,12 gewählt, für die Jahre die (willkürliche) Kodierung durch 85,86,87. Achtung: hinter manchen dieser Punkte stehen mehrere Merkmalsträger!

  13. Zweidimensionale Häufigkeitsverteilung zur gegebenen Datenmatrix: für jede Ausprägungskombination wird die zugehörige absolute (oder relative) Auftrittshäufigkeit aufgetragen Hier: Verteilung derabsoluten Häufigkeiten der Ausprägungskombinationen (Geburtsmonat, Geburtsjahr)

  14. Frage: Bestehen Zusammenhänge zwischen den beiden uns interessierenden Merkmalen? Lassen sich aus unseren Daten statistische Zusammenhänge zwischen den beiden Merkmalen vermuten? Vorgehen: n Merkmalsträger, jeweils bezüglich beider Merkmale befragt Merkmal 1: Merkmalsausprägungen x1, … , xn werden notiert, Merkmal 2: Merkmalsausprägungen y1, … , yn werden notiert, Die arithmetischen Mittel und werden berechnet, die Stichprobenvarianzen s2(Merkmal 1) und s2(Merkmal 2) werden berechnet.

  15. Korrelationskoeffizient der beiden Merkmale bezüglich der untersuchten Stichprobe EXCEL-Befehle zur Berechnung der Standardabweichung und des Korrelationskoeffizienten für Datenreihen von Merkmalsausprägungspaaren: STABWN(A1:A49) , STABWN(B1:B49) KORREL(A1:A49;B1:B49)

  16. Geburtstagsbeispiel: = …

  17. Berechnung von Zähler und Nenner der Formel für den Korrelationskoeffizienten Achtung: Unter den 49 Merkmalsträgern kommen manche xj-Werte mehrmals vor!

  18. Entsprechend für das 2. Merkmal: Achtung: Die 3 Ausprägungen treten sämtlich mehrmals für die Gruppe unserer 49 Merkmalsträger auf!

  19. Daraus Berechnung des Korrelationskoeffizienten für unsere Stichprobe: . . .  Interpretation: Es gilt für unsere Stichprobe r= 0,396925 Also besteht - gemäß unserer Stichprobe - nur ein niedriger Zusammenhang zwischen den beiden Merkmalen.

  20. r = 0 kein (linearer ) Zusammenhang 0 < 0,4 niedriger Zusammenhang 0,4 < 0,7 mittlerer Zusammenhang 0,7 < < 1 starker Zusammenhang = 1 linearer Zusammenhang

  21. Eigenschaften:Der Korrelationskoeffizient stellt ein Maß für die Abweichung des Zusammenhangs der beiden Merkmale vom strikt linearen Zusammenhang dar: • r nimmt nur Werte zwischen -1 und +1 (jeweils einschließlilch) an. • r=-1 oder r=+1 bedeutet, dass die beiden Merkmale linear voneinander abhängen. • r nahe bei -1 oder nahe bei +1 bedeutet annähernd linearen Zusammenhang. • Wenn beide Merkmale sich im gleichen Sinn verändern, ist r positiv. • Wenn beide Merkmale sich im entgegengesetzten Sinn verändern, ist r negativ. • Achtung: r = 0 bedeutet nicht, dass gar kein Zusammenhang zwischen den beiden Merkmalen besteht! Wir können ihn nur nicht mit unserer Datenmenge nachweisen!

  22. Darstellung der Merkmalsausprägungskombinationen (Geburtsmonat, Geburtsjahr) für jedes Mitglied unsere Gruppe in einem Punktediagramm  Versuch, eine „möglichst gut passende“ Gerade durch die Wolke zu legen: Also: Niedriger Zusammenhang! Die Geraden „passen nicht richtig“: viele Punkte liegen ober- und unterhalb.

  23. Wichtige Grundbegriffe der Mengentheorie Die Sprache der Mathematik ist wie ein Code. Auf diese Weise kann man mathematische Gedanken sehr kurz fassen. Aus: K. Dahl, S. Nordquist: Zahlen, Spiralen und magische Quadrate

  24. Menge: Familie von Objekten, Zusammenstellung bestimmter Objekte, Familie von Objekten, die eine bestimmte gemeinsame Eigenschaft haben  Menge der Merkmalsträger = Grundgesamtheit  Menge aller Studierenden, die jetzt in diesem Hörsaal sind Teilmenge  Menge der Merkmalsträger, die für eine bestimmter Stichprobe herangezogen werden Element einer Menge:jedes einzelne Objekt der Menge  jeder einzelne Merkmalsträger Das Element x ist enthalten in der Teilmenge A der Menge G.

  25. A B Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die weiblich sind oder im Jahr 1985 geboren wurden Vereinigungsmenge, Vereinigung von zwei Mengen: Menge aller Objekte, die zu A oder zu B gehören Die Elemente aus der Vereinigungsmenge von A und B gehören jeweils zu mindestens einer der beiden Mengen A oder B.

  26. A B Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A B: Menge aller Studierenden im Hörsaal, die sowohl weiblich sind als auch im Jahr 1985 geboren wurden Durchschnittsmenge, Durchschnitt von zwei Mengen: Menge aller Objekte, die zu A und zu B gehören Die Elemente aus der Durchschnittsmenge von A und B gehören sowohl zu der beiden Menge A als auch zu der Menge B.

  27. Rein grüner Bereich: B-A Rein gelber Bereich: A-B Differenzmengemenge, Differenz A - B: Menge aller Objekte, die zu A, aber nicht gleichzeitig auch zu B gehören Menge A: Menge aller Studentinnen, die jetzt in diesem Hörsaal sind. Menge B: Menge aller Studierenden des Jahrgangs 1985, die jetzt im Hörsaal sind A-B: Menge aller Studierenden im Hörsaal, die weiblich sind, aber nicht im Jahr 1985 geboren wurden B-A: Menge aller Studierenden im Hörsaal, die im Jahr 1985 geboren wurden, aber nichtweiblich (also männlich) sind.

  28. Zum kommenden Montag zu lösende Übungsaufgaben: Aufgabe Nr. 13 und Aufgabe Nr. 16 aus dem Skript

  29. 1 2 3 4 5 6 Wichtige Begriffe aus der heutigen Vorlesung: Arithmetisches Mittel (= „Durchschnittswert“ = erwarteter Wert einer Stichprobe) Standardabweichung vom erwarteten Wert einer Stichprobe Zwei Merkmale für ein und dieselbe Klasse von Merkmalsträgern Korrelationskoeffizient: Stärke (Ausmaß) des Zusammenhangs zwischen zwei Merkmalen Mengentheoretische Grundbegriffe: Menge, Element, Teilmenge, Vereinigung, Durchschnitt, Differenz

More Related