1 / 164

Brunnen A

Wie lässt sich die Stärke eines Zusammenhanges bei kategorialen Werten (nominalskalierten Werten) auf Basis einer Kreuztabelle, Kontingenz- tafel bewerten? Mit Hilfe der Differenz zwischen beobachteten und erwarteten Anzahlen. Erkrankt Nicht-erkrankt. Brunnen A. Brunnen B.

Download Presentation

Brunnen A

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wie lässt sich die Stärke eines Zusammenhangesbei kategorialen Werten (nominalskaliertenWerten) auf Basis einer Kreuztabelle, Kontingenz- tafel bewerten? Mit Hilfe der Differenz zwischen beobachteten und erwarteten Anzahlen

  2. Erkrankt Nicht-erkrankt Brunnen A Brunnen B

  3. Vier Felder Matrix

  4. Mädchen 347 Jungen 374 N = 721 gut = 353 schlecht = 368

  5. Eine Dreisatzaufgabe: Wenn von 721 Schülerinnen und Schülern 353 gut sind, wie viele müssten dann von 374 (Jungen) gut sein? 721 = 353 374 = ? 353 mal 374 = 183 721

  6. Mädchen 347 Jungen 374 N = 721 gut = 353 schlecht = 368

  7. Gibt es einen Zusammenhang zwischen den Leistungen in den Fächern Geographie und Grammatik? Gerechnet wird: 32 mal 40 = 1280 geteilt durch 80 = 16 Sie können diese Berechnung selbstverständlich auch als Dreisatz formulieren:von 80 (Gesamt) sind in Gram gut 32von 40 (Gesamt in Geo gut) sind in Geo gut X

  8. Die Stärke des Zusammenhangsergibt sich logisch aus der Größeder Differenz zwischen erwartetund beobachtet. Berechnet werden kann dieseStärke bspw. durch das sog.Chi-Quadrat.

  9. Konvention über den Aufbau: abhängige Variable in die Spalte, unabhängige in Zeile

  10. Berechnet werden die Zahlen „Erwartet“ wie folgt: In der ersten Zeile wurden 203 Gerettete beobachtet. Die Gesamtzahl der Passagierein der ersten Klasse betrug 325. Ingesamt wurden 711 Personen gerettet, an Bordwaren insgesamt 2201 Personen. Die Rechnung lautet jetzt:711 mal 325 = 231075, geteilt durch 2201 macht 104,98 (~ 105) Sie können diese Berechnung selbstverständlich auch als Dreisatz formulieren:von 2201 (Gesamt) überlebten 711von 325 (erste Klasse) überlebten X

  11. Der „Chi-Quadrat-Test“ zur Überprüfung der Unabhängigkeit von zwei Variablen Mit diesem Test kann die Unabhängigkeit von zwei Variablen, und damit indirekt auchdie Größe des Zusammenhangs zwischen zwei Variablen geprüft werden.Von Bedeutung ist dieser Test bspw. wenn der Frage nachgegangen werden soll,ob – um bei dem Beispiel der Titanic zu bleiben – das Alter oder das Geschlecht eine größere Rolle bei der Frage des Überlebens gespielt hat. Dazu rufen wir wieder die Dialogbox „Kreuztabelle“ auf und setzen wieder, wie auf der nächsten Folie ersichtlich, „class“ in die Zeile und „survival“ in die Spalte. Jetzt klicken wir das Fenster „Statistik“ an und erhalten die folgende Dialogbox. („Wert beobachtet“ – „Wert erwartet“)2 ∑ Chi-Quadrat = „Wert erwartet“

  12. Chi-Quadrat

  13. Betrachten wie nun die Tabellen und Werte des Chi-Quadrats: Damit haben wir für die Variablen „Überleben/Klasse“ einen Chi-Quadrat-Test Wert von 190,401und für die Variablen „Überleben/Alter“ einen Wert von 20,956Was sagen diese Werte aus?

  14. Um diese Frage zu beantworten soll erläutert werden, wie die Werte errechnet werden. Aus der Kreuztabelle werden die Werte für „Beobachtet“ und „Erwartet“ jeder Zeile wie in derunteren Tabelle zu sehen voneinanderabgezogen. Anschließend wirddieser Wert quadriert, (um nur positive Werte zu erhalten) und durchdie „erwarteten Werte“dividiert. Diese Werte werdenschließlich aufaddiertund wir erhalten den Wert desChi-Quadrat-Tests!

  15. Einige Lehrbücher berechnen den Wert so: Um diese Frage zu beantworten soll erläutert werden, wie die Werte errechnet werden. Aus der Kreuztabelle werden die Werte für „Beobachtet“ und „Erwartet“ jeder Zeile wie in derunteren Tabelle zu sehen voneinanderabgezogen. Anschließend wirddie Wurzel ausdem Wert E gezogen,denn B-E durchdie Wurzel E geteilt undschließlich wirddas Ganze quadriert (um nurpositive Werte zu erhalten). DieseWerte werdenschließlich aufaddiertund wir erhalten den Wert desChi-Quadrat-Tests!

  16. Um einen Aspekt zu verstehen, der diesem Wert entnommen werden kann, verdeutlichen wir uns einmal den Fall, bei dem der beobachtetet Wert nahezu dem erwarteten Wert entspricht: Anschließend den Wert, der einer maximal möglichen Abweichung entspricht: Dieser Vergleich zeigt (hoffentlich) deutlich (einen der) hier zugrunde liegendenAspekte: Je höher der Chi-Quadrat-Test Wert, desto größer der Zusammenhangzwischen den betrachteten Variablen. Zurück zu der gestellten Frage ergibt sich folglich, dass die Variablen „Klasse“ mit dem Chi-Quadrat-Test Wert von 190,401 einen höheren Zusammenhang zwischen dieser Variablen und dem Überleben aufweist, als die Variable „Alter“ mit einem Wert von nur 20,956.Kurz: Mit Hilfe des Chi-Quadrat-Test Wertes kann die Stärke des Zusammen-hang zwischen verschiedenen Variablen vergleichend beurteilt werden.

  17. Es ist auch möglich, um eine weitere Variante zuzeigen, sich die Chi-Quadrat-Werte geschichtetanzeigen zu lassen – eineggf. übersichtlichereDarstellungsform.Es zeigt sich, dass von den hier vorliegenden Variablen dieKombination „Female/Adult“den größten Einfluss auf die Frage „Überleben“ oder„Nicht-Überleben“ hatte.

  18. Wie lässt sich die Stärke eines Zusammenhangesbei numerischen Werten (intervallskaliertenWerten) auf Basis einer Korrelationsanalyse bewerten? Mit Hilfe des sog. Korrelationskoeffizienten

  19. Ausgangspunkt: Ein Streudiagramm oder Scatterplot Für jede Person, jedes Objekt wird ein Wert erhoben oder gemessen und am Schnittpunkt der beiden Werte wird eine Markierung eingetragen Körperlänge Gewicht

  20. Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht

  21. Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Gewicht

  22. Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Sog. Regressionsgrade Gewicht

  23. Ausgangspunkt: Ein Streudiagramm oder Scatterplot Körperlänge Summe der kleinsten Quadrate Gewicht

  24. Ausgangspunkt: Ein Streudiagramm oder ScatterplotKorrelation: Je kleiner die Summe der kleinsten Quadrate, desto stärker der Zusammenhang Körperlänge Summe der kleinsten Quadrate Gewicht

  25. Einzelwerte für Variable B Einzelwerte für Variable A Korrelationskoeffizient 0

  26. Korrelationskoeffizient hoch, positiv Einzelwerte für Variable B Einzelwerte für Variable A

  27. Korrelationskoeffizient hoch, negativ Einzelwerte für Variable B Einzelwerte für Variable A

  28. Positiver korrelativer Zusammenhang: „Je mehr, desto mehr“ Korrelationskoeffizient +1.0 Negativer korrelativer Zusammenhang: „Je mehr, desto weniger“ Korrelationskoeffizient -1.0

  29. A A A A A A A Leistungen in Klasse A und in Klasse B B A B A B B B A B B B B A B B B B A B Verlauf über die Zeit

  30. A A A A A A A Leistungen in Klasse A und in Klasse B B A B A B B B A B B B B A B B B B A B Verlauf über die Zeit

  31. A A A B A A Ausreißer A Leistungen in Klasse A und in Klasse B B A B A B B B A B B B B A B B B A A B Verlauf über die Zeit

  32. A A A Böse Falle Null: Missing Value:Für eine Personliegen keine Angaben zuder Leistung in Klasse B vor A A Leistungen in Klasse B A A A A A A A 0 Leistungen in Klasse A

  33. Scores of 12th graders on standardized tests (index for average: 100 pts)

  34. Beachten Sie den Korrelationsquotienten!

  35. Beachten Sie den Korrelationsquotienten!

  36. Welche Möglichkeiten des Umgangs mit fehlenden Werten gibt es? Y Y X X Bei metrischen Merkmalendurchschnittlicher Wert derk nächsten Nachbarn Bei kategorialen Merkmalenhäufigste Ausprägung derk nächsten Nachbarn Aber auch: Missing Values rauswerfen!

  37. Wie kann der Befund von Snow transformiert werden und wozu? • Um Vergleiche zwischen den Stärken des Effekts möglich zu machen • Um die wirkungsvollsten Interventionsansatz zu bestimmen • Um die Wirkungen von Interventionen abschätzen zu können • … • ..

  38. „Snow“ enthält kategoriale Daten: • Brunnen • An Cholera Verstorbene • Wie ließen sich diese kategorialenDaten in numerische übertragen?

  39. Beispiel:

  40. Distanz Anzahl der Erkrankten

  41. Distanz Anzahl der Erkrankten

  42. Distanz Anzahl der Erkrankten

  43. Distanz „Schwelle“ Anzahl der Erkrankten

  44. Distanz Anzahl der Erkrankten

More Related