250 likes | 373 Views
Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel. Korrelation zweier stetiger Merkmale X und Y. Grafische Darstellung zweier Merkmale als Punktewolke / Scatterplot / Streudiagramm / X-Y-Diagramm
E N D
Nachtrag zur Vorlesung vom 8.12.2005, allgemeine IxJ-Kontingenztafel Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation zweier stetiger Merkmale X und Y • Grafische Darstellung zweier Merkmale als Punktewolke / Scatterplot / Streudiagramm / X-Y-Diagramm • Geht man davon aus, dass X auf Y wirkt im Sinne einer Ursache-Wirkungs-Beziehung, so ist es sinnvoll, X auf der x-Achse und Y auf der y-Achse der Grafik abzutragen (wie bei einer mathematischen Funktion) • Beispiel: siehe Vorlesung vom 20.10.2005, EKG bei Leguanen • X: Temperatur, Y: Elek. Herzachse Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Scatterplot / Streudiagramm Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson • Die Korrelation nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von X und Y • Exakter linearer Zusammenhang: y = a + bx (Gerade) • Exakte lineare Zusammenhänge sind bei empirischen Daten nicht zu erwarten. Bestenfalls erhält man eine Punktewolke, die einen approximativen linearen Zusammenhang nahe legt • Beispiel (nächste Folie): Linearer Zusammenhang in rechter Grafik „stärker“ als in linker Grafik Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson II Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson III • Visuelle Beurteilung genügt nicht. Wir brauchen eine Maßzahl • Der Korrelationskoeffizient nach Bravais-Pearson ist eine solche normierte Maßzahl • Definition: Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson IV • Der Korrelationskoeffizient nimmt Werte im Bereich -1 ≤ rXY ≤ +1 an. • rXY = +1 : Perfekter positiver linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b>0 • rXY = -1 : Perfekter negativer linearer Zusammenhang, d.h. alle Punkte liegen exakt auf einer Geraden y = a+bx mit b<0 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson V • rXY=0: Die Merkmale sind linear unabhängig • Hypothetische Datenbeispiele zur Veranschaulichung Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 1: rXY=+1, exakter positiver linearer Zusammenhang • Daten: • x y • 12 • 14 • 16 • 18 • 20 • 22 • y=10+2 x Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 2: rXY=-1, exakter negativer linearer Zusammenhang • Daten: • x y • 8 • 6 • 4 • 2 • 0 • -2 • y=10-2 x Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 3: rXY=0.72, starker positiver linearer Zusammenhang • Daten: • x y • 12 • 15 • 13 • 18 • 17 • 16 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 4: rXY≈ 0, kein linearer Zusammenhang • Daten: • x y • 10 • 12 • 9 • 10 • 8.33 • 12 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Beispiel 5: rXY= 0, kein linearer Zusammenhang • Daten: • x y • 3.125 • 1.125 • 0.125 • 0.125 • 1.125 • 3.125 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Alternative: Rangkorrelationskoeffizient nach Spearman rSp • Alternative zum Korrelationskoeffizienten nach Bravais-Pearson, wenn • X metrisch, Y ordinal • Y metrisch, X ordinal • X ordinal, Y ordinal • der Fokus nicht auf der Linearität des Zusammenhangs liegt, sondern nur interessiert, ob der Zusammenhang monoton ist Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Definition von rSp • Vorarbeit: Die Originaldaten werden durch Rangzahlen ersetzt • Die Berechnung erfolgt wie beim Korrelationskoeffizienten nach Bravais-Pearson, indem statt den Originaldaten ihre Ränge verwendet werden: Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Fortsetzung Beispiel 3 (Seite 11) Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Fortsetzung Beispiel 3 (II) Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Hinweise • -1 ≤ rSp ≤ +1 • Sind alle (Original-)Werte von X und Y verschieden, so sind die Rangzahlen eindeutig zu vergeben. Man sagt: es treten keine Bindungen (no ties) auf • Kommen (Original-)Werte von X und/oder Y doppelt oder mehrmals vor, so wird folgender „Trick“ angewendet (Verwendung von Durchschnittsrängen): Datenreihe y: 12 13 13 14 15 15 15 16 Rangzahlen : 1 2.5 2.5 4 6 6 6 8 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Hinweise (II) • Kommen keine Bindungen vor, so kann rSp einfacher berechnet werden: Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Fortsetzung (II) Beispiel 3 (Seite 11) Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Noch ein Beispiel • Datenreihe x: 1 2 3 4 5 6 • Datenreihe y: 1 4 9 16 25 36 • y=x2 • Zusammenhang ist monoton (quadratisch), aber nicht linear • Rang(xi)=Rang(yi) • rSp=1 (da di=0 für alle Paare i) • r nach Bravais-Pearson ist 0.98 Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Scheinkorrelationen (Nonsens-Korr.) • Klassiker: Positive Korrelation zwischen der Anzahl beobachteter Störche und der Anzahl der Geburten in Regionen in Deutschland (Korrelation ≠ Kausalität) • Confounder-Problematik (u.a.) • Im Storchenbeispiel: es gibt andere Variablen (Urbanität, Sozialverhalten), die ihrerseits assoziert sein können und mit den untersuchten Variablen (Anzahl Störche, Anzahl Geburten) in Verbindung stehen Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Weitere Anmerkungen • Auch das Gegenteil von Scheinkorrelation kann auftreten: Tatschlich vorhandene Korrelationen werden nicht erkannt • Vorzeichenumkehr: in der Gesamtpopulation wird eine (z.B.) positive Korrelation beobachtet. Zerlegt man die Gesamtpopulationen in Teilpopulationen, so kann der Fall eintreten, dass in jeder Teilpopulation eine negative Korrelation beobachtet wird Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Zusammenfassung I (was Sie wissen sollten) • Der Korrelationskoeffizient nach Bravais-Pearson ist ein Maß für den linearen Zusammenhang von zwei stetigen Merkmalen (grafisch: Streudiagramm). Wert in [-1;1] • Der Rangkorrelationskoeffizient nach Spearman ist ein Maß für den monotonen Zusammenhang. Die beiden Merkmale können stetig und ordinal sein (alle Kombinationen erlaubt: stetig/stetig, stetig/ordinal, ordinal/ordinal). Er verwendet Ränge statt Originalwerte (Berechnungsformel wie bei Bravais-Pearson bzw. vereinfachte Formel, wenn keine Bindungen vorkommen) • Problematik: Schein-/verdeckte Korr., Vorzeichen Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005
Zusammenfassung II (was Sie können sollten) • Streudiagramm zeichnen • Korrelationskoeffizient nach Bravais-Pearson berechnen • Ränge bilden (auch: bei Bindungen) • Korrelationskoeffizient nach Spearman berechnen • Interpretation: linearer Zusammenhang, monotoner Zusammenhang, positiver/negativer Zusammenhang Vorlesung: Biometrie für Studierende der Veterinärmedizin 15.12.2005