790 likes | 1.49k Views
Korrelation. Gliederung Kovarianz Die Produkt-Moment-Korrelation Berechnung SPSS Voraussetzungen Mittelwerte von Korrelationen berechnen Unterschiede von Korrelationen testen Optimale Stichproben. Korrelation. Gliederung Korrelationen bei nicht intervallskalierten Variablen
E N D
Korrelation 09_korrelation 1 Gliederung • Kovarianz • Die Produkt-Moment-Korrelation • Berechnung • SPSS • Voraussetzungen • Mittelwerte von Korrelationen berechnen • Unterschiede von Korrelationen testen • Optimale Stichproben
Korrelation 09_korrelation 2 Gliederung • Korrelationen bei nicht intervallskalierten Variablen • Spearman‘s Rangkorrelation • Kendallsτ • Punktbiseriale Korrelation • Biseriale Korrelation • Biseriale Rangkorrelation • Punkttetrachorische Korrelation • Tetrachorische Korrelation • Polychorische Korrelation • Yules Y • ν-Koeffizient • Der Kontingenzkoeffizient CC • Cramérs Index
Kovarianz und Korrelation 09_korrelation 3 Kovarianz und Korrelation sind Maße für den (linearen) Zusammenhang zwischen zwei Variablen. Eine positive Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen hohen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Risikobereitschaft). Eine negative Korrelation (bzw. Kovarianz) ist dann gegeben, wenn ein hoher Wert auf einer Variable häufig mit einen niedrigen Wert auf der anderen Variable einhergeht (z.B. Optimismus und Ängstlichkeit).
Kovarianz und Korrelation negativer Zusammenhang positiver Zusammenhang 09_korrelation 4 Grafisch kann man Zusammenhänge zwischen zwei Variablen in einem Scatterplot darstellen.
Kovarianz 09_korrelation 5 Die Kovarianz (= „gemeinsame Varianz“) wird zur Herleitung der Korrelation benötigt. Die Kovarianz wird ähnlich wie die Varianz berechnet:
Kovarianz 09_korrelation 6 Beispiel
Kovarianz 09_korrelation 7 • Immer, wenn eine Person auf beidenVariablen über dem Durchschnitt oderauf beiden Variablen unter dem Durchschnitt liegt, vergrößert sich der Wert für die Kovarianz, sonst verkleinert er sich. • Interpretation: Die Kovarianz ist ein unstandardisiertes Maß • d.h. sie hängt von der Skalierung der beteiligten Variablen ab • Daher können Kovarianzen nicht direkt interpretiert oder verglichen werden. • Aus diesem Grund wird die Kovarianz standardisiert. • Die standardisierte Kovarianz ist der Korrelationskoeffizient.
Produkt-Moment-Korrelation 09_korrelation 8 Der am häufigsten Verwendete Korrelationskoeffizient ist die Produkt-Moment-Korrelation (Pearson-Koeffizient) Berechnung: Die Korrelation entspricht der Kovarianz der z-transformierten Variablen
Produkt-Moment-Korrelation 09_korrelation 9 Interpretation des Korrelationskoeffizienten • Der Korrelationskoeffizient (r) hat einen möglichen Wertebereich von +1 bis -1. • Es gilt: • r = 1 Perfekter positiver Zusammenhang • 1>r > 0 Positiver Zusammenhang • r ≈ 0 kein Zusammenhang • -1<r < 0 Negativer Zusammenhang • r =-1 Perfekter Negativer Zusammenhang
Produkt-Moment-Korrelation 09_korrelation 10 • Korrelationen zeigen nur einen statistischen Zusammenhang dar. Sie dürfen nicht als Beweis für Kausalität verwendet werden. • Zusammenhänge können bedeuten, dass… • … sich „A“ auf „B“ auswirkt. • … sich „B“ auf „A“ auswirkt. • … „A“ und „B“ beide von einem dritten Merkmal „C“ beeinflusst werden • Beispiel: Es soll die Wirksamkeit von Nachhilfestunden untersucht werden. Dabei zeigt sich eine Korrelation von r = -.20 zwischen der Anzahl der genommenen Nachhilfestunden und der Schulleistung.
Varianz von X Varianz von Y Gemeinsame Varianz Determinationskoeffizient 09_korrelation 11 Der Determinationskoeffizient (r²) ist die quadrierte Korrelation Er beschreibt den relativen Anteil der gemeinsamen Varianz von zwei Merkmalen. Der Determinationskoeffizient hat einen Wertebereichvon 0 bis 1.
Produkt-Moment-Korrelation 09_korrelation 12 Beispiel
Signifikanztest 09_korrelation 13 Statistische Signifikanz des Korrelationskoeffizienten • Auch bei Korrelationskoeffizienten muss ein Signifikanztest durchgeführt werden • Es werden dabei folgende Hypothesen geprüft • Ungerichtet: • H0: ρ = 0 (“rho” = Null) • H1: ρ ≠ 0 • Gerichtet: • H0: ρ ≤ 0 (bzw.: ρ ≥ 0) • H1: ρ > 0 (bzw.: ρ < 0)
Signifikanztest 09_korrelation 14 Auch der Korrelationskoeffizient kann mit einem t-Test auf Signifikanz getestet werden. Dabei wird der empirische t-Wert wie folgt berechnet: Wie immer gilt: Wenn temp> tkrit wird die H0 verworfen tkrit wird unter Berücksichtigung der Freiheitsgrade, des Alpha-Niveaus und der Art der Testung aus der Tabelle abgelesen.
Signifikanztest 09_korrelation 15 Für das Beispiel ergibt sich: • Der kritischer t-Wert bei df=3, α=.05 und 2-seitiger Testung beträgt:tkrit = 3.18. • Die H0 wird also verworfen. Es besteht demnach ein bedeutsamer Zusammenhang zwischen den beiden untersuchten Variablen.
SPSS 09_korrelation 16 Datensatz: • Für eine Korrelation werdenimmer für jede Vp gültigeWerte für beide Variablen benötigt.
SPSS 09_korrelation 17 Menu Befehl: • Analysieren • Korrelation • Bivariat
SPSS 09_korrelation 18 Menu Befehl: • Beide Variablenauswählen • Pearson (für die Produkt-Moment-Korrelation) • Ein oder Zweiseitig? • OK
SPSS 09_korrelation 19 SPSS Syntax: correlationoptwithrisiko. • Allgemein: correlationVAR1 withVAR2. • Oder: correlationVAR1,VAR2, VAR3, … .
SPSS 09_korrelation 20 SPSS Ausgabe: • r = .93 • p < .05 • Also: signifikanter Zusammenhang
SPSS 09_korrelation 21
Voraussetzungen der Produkt-Moment Korellation Voraussetzungen der Produkt-Moment-Korrelation: • Intervallskalenniveau der Variablen • Normalverteilung der Variablen • Homoskedastizität: • Normalverteilung von y für alle Probanden, die den gleichen x-Wert haben. • Die Homoskedastizität ist in der Praxis kaum zu überprüfen!) • Zusätzliche Einschränkung: Es können nur lineare Zusammenhänge gezeigt werden! 09_korrelation 22
Mittelwerte von Korrelationen • Korrelationen sind nicht intervallskaliert. Daher ist es nicht erlaubt, direkt einen Mittelwert zu bilden! • Vorgehen: • Berechnung von Fischers Z-Transformation für die einzelnen Korrelationen • Berechnung des (gewichteten) Mittelwertes der Z-Werte • Rücktransformation des arith-metischen Mittels (Tabelle in Leonhart, S. 466) 09_korrelation 23
Mittelwerte von Korrelationen Beispiel: In zwei Untersuchungen wurde derZusammenhang zwischen der Studien-motivation und der Examensnote bestimmt. Fischers Z: Mittelwert: Rücktransformierung (nach Tabelle): 09_korrelation 24
Unterschiede von Korrelationen • Fragestellung: Ist der Unterschied zwischen zwei Korrelationen statistisch bedeutsam? • Vorgehen: • Berechnung von Fischers Z-Transformation für beide Korrelationen. • Berechnung eines empirischen z-Werts • Bestimmung eines kritischen z-Wert (aus der Tabelle für die Standard-normalverteilung). • Wenn zemp > zkrit, liegt ein signifikanter Unterschied zwischen r1 und r2 vor. 09_korrelation 25
Unterschiede von Korrelationen Beispiel: Es soll geprüft werden, ob sich diebeiden Korrelationen von Folie 24 signifikantunterscheiden. Berechnung: Interpretation: Die H0 kann nicht verworfen werden. Der Unterschied zwischen r1 und r2 ist nicht statistisch bedeutsam. 09_korrelation 26
Optimale Stichprobenumfänge Wie beim t-Test gilt auch bei der Korrelation: Je kleiner ein Effekt (d.h. ein Zusammenhang), desto mehr Probanden werden benötigt, um ihn nachzuweisen! Die optimale Stichprobengröße kann mit G*Power bestimmt werden. Folgende Formel erlaubt eine Schätzung der optimalen Stichprobengröße:(Z: Fischers Z) 09_korrelation 27
Optimale Stichprobenumfänge Fazit: Um eine Korrelation vonr = .30 mit einer Power von .90zeigen zur können, benötigt maneine Stichprobe von N=109. 09_korrelation 28
Optimale Stichprobenumfänge Fazit: Um eine Korrelation vonr = .50 mit einer Power von .80(1-seitig) zeigen zur können, benötigt man eine Stichprobevon N=21. 09_korrelation 29
Korrelationen ohne Intervallskalenniveau Wenn zur Überprüfung einer Zusammenhangshypothese keine intervallskalierten Daten zur Verfügung stehen, kann die Produkt-Moment-Korrelation nicht verwendet werden. Es gibt jedoch eine ganze Reihe weiterer Maße für die Korrelation, die in diesem Fall eingesetzt werden können. Dabei muss das Skalenniveau beider Variablen berück-sichtigt werden. Die folgende Tabelle gibt einen Überblick über den Einsatz der unterschiedlichen Koeffizienten. 09_korrelation 30
Spearmans Rangkorrelation Spearmans Rangkorrelation wird eingesetzt, wenn… • … zwei Variablen (x, y) als ordinalskaliert sind. • … eine intervallskalierte und eine ordinalskalierte Variable vorliegen. • … intervallskalierte Variablen vorliegen aber die Normalverteilungsannahme verletzt ist. Vorsicht: • Wenn Rangplätze mehrfach besetzt sind („Rangbindung“), sollte Spearmans Rangkorrelation nicht verwendet werden. • In diesem Fall empfiehlt sich die Verwendung vonKendallsτ. 09_korrelation 32
Spearmans Rangkorrelation • Alle Variablen werden vor der Berechnung in eine Rangreihe (Rang 1 bis N) transformiert. • Beispiel: • 3.40; 27.40; 7.80; 15.00; 27.10 • 1, 5, 2, 3, 4 • Berechnung: • Signifikanztest: 09_korrelation 33
Spearmans Rangkorrelation Beispiel: Vergleich der Ergebnisse aus zwei Angsttests: 09_korrelation 34
Spearmans Rangkorrelation Berechnung des Koeffizienten: Signifikanztest: Für df=6 und α=.05 bei einseitiger Testung ergibt sich: Die Korrelation ist statistisch signifikant! 09_korrelation 35
Spearmans Rangkorrelation • Spearmans Rangkorrelation in SPSS • Gleicher Befehl wie für „Pearson“, aber „Spearman“ anwählen 09_korrelation 36
Spearmans Rangkorrelation SPSS Ausgabe 09_korrelation 37
Kendallsτ Kendallsτ („tau“) ist ebenfalls ein Koeffizient für ordinalskalierte Variablen. Kendallsτist unempfindlich gegenüber Ausreißern (es dürfen leere Ränge verwendet werden; die Bildung einer Rangreihe ist nicht notwendig!) Kendallsτwird verwendet, wenn Ränge mehrfach besetzt sind („Rangbindungen“). Hinweis: Kendallsτ fällt in der Regel kleiner aus als Spearmans Koeffizient. Daher sollte letzterer bevorzugt werden, wenn die Voraussetzungen erfüllt sind. 09_korrelation 38
Kendallsτ Berechnung, wenn Rangbindungen vorliegen: • Mit… • P: Anzahl der Proversionen über alle Personen • I: Anzahl der Inversionen über alle Personen • N: Stichprobenumfang • k, m: Anzahl der Kategorien der Variablen X und Y • ti, wj: Anzahl der Probanden auf Rang i oder j 09_korrelation 39
Kendallsτ • Proversionen: Anzahl der Vpn „rechts unterhalb“ eines Werts. • Inversionen: Anzahl der Vpn „links-unterhalb“ eines Werts. P=6 P=2 I=3 I=3 Über alle Vpn ergibt sich: P = 44 I = 7 09_korrelation 40
Kendallsτ Signifikanzprüfung nach Tabelle (Leonhart, 2004, S. 465): Bei N = 12 ist ein Zusammenhang ab P – I > 26 statistisch bedeutsam. 09_korrelation 41
Kendallsτ • Kendallsτ in SPSS: • Gleicher Befehl wie für „Pearson“, aber „Kendallsτ“ anwählen 09_korrelation 42
Punktbiseriale Korrelation Verwendung der Punktbiserialen Korrelation • Es soll ein Zusammenhang zwischen einer intervallskalierten und einer natürlich dichotomen nominalskalierten Variable bestimmt werden. • Oder: Es soll ein Zusammenhang zwischen einer intervallskalierten Variable einerseits und einer (aus einer ursprünglich normalverteilten intervallskalierten Variable) künstlich dichotomisierten Variable bestimmt werden. • Die punktbiseriale Korrelation sollte nicht für latente Variablen verwendet werden! 09_korrelation 43
Punktbiseriale Korrelation Berechnung der Punktbiserialen Korrelation 09_korrelation 44
Punktbiseriale Korrelation Beispiel: Ängstlichkeit von Männern und Frauen Signifikanztest tkrit= 1.99 Der Zusammenhang ist statistisch bedeutsam! 09_korrelation 45
Biseriale Korrelation Verwendung der Biserialen Korrelation: • Ein latentes, intervallskaliertes Konstrukt wird über eine dichotome, manifeste Variable erfasst. (z.B. „Haben Sie gute Statistikkenntnisse: ja/nein?“). • Eine intervallskalierten Variable wird künstlich dichotomisiert. (z.B. Alter größer oder kleiner 18 Jahre). 09_korrelation 46
Biseriale Korrelation Berechnung der Biserialen Korrelation 09_korrelation 47
Biseriale Korrelation Bestimmung von δ: • Bestimmung des Anteil der Probanden in Gruppe 1: • z.B. p(Gr.=1) = .40 • Bestimmung der Ordinate („y-Achse“) der Normalverteilung für p aus einer Tabelle zur Standardnormalverteilung. • z.B. Ordinate(p =.40) = 0.386 09_korrelation 48
Biseriale Korrelation Beispiel: Nutzungsdauer des Internets (Minuten pro Tag) von Jugendlichen und Erwachsenen. 09_korrelation 49
Biseriale Rangkorrelation Verwendung der BiserialenRangkorrelation: • Der Zusammenhang zwischen einer ordinalskalierten Variable und einer dichotomen Variable soll bestimmt werden. Berechnung: 09_korrelation 50