150 likes | 305 Views
Korelace a elaborace aneb úvod do vztahů proměnných. Závislost dvou proměnných-přehled. Nominální (kontingenční koeficienty, koeficienty asociace) Ordinální (Korelační koeficienty dle Spearmana a Kendalla) Kardinální (Pearsonův párový korelační koeficient, párová regrese).
E N D
Závislost dvou proměnných-přehled • Nominální (kontingenční koeficienty, koeficienty asociace) • Ordinální (Korelační koeficienty dle Spearmana a Kendalla) • Kardinální (Pearsonův párový korelační koeficient, párová regrese)
4 typy závislosti 2 kardinálních proměnných • Silná pozitivní závislost • Slabá pozitivní závislost • Silná negativní závislost • Nulová závislost • Dopad na korelační koeficient a regresní koeficient • Upozornění-lineární regrese i korelace měří jen lineární vztahy
4 typy lineární závislosti 2 kardinálních proměnných Silná pozitivní závislost r = 0,97
4 typy lineární závislosti 2 kardinálních proměnných Silná negativní závislost r = - 0,97
4 typy lineární závislosti 2 kardinálních proměnných Slabápozitivní závislost r = 0,35
4 typy lineární závislosti 2 kardinálních proměnných Nulová závislost r = 0
!!!Korelace předpoklady!!! • Předpoklad pro Pearsonův koeficient normalita proměnných viz např procedura Explore v Analyze-Descriptives (tedy pro korelace chceme náhodný výběr z normálního rozdělení/regrese naopak předpokládá volbu kombinace vysvětlujících proměnných) • Předpoklad pro Spearmanův/Kendallův koeficient ordinalita proměnných
Korelace v SPSS • Analyze-Correlate-Bivariate • Výběr tří základních koeficientů • Options-popisná statistika a kovariance a součin směrodatných odchylek • Volba práce s chybějícími hodnotami (viz i další metody)
Korelace v SPSS • Jedno (one-tailed) a dvoustranný test (two-tailed) aneb různé alternativní hypotézy Co je za tím? • Flag significant correlations. Korelační koeficienty významné na 5% (0,05) hladině významnosti označeny jednou hvězdičkou resp. pro 1% dvěmi
Korelace v SPSS-syntax Všechny proměnné se všemi CORRELATIONS /VARIABLES=q9 q10 q53 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE. Jedna proměnná (q53) se všemi CORRELATIONS /VARIABLES=q53 with q9 q10 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.
Poučky o korelačních koeficientech • Koeficient pro intervalové proměnné měří lineární vztah. Vychází-li korelace nízká, znamená to pouze, že vztah mezi proměnnými nemá lineární povahu. Možná je souvislost mezi znaky velmi těsná, ale má jinou než lineární podobu. Co s tím udělat? • A) Použijte koeficientu pro nominální znaky, např. Cramerova V. Pokud vyjde vyšší než ten, který jste použili původně, je to indikace nelinearity. • B) Použijte k analýze grafu nebo tabulky, abyste zjistili, v kterých kategoriích dochází k odchylce od linearity.
Poučky o korelačních koeficientech • V případě, že počítáte příliš mnoho korelací mezi navzájem provázanými proměnnými, vychází zpravidla všechny korelační koeficienty jako významné. V duchu vícenásobných porovnání (používaných například v analýze rozptylu) se doporučuje snížit konvenční hladinu významnosti (0,05) tolikrát kolik počítáme párových korelačních koeficientů (dle autora této metody se nazývá Bonferonniho korekce) . • Tímto postupem zajistíme, že celková hladina významnosti všech párových srovnání bude maximálně rovna konvenční hladině významnosti (0,05). • Stejného výsledku lze dosáhnout i tak, že jednotlivé Sig. vypočtené v SPSS vynásobíme počtem párových srovnání a porovnáváme je s konvenční hladinou významnosti 0,05.
Poučky o velikosti koeficientů De Vaus: 2002
Poznámky závěrem • Jiné/další koeficienty-viz Analyze-Descriptives-Crosstabs (tam jsou i kontingenční koeficienty) • Vždy než začneme počítat zobrazme si grafy zobrazující závislost proměnných, to nám může ušetřit mnohá překvapení či pochybení