260 likes | 650 Views
Korelacija in regresija. ven. REGRESIJA. opis odnosov, napovedovanje. KORELACIJA. opis velikosti povezanosti. ven. ven. Vrste povezanosti. ven. Vrste povezanosti. ven. Vrste povezanosti. ven. Vrste povezanosti. ven. Vrste povezanosti. ven.
E N D
REGRESIJA opis odnosov, napovedovanje KORELACIJA opis velikosti povezanosti ven
MY = najboljša napoved Y, če ne poznamo vrednosti X Če poznamo vrednosti X, je boljša napoved Y (tj. Y') aritmetična sredina dosežkov Y vseh posameznikov, ki so dosegli tak rezultat X. Pogojne aritmetične sredine Y X ven
e Y = Y’ + e Y’ Napaka napovedi (rezidual): e = Y - Y’ Pogojne aritmetične sredine Y X
Načelo najmanjših kvadratov • Y’ napovedujemo na osnovi pogojnih sredin • linearna regresija: Y’ ležijo na premici • Y so razpršene okrog Y’ • vsota kvadratov odklonov je minimalna • standardna napaka napovedi = razpršitev dejanskih okoli napovedanih vrednosti ven
Za napovedovanje potrebujemo le enačbo premice: Y’ = a + bX regresijska premica a: vrednost Y, ko je X = 0 b: povečanje Y’, ko X naraste za 1 enoto DY DX a ven
Predpostavke v regresijski analizi 1. naključno vzorčenje, 2. linearnost odnosa, 3. homoscedastičnost, 4. normalnost porazdelitve rezidualov ven
Primer rezidualnega grafa pri nelinearni povezanosti ven
Primer rezidualnega grafa pri heteroscedastičnosti ven
Primer rezidualnega grafa pri normalni porazdeljenosti rezidualov ven
Y’ e Razstavljanje variance Y kot podlaga r Y Y Mtot X Y - Mtot = (Y’ - Mtot) + (Y - Y’) var(Y) = var(Y’) + var(e)
Skupna varianca = pojasnjena + nepojasnjena varianca standardna deviacija rezidualov = standardna napaka napovedi se Koeficient determinacije r2:delež pojasnjene variance r … Pearsonov koeficient korelacije ven
‘produkt-moment’ pristop k r Ali je visok dosežek na eni povezan z visokim dosežkom na drugi spremenljivki? Ali je odklon dosežka od sredine pri prvi spremenljivki povezan z odklonom pri drugi spremenljivki? r … indeks tendence po skupnem variiranju obeh spremenljivk zY zY = bzX zX ven
Vedno enako vrednost bi dala enačba … = enačba za r ven
Statistična pomembnost r : t-test odvisna od r in N ! Dve pogosti zablodi: • statistična pomembnost = praktična pomembnost • statistično nepomemben r = korelacije ni ven
Vplivne točke Posamezni primeri lahko nesorazmerno vplivajo na velikost korelacijskih in regresijskih koeficientov. Vplivnost odvisna od oddaljenosti od: 1. aritmetične sredine X in 2. regresijske premice ven
N = 100 r = 0.81 N = 101 r = 0.74 ven
N = 100 r = 0.09 N = 101 r = 0.31 ven
Težave pri interpretaciji r korelacija in vzročnost
Korelacija spremenljivk, ki niso merjene na intervalni merski ravni n.d.: naravno dihotomna u.d.: umetno dihotomna Kendallov koeficient konkordance W - skladnost med ocenjevalci ven