760 likes | 1.07k Views
5. Változók kapcsolatának vizsgálata. Kétdimenziós minta (pontdiagram) Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás. Tartalom. Kétdimenziós minta.
E N D
Kétdimenziós minta (pontdiagram) Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás Tartalom
Pontdiagram (kétváltozós) 5 4 Tanulmányi átlag 3 2 0 1 2 3 4 5 Hány órát tanul naponta?
Pozitív lineáris kapcsolat (I) 55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)
Pozitív lineáris kapcsolat (II) 145 140 135 Testmag. 10 évesen 130 125 120 115 20 25 30 35 40 45 Testsúly 10 éves korban (kg)
Nem lineáris (U-alakú) kapcsolat Y X -3 0 3
Függetlenség 1 80 Y Y 50 0,5 20 0 X X 20 50 80 0 0,5 1
Az X-értékek és az Y-értékek együttjárása, együttmozgása, együtt-változása valamilyen szabály szerint Összefüggés, kapcsolat két változó (X és Y) között
Mi a szabály az alábbi két változó kapcsolatában? 55 50 45 Születési hossz (cm) 40 35 1 2 3 4 5 Születési súly (kg)
Megértünk valamit (elméleti szempont) Segítségével következtetéseket vonhatunk le (gyakorlati szempont). Pl.: ha X értéke ennyi, Y értéke mennyi? Mire jó, ha egy ilyen szabályt feltárunk?
Előrejelzés egyenes segítségével: ha X = 2, Y = ? Y 55 50 45 Születési hossz (cm) 40 35 1 2 3 4 5 X Születési súly (kg)
Az X és az Y változó között az összefüggés szabályának kitalálása: hogyan „függ” X-től Y? A függés nem feltétlenül ok-okozati (pl. a gyerekről is lehet a szülőre következtetni) A függés típusa többféle lehet: pl. lineáris vagy sokféle nemlineáris (U-alakú, exponenciális stb.) Regressziós feladat
Jósolt (függő) változó: Y Jósló (előrejelző, független) változó: X Lineáris előrejelzés (jóslás): Ŷ = a + bX Az x értékhez tartozó igazi Y-érték: y Az x értékhez tartozó előrejelzés: ŷ = a + bx Az előrejelzés alapfogalmai
Egyy = a + bxegyenes paraméterei Y 320 240 160 a 80 0 X 0 1 2 3 4 5 ‘a’:Y-tengelymetszet ‘b’:meredekségi együttható: b = tg(
Nem mindig egyenes arányosság Azonos mértékű X-változást mindig azonos mértékű Y-változás kísér 1 egységnyi X-változás esetén Y várható változása b egységnyi A lineáris kapcsolat jellemzője
Változók: X: ThosszSzül, Y: Thossz10éves Regressziós egyenlet: Ŷ = 96,88 + 0,83X Következtetés (regressziós előrejelzés): Pl. X = 45cm esetén: Ŷ = 96,88 + 0,83·45 = 134,23 (cm) Példa lineáris regresszióra GYAK
A regressziós becslés hibája egy személynél • Ha egy személynél a becsült (előrejelzett) 10 éves kori testmagasság 151 cm (Ŷ) és a valódi érték 146 cm (Y), akkor a hiba: • Abszolút eltérés: |151-146| = 5 cm • Négyzetes eltérés: (151-146)2 = 52 = 25 cm2
Átlagos négyzetes eltérés = Hibavariancia = Res Hibaszórás = Gyök(hibavariancia) = Standard hiba (SH) A regressziós becslés átlagos hibája: a standard hiba
Var(Y): átlagtól való átlagos négyzetes eltérés = átlaggal való becslés hibavarianciája. (!!!) SH2 = Res: regressziós becslés hibavarianciája. Minél kisebb Var(Y)-nál Res, annál jobb a regressziós becslés Hibacsökkenés: Var(Y) – Res Relatív hibacsökkenés: (Var(Y) – Res)/Var(Y) Var(Y) és Res jelentése
Változó Átlag Variancia Res SH RHCS X: ThosszSzül 50,2 6,4 Y: Thossz10 138,7 41,5 37,09 6,1 0,107 X: Anyatesth 161,1 38,3 Y: Thossz10 138,7 41,5 36,02 6,0 0,132 X: Apatesth 173,4 46,0 Y: Thossz10 138,7 41,5 35,96 6,0 0,134 X: Tsúly10 33,246,4 Y: Thossz10 138,7 41,5 23,33 4,8 0,438 Példák GYAK
Relatív hibacsökkenés = determinációs együttható Megmagyarázott variancia-arány Jelölés: Det(X, Y) A determinációs együttható
A korrelációs együttható abszolút értéke a determinációs együttható négyzetgyöke: A korrelációs együttható • A korrelációs együttható előjele megegyezik a regresszió meredekségi együtthatójának (b) előjelével: Pozitív trend: +, negatív trend: -
Populációbeli (elméleti) korrelációs együttható jelölése: ρ (ejtsd: ró),ρxy, ρ(x,y) Mintabeli (Pearson-féle) korrelációs együttható jelölése: r, rxy, r(x,y) A korrelációs együttható jelölései
-1 r 1, -1 1 Ha X és Y független, akkor(X,Y) = 0. Ha (X,Y) = 0, vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens. A korrelációs együttható jellemzői
Lineáris transzformációk: Szám hozzáadása a változóhoz: Y = X + 100 Változó számmal szorzása: Y = 10X Ezek kombinációja: Y = 50 + 3X ρ és r abszolút értéke nem változik, legfeljebb az előjele A lineáris transzformáció hatása a korrelációs együtthatóra
A korrelációs együttható szignifikanciájának vizsgálata • Nullhipotézis: H0: ρ = 0 • Döntés alapja: egy n-elemű mintában kiszámított korrelációs együttható (r) • Mitől függ H0 elutasíthatósága? • Az r együttható nagysága • Az f szabadságfok nagysága (f = n - 2)
Korrelációs mátrix szignifikanciákkal (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK
Korrelációs mátrix p-értékekkel (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK
A H0: r = r0 hipotézis vizsgálata Szakmai kérdés: két változó (X és Y) korrelációja (r) egy populációban megegyezik-e egy feltételezett értékkel (r0)?
H0: r = r0 Az r együtthatón végrehajtott Fisher-féle Z-transzformáció segítségével lehetséges Z(r) normális eloszlású lesz
Intervallumbecslés r-ra Szintén a Z-transzformáció segítségével: C0,95 = (r1; r2)
Intervallumbecslés -ra • A nullhipotézis elutasítása csak annyit jelent, hogy valószínűleg ρ≠ 0. • Ez nem sokat mond nekünk. • 95%-os konfidencia-intervallum (hol kell keresnünk nagy (95%-os) megbízhatósággal ρ-t? C0,95 = (ra; rf) • Pl. n = 500, r = 0,79 esetén: C0,95 = (0,75; 0,82) • Pl. n = 16, r = -0,87 esetén: C0,95 = (-0,96; -0,65) GYAK
Korrelációs együtthatók összehasonlítása független minták segítségévelH0: r1 = r2
H0: r1 = r2 Ha H0 igaz, Z* st. norm. eloszlású
Személyiség és házasság: korrelációk férj és feleség között
A korreláció nem feltétlenül oki kapcsolat, csak egy együttjárás Ha r > 0, akkor három eset lehetséges: • X pozitív hatással van Y-ra • Y pozitív hatással van X-re • Valamilyen Z háttérváltozó hat egyidejűleg X-re és Y-ra
Meglepő korrelációk Milyen korreláció van egy általános iskola összes tanulójának a mintájában a szókészlet és a lábméret között?
A parciális korrelációs együttható logikája X ~~~~ Y Z
A parciális korrelációs együttható jelentése Milyen lenne X és Y között a korreláció, ha a Z változó hatását kiküszöbölnénk, állandó szinten tartva az értékét (feltételes korreláció)? Alkalmazási feltétel: X, Y és Z legyen külön-külön és együtt is normális eloszlású.
X és Y felbontása Xmar X változó Ymar Z-től nem függő rész Z-től függő rész Z-től nem függő rész Z-től függő rész Y változó