1 / 75

5. Változók kapcsolatának vizsgálata

5. Változók kapcsolatának vizsgálata. Kétdimenziós minta (pontdiagram) Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás. Tartalom. Kétdimenziós minta.

tom
Download Presentation

5. Változók kapcsolatának vizsgálata

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 5.Változók kapcsolatánakvizsgálata

  2. Kétdimenziós minta (pontdiagram) Trendvizsgálat, lineáris regresszió Determinációs együttható A korrelációs együttható jelentései A Fisher-féle Z-transzformáció A parciális korreláció modellje A sztochasztikus monotonitás Tartalom

  3. Kétdimenziós minta

  4. Pontdiagram (kétváltozós) 5 4 Tanulmányi átlag 3 2 0 1 2 3 4 5 Hány órát tanul naponta?

  5. Pozitív lineáris kapcsolat (I) 55 50 Születési hossz (cm) 45 40 35 1 2 3 4 5 Születési súly (kg)

  6. Pozitív lineáris kapcsolat (II) 145 140 135 Testmag. 10 évesen 130 125 120 115 20 25 30 35 40 45 Testsúly 10 éves korban (kg)

  7. Nem lineáris (U-alakú) kapcsolat Y X -3 0 3

  8. Függetlenség 1 80 Y Y 50 0,5 20 0 X X 20 50 80 0 0,5 1

  9. Az X-értékek és az Y-értékek együttjárása, együttmozgása, együtt-változása valamilyen szabály szerint Összefüggés, kapcsolat két változó (X és Y) között

  10. Mi a szabály az alábbi két változó kapcsolatában? 55 50 45 Születési hossz (cm) 40 35 1 2 3 4 5 Születési súly (kg)

  11. Megértünk valamit (elméleti szempont) Segítségével következtetéseket vonhatunk le (gyakorlati szempont). Pl.: ha X értéke ennyi, Y értéke mennyi? Mire jó, ha egy ilyen szabályt feltárunk?

  12. Előrejelzés egyenes segítségével: ha X = 2, Y = ? Y 55 50 45 Születési hossz (cm) 40 35 1 2 3 4 5 X Születési súly (kg)

  13. Az X és az Y változó között az összefüggés szabályának kitalálása: hogyan „függ” X-től Y? A függés nem feltétlenül ok-okozati (pl. a gyerekről is lehet a szülőre következtetni) A függés típusa többféle lehet: pl. lineáris vagy sokféle nemlineáris (U-alakú, exponenciális stb.) Regressziós feladat

  14. Jósolt (függő) változó: Y Jósló (előrejelző, független) változó: X Lineáris előrejelzés (jóslás): Ŷ = a + bX Az x értékhez tartozó igazi Y-érték: y Az x értékhez tartozó előrejelzés: ŷ = a + bx Az előrejelzés alapfogalmai

  15. Egyy = a + bxegyenes paraméterei Y 320 240  160 a 80 0 X 0 1 2 3 4 5 ‘a’:Y-tengelymetszet ‘b’:meredekségi együttható: b = tg(

  16. Nem mindig egyenes arányosság Azonos mértékű X-változást mindig azonos mértékű Y-változás kísér 1 egységnyi X-változás esetén Y várható változása b egységnyi A lineáris kapcsolat jellemzője

  17. Változók: X: ThosszSzül, Y: Thossz10éves Regressziós egyenlet: Ŷ = 96,88 + 0,83X Következtetés (regressziós előrejelzés): Pl. X = 45cm esetén: Ŷ = 96,88 + 0,83·45 = 134,23 (cm) Példa lineáris regresszióra GYAK

  18. A regressziós becslés hibája egy személynél • Ha egy személynél a becsült (előrejelzett) 10 éves kori testmagasság 151 cm (Ŷ) és a valódi érték 146 cm (Y), akkor a hiba: • Abszolút eltérés: |151-146| = 5 cm • Négyzetes eltérés: (151-146)2 = 52 = 25 cm2

  19. Átlagos négyzetes eltérés = Hibavariancia = Res Hibaszórás = Gyök(hibavariancia) = Standard hiba (SH) A regressziós becslés átlagos hibája: a standard hiba

  20. Var(Y): átlagtól való átlagos négyzetes eltérés = átlaggal való becslés hibavarianciája. (!!!) SH2 = Res: regressziós becslés hibavarianciája. Minél kisebb Var(Y)-nál Res, annál jobb a regressziós becslés Hibacsökkenés: Var(Y) – Res Relatív hibacsökkenés: (Var(Y) – Res)/Var(Y) Var(Y) és Res jelentése

  21. Változó Átlag Variancia Res SH RHCS X: ThosszSzül 50,2 6,4 Y: Thossz10 138,7 41,5 37,09 6,1 0,107 X: Anyatesth 161,1 38,3 Y: Thossz10 138,7 41,5 36,02 6,0 0,132 X: Apatesth 173,4 46,0 Y: Thossz10 138,7 41,5 35,96 6,0 0,134 X: Tsúly10 33,246,4 Y: Thossz10 138,7 41,5 23,33 4,8 0,438 Példák GYAK

  22. Relatív hibacsökkenés = determinációs együttható Megmagyarázott variancia-arány Jelölés: Det(X, Y) A determinációs együttható

  23. A korrelációs együttható abszolút értéke a determinációs együttható négyzetgyöke: A korrelációs együttható • A korrelációs együttható előjele megegyezik a regresszió meredekségi együtthatójának (b) előjelével: Pozitív trend: +, negatív trend: -

  24. Populációbeli (elméleti) korrelációs együttható jelölése: ρ (ejtsd: ró),ρxy, ρ(x,y) Mintabeli (Pearson-féle) korrelációs együttható jelölése: r, rxy, r(x,y) A korrelációs együttható jelölései

  25. Egy korrelációs mátrix (n = 500)

  26. Néhány tipikus korreláció

  27. 0

  28. 0

  29. 0

  30. 

  31. 

  32. -1 r 1, -1  1 Ha X és Y független, akkor(X,Y) = 0. Ha (X,Y) = 0, vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens. A korrelációs együttható jellemzői

  33. Lineáris transzformációk: Szám hozzáadása a változóhoz: Y = X + 100 Változó számmal szorzása: Y = 10X Ezek kombinációja: Y = 50 + 3X ρ és r abszolút értéke nem változik, legfeljebb az előjele A lineáris transzformáció hatása a korrelációs együtthatóra

  34. A korrelációs együttható szignifikanciájának vizsgálata • Nullhipotézis: H0: ρ = 0 • Döntés alapja: egy n-elemű mintában kiszámított korrelációs együttható (r) • Mitől függ H0 elutasíthatósága? • Az r együttható nagysága • Az f szabadságfok nagysága (f = n - 2)

  35. Korrelációk férj és feleség ugyanazon jellemzői között

  36. Korrelációs mátrix szignifikanciákkal (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK

  37. Korrelációs mátrix p-értékekkel (f = 254; +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001) GYAK

  38. A H0: r = r0 hipotézis vizsgálata Szakmai kérdés: két változó (X és Y) korrelációja (r) egy populációban megegyezik-e egy feltételezett értékkel (r0)?

  39. H0: r = r0 Az r együtthatón végrehajtott Fisher-féle Z-transzformáció segítségével lehetséges Z(r) normális eloszlású lesz

  40. Intervallumbecslés r-ra Szintén a Z-transzformáció segítségével: C0,95 = (r1; r2)

  41. Intervallumbecslés -ra • A nullhipotézis elutasítása csak annyit jelent, hogy valószínűleg ρ≠ 0. • Ez nem sokat mond nekünk. • 95%-os konfidencia-intervallum (hol kell keresnünk nagy (95%-os) megbízhatósággal ρ-t? C0,95 = (ra; rf) • Pl. n = 500, r = 0,79 esetén: C0,95 = (0,75; 0,82) • Pl. n = 16, r = -0,87 esetén: C0,95 = (-0,96; -0,65) GYAK

  42. Korrelációs együtthatók összehasonlítása független minták segítségévelH0: r1 = r2

  43. H0: r1 = r2 Ha H0 igaz, Z* st. norm. eloszlású

  44. Személyiség és házasság: korrelációk férj és feleség között

  45. A korreláció nem feltétlenül oki kapcsolat, csak egy együttjárás Ha r > 0, akkor három eset lehetséges: • X pozitív hatással van Y-ra • Y pozitív hatással van X-re • Valamilyen Z háttérváltozó hat egyidejűleg X-re és Y-ra

  46. A parciális korrelációs együttható Z

  47. Meglepő korrelációk Milyen korreláció van egy általános iskola összes tanulójának a mintájában a szókészlet és a lábméret között?

  48. A parciális korrelációs együttható logikája X ~~~~ Y Z

  49. A parciális korrelációs együttható jelentése Milyen lenne X és Y között a korreláció, ha a Z változó hatását kiküszöbölnénk, állandó szinten tartva az értékét (feltételes korreláció)? Alkalmazási feltétel: X, Y és Z legyen külön-külön és együtt is normális eloszlású.

  50. X és Y felbontása Xmar X változó Ymar Z-től nem függő rész Z-től függő rész Z-től nem függő rész Z-től függő rész Y változó

More Related