1 / 34

Bevezetés a Korreláció & Regressziószámításba

Bevezetés a Korreláció & Regressziószámításba. Petrovics Petra Doktorandusz. Statisztikai kapcsolatok. A ss z oci áció – 2 minőségi/területi ismérv között Vegyes kapcsolat – minőségi/területi és egy mennyiségi ismérv között K orrel áció – mennyiségi ismérvek között.

penney
Download Presentation

Bevezetés a Korreláció & Regressziószámításba

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz

  2. Statisztikai kapcsolatok • Asszociáció– 2 minőségi/területi ismérv között • Vegyes kapcsolat– minőségi/területi és egy mennyiségi ismérv között • Korreláció– mennyiségi ismérvek között

  3. X (or X1, X2, … , Xp): magyarázó változó(k), független változó(k) • Y: eredményváltozó, függő változó • Ok-okozati kapcsolat: X okozza Y változását

  4. Korrelációs mutatószámok • Kovariancia • értéke - és + közötti; • C = 0, amikor X és Y között nincs kapcsolat; • a kapcsolat irányát mutatja • nem mutatja a kapcsolat értékét!!!

  5. 2. Korrelációs együttható • A kapcsolat irányát mutatja • a kapcsolat erősségét is mutatja • 0 < r < 1  sztochasztikus kapcsolat r = 0  X és Y függetlenek r = -1  negatív☻ r = 1  pozitív ☺ • Csak lineáris kapcsolat esetében használható! • r2 – determinációs együttható: %-os formában méri a kapcsolat erősségét – hány %-ban befolyásolja X az Y-t

  6. 3. Rangkorrelációs együttható • Rangsorba rendezett adatok közötti kapcsolatot elemez • n = elemszám, d = a rangszámok közötti különbség • Függvényszerű pozitív kapcsolat  = 1  Inverz kapcsolat = -1  Függetlenség = 0 

  7. 1. Feladat File / Open / Employeedata.sav Van kapcsolat a - currentsalary és a - beginningsalaryközött? KORRELÁCIÓ

  8. Analyze / Correlate / Bivariate… r Irányt és erősséget mutat 0  I r I0,3  Gyenge kapcsolat 0,3  I r I 0,7  Közepesen erős kapcsolat 0,7  I r I 1  Erős kapcsolat C Csak irányt mutat!!! + -

  9. Output

  10. 2. Feladat Van kapcsolat a: • current salary • previous experience (month) • month since hire • beginning salary között? Többváltozós KORRELÁCIÓ

  11. Analyze / Correlate / Bivariate… r Irányt és erősséget mutat 0  I r I0,3  Gyenge kapcsolat 0,3  I r I 0,7  Közepesen erős kapcsolat 0,7  I r I 1  Erős kapcsolat C Csak irányt mutat!!! + -

  12. Output Mátrix Negatív irányú (inverz) kapcsolat r C Negatív irányú (inverz) & gyenge kapcsolat Pozitív irányú kapcsolat Direkt (pozitív irányú) & erős kapcsolat

  13. Lineáris regressziós modell • X és Y közötti kapcsolatot ábrázoló egyenes. • Az Y függ: • x1, x2, …, xp – p db magyarázó változótól • A véletlen ingadozásától (ε) • β0, β1, …, βp regressziós együtthatóktól. y = β0 + β1x + ε ahol: y – függő vagy eredményváltozó x – független vagy magyarázó változó ε – véletlen hibatag β0 – x=0 helyen β1 – a függvény meredeksége E (y) β1 β 0 x

  14. Legkisebb négyzetek módszere y ŷi = b0 + b1X i Véletlen x

  15. A legkisebb négyzetek módszere becsült mutatói: b0 - β0 b1 - β1 • Regressziós egyenes Ŷ = b0 + b1X • Kétváltozós normálegyenlet Σy = nb0 + b1Σx Σxy = b0Σx + b1Σx2

  16. Scatter diagram Direkt kapcsolat Pozitív kapcsolat linear nemlineáris Inverz kapcsolat Negatív kapcsolat

  17. Nincs kapcsolat

  18. Hatványkitevős regresszió(Power) Y = a  Xb logY = loga + b  logX ↓ ↓ ↓ V = b0 + b1 ∙ x b1 = b b0 = lga

  19. Exponenciális regresszió(Compound) Y = a  bx logY = loga + logb  x ↓ ↓ ↓ V = b0 + b1 ∙ x b1 = lgb b0 = lga

  20. 2. Feladat File / Open / Employee data.sav Milyen természetű a kapcsolat a fizetés és az életkor között? ?  Új változó létrehozása!

  21. Új változó: életkor = adott év – születési dátum (ÉV!) (date of birth) Analyze / ComputeVariable… This year

  22. Analyze / Regression / CurveEstimation… • Lineáris • Compound • Power Diagram

  23. Output Lineáris Compound Power Itt a legnagyobb az R2

  24. Output View… Melyik regresszió-függvény illeszkedik a legjobban? • Mi az oka a szóródásnak? • Nemek szerinti megoszlás / • Munkatípus szerinti megoszlás!

  25. Graphs / Scatter/Dot / Simple

  26. Nemek szerint csoportosítva Általánosságban véve a férfiak fizetése magasabb, de a szórás itt nagyon magas.

  27. Munkatípus szerinti csoportosításban:

  28. A 3 munkakategóriát elkülönítve  Data / Split File... Graphs / Scatter/Dot… / Simple

  29. Fit line… Output View: Dupla kattintás az ábrába – Chart Editor Elements / Fit Line at Total („Csúsztatott”)

  30. A hivatalnokok esetében a regressziófüggvény csökken, a többi esetben nő. MIÉRT? (A hivatalnokok fizetése teljesítmény alapú.)

  31. Regresszió Analyze / Regression / Linear…

  32. Korrigált többszörös determinációs együttható Többszörös korrelációs együttható Többszörös determinációs együttható Összehasonlíthatóvá teszi a többszörös determinációs együtthatót a sokaságon belül. Kiszűri a különböző nagyságú mintákból eredő, különböző függő változó számú, különböző elemszámú (n) és független változó számú (p) sokaságokból eredő hibákat. Az összes változónak a függő változóra gyakorolt hatását fejezi ki Megmutatja, hogy a függő változó hány %-át határozza meg az összes független változó együttvéve. A függő változót (current salary) 2,1%-ban határozza meg ez a regressziós modell. Gyenge kapcsolat

  33. b0 b1 Minden szignifikanciaszinten elfogadható a modell. Regresszió egyenes: ŷ = b0 + b1X b0:X = 0 helyen mennyi az Y.  Ha 0 évesek a dolgozók, akkor a keresetük 41543,805$. (Nincs értelme.) b1: ha az X 1 egységgel nő, mennyivel változik az Y.  Ha a dolgozók életkora 1 évvel nőne, a fizetésük 211,609$-ral csökkenne.

  34. Köszönöm a figyelmet!

More Related