1 / 33

TIESINĖ REGRESIJA

TIESINĖ REGRESIJA. Pavyzdžiai. Koks parduodamų ledų kiekis priklausomai nuo oro temperatūros? Kaip sistolinis kraujo spaudimas priklauso nuo KMI? Kaip išlaidos priklauso nuo pajamų? Ar gimstamumas priklauso nuo šeimos pajamų?

miyoko
Download Presentation

TIESINĖ REGRESIJA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TIESINĖ REGRESIJA

  2. Pavyzdžiai • Koks parduodamų ledų kiekis priklausomai nuo oro temperatūros? • Kaip sistolinis kraujo spaudimas priklauso nuo KMI? • Kaip išlaidos priklauso nuo pajamų? • Ar gimstamumas priklauso nuo šeimos pajamų? • Išmatavome IQ pirmame kurse. Ar galima prognozuoti koks bus studento diplomo pažymių vidurkis? • Kokį vidutinį VS studento baigiamojo darbo balą galima prognozuoti, jei visas studijų balų vidurkis 8,7?

  3. Tiesinė regresija ir koreliacija • Tas pats koreliacijos koeficientas gali nusakyti skirtingą priklausomybę (stipri, silpna, teigiama, neigiama) • Regresinė analizė leidžia prognozuoti vieną kintamąjį kito atžvilgiu • Koreliacija simetriška, regresiniai modeliai kintamųjų atžvilgiu asimetriški.

  4. Skirtingos koreliacijos pavyzdys • Koreliacija tarp išlaidų reklamai ir pajamų yra 0,99 – stiprus teigiamas ryšys. • Ar naudinga firmai padidinti išlaidas reklamai? • Atrodytu, kad taip! • Tačiau tokį rezultatą gali duoti tiek įdėtas 1 Lt ir gautas kelių Lt pelnas, tiek kelių cnt. pelnas.

  5. Kintamieji • Kintamasis, kurio reikšmes norima prognozuoti, vadinamas priklausomu kintamuoju (dependent variable). • Kintamasis, pagal kurio reikšmes norima prognozuoti priklausomo kintamojo reikšmes, vadinamas nepriklausomu kintamuoju (independent variable).

  6. Du ir daugiau nepriklausomų kintamųjų

  7. Paprastos tiesinės regresijos modelis y=a+bx+e y ir x kintamieji a ir b konstantos (a- laisvasis narys (angl. intercept), b-tiesės krypties koeficientas (angl. slope)) e atsitiktinė paklaida

  8. Regresijos grafinis vaizdas

  9. Tiesinės regresijos žingsniai • Priklausomo ir nepriklausomo kintamojo nustatymas. • Jų ryšys (tiesinis – koreliacija). Daugialypėje regresijoje multikolinearumo įvertinimas tarp nepriklausomų kintamųjų. • Regresijos modelio vertinimas: • Determinacijos koeficientas. • ANOVA • Regresijos koeficientai, jų stat. reikšmingumas. • Paklaidų (residuals) analizė (išskirtys, paklaidų grafikai). • Galutinės lygties užrašymas, jos interpretacija.

  10. Pavyzdys excel –Automobilio taisymo kainos priklausomybė nuo ridos Priklausomas kintamasis – remonto kaina Nepriklausomas kintamasis – rida Duomenys:

  11. KORELIACIJA

  12. Lygtis ir hipotezė y=a+bx Tikrinama H0: b=0 HA: b≠0

  13. Excel – “Data analysis” → “Regression”

  14. Analizės išklotinė

  15. Grafiškai pagal duomenis(Automobilio taisymo kainos priklausomybė nuo ridos)

  16. Išklotinės rezultatai – ką vertinti?

  17. Determinacijos koeficientas,ANOVA,regresijos koeficientai

  18. Paklaidų analizė • Išskirtys (iš grafiko arba standartizuotų paklaidų) • Vidurkiai lygūs nuliui • Paklaidų skirstiniai normalūs • Dispersija tolygi (homoskedatiška) • Paklaidos atsitiktinės (aiškinimas youtube: http://www.youtube.com/watch?v=vM13uarpcuQ)

  19. Paklaidų vidurkiai lygūs nuliui

  20. Paklaidų skirstiniai normalūs

  21. Paklaidų dispersija tolygi (homoskedatiška)

  22. Galutinės lygties užrašymas(Automobilio taisymo kainos priklausomybė nuo ridos) Remonto kaina=-197,3+0,01*rida(km) Jei nepriklausomas kintamasis (rida) padidėja vienu vienetu (1 km), priklausomas kintamasis (remonto kaina) padidės dydžiu, lygiu b įverčiui (0,01 USD).

  23. Grafiškai(Automobilio taisymo kainos priklausomybė nuo ridos)

  24. Tiesinė daugialypė regresija

  25. Pavyzdžiai • Ar poegzamininis dirglumas priklauso nuo gauto pažymio, nuo egzamino trukmės ir nuo ko labiau? • Kaip antikvarinės keramikos kaina priklauso nuo jos senumo ir aukciono dalyvių skaičiaus? • Ar diplomo pažymių vidurkis ir komunikabilumas gali padėti prognozuoti būsimą atlyginimą?

  26. Tiesinė daugialypė regresija y=a+b1x1+b2x2+b3x3+ …+ bjxj+e Tikrinama H0: b=0 HA: bent vienas b≠0

  27. Tiesinė daugialypė regresija Prieš pradedant įvertinama: • Koreliacija • Multikolinearumas (nepriklausomų kintamųjų priklausomybė vienas nuo kito) • Ryšys paprastai žinomas iš praktikos • Ryšio stiprumui nustatyti skaičiuojame koreliacijos koeficientą • Stat. paketuose skaičiuojame VIF ir tolerance. Kintamasis “perdaug multikolinearus”: • Jeigu VIF>4 • Jei tolerance artėja prie nulio

  28. Tiesinė daugialypė regresija

  29. Tiesinė daugialypė regresija

  30. Tiesinė daugialypė regresija kaina=85,71+0,01*rida(km)-92,74*išsilavinimas

  31. Tiesinės regresijos (paprastos ir daugialypės) atlikimo reziumė • Priklausomo ir nepriklausomo kintamojo nustatymas. • Jų ryšys (tiesinis – koreliacija). Daugialypėje regresijoje multikolinearumo įvertinimas tarp nepriklausomų kintamųjų. • Regresijos modelio vertinimas: • Determinacijos koeficientas. • ANOVA • Regresijos koeficientai, jų stat. reikšmingumas. • Paklaidų (residuals) analizė (išskirtys, paklaidų grafikai). • Galutinės lygties užrašymas, jos interpretacija.

  32. Tiesinės regresijos prielaidos • Stebėjimai: • Tiesinis ryšys • Normalūs skirstiniai (bet nebūtinai) • Dipersijos panašios • Paklaidos • e normaliai pasiskirstę atsitiktiniai dydžiai; • visų e vidurkiai lygūs nuliui; • visų e dispersijos tolygios (homoskedatiškos); • visi e nepriklausomi.

  33. Pagrindinės priežastys, dėl kurių tiesinė regresija gali netikti • Kintamųjų priklausomybė nėra tiesinė • Stebėjimai heteroskedatiški • Paklaidų skirstiniai nėra normalieji • Paklaidos nėra atsitiktinės • Duomenyse yra išskirčių

More Related