1 / 16

Nelineární závislosti

Nelineární závislosti. Co dělat, když závislost přímkou neproložím. Jaké mám možnosti. Transformace - pomůže prakticky jen u monotónních závislostí - je třeba si dát pozor - transformace prediktoru mění jen tvar, transformace odpovědi i pravděpodobnostní charakteristiky. Jaké mám možnosti.

akina
Download Presentation

Nelineární závislosti

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Nelineární závislosti Co dělat, když závislost přímkou neproložím

  2. Jaké mám možnosti • Transformace - pomůže prakticky jen u monotónních závislostí - je třeba si dát pozor - transformace prediktoru mění jen tvar, transformace odpovědi i pravděpodobnostní charakteristiky

  3. Jaké mám možnosti • Polynomiální regrese - libovolnou funkci lze nahradit (v omezeném rozsahu hodnot prediktoru) polynomem • Užiju, když věřím, že reziduály budou náhodně a rovnoměrně rozloženy kolem polynomu • Tradiční názvy kvadratická regrese, kubická regrese

  4. Polynomiální regrese Y=α + β1X + β2X2 + β3X3 +…+ βmXm+ε Je to vlastně aplikace mnohonásobné lineární regrese, kde prediktory jsou X, X2, X3 atd. Počítá se stejně (tj. opět kriterium nejmenšího součtu residuálních čtverců, které má opět (normálně) jedno minimum). Obdobný význam má i R2, obdobně se počítají testy významnosti (tj. celková ANOVA modelu, a testy pro jednotlivé členy polynomu). Takže opět předpokládám, že ε je aditivní, nezávislé na predikované hodnotě (homogenita variance).

  5. 1 2 Se zvyšujícím se stupněm polynomu stoupá “flexibilita” 3 4 5 Pozor! Zvyšující se složitost nemusí znamenat lepší predikční schopnost

  6. Stepwise regression - postupně zesložiťuji model

  7. Stepwise regression - postupně zesložiťuji model -kvadratická regrese může být vysoce průkazná, i když lineární regrese průkazná není Průkaznost kvadratického členu můžeme chápat jako důkaz nelinearity vztahu

  8. Polynomiální regresi užíváme obvykle, když • vidíme, že vztah není lineární, ale nemáme žádnou představu, jak by funkční závislost měla vypadat • Nepamatuji se, že bych viděl rozumné použití polynomu vyššího než třetího stupně

  9. Jaké mám možnosti • Mám představu (třeba z nějaké teorie), jak má závislost vypadat, a věřím, že reziduály budou náhodně kolem predikované hodnoty, tj model je • Y=f(X) + ε [X zde značí vektor, může se tedy jednat o více vysvětlujících proměnných] • Odhadujeme opět metodou nejmenšího součtu čtverců

  10. Na rozdíl od metod lineární regrese (včetně polynomiální) je nutné hledat minimum metodami numerické matematiky - nemusí existovat analytické řešení, ani není jistota, že nalezené minimum je minimem globálním. Numerický postup: 1. Zderivovat podle všech odhadovaných parametrů. 2. Položit všechny derivace rovny nule. 3. Vyřešit soustavu. Numerické řešení rovnice f(x)=0

  11. Na rozdíl od metod lineární regrese (včetně polynomiální) je nutné hledat minimum metodami numerické matematiky - nemusí existovat analytické řešení, ani není jistota, že nalezené minimum je minimem globálním. Numerický postup: 1. Zderivovat podle všech odhadovaných parametrů. 2. Položit všechny derivace rovny nule. 3. Vyřešit soustavu. Numerické řešení rovnice f(x)=0 [Newtonova metoda] f(x) x1 x2 x3 x “Můj” odhad x

  12. Nevýhody numerického řešení • Ne vždy konverguje • Někdy najde jen lokální minimum (i tam se derivace rovnají nule), a nemáme moc možností ověřit, jaké to minimum je • Potřebujeme počáteční odhady hodnot parametrů

  13. Analogie - kulička padá dolů

  14. Různé “lokální regrese” - nedostanu funkci, pro každý kousek platí trochu jiná

  15. Vím, jaké má asi rozdělení odpověď • Zobecněné lineární modely • Jsou schopny odrážet typ rozdělení, (tedy i to, jakých hodnot může odpověď nabývat (třeba že pravděpodobnost přežití musí být mezi nulou a jedničkou)

  16. Typický příklad - logistická regrese

More Related