200 likes | 615 Views
REGRESNÁ A KORELAČNÁ ANALÝZA. 2. časť. PREDNÁŠKA. nelineárna regresná analýza intervaly spoľahlivosti a testy hypotéz pre parametre regresného modelu overenie štatistickej významnosti regresného modelu. Nelineárna regresná analýza.
E N D
REGRESNÁ A KORELAČNÁ ANALÝZA 2. časť
PREDNÁŠKA • nelineárna regresná analýza • intervaly spoľahlivosti a testy hypotéz pre parametre regresného modelu • overenie štatistickej významnosti regresného modelu
Nelineárna regresná analýza • v praxi nielen lineárne funkcie, ale veľmi často má priebeh nelineárny priebeh • nelineárne funkcie je možné použiť s dvoma alebo viacerými parametrami • niektoré nelineárne regresné funkcie je možné vhodnou transformáciou upraviť na lineárne v parametroch • k odhadu ich parametrov je potom možné použiť metódou najmenších štvorcov.
Použitie MNŠ • MNŠ je možné použiť k odhadu parametrov regresnej funkcie, ak: • je regresná funkcia lineárna • resp. lineárna v parametroch • je možné regresnú funkciu pretransformovať na lineárnu v parametroch
Nelineárna regresná a korelačná analýza • niektoré typy nelineárnych funkcií hyperbola logaritmická funkcia parabola exponenciálna funkcia mocninová funkcia
Funkcia HYPERBOLY substitúcia
LOGARITMICKÁ funkcia substitúcia
EXPONENCIÁLNA funkcia logaritmická transformácia • VÝSTUP: • ln b0 b0=EXP(lnb0) • ln b1 b0=EXP(lnb0) • VSTUP: • ln y • x
MOCNINOVÁ funkcia logaritmická transformácia • VÝSTUP: • ln b0 b0=EXP(lnb0) • b1 • VSTUP: • ln y • ln x
Intervaly spoľahlivosti pre parametre RF MNŠ vedie k odhadu parametrov RF, ktorá minimalizuje súčet štvorcov odchýlok Vydelením tohto súčtu počtom stupňov voľnosti (v prípade lineárnej regresii n-2) získavame reziduálny rozptyl a jeho odmocnenímreziduálnusmerodajnú odchýlku. Reziduálny rozptyl je neskresleným odhadom rozptylu náhodných chýb, reziduálna smerodajná odchýlka je neskresleným odhadom smerodajnej odchýlky náhodných chýb, čo je možné zapísať nasledovne:
Intervaly spoľahlivosti pre parametre RF Je možné dokázať, že neskresleným odhadom rozptylu lokujúcej konštanty b0 je výberový rozptyl a najlepším odhadom rozptylu regresného koeficientu b1 je alebo
Intervaly spoľahlivosti pre parametre RF Intervalový odhad ľubovoľného parametra pre regresnú priamku vychádza z toho, že za predpokladov formulovaných klasickým lineárnym modelom má veličina trozdelenie s n – p stupňami voľnosti. Pri zvolenej spoľahlivosti 1 – a je obojstranný interval spoľahlivosti pre parameterb0 daný vzťahom
Intervaly spoľahlivosti pre parametre RF a pre parameterb1
Test významnosti parametrov RF • Testovanie významnosti parametrov modelu H0: parametre regresnej funkcie sú štatisticky nevýznamné b0 = 0b1 = 0 H1: parametre regresnej funkcie sú štatisticky významné b0 0b1 0 Záver: p hodnota > platí H0parametre nie sú štatisticky významnép hodnota < platí H!parametre sú štatisticky významné Testovacia charakteristika: t = b0/s(b0) t = b1/s(b1)
Overenie kvality modelu • Testovanie významnosti modelu ako celku • na základe rozkladu variability • celková variabilita • na koľko sa odchyľujú konkrétne hodnoty premennej Y od celkového priemeru • vysvetlená variabilita • na koľko sa odchyľujú hodnoty na regresnej priamky od celkového priemeru • nevysvetlená variabilita • na koľko sa odchyľujú skutočné hodnoty premennej Y od hodnôt odhadnutých regresnou priamkou • čím väčšia je vysvetlená variabilita v porovnaní s nevysvetlenou variabilitou, tým lepšie odhadnutápriamka modeluje závislosť premenných
priemerná suma štvorcov modelu priemerná reziduálna sumaštvorcov = F Overenie kvality modelu • Testovanie významnosti modelu ako celku • Hypotézy: H0: model ako celok nie je významný H1: model ako celok je významný • Testovacia charakteristika • porovnáva variabilitu vysvetlenú modelom a variabilitu nevysvetlenú modelom • čím väčšia je variabilita vysvetlená modelom, tým lepšie model vystihuje závislosť medzi závislou a nezávislou premennou vysvetlenávariabilita suma štvorcovmodelu reziduálna suma štvorcov nevysvetlenávariabilita celková suma štvorcov celková variabilita
Nevysvetlenávariabilita Závisle premenná Vysvetlenávariabilita Celkovávariabilita _ Y Y´ = b0 + b1X Nezávisle premenná Overenie kvality modelu • Testovanie významnosti modelu ako celku • pomocou rozkladu variability modelu
Overenie kvality modelu • ANOVA – analýza rozptylu, ktorá sa využíva na verifikáciu vypovedacej schopnosti modelu
Overenie kvality modelu • testovacie kritérium v tabuľke je možné využiť k súčasnému testovaniu významnosti celého regresného modelu, indexu determinácie aj indexu korelácie • vypočítanú hodnotu F testu porovnávame s tabuľkovou F hodnotou (Fischerove rozdelenie) pri (p-1) a (n – p) stupňov voľnosti • ak F < Ftab považujeme regresný model za nevýznamný, podobne aj index determinácie a index korelácie • ak F > Ftab považujeme regresný model za štatisticky významný, podobne aj index determinácie a index korelácie