100 likes | 202 Views
Regresie lineara multipă cu variabile dummy - efecte aditive - efecte interactive. Norbert Petrovici NorbertPetrovici @yahoo.com. regresie multiplă. Ipoteza : venitul asteptat este dependent de nivelul d e consum , de mediu de rezidenţă şi consumul în funcţie de mediul de rezidenţăww.
E N D
Regresie lineara multipă cu variabile dummy- efecte aditive- efecte interactive Norbert Petrovici NorbertPetrovici@yahoo.com
regresie multiplă • Ipoteza: venitul asteptat este dependent de nivelul de consum, de mediu de rezidenţă şi consumul în funcţie de mediul de rezidenţăww
regresie multiplă efecte aditive si efcte de interactiune • Putem modela în două moduri ipoteza • 1. Teorie: Mediu urban comparativ cu mediul rural oferă mai multe oportunităţi de consum Venit = a+ b1*Consum + b2*Mediu • 2. Teorie:Mediu urban comparativ cu mediul rural oferă oportunităţi diferit, şi în plus chiar consumul variază în funcţie de mediu. Venit = a+ b1*Consum + b2*Mediu+ b3*Consum*Mediu →
Model 1. Teorie: Pe măsură ce creşte consumul venitul aşteptat creşte în acelaşi ritm si in urban şi în rural, doar că în urban începe de la un nivel mai mare Modelare dreapta de regresie: • Interceptul diferă pentru urban şi rural (venitul asptetat va creşte de la o valoare mai mare in urban comparativ cu rural= • panta este aceeaşi pentru urban si rural (venitul asteptat va creste in acelasi ritm şi în urban şi în rural) Model 2. Teorie: Pe măsură ce consumul creşte venitul aşteptat în urban creşte mult mai mult decât în rural. Modelare dreapta de regresie: • Interceptul diferă pentru urban şi rural (venitul aşptetat creşte de la o valoare mai mare in urban) • Panta este diferită pentru urban si rural (venitul asteptat creste mai accentuat în urban decât în rural)
regresie multiplă (catintativ + dummy) • Consum + Mediu -> Venit aşteptat Valoarea de 0.487 a corelaţia indică o intensitate moderată a legătură medii dintre variabile Nivelul Consumului per membru de familie luna trecuta şi tipul localităţii explică 23,7%, din varianţa variabilei venit asteptat per membru de familie Modelul este generalizabil de la eşantion la populaţie. Diferenţele dintre panta dreptei de regresie si medie nu se datoreaza erorilor de eşantionare Dreapta de regresie nestand. Y* = 2,572+0,511*X1+ 1,657*X2 Sau standardizat Y* = 0.375*X1+ 0,227*X2 Toţi coeficienţii sunt semnificativi (sig. < 0.050)
cum interpretăm? • Interpretare R • Intensitatea medie a legăturii dintre venitul aşteptat, consum şi mediu de rezidenţă este de 0,487 (pe o scală de la -1 la 1, unde zero indică lipsa unei legături). • Interpretare R2 • Dacă utilizăm ecuaţia lineară de predicţie Venit = 2,572 + 0.511*Consum + 1,657*Mediu pentru a estima venitul aşteptatcomitem cu 23,7% mai puţine erori decât dacă l-am estima pe baza mediei. • Interpretarea coeficientului b • Venitul aşteptat creşte în medie cu 511 mii lei cu fiecare milion de lei consumat pentru subieţii a care provin din acelaşi mediu rezidenţial (admiţând că între cele două variabile există o dependeţă lineară). • Venitul aşteptat creşte în medie cu 1,757 mii lei pentru cineva din urban comparativ cu cineva din rural pentru un nivel de consum similar (admiţând că între cele două variabile există o dependeţă lineară). • Interpretarea coeficientului a • cineva care nu a consumat deloc luna trecuta şi provine din mediul rural atunci se aşteaptă în medie la 2 572 mii lei (admiţând că între cele două variabile există o dependeţă lineară) • Interpretarea coeficientului β • La o creştere cu o abatere standard a consumului per membru de familie, pentru subiecţii din acelaşi mediu de rezidenţă,îi corespunde o creştere de 0,375 abateri standard a variabilei venit aşteptat per membru de familiei (admiţând că între cele două variabile există o dependenţă lineară)
regresie multiplă (catintativ + dummy+ catitativ*dummy) • Consum + Mediu + Consum*Mediu-> Venit asteptat Intensitatea medie a leg[turii ]ntre variabile a crescut de la 0.487 din modelul precedent la 0.497 Proporţia explicată din varianţa variabilei dependent[ (venit asteptat per membru de familie) a crescut la 24,7% de la 23,7% (valoarea din modelul anterior) Modelul este generalizabil de la eşantion la populaţie. Diferenţele dintre panta dreptei de regresie si medie nu se datoreaza erorilor de eşantionare Dreapta de regresie nestand. Y* = 2,936+0,307*X1+ 1,657*X2 Sau standardizat Y* = 0.375*X1+ 0,227*X2 Toţi coeficienţii sunt semnificativi (sig. < 0.050)
cum interpretăm? • Interpretare R • Intensitatea medie a legăturii dintre venitul aşteptat, consum şi mediu de rezidenţă şi interacţiunea dintre rezidneţă şi consum este de 0,497 (pe o scală de la -1 la 1, unde zero indică lipsa unei legături). • Interpretare R2 • Dacă utilizăm ecuaţia lineară de predicţie Venit = 2,936 + 0.307*Consum + 0,962*Mediu + 0.307 Consum*Mediupentru a estima venitul aşteptatcomitem cu 24,7% mai puţine erori decât dacă l-am estima pe baza mediei. • Interpretarea coeficientului b factor interactiune • Venitul aşteptat creşte în medie în urban faţă de rural cu 307 mii lei mai mult pentru fiecare milion de lei consumatper membru de familie pentru acelaşi nivel de consum (admiţând că între cele două variabile există o dependeţă lineară). • Interpretarea coeficientului a • cineva care nu a consumat deloc luna trecuta şi provine din mediul rural atunci se aşteaptă în medie la 2 936 mii lei (admiţând că între cele două variabile există o dependeţă lineară) • Interpretarea coeficientului β factor interacţiune • Venitul aşteptat creşte în medie în urban faţă de urban cu 0.223 abateri standard, dacă consumul per membru de familie creşte cu o abatere standard, pentru acelaşi nivel de consum (admiţând că între cele două variabile există o dependenţă lineară)
Care e diferenţa algebrică? efect aditiv efect interactiv Dreapta de regresie nestand Venit= 2.419 + 0,618*Consum+ 1,716*Mediu Dreapta de regresie nestand Venit= 3.010+0,287*Consum+ 0,595*Mediu+ 0,496*Consum*Mediu Mediu Rural:Mediu = 0 Venit* = 2.419 + 0,618*Consum+ 1,716*0 = 2,419 + 0,618*Consum Mediu Rural:Mediu = 0 Venit* = 3,010 + 0,287*Consum+ 0,595*0+ 0,496*Consum*0 = 3,010 + 0,287*Consum Mediu Urban:Mediu = 1 Venit* = 2.419 + 0,618*Consum+ 1,716*1 = (2,419 +1,716) + 0,618*Consum = 4,135 + 0,618*Consum Mediu Urban:Mediu = 1 Venit* = 3,010 + 0,287*Consum+ 0,595 *1+ 0,496*Consum*1 = (3.010 + 0,595) + (0,287+ 0,496)*Consum = 3.605 + 0,783 În acest model se schimba doar interceptul (coeficientul a) din dreapta de regresie În acest model se schimba şi interceptul şi panta (coeficientul a şi b) din dreapta de regresie
Care e diferenţa geometrică? Efect aditiv: se schimbă doar interceptul (a-ul) • Efect interactiv: se schimbă • şi interceptul (a-ul) • şi panta (b-ul)