150 likes | 432 Views
Modelul de regresie lineară Aspecte tehnice în SPSS [ 1 - Regresia liniara simpl ă ] [ 2 - Regresia liniara multiplă ]. Bibliografie recomandată Agresti & Finley, pp. 243-288 (Ch. 9). Rotariu et. al. (1999), pp. 176-184 Fox, J. 1991. Regression diagnostics , Sage
E N D
Modelul de regresie linearăAspecte tehnice în SPSS[1 - Regresia liniara simplă][2 - Regresia liniara multiplă] Bibliografie recomandată • Agresti & Finley, pp. 243-288 (Ch. 9). • Rotariu et. al. (1999), pp. 176-184 • Fox, J. 1991. Regression diagnostics, Sage norbertpetrovici@yahoo.com cristina_rat@yahoo.com
VEN. În luna trecută (septembrie), suma totală de bani obţinută de către toţi membrii gospodăriei dvs. incluzând salarii, dividende, chirii, vânzări etc., a fost cam de … 0. nici un venit98. NŞ99. NR milioane lei [1 - Regresia liniara simplă]Ipoteza • Întrebarea noastra este: • Există diferenţe între venitul mediu al gospodăriei şi capitalul cultural (total) al membrilor gospoăriei • Întrebarile din BOP 2004 oct care operationalizează conceptele sunt: • (a) capitalul cultural (total) al membrilor gospodăriei • (b) venitul gospodăriei per membru: vengos = pven/nmem BOOK. Aproximativ câte cărţi (în afara manualelor şcolare) aveţi în gospodărie? |__|__|__|__|
Cum calculăm venitul gospodăriei per membru? • venitul gospodăriei per membru: vengos = pven/nmem • Înainte de a face aste operaţii mai întâi trebuie inspectate frecvenţele acesor variabile pentru a observa dacă există sau nu un număr mare de valori lispă sau non-răspunsuri.
Cum se obţine un model de regresie simplă? • 1. reprezentarea vizuală: cum?
Cum se obţine un model de regresie simplă? • 1. reprezentarea vizuală: cum? Dublu click
Cum se obţine un model de regresie simplă? • 1. reprezentarea vizuală: rezultate
Cum se obţine un model de regresie simplă? • 2. statistici: cum?
Cum se obţine un model de regresie simplă? • 2. statistici: rezultate Modelul de regresie lineară obţinut: • r = 0.415 • r2 = 0.172 • Ecuaţia nestandardizată: VenGosp = 1,245 + 0,007*Book • Ecuaţia standardizată: VenGosp = ,415*Book
Cum se obţine un model de regresie simplă? • 2. statistici: interpretare • Interpretare r • Intensitatea medie a legăturii dintre venitul gospodăriei per membru şi numprul de cărţi în gopsodărie este de 0,415 (pe o scală de la -1 la 1, unde zero indică lispa unei legături). • Interpretare r2 • Dacă utilizăm ecuaţia lineară de predicţie VenGosp = 1,245 + 0,007*Book pentru a estima venitul mediul al gospodăriei per membru comitem cu 17,2% mai puţine erori decât dacă am estima acest venit pe baza mediei sale. • Interpretarea coeficientului b • Venitul gospodăriei per membru de familie creşte în medie cu 0,007 milioane de lei vechi = 7000 de lei vechi cu fiecare carte în plus în biblioteca (admiţând că între cele două variabile există o dependeţă lineară). • Interpretarea coeficientului a • cineva care nu are nici o carte în bibliotecă are în medie un venit al gospodăriei per membru de 1,245 milioane de lei = 1.245.000 lei vechi(admiţând că între cele două variabile există o dependeţă lineară). • Interpretarea coeficientului β • La o creştere cu o abatere standard a variabilei BOOK îi corespunde o creştere de ,415 abateri standard a variabilei VenGosp (admiţând că între cele două variabile există o dependeţă lineară)
[2- Regresia liniara multiplă]Ipoteză • Întrebarea noastra este: • Care sunt factorii care pot explica numărul de cărţi al unei gospodării (formă a capitalului cultrural obiectivat)? • Posibili factori explicativi • (a) nivelul educaţiei subiectului / a capului de gospodărie • (b) background familial: educaţia tatălui/educaţia mamei • (c) Mediul de origine / mediul de rezidenţă • (d) ocupaţie nonmanuală • Ipoteza: capitalul cultural obiectivat (book) este dependent de • capitalul cultural institutionalizat al subiectului (educatia subiectului), • capitalul cultural moştenit (educatia tatălui, mediu de origine), • tipul de ocupatie: orientat spre manipulari simbolice a obiectelor sau manuale (ocupaţia nonmanuală) şi • rezidenţa urbană
Model de regresie simplă • Educatie -> Book Principala statistică oferită de tabel este cea care evaluează puterea modelului: ce procent din varianţa variabilei dependente este explicată de modelul de regresie. R2=0.197, adică 19,7% din varianţă. Este un test de seminificaţie pornind de la raţiuni inferenţiale: tabelul ne indică în ce măsură modelul poate fi generalizat la întreaga populaţie.Sig. <=0.05, prin urmare modelul este generaliyabil Tabelul ne oferă informaţiile necesare pentru a construi dreapta de regresie. Y* = -76.700+16.919X Sau standardizat Y* = .444*X
Cum se obţine un model de regresie simplă? • Statistici: interpretare • Interpretare R • Intensitatea medie a legăturii dintre educaţia subiectului şi numărul de cărţi în gopsodărie este de 0,444 (pe o scală de la -1 la 1, unde zero indică lispa unei legături). • Interpretare R2 • Dacă utilizăm ecuaţia lineară de predicţie Book = -76,700 + 16,919*Educaţie pentru a estima numărul mediul de cărţi a gospodăriei comitem cu 19,7% mai puţine erori decât dacă am estima numărul de cărţi pe baza mediei acestei variabile. • Interpretarea coeficientului b • Numărul de căriţi în gospodăriei creşte în medie cu 16,919 exemplare cu fiecare an în plus de şcoală (admiţând că între cele două variabile există o dependenţă lineară). • Interpretarea coeficientului a • cineva care nu are nici un an de şcoală are în medie în gospodăriei -76,700 exemplare (admiţând că între cele două variabile există o dependenţă lineară) [ceea ce este absurd!!] • Interpretarea coeficientului β • La o creştere cu o abatere standard a variabilei Educaţieîi corespunde o creştere de ,444 abateri standard a variabilei Book (admiţând că între cele două variabile există o dependenţă lineară)
Model de regresie multiplă: • Educatie + EducTata -> Book Prin introducerea unei noi variabile: EducatieTata procentul variaţiei explicate este 22,3%, adică o creştere de la 19,7% din varianţă din modelul anterior. Modelul este generalizabil de la eşantion la populaţie Dreapta de regresie nestand. Y* = -76.700+12.906X1+ 6,176X2 Sau standardizat Y* = .339*X1+193X2 Observaţie: R2a crescut, iar coeficientul b şiβ asociat educaţiei a scăzut
Cum se obţine un model de regresie simplă? • Statistici: interpretare • Interpretare R • Intensitatea medie a legăturii dintre educaţia subiectului, educaţia tatălui şi numărul de cărţi în gopsodărie este de 0,473 (pe o scală de la -1 la 1, unde zero indică lispa unei legături). • Interpretare R2 • Dacă utilizăm ecuaţia lineară de predicţie Book = -76,700 + 12.906*Educaţie + 6,176*EducTata pentru a estima numărul mediul de cărţi a gospodăriei comitem cu 22,3% mai puţine erori decât dacă am estima numărul de cărţi pe baza mediei. • Interpretarea coeficientului b • Numărul de căriţi în gospodăriei creşte în medie cu 12,906 exemplare cu fiecare an în plus de şcoală pentru subieţii a căror tată au acelşi număr de ani de şcoală (admiţând că între cele două variabile există o dependeţă lineară). • Interpretarea coeficientului a • cineva care nu are nici un an de şcoală şi nici tatăl subiecului nu are nici un an de şcoală atunci are în medie în gospodăriei -76,700 exemplare (admiţând că între cele două variabile există o dependeţă lineară) [ceea ce este absurd!!] • Interpretarea coeficientului β • La o creştere cu o abatere standard a variabilei Educaţie, pentru subiecţii a căror tată au acelaşi număr de ani de şcoală,îi corespunde o creştere de ,444 abateri standard a variabilei Book (admiţând că între cele două variabile există o dependenţă lineară)
Cum se obţine un model de regresie simplă? • Metoda celor mai mici pătrate (distanţă faţă de un plan • Efectul acestui tip de estimare a dreptei de regresie este acela că fiecare variabilă va aduce în model numai efectul său unic, şi nu si cel mediat. Prin urmare: • Va creşte varianţa totală explicată • Va scădea mărimea coeficientului b