120 likes | 400 Views
Regresijska analiza. Doc. dr. sci. Darko Datzer. Uvod. Korelacijska analiza je vrlo smislena i često sasvim dovoljna; no, ponekad želimo iz podataka jedne varijable zaključiti koji joj rezultat najvjerojatnije odgovara u drugoj varijabli
E N D
Regresijska analiza Doc. dr. sci. Darko Datzer
Uvod • Korelacijska analiza je vrlo smislena i često sasvim dovoljna; no, ponekad želimo iz podataka jedne varijable zaključiti koji joj rezultat najvjerojatnije odgovara u drugoj varijabli • Varijabla iz koje predviđamo vrijednost druge se naziva prediktor, a ona čiju vrijednost predviđamo ovisna
Uvod • Odnos između varijabli x i y definiramo kao skup svih vrijednosti koje označava zadana jednadžba y = α+ βx, gdje su α i β konstante, a x i y predstavljaju varijable čiji se odnos može definirati različitim vrijednostima x i y koji zadovoljava dana jednadžba • U analizama je najveći problem kako izračunati parametre regresije (αiβ); u statističkoj praksi najčešće se primjenjuju tri metode, od kojih je nama najzanimljivija metoda najmanjih kvadrata • Ona kreira pravac regresije koji ima najmanju sumu kvadrata odstupanja pojedinačnih y rezultata od tog pravca
Pretpostavke multiple regresije • Četiri temeljne pretpostavke: • između ovisnih i neovisnih varijabli postoji linearan odnos; • b) ovisna varijabla mora biti neprekidna ili barem intervalna (mjerena na kvantitativnoj skali); • c) empirijska odstupanja oko regresijske površine moraju biti ista za sve vrijednosti neovisnih varijabli (homoskedastičnost) i • d) između parova podataka, tj. empirijskih vrijednosti varijabli ne bi smjelo biti korelacije
Implementacija linearne regresije u SPSS-u • Inicijalna razmatranja vezana za primjenu modela • Veličina uzorka • Dummy varijable • Implementacija Regresijskog Modela u SPSS-u • Analiza SPSS outputa
Pretpostavke za primjenu modela prema A. Fieldu • Tipovi varijabli • Varijansa različita od nule • Odsustvo perfektne multikolinearnosti • Zavisne varijable ne trebaju biti korelirane sa vanjskim varijablama • Homoskedastičnost • Neovisne greške (odsustvo autokorelacije) • Normalno distribuirane greške • Nezavisnost • Linearnost
Tipovi varijabli • Neovisne varijable trebaju biti: • Kvantitativne, ili • Kategoričke s dvije kategorije • Ovisne varijable trebaju biti • Kvantitativne • Kontinuirane • Neograničene (u smislu čitavog opsega predviđanja )
Veličina uzorka • Postoji više kriterija • Što veći uzorak, to bolje • 10 do 15 slučajeva za svaku neovisnu varijablu (najčešće) • 50+8*k (Green – testiranje čitavog modela) • 104+k (Green – testiranje svih ovisnih varijabli) • 100 (dobar model - ovisne varijable dobro objašnjavaju ovisnu) • 200 (model srednjeg kvaliteta) • 600 (loš model - ovisne varijable loše objašnjavaju ovisnu)
Dummy varijable • Kategoričke varijable s dvije kategorije • Vrijednosti su 0 i 1 • Primjer: transformacija varijable Obrazovanje
Implementacija Regresijskog Modela u SPSS-u Analyse Regression Linear...