270 likes | 572 Views
Korelacija. Prof .dr.sc. Elza Jurun Ekonomski fakultet Split POSLOVNA STATISTIKA - stručni studij. ISPITIVANJE ODNOSA MEĐU POJAVAMA. y i. y i. x i. x i. (a) pozitivna funckionalna veza. (b) pozitivna statistička veza. Dijagram rasipanja.
E N D
Korelacija Prof.dr.sc. Elza Jurun Ekonomski fakultet Split POSLOVNA STATISTIKA - stručni studij
yi yi xi xi (a) pozitivna funckionalna veza (b) pozitivna statistička veza Dijagram rasipanja • Poslovna i makroekonomska analiza često, uz promatranje kretanja jedne ekonomske pojave, imaju potrebu istražiti ovisnosti dviju ili više pojava, odnosno numeričkih nizova, zajedno. • Prvi korak: • Dijagram rasipanja u pravokutnom koordinatnom sustavu točkama prikazuje parove vrijednosti dviju promatranih numeričkih varijabli.
yi yi xi xi (b) negativna statistička veza (a) negativna funckionalna veza
yi yi yi xi xi xi (a) nema veze međupojavama (a) pozitivna funckionalna krivolinijska veza (b) pozitivna statistička krivolinijska veza • Veza između promatranih varijabli ne mora uvijek odgovarati jednadžbi pravca.
Primjer Dijagram rasipanja vrijednosti proizvodnje u tekućim cijenama (u 000 kn) i broj zaposlenih (u tis.) na nekom području za nekoliko vremenskih razdoblja Izvor: Podaci su simulirani • Raspored točaka dijagrama rasipanja upućuje na pozitivnu statističku vezu između vrijednosti proizvodnje i broja zaposlenih. Između točaka može se zamisliti linija pravca, ali sve točke ne leže na toj liniji već postoje pozitivna i/ili negativna odstupanja. Dakle, u ovom slučaju, porast broja zaposlenih na promatranom području prati porast vrijednosti proizvodnje.
Koeficijent linearne korelacije Pod pojmom korelacija podrazumijeva se međuzavisnost ili povezanost slučajnih varijabli. • Po smjeru korelacija može biti: • pozitivna i • negativna. Pozitivna korelacija je prisutna kada rast vrijednosti jedne varijable prati rast vrijednosti druge promatrane varijable, odnosno kada pad jedne prati pad vrijednosti druge varijable. Negativna korelacija prisutna je kada rast jedne varijable prati pad druge varijable i obratno.
Pearsonov koeficijent linearne korelacije (r) -najpoznatija mjera linearne korelacije između slučajnih varijabli: ili , gdje su i jednostavne standardne devijacije promatranih varijabli: i
Kreće se u intervalu: Ako je: ; funkcionalna negativna/pozitivna korelacija, ; jaka negativna/pozitivna korelacija, ; srednje jaka negativna/pozitivna korelacija, ; slaba negativna/pozitivna korelacija, nema korelacije.
Primjer Iz osnovnog skupa od 1744 industrijskih poduzeća u Splitsko-dalmatinskoj županiji nakon odbacivanja podataka o poduzećima s 0 zaposlenih i negativnim poslovanjem, te "outliersa" po različitim financijskim pokazateljima, u analizi je ostao uzorak veličine 316 poduzeća. Zadatak je izračunati linearnu korelaciju između odabranih varijabli za poduzeća u uzorku: • broja zaposlenih, • ukupnog prihoda, • neto dobiti i • vlastitog kapitala.
Broj zaposlenih Ukupni prihodi Neto dobit Vlastiti kapital Broj zaposlenih Pear. Corr. 1 .954** .868** .302** Sig. . .000 .000 .000 N 316 316 316 316 Ukupni prihodi Pear. Corr. .954** 1 .959** .311** Sig. .000 . .000 .000 N 316 316 316 316 Neto dobit Pear. Corr. .868** .959** 1 .146** Sig. .000 .000 . .009 N 316 316 316 316 Vlastiti kapital Pear. Corr. .302** .311** .146** 1 Sig. .000 .000 .009 . N 316 316 316 316 Correlations ** Correlation is significant at the 0.01 level (1%).
Korelacija ranga • Ako se želi istražiti međuovisnost pojava koje su izražene modalitetima redosljednog obilježja, odnosno ako su im modaliteti pridruženi na temelju ordinalne skale računa se korelacija ranga. • Spearmanov koeficijent korelacjie ranga (rS): gdje je: N - odgovarajuća vrijednost iz tablica normalne distribucije, - razlika rangova vrijednosti varijabli X i Y.
Korelacija ranga • Spearmanov koeficijent korelacije ranga može poprimiti vrijednosti u intervalu: • Kada ovaj koeficijent poprimi vrijednosti -1 i 1, riječ je o potpunoj korelaciji ranga među varijablama. • Vrijednost ovog koeficijenta 0 znači da nema nikakve korelacije ranga među pojavama. • Najćešće se vrijednost Spearmanovog koeficijenta kreće u rasponu
Primjer Zadani su podaci za 12 studenata fakulteta "E" o bodovima na testu iz predmeta: Matematika i Ekonometrija. Zadatak je izračunati Spearmanov koeficijent korelacije ranga uspjeha na testovima.
Studenti Bodovi na testu iz Matematike (xi) Bodovi na testu iz Ekonometrije (yi) Rang r(xi) Rang r(yi) Razlika rangova di A 50* 45* 6,5 5 1,5 2,25 B 64 70 9 11 -2 4 C 43 45* 5 5 0 0 D 80 75 12 12 0 0 E 21 38 2 2 0 0 F 57 60 8 8 0 0 G 50* 45* 6,5 5 1,5 2,25 H 37 50 4 7 -3 9 I 10 25 1 1 0 0 J 75 68 11 10 1 1 K 65 63 10 9 1 1 L 35 40 3 3 0 0 Ukupno: - - - 0 19,5 Tablica: Bodovi na testu iz Matematike i Ekonometrije odabranih studenata fakulteta "E" Izvor: Podaci su simulirani
Spearmanov koeficijent korelacije ranga je pozitivan i iznosi 0.93. Može se zaključiti da u ovom primjeru između uspjeha na testu iz Matematike i Ekonometrije postoji visoka korelacija ranga. Odnosno, ako je student postigao dobar rezultat na testu iz Matematike, može se očekivati da će postići dobar rezultat i na testu iz Ekonometrije i obratno.
Kendallov koeficijent korelacije ranga (W) • mjeri stupanj korelacije skupine od varijabli ranga. • pretpostavlja se da su vrijednosti svih varijabli ranga izražene s prvih N prirodnih brojeva. • ako su varijable originalno dane u numeričkom obliku, potrebno ih je transformirati u varijable ranga.
gdje je: - aritmetička sredina rangova (rki) po svim varijablama k, za svako opažanjei. - aritmetička sredina svih rangova (rki) za sve varijable k i sva opažanja i.
Ovaj koeficijent se kreće u intervalu: • W=1, znači potpuno neslaganje rangova promatranih K varijabli. • W=0, znači potpunu podudarnost rangova promatranih K varijabli.
Primjer Zadani su rangovi za 19 različitih regija prema 3 regionalna ekonomskapokazatelja: r1 - društveni proizvod po stanovniku, r2 - broj ind. poduzeća s pozitivnim poslovanjem, r3 - broj stanovnika s VSS na 1000 stanovnika. Zadatak je izračunati Kendallov koeficijent korelacije ranga između ovih varijabli.
Regija A 2 3 2 7 2,3333 58,7778 B 4 4 3 11 3,6667 40,1111 C 1 2 1 4 1,3333 75,1111 D 7 7 6 20 6,6667 11,1111 E 3 1 4 8 2,6667 53,7778 F 5 6 7 18 6,0000 16,0000 G 6 5 5 16 5,3333 21,7778 H 9 10 9 28 9,3333 0,4444 I 11 11 10 32 10,6667 0,4444 J 8 9 8 25 8,3333 2,7778 K 14 14 13 41 13,6667 13,444 L 10 8 11 29 9,6667 0,1111 M 12 13 14 39 13,000 9,0000 N 13 12 12 37 12,3333 5,4444 O 16 17 16 49 16,3333 40,1111 P 18 18 17 53 17,6667 58,7778 R 15 16 15 46 15,3333 28,4444 S 19 19 19 57 19,0000 81,0000 T 17 15 18 50 16,6667 44,4444 190 190 190 - - 561,1111 Tablica: Rangovi za 19 različitih regija prema 3 regionalna ekonomska pokazatelja Izvor: Podaci su simulirani
Kendallov koeficijent korelacije ranga (W=0,9844) pokazuje da postoji visoki stupanj podudarnosti rangova u 19 odabranih regija prema ova 3 ekonomska pokazatelja. • Regije s visokim društvenim proizvodom po stanovniku imaju veći broj industrijskih poduzeća s pozitivnim poslovanjem, kao i veći udio visoko obrazovanih stanovnika (s VSS).