350 likes | 598 Views
Sveučilište u Zagrebu Filozofski fakultet Odsjek za psihologiju. Vježbe iz psihometrije. Vježba Relacije diferencijalno ponderiranih linearnih kombinacija i drugih varijabli. Uvod.
E N D
Sveučilište u Zagrebu Filozofski fakultet Odsjek za psihologiju Vježbe iz psihometrije Vježba Relacije diferencijalno ponderiranih linearnih kombinacija i drugih varijabli
Uvod Kao što je ranije spomenuto zbog višestruke determiniranosti kriterijskih varijabli (kompleksnosti kriterija) u svrhu njihove predikcije koristi se manje-više redovito baterija testova, a ne samo jedan mjerni instrument. Jednostavna linearna kombinacija vrlo često nije zadovoljavajući model za formiranje ukupnih rezultata u skupovima prediktorskih varijabli. U prediktivnim modelima neke varijable imaju redovito veću relevantnost za procjenu najvjerojatnijih kriterijskih rezultata pa je, razumljivo takvim varijablama potrebno dati i odgovarajuću veću težinu ili značaj,
Kao i kod JLK varijable u linearnoj kombinaciji gotovo uvijek nazivamo prediktorskim (nezavisnim), a jednostavne varijable kriterijima ili kriterijskim varijablama (zavisnim). Stoga je katkada i teoretski i praktički opravdano, pa i nužno ukupne rezultate formirati po modelu DPLK koji u općem formalnom obliku glasi Uidp = Xi1w1 + Xi2w2 + ... + Xikwk
Uidp = Xi1w1 + Xi2w2 + ... + Xikwk gdje su: X1 ... Xk - individualni rezultati u komponentama L.K. (prediktorima) w1 ... wk - pripadajući ponderi, tj. koeficijenti važnosti pojedinih komponenti Kao što je već ranije pokazano, aritmetička sredina ovakve D.P.L.K. je: Mu(dp) = M1w1 + M2w2 + ... + Mkwk = Mjwj , j = 1,...,k gdje su M1 do Mk aritmetičke sredine komponenata.
Varijanca je jednaka slijedećem izrazu: pri čemu i = 1,...,k , j = 1,...,k , i < j
1. Korelacija između diferencijalno ponderirane linearne kombinacije i jednostavne vanjske varijable Ovaj tip odnosa od velike je teorijske i praktične važnosti jer omogućava nalaženje najpovoljnijeg skupa pondera za neki skup prediktorskih varijabli u svrhu prognoze neke jednostavne kriterijske varijable. Glavni cilj bilo kakvog prediktivnog postupka sastoji se u maksimaliziranju efikasnosti prognoze i prema tome, nalaženju sustava pondera prediktorskih varijabli koji će omogućiti maksimalno efikasnu prognozu zadanog kriterija.
Pokušat ćemo provjeriti o kojim faktorima ovisi korelacija između diferencijalno ponderirane linearne kombinacije sačinjene od k članica i neke jednostavne vanjske varijable Y. Da bismo izjednačili udio svake varijable, transformirat ćemo sve varijable u z-vrijednosti.
Neka je zadan neki skup prediktorskih varijabli koje su standardizirane (transformirane u tzv. z-metriku, ili z-vrijednosti). Skup članica J.L.K.: Neka je zadana neka kriterijska varijabla Y, koja ne pripada prethodnom skupu, a za koju vrijedi:
Neka je zadana D.P.L.K. od dvije varijable koje su standardizirane (transformirane u tzv. z-metriku, ili z-vrijednosti), Definirajmo korelaciju između linearne kombinacije koja se sastoji od 2 članice izražene u z-vrijednostima i kriterijske varijable Y kao produkt-moment koeficijent korelacije:
Budući da kod standardiziranih varijabli vrijedi: M(dp) = w1M1 + w2M2 = 0 Možemo pisati:
Za standardne devijacije vrijedi: ukoliko pomnožimo izraz u brojniku, te uvrstimo izraze za standardne devijacijemožemo pisati:
Provedemo li sumaciju polinoma u zagradi brojnika, a zatim dobivene članove podijelimo sa N, dobivamo pojedinačne korelacije između članica i vanjske varijable (kriterija).
U općem obliku, za bilo koji broj varijabli u linearnoj kombinaciji, korelacija između diferencijalno ponderirane linearne kombinacije z-vrijednosti i neke kriterijske varijable koja nije njezina članicajednaka je:
Iz posljednje formule jasno je da će korelacija između neke D.P.L.K. i jedostavne vanjske varijable ovisiti o pojedinačnim korelacijama članicalinearne kombinacije i kriterija, njihovoj međusobnoj povezanosti, ali i o strukturi pondera pridruženih pojedinim članicama. Iz posljednje formule je očito da se ova korelacija može izračunati iz korelacijske matrice koja sadrži sve korelacije koje je moguće izračunati tretirajući članice linearne kombinacije i kriterijsku varijablu kao separatne mjere, te poznavajući pondere za prediktorske varijable Ukoliko je zadana kompletna korelacijska matrica definirana sa k prediktorskih varijabli i kriterijskom varijablom Y
Matrica R se može sadržajno podijeliti u tri dijela: matricu (vektor) korelacija članica linearne kombinacije i vanjske varijable, matricu intrakorelacija članica linearne kombinacije, koja je očito kompletna korelacijska matrica, te vektor s ponderima pridruženim svakoj od članica.
Razmotrimo ovaj odnos na jednom primjeru: Neka je zadana kompletna korelacijska matrica definirana sa dva standardizirana prediktora i jednim kriterijem K: Neka je zadana neka kriterijska varijabla K, koja ne pripada prethodnom skupu, a za koju vrijedi: a) Izračunajte korelaciju između J.L.K. z1 i z2 s kriterijem K
b) Izračunajte korelacije između D.P.L.K. i kriterija K upotrebljavajući sljedeće vrijednosti pondera: Nacrtajte grafički prikaz odnosa između pondera za z1 i korelacije između D.P.L.K., te komentirajte crtež:
Ukoliko u nekoj prediktorskoj bateriji koristimo nestandardizirane varijable, tj. varijable s različitim standardnim devijacijama, onda njihove st.devijacije imaju ulogu pondera. Stoga za računanje korelacije između takve diferencijalno ponderirane linearne kombinacije i vanjske varijable možemo koristiti prethodnu formulu, pri čemu umjesto pondera (w) možemo uvrstiti standardne devijacije varijabli, tj. (koje u ovom slučaju imaju ulogu pondera).
i,j = 1,...,k ; i < j Ili još jednostavnije:
Prethodni slučaj možemo razmatrati i kao model prema kojemu smo standardizirali članice linearne kombinacije i zatim ih ponderirali njihovim standardnim devijacijama: Ui(dp) = zi11 + zi22 + ... + zikk
Primjer: Neka su zadana 2 prediktora (P1 i P2) i kriterij K P1 je dobar prediktor za K P2 je loš prediktor za K P1 i P2 su nisko korelirani P1 i P2 imaju različite standardne devijacije
a) Izračunajte korelaciju J.L.K. P1 i P2 sa kriterijem K, uz pretpostavku da su prediktori standardizirani: b) Izračunajte korelaciju J.L.K. P1 i P2 sa kriterijem K uz originalne st.dev. prediktorskih varijabli: c) Izračunajte korelaciju između D.P.L.K. P1 i P2 u slučaju kada bismo standardizirane varijable ponderirali na prikladniji način: Optimalni regresijski ponderi za ova 2 prediktora iznose: w P1 = 0.98 w P2 = -0.096
2. Korelacija između diferencijalno ponderirane linearne kombinacije i neke njezine članice (spuriozna ili patvorena korelacija) Prilikom nekih praktičnih operacija pri konstrukciji i validaciji testova (procjena diskriminativne valjanosti čestica kompozitnih testova, faktorska validacija i sl.) susrećemo se s problemom izračunavanja korelacije između linearne kombinacije i neke varijable koja je uključena u tu linearnu kombinaciju.
Ova situacija predstavlja samo poseban oblik algoritma koji smo prethodno pokazali, no u ovom slučaju kriterijska varijabla je bilo koja članica linearne kombinacije. Neka je zadan neki skup prediktorskih varijabli koje su standardizirane (transformirane u tzv. z-metriku, ili z-vrijednosti). Skup članica J.L.K.:
Definirajmo korelaciju između linearne kombinacije koja se sastoji od 2 članice izražene u z-vrijednostima i npr. prve članice te linearne kombinacije kao produkt-moment koeficijent korelacije:
Neka je zadana D.P.L.K. od dvije varijable koje su standardizirane (transformirane u tzv. z-metriku, ili z-vrijednosti), Definirajmo korelaciju između linearne kombinacije koja se sastoji od 2 članice izražene u z-vrijednostima i kriterijske varijable Y kao produkt-moment koeficijent korelacije:
Budući da kod standardiziranih varijabli vrijedi: M(dp) = w1M1 + w2M2 = 0 Možemo pisati:
Za standardne devijacije vrijedi: ukoliko pomnožimo izraz u brojniku, te uvrstimo izraze za standardne devijacijemožemo pisati:
Provedemo li sumaciju polinoma u zagradi brojnika, a zatim dobivene članove podijelimo sa N, dobivamo pojedine korelacije između članica linearne kombinacije i prve članice:
U općem obliku, za bilo koji broj varijabli u linearnoj kombinaciji, korelacija između diferencijalno ponderirane linearne kombinacije z-vrijednosti i neke njezine članice (ovdje je označena kao prva članica)jednaka je:
Primjer: zadana je linearna kombinacija koja se sastoji od dvije članice: Ukupni rezultat u ovoj linearnoj kombinaciji izražen je kao zbroj rezultata u dvije članice: Udp = P1 + P2 Važno ja uočiti da je to ekvivalentno modelu diferencijalno ponderirane linearne kombinacije u kojoj standardizirane članice ponderiramo njihovim standardnim devijacijama: U(dp) = zP11+ zP22
a) izračunajte korelaciju članice P1 i cijele linearne kombinacije U b) Izračunajte korelaciju članice P2 i cijele linearne kombinacije U c) Provjerite za obje varijable koliko bi iznosile prethodne dvije korelacije kada bi ukupni rezultat bio izražen prema modelu: U(dp) = zP1+ zP2