2.32k likes | 3.45k Views
Prof. dr Stanislav Fajgelj stanef@eunet.yu www.cpijm.org.yu/stanef.htm. Stanislav Fajgelj. April 2006.. 3. LITERATURA. Fajgelj, S. (2005). Psihometrija ? Metod i teorija psiholo?kog merenja, II dopunjeno izdanje, Beograd: Centar za primenjenu psihologiju.Bukvic, A. (1996): Nacela izrade psiholo?kih
E N D
1. MERNI INSTRUMENTI U KINEZIOLOGIJI, NJIHOVA KONSTRUKCIJA I EVALUACIJA
2. Prof. dr Stanislav Fajgeljstanef@eunet.yuwww.cpijm.org.yu/stanef.htm
3. Stanislav Fajgelj April 2006. 3 LITERATURA Fajgelj, S. (2005). Psihometrija Metod i teorija psiholokog merenja, II dopunjeno izdanje, Beograd: Centar za primenjenu psihologiju.
Bukvic, A. (1996): Nacela izrade psiholokih testova (III izdanje), Zavod za udbenike i nastavna sredstva, Beograd.
Nunnally, J.C., Bernstein, I.H. (1994). Psychometric theory III Edition, McGraw-Hill Series in Psychology, New York.
American Educational Research Association AERA (1999). Standards for educational and psychological testing, Washington: autor.
Momirovic, K., Wolf, B., Popovic, B. (1999). Uvod u teoriju merenja, I. Metrijske karakteristike kompozitnih mernih instrumenata, 2. izdanje, Pritina: Fakultet za fizicku kulturu.
Hambleton, R.K., Swaminathan, H., Rogers, J.H. (1991). Fundamentals of Item Response Theory, SAGE Publications, Newbury Park CA.
4. Stanislav Fajgelj April 2006. 4
5. Stanislav Fajgelj April 2006. 5 Konstrukcija mernih instrumenata i njihova evaluacija Prvi merni instrumenti su merili svojstva objekata koja su dostupna culima: duina, masa, zapremina, vreme. . .
Problemi konstrukcije i evaluacije takvih mernih instrumenata svode se na:
standardizaciju
odredivanje apsolutne nule i jedinice merenja koja reava i problem standardizacije
6. Stanislav Fajgelj April 2006. 6 Konstrukcija mernih instrumenata i njihova evaluacija Po Medunarodnom sistemu mera (SI), donesenom u Parizu 1960. godine, elementarne jedinice su:
metar (duina), kilogram (masa), sekunda (vreme), amper (elektricna struja), kelvin (temperatura), kandel (jacina svetlosti), a ponegde i radijan (ugao)
Sve ostale mere se mogu izvesti iz ovih
Prema tome, spisak osnovnih mera neivog sveta je vrlo kratak
7. Stanislav Fajgelj April 2006. 7 Konstrukcija mernih instrumenata i njihova evaluacija Merenje u prirodnim i tehnickim naukama nailazi na probleme kada meri atribute koji nisu dostupni culima
Pravo reenje za takve probleme su fizicki zakoni koji dovode u egzaktnu vezu dva ili vie atributa
Na osnovu takvih zakona moemo meriti jacinu elektricne struje ili jacinu magnetskog polja
8. Stanislav Fajgelj April 2006. 8 Konstrukcija mernih instrumenata i njihova evaluacija Umesto fizickih zakona, koristi se i blaa varijanta povezanosti atributa empirijska
Na osnovu nje merimo temperaturu, vazduni pritisak, vreme itd.
Ali... vazduni pritisak zavisi od temperature, temperatura od nadmorske visine itd...
Dakle, i fizicko merenje ima problem validnosti i pouzdanosti
9. Stanislav Fajgelj April 2006. 9 Konstrukcija mernih instrumenata i njihova evaluacija Problem merenja u antropolokim i drutvenim naukama je to nema osnovnih jedinica mera, to nema fizickih zakona ni tacnih empirijskih povezanosti atributa. . .
Zbog toga je konstrukcija i evaluacija mernih instrumenata jedan od osnovnih zadataka tih nauka
10. Stanislav Fajgelj April 2006. 10 Evaluacija mernih instrumenata Pod evaluacijom mernih instrumenata podrazumevamo
Odredivanje njihovih mernih svojstava
Ocenjivanje korisnosti, pogodnosti i primenljivosti
11. Stanislav Fajgelj April 2006. 11 Odredivanje mernih svojstava Ne postoji univerzalna definicija mernog svojstva
Ne postoji opte prihvaceni spisak mernih svojstava
Ne postoji opte prihvacena podela mernih svojstava
12. Stanislav Fajgelj April 2006. 12 Odredivanje mernih svojstava Izbor i ocenjivanje mernih svojstava zavisi od: naucne discipline, predmeta merenja, vrste instrumenta itd., ali pre svega od
modela merenja
13. Stanislav Fajgelj April 2006. 13
14. MERNI INSTRUMENTI U NAUKAMA O PONAANJU
15. Stanislav Fajgelj April 2006. 15 Testovi i merenje Testovi su merni instrumenti
U naukama o ponaanju merenje ima vanu ulogu u:
Prakticnoj primeni nauke
Razvoju naucnih konstrukata i nauke u celini
Proveri naucnih hipoteza
Komunikaciji znanja
Evaluaciji znanja. . .
16. Stanislav Fajgelj April 2006. 16 Testovi i merenje Kako razlikujemo testove od metra ili toperice?
Testovima evidentiramo, snimamo manifestno ponaanje ispitanika:
Pokrete
Miljenja, stavove
Reavanje zadataka. . .
Sa ciljem da utvrdimo prisustvo ili stepen prisustva skrivenih osobina koje izazivaju to ponaanje
17. Stanislav Fajgelj April 2006. 17 Vrste testova Postoje brojne mogucnosti za podelu testova
Na primer, po optem izgledu ili medijumu:
Testovi tipa papira i olovke, tampani testovi
Testovi izvodenja, test-aparati, motoricki testovi
18. Stanislav Fajgelj April 2006. 18 Vrste testova tampani testovi
Psiholoki testovi
Upitnici
Skale (stavova npr.)
Skale procene. . .
Ne moraju biti na papiru, nego na racunaru ili nekom drugom medijumu
U psihologiji se koriste sve ove vrste testova, ukljucujuci i testove izvodenja, pa se cesto svi oni nazivaju testovima
19. Stanislav Fajgelj April 2006. 19 Vrste testova Tipicne vrste tampanih testova su:
Verbalni, koji se sastoje od tekstualnih stavki u obliku pitanja, tvrdnji, zadataka, nedovrenih recenica. . .
Neverbalni, koji imaju stavke grafickog, ikonickog ili likovnog karaktera, ili koji nemaju vidljive stavke
Numericki testovi mogu spadati i u jednu i u drugu grupu
20. Stanislav Fajgelj April 2006. 20 Definicije testa Vane komponente svih definicija
Standardizovanost, kao vana komponenta objektivnosti
Testovi sadre proverene drai na koje ispitanici reaguju
Uzima se uzorak ponaanja iz domena osobine
Ispitanici se porede na osnovu rezultata
21. Stanislav Fajgelj April 2006. 21 Testiranje i ocenjivanje Testiranje je: administriranje, ocenjivanje i tumacenje psiholokih testova
Ocenjivanje je prikupljanje podataka razlicitim metodama, njihova analiza, tumacenje i objedinjavanje nalaza
22. Stanislav Fajgelj April 2006. 22 Vrste psiholokih testova Testovi sposobnosti testovi licnosti
Verbalni testovi neverbalni testovi
tampani testovi testovi izvodenja
Strukturirani testovi nestrukturirani testovi
Testovi sa slobodnim odgovorima testovi sa predloenim odgovorima
Grupni testovi individualni testovi
Klinicki testovi neklinicki testovi
Testovi brzine testovi snage
Racunarski podrani i adaptivni testovi
23. Stanislav Fajgelj April 2006. 23 Testovi sposobnosti Od ispitanika se trai maksimalna aktivnost, a rezultate ocenjuje neko drugi
Sposobnosti su kapaciteti da se izvede neko ponaanje: senzomotorne, perceptivne, panja, inteligencija
Kognitivni testovi
Ajtemi se nazivaju zadacima
Testovi podobnosti, testovi postignuca i neuropsiholoki testovi
24. Stanislav Fajgelj April 2006. 24 Primeri kognitivnih ajtema _____ je prema eiru kao kuca prema _____
1. odelo A. prozor
2. glava B. vrt
3. civiluk C. krov
4. rupa D. dimnjak
JIRE : KIRE = FORA : KORE KORA LIRE GORA GIRE
pots stop avum muva acvo ________
Sto puta meri, a jednom seci.
a) Pre nego to neto ucini, dobro promisli
b) Ko hita, vrat lomi
c) Rec se meri, a ne broji.
25. Stanislav Fajgelj April 2006. 25 Guilfordov ajtem za divergentnu produkciju Navedite to vie mogucnosti upotrebe navedenog predmeta (ta sve moete uciniti sa ciglom). Za reavanje imate 2 minuta.
CIGLA moze posluiti za:
26. Stanislav Fajgelj April 2006. 26 Testovi licnosti Od ispitanika se trai tipicna aktivnost i on sam sebe ocenjuje
Osobine (crte) se definiu kao dispozicije
Konativni testovi
Upitnici, inventari ili skale
Ajtemi se nazivaju pitanjima
27. Stanislav Fajgelj April 2006. 27 Racunarski podrani i adaptivni testovi RBT i KAT
U adaptivnim testovima se zadaju ajtemi koji su prilagodeni ispitaniku
28. Stanislav Fajgelj April 2006. 28 Delovi testa Stavka, ajtem, cestica. . .
Paketi ili testleti
Podtestovi i podskale
Uputstvo, primer i veba
Baterije testova
29. Stanislav Fajgelj April 2006. 29 Stavka, ajtem, cestica. . . Osnovni deo svakog testa
Dilema:
ono to ispitanik vidi, ili
ono to psiholog ocenjuje
Kod strukturisanih, objektivnih, tampanih testova... stavka je pojedinacno pitanje ili zadatak
30. Stanislav Fajgelj April 2006. 30 Paketi ili testleti Grupa ajtema koji se odnose na isti sadraj, ili koji predstavljaju celinu, ili koje ispitanik moe da rei sledeci definisani put
Namena im je u povecanju pouzdanosti ili u alternativnim formama (KAT)
Tautologije nisu dobar nacin
31. Stanislav Fajgelj April 2006. 31 Podtestovi ili podskale Mere razlicite osobine
Mere razlicite facete, faktore ili nivoe iste osobine
Imaju stavke razlicitog formata
Zasebno se skoruju
32. Stanislav Fajgelj April 2006. 32 Uputstvo, primer i veba Odtampani su na samom testu (prirucniku) i administrator ih cita takve kakvi jesu
Oni su delovi testa jer mogu dramaticno da uticu na odgovore
Standardno uputstvo i uvodno uputstvo
Testovi sposobnosti obicno imaju primer i vebu
33. Stanislav Fajgelj April 2006. 33 Baterije testova Omnibus testovi
Nekada konstruktori sami prave sloene testove koje nazivaju baterijom
Vanija je situacija kada psiholog kombinuje vie testova za odredenu namenu
Takvoj bateriji nisu odredena merna svojstva
Problem formiranja kompozitnog skora
Prirodan nacin da se homogenim testovima meri iri repertoar osobina
34. Stanislav Fajgelj April 2006. 34 Vrste stavki i format stavki Format ocenjivanja
Binarni
Ordinalni
Nominalni
Stepenovano ocenjivanje
Format prezentiranja
35. Stanislav Fajgelj April 2006. 35 Stavke dihotomnog formata Sastoje se od stabla i ponudena dva odgovora
Liste oznacavanja ili kontrolne liste
Stavke sa prisilnim izborom
Skale sa prisilnim izborom
Stavke sa alternativnim izborom
36. Stanislav Fajgelj April 2006. 36 Pitanja sa viestrukim izborom PVI Ocenjuju se nominalno (nekognitivna) ili binarno (kognitivna)
Sastoje se iz stabla i tri ili vie alternativa
U binarno ocenjivanim PVI jedna od alternativa je najtacniji odgovor
Ostale alternative su distraktori
37. Stanislav Fajgelj April 2006. 37 PVI pitanje broja alternativa Ako nema pogadanja dovoljne su tri
U praksi, dovoljne su cetiri
Istraivanja pokazuju da PVI obicno sadre jedan do dva dobra distraktora, a ostali su obicno nulti distraktori
Ne mora biti isti broj kod svih pitanja
38. Stanislav Fajgelj April 2006. 38 Kako pisati dobra PVI Timski rad
Ako je jedna alternativa najtacnija, to znaci da ostale nisu besmislene
Besmisleni, providni, gramaticki pogreni itd. distraktori cine citavo PVI loim
Dobri distraktori cine PVI dobrim
Atraktor je alternativa koja je posebno privlacna ispitanicima sa poluznanjem
39. Stanislav Fajgelj April 2006. 39 Stavke sa uredenim kategorijama Stavke sa ordinalnim kategorijama
Alternative su poredane po nekom kriterijumu
Skale procene
Likertove skale
Binomni pokuaji, brojanje tacnih odgovora u nekom zadatku. . .
Ali ne i: stavke sa stepenovanim ocenjivanjem koje predstavljaju nacin ocenjivanja
40. Stanislav Fajgelj April 2006. 40 Skale procene Politomne stavke sa uredenim kategorijama
Procenjuje se neko svojstvo ili ponaanje drugih ljudi za koje postoji teorijski okvir da se tretira kao kvantitativno
41. Stanislav Fajgelj April 2006. 41 Skale procene Skalu cini stavka koja ima stablo i skalu odgovora
Skalu odgovora cini skup alternativa koji moe biti: semanticki, numericki ili graficki
Da bi skala odgovora postala skala merenja moraju postojati teorijski i empirijski dokazi
42. Stanislav Fajgelj April 2006. 42 Standardni problemi procenjivanja Popustljivost strogost velikodunost
Ekstremnost greka centralne tendencije
Halo efekt
Procenjivacko usmerenje
Oportunizam
Nestabilnost
43. Stanislav Fajgelj April 2006. 43 Pravila dobre skale procene Skala, posebno skala odgovora mora biti takva da za sve ucesnike ima isto znacenje
Da bude multiajtemska
BARS
Bipolarne skale, skale sa prisilnim izborom. . .
44. Stanislav Fajgelj April 2006. 44 Stavke sa konstruisanim odgovorima Stavke sa otvorenim ili slobodnim odgovorima
Podrazumevaju se kognitivne stavke
Postoji stablo (eksplicitno ili implicitno) i mesto za upisivanje odgovora
45. Stanislav Fajgelj April 2006. 45 Ajtemi sa kompletiranjem Primer:
Ova stavka naziva se ajtem sa _________
Linija moe biti na pocetku ili sredini recenice
Lako se ocenjuju
46. Stanislav Fajgelj April 2006. 46 Ajtemi sa kratkim odgovorima Sastoji se od pitanja koje zahteva kratak odgovor:
Strucni izraz
Frazu
Recenicu
Pasus
Duina linije sugerie koliko dug odgovor se ocekuje
47. Stanislav Fajgelj April 2006. 47 Esejska pitanja Ajtemi sa proirenim odgovorom
to je odgovor dui:
Tee ga je objektivno oceniti
Nepogodniji je za velike grupe
Duina zavisi i od namene, predmeta merenja, osobina ispitanika
Dovoljno je pola strane do jedne strane
Najbolje je ako se zahteva komparacija, ocena i licno miljenje ispitanika o nekoj kontroverzi, problemu. . .
48. Stanislav Fajgelj April 2006. 48 PVI ili PKO PVI se teko prave a lako ocenjuju
PKO se lako prave a teko ocenjuju
PVI nisu pogodna za kompleksne vetine, divergentno miljenje i stvaralatvo
PKO mogu da imaju vrlo nisku pouzdanost, ne mogu da pokriju svo gradivo, ne mogu na velikim grupama...
49. Stanislav Fajgelj April 2006. 49 Ocenjivanje pomocu dosijea Dosijei su zbirka ili uzorak radova prikupljenih tokom vremena
Bliski su metodi prakticnih zadataka
Pravila za formiranje dosija moraju da budu jasna i precizna
Kriterijumi ocenjivanja dosijea moraju biti definisani unapred, jasno i precizno
50. Stanislav Fajgelj April 2006. 50 Banke ajtema Banka ajtema je strukturisani skup ajtema cija su merna svojstva poznata
Banka ajtema je namenjena da se iz nje izvlace alternativne forme testova sa poznatim mernim svojstvima
Banke ajtema su danas implementirane na racunarima
Banka ajtema moe biti jednodimenzionalna ili viedimenzionalna
51. Stanislav Fajgelj April 2006. 51 Banke ajtema Kalibracija banke ajtema
100 do vie stotina ajtema, u zavisnosti od kvaliteta ajtema, namene banke, predmeta merenja itd.
Najjednostavniji nacin biranja ajtema iz banke je na osnovu teine ajtema
Danas se najcece koristi funkcija informativnosti
52. Stanislav Fajgelj April 2006. 52 Racunarsko adaptivno testiranjeKAT Svakom ispitaniku se zadaju ajtemi cija je teina prilagodena nivou osobine kod tog ispitanika
Svaki ispitanik dobija svoj test
Procedura startovanja
Procedura selekcije ajtema
Kriterijumi zaustavljanja
53. Stanislav Fajgelj April 2006. 53 KAT sa binarnim ajtemima
54. Stanislav Fajgelj April 2006. 54 Racunarski zasnovano testiranjeRBT Tu spadaju i banke ajtema i KAT
Pomoc u zadavanju testova
Pomoc u skorovanju i interpretaciji, ekspertski sistemi
Automatsko generisanje ajtema
55. Stanislav Fajgelj April 2006. 55 Testovi orijentisani na norme i na kriterijum Testovi orijentisani na norme se tumace tako to se skor poredi sa normom, tj. sa drugim ispitanicima
Testovi orijentisani na kriterijum se interpretiraju tako to se utvrduje da li je ispitanik dostigao neki kriterijum:
naucio celo gradivo
ovladao nekom vetinom
u stanju da obavlja neki posao, zavri kolu...
56. SKALE I SKALIRANJE
57. Stanislav Fajgelj April 2006. 57 Semanticki diferencijal Osgood ga je konstruisao sa otkrivanje konotativnog znacenja pojmova
Utvrdio je da postoji tri osnovne dimenzije konotativnih znacenja:
Evaluacija ili ocena
Potencija ili snaga
Aktivnost
58. Stanislav Fajgelj April 2006. 58 Semanticki diferencijal
uglast | | | | | | zaobljen
slab | | | | | | jak
rapav | | | | | | gladak
aktivan | | | | | | pasivan
mali | | | | | | veliki
hladan | | | | | | topao
dobar | | | | | | rdav
napet | | | | | | oputen
mokar | | | | | | suv
sve | | | | | | ustajao
59. Stanislav Fajgelj April 2006. 59 MERENJE STAVOVA Stavovi su steceni, nauceni
Tri komponente stava: kognitivna, afektivna i konativna
Stavovi imaju referentni objekt
Stavovi imaju valencu: pozitivnu ili negativnu
Stavovi imaju intenzitet
60. Stanislav Fajgelj April 2006. 60 MERENJE STAVOVA Stavovi se najcece mere skalama stavova.
Skalom stava meri se valenca i intenzitet stava, odnosno njegova afektivna komponenta.
Skale stavova objedinjavaju teorijski pristup stavu, tehnologiju konstrukcije i nacin dodeljivanja brojeva.
61. Stanislav Fajgelj April 2006. 61 OSNOVNE SKALE STAVOVA Skala socijalne distance Bogardusova
Guttmanova skala skalogramska analiza
Thurstoneova skala diferencijalna
Likertova skala sumaciona
62. Stanislav Fajgelj April 2006. 62 BOGARDUSOVA SKALA SOCIJALNE DISTANCE
1) pristao bih da posete moju zemlju
2) pristao bih da ive u mojoj zemlji
3) pristao bih da radim sa njima
4) pristao bih da budu moje komije
5) pristao bih da budu u mom klubu
6) pristao bih na brak sa njima.
63. Stanislav Fajgelj April 2006. 63 GUTTMANOVA SKALA
a) Jeste li vii od 1,90m da ne
b) Jeste li vii od 1,80m da ne
c) Jeste li vii od 1,70m da ne
d) Jeste li vii od 1,60m da ne
64. Stanislav Fajgelj April 2006. 64 GUTTMANOV SKALOGRAM Ajtem Ajtem Ajtem Ajtem
Ispitanik a b c d
11 X X X X
6 X X X X
15 X X X
21 X X X
14 X X X
19 X X
1 X X
9 X
18 X X
11
. . .
Sa X je oznacen tacan odgovor.
65. Stanislav Fajgelj April 2006. 65 THURSTONEOVA SKALA - Smrtna kazna je pogrena, ali je neophodna u naoj nesavrenoj civilizaciji
- Svaki kriminalac treba biti pogubljen
- Smrtna kazna nikad nije bila efikasna u sprecavanju kriminala
- Ne verujem u smrtnu kaznu ni pod kakvim okolnostima
- Smrtna kazna daje kriminalcu ono to on zasluuje
66. Stanislav Fajgelj April 2006. 66 THURSTONEOVA SKALA Stavke se prikupljaju iz razlicitih izvora (eksperti, mediji, zainteresovane osobe...)
Formuliu se u obliku tvrdnji koje imaju opti format:
{objekat stava} {relacija} {vrednost, atribut}
67. Stanislav Fajgelj April 2006. 67 Thurstoneova skala Nakon toga procenjivaci razvrstavaju tvrdnje u 11 kategorija.
Tvrdnje koje sadre najpozitivniji stav u 11. kategoriju
Tvrdnje koje sadre najnegativniji stav u 1. kategoriju
Neutralne tvrdnje u 6. kategoriju
68. Stanislav Fajgelj April 2006. 68 THURSTONEOVA SKALA Nakon razvrstavanja, za svaku stavku imamo njenu srednju teinu (medijanu)
Od zadranih stavki se formira skala
Po teoriji, svaki ispitanik ce zaokruiti jednu stavku (najvie tri), koja odgovara njegovom stavu prema smrtnoj kazni
Teina zaokruene stavke je mera ispitanikovog stava
69. Stanislav Fajgelj April 2006. 69 LIKERTOVA SKALA Smatram da crkvena sluba umiruje i inspirie
Uopte se ne slaem 1
Ne slaem se 2
Neodlucan sam 3
Slaem se 4
Potpuno se slaem 5
70. Stanislav Fajgelj April 2006. 70 LIKERTOVA SKALA
Svaka stavka reprezentuje citav kontinuum stava
Nema etape procenjivaca
Ispitanici zaokruuju alternativu koja odraava njihov stav
Mera ispitanikovog stava dobija se sabiranjem zaokruenih odgovora
71. Stanislav Fajgelj April 2006. 71 Likertova skala Skup alternativa moe imati tri glavna oblika:
Slaganje
Ocenjivanje
Frekvencija i kolicina
Kvantifikacija alternativa
Unipolarno
Bipolarno
72. Stanislav Fajgelj April 2006. 72 Likertova skala Vano je razlikovati skalu odgovora od merne skale
Da bi zaokrueni odgovori 1, 2, 3,... postali mera stava potrebna je dobra teorija i empirijska provera
73. Stanislav Fajgelj April 2006. 73 Likertova skala Problem konstrukcije neutralnih tvrdnji
Nije dobro: crkva je divna, grozna ustanova
Sa tvrdnjom: smrtna kazna je nuna, ali bih voleo da nije se slau oni sa srednjim stavom, ali se ne zna ko se sa njom ne slae
Problem negativno formulisanih tvrdnji
Inverzija stabala
Inverzija alternativa
74. Stanislav Fajgelj April 2006. 74 Likertova skala Problem registrovanja ekstremnih stavova
Ispitanici sa ekstremnim stavom se nece slagati sa blaim tvrdnjama
Problem srednje kategorije, ne znam, ne elim da odgovorim i drugo
75. Stanislav Fajgelj April 2006. 75
76. Stanislav Fajgelj April 2006. 76 Model merenja Model merenja je matematicki ili statisticki model koji numericki kombinuje nezavisne varijable s ciljem da se predvidi zavisna varijabla
Nezavisne varijable su obicno latentne osobine, koje su skrivene konstrukti
Zavisna varijabla je po pravilu odgovor, odnosno ponaanje jedinke, odnosno skor
77. Stanislav Fajgelj April 2006. 77 Model merenja Dve osnovne grupe mernih modela u psihometriji su:
Klasicna teorija testa, ili klasicni merni model, ili model pravog skora KTT
Teorija ajtemskog odgovora ili teorija latentne crte TAO
78. Stanislav Fajgelj April 2006. 78 Klasicna teorija testa Z = T + E ? MODEL
S2 = EtE = diag
TtE = 0
ZtE = (T + E) tE = S2
P = ZtT = Zt(ZE) = ZtZ ZtE = R S2
C = TtT = (ZE)t(ZE) =
= ZtZ EtZ ZtE + EtE = R S2
R = ZtZ = (T+E)t(T+E) = C + S2
79. Stanislav Fajgelj April 2006. 79 Nedostaci KTT Uvek je tacna
Platonski pravi skorovi
Razlicit nacin koncipiranja; test-retest. . .
Nekoreliranost greaka
Meduzavisnost mera osobine od uzorka
Lak test je teak loim ispitanicima. . .
Preplitanje definicija mernih svojstava
80. Stanislav Fajgelj April 2006. 80 Nedostaci KTT Da bi se otklonili, stvoren je niz pomocnih modela, pre svih:
Model paralelnih indikatora
Model uzorkovanja iz domena
81. Stanislav Fajgelj April 2006. 81 Modeli paralelnih indikatora Paralelni indikatori
Tj = Tk
sj2 = sk2 iste varijanse
sjk = slk iste kovarijanse
rjk = rtt = st2 / s2
Pouzdanost nekog indikatora jednaka je njegovoj korelaciji sa nekim drugim, njemu paralelnim indikatorom
82. Stanislav Fajgelj April 2006. 82 Modeli paralelnih indikatora Definisani su i drugi tipovi paralelnih indikatora:
Tau ekvivalentni indikatori, koji imaju jednake prave skorove, razlicite varijanse i iste kovarijanse
Za ocenjivanje pouzdanosti testa najcece se koristi upravo model t-ekvivalentnih indikatora
Kongenericki indikatori, koji imaju razlicite prave skorove, varijanse i kovarijanse
Jedini zahtev je da indikatori imaju samo jedan zajednicki izvor (predmet merenja)
83. Stanislav Fajgelj April 2006. 83 Model uzorkovanja iz domena Druga populacija i drugi uzorak
Domen crte cine sva ponaanja koja izaziva, na koja utice ili koja modulie ta crta
Test obuhvata jedan uzorak tih ponaanja
Pravi skor je onaj koji bi ispitanik dobio kad bi bio ispitan svim ajtemima iz domena
84. Stanislav Fajgelj April 2006. 84 Model uzorkovanja iz domena Za ajteme:
r1. = r2. = ... = rj. = rjk
rjk je prosecna korelacija u matrici
rj(1...m) = rjT = sqrt(rjk) = sqrt(rj.) m?8
Za testove
rj. = rjk = rjT2
rjT je korelacija j-tog testa sa pravim skorom
85. Stanislav Fajgelj April 2006. 85 Teorija generalizabilnosti Univerzum merenja cine sva moguca merenja koja su jednako prihvatljiva onome ko ih primenjuje
Skor univerzuma prosek ili zbir svih merenja
Skor univerzuma = pravi skor
Ako je pojedinacan skor blizak skoru univerzuma, on je generalizabilan
86. Stanislav Fajgelj April 2006. 86 Univerzum i facete Univerzum cine facete:
Ajtemi
Procenjivaci
Vremena
Situacije . . .
Facete su izvori varijanse koji mogu da ometaju odlucivanje, na primer, razliciti kriterijumi procenjivaca
Generalizabilnost-pouzdanost se iskazuje intraklasnim koeficijentima korelacije, a oni se izracunavaju iz tabele ANOVA
87. Stanislav Fajgelj April 2006. 87 Guttmanova ima teorija U univerzumu:
ima je onaj deo varijable koji se moe predvideti iz ostalih varijabli R2 koeficijent determinacije
Antiima je 1 R2
U uzorku-testu:
parcijalni ima
parcijalni antiima = specifitet + greka
88. Stanislav Fajgelj April 2006. 88 Guttmanov model merenja Kljucna matrica je: V2 = diag(R1)1
Ona sadri parcijalne antiimae varijabli:
greke se mogu egzaktno izracunati
Medutim, u Guttmanovom modelu
greke mogu biti korelirane
89. Stanislav Fajgelj April 2006. 89 Faktorski model merenja Nastao kao model podataka, a ne model merenja
Prava varijansa se definie kao varijansa koju objanjavaju zadrani faktori
U terminima FA to je komunalitet h2
Neobjanjena varijansa se naziva unikvitetom (u2) i sadri specifitet (s2) + greku (e2)
h2 + (s2 + e2) = 1
90. Stanislav Fajgelj April 2006. 90 Osnove teorije ajtemskog odgovora TAO Item Response Theory IRT
Osnovne karakteristike:
Skaliranje
Modeliranje
Statisticki pristup dodeljivanju numerala
Specificna objektivnost invarijantnost poretka
91. Stanislav Fajgelj April 2006. 91 Ocena osobine i teine po KTT
92. Stanislav Fajgelj April 2006. 92 Problemi
93. Stanislav Fajgelj April 2006. 93 Ocena osobine i teine u TAO
dajtema = ln[pkolone / (1 pkolone)]
?ispitanika = ln[preda / (1 preda)]
94. Stanislav Fajgelj April 2006. 94 Ocena osobine i teine u TAO
95. Stanislav Fajgelj April 2006. 95 Verovatnoca odgovora po TAO
96. Stanislav Fajgelj April 2006. 96 Verovatnoca odgovora po TAO
97. Stanislav Fajgelj April 2006. 97 Reenje prvog problema - misfit
98. Stanislav Fajgelj April 2006. 98 Reenje drugog problema-misfit
99. Stanislav Fajgelj April 2006. 99 Osnovne pretpostavke Jednodimenzionalnost
Svi ajtemi moraju imati zajednicko jezgro
Lokalna nezavisnost
Korelacija izmedu ajtema mora biti nulta ako se osobina dri konstantnom
100. Stanislav Fajgelj April 2006. 100 Fitovanje modela Modelski pristup merenju se ocituje u tome to se sistematski proverava da li podaci odgovoraju modelu (ili obrnuto)
Uporeduju se modelske predikcije (verovatnoce odgovora) i dobijeni podaci - vidi reenja prvog i drugog problema
101. Stanislav Fajgelj April 2006. 101 Karakteristicna kriva ajtema KKS
102. Stanislav Fajgelj April 2006. 102 3PL TAO model za dihotomne ajteme
? je parametar ispitanika nivo osobine
d, a i c su parametri ajtema:
Teine
Diskriminativnosti
Pogadanja
103. Stanislav Fajgelj April 2006. 103 Raschov model Najpoznatiji model, 1PL
104. Stanislav Fajgelj April 2006. 104 Raschov model Najblii ideji modela merenja slican psihofizickim modelima
Najblii konceptu invarijantnosti poretka, odnosno specificnoj objektivnosti
Najblii Thurstoneovoj definiciji dobrog merenja
105. Stanislav Fajgelj April 2006. 105 Ostali TAO modeli 1P, 2P i 3P modeli
Logisticki i normalni
Za dihotomne i polihotomne ajteme
Za nominalne (PVI) i ordinalne ajteme
Viedimenzionalni i neparametrijski
Tendencija je da se za svaki format ajtema izgrade posebni modeli
106. Stanislav Fajgelj April 2006. 106 KTT TAO KTT
U argonu, merna svojstva se predstavljaju statisticima
Razdvojeni su pouzdanost i valjanost
Nema provere fitovanja
TAO
Merna svojstva se predstavljaju parametrima
Pouzdanost i valjanost se razmatraju u kontekstu objektivnosti
Pouzdanost i valjanost su donekle zamenjeni analizom fitovanja
107. Osnovna merna svojstva
108. Stanislav Fajgelj April 2006. 108 Osnovna merna svojstva
Stavki
Testova
Po KTT koeficijenti ili statistici
Po TAO parametri
109. Stanislav Fajgelj April 2006. 109 Teina stavke KTT Kod binarnih stavki proporcija pozitivnih odgovora p vrednost
U optem slucaju: aritmeticka sredina ajtemskih skorova
Za binarne var. M=p
Za polihotomne var. umesto M mogu se koristiti Mdn ili Mod
110. Stanislav Fajgelj April 2006. 110 Teina stavke ili testa KTT Teina
kao
lokacija
na
kontinuumu
osobine
111. Stanislav Fajgelj April 2006. 111 Teina stavke KTT Protivrecnost: veci p ili M manja teina
Teina nije dobar naziv za stavke koje ne mere sposobnosti
Alternativni nazivi: indeks teine, popularnost, indeks lakoce, p-vrednost. . .
112. Stanislav Fajgelj April 2006. 112 Teina stavke KTT Teina je jedan od dva osnovna kriterijuma za izbor stavki u test
Biraju se stavke razlicitih teina, ali tako da im prosecna teina bude p = 0,50
Izbegavaju se ekstremno lake i ekstremno teke stavke (npr. 0,10 i 0,90)
113. Stanislav Fajgelj April 2006. 113 Teina testa KTT
Prosecna teina stavki u testu ili: aritmeticka sredina ukupnog skora
Zavisi od teine stavki
114. Stanislav Fajgelj April 2006. 114 Diskriminativnost stavke KTT Svojstvo stavke da razlikuje ispitanike sa niskom i visokom osobinom
Alternativni naziv osetljivost (da se razlikuju ispitanici sa razlicitim nivoom osobine)
115. Stanislav Fajgelj April 2006. 115 Diskriminativnost stavke KTT Klasicni pokazatelj: diskriminativna moc (DP), tj. indeks diskriminativne moci, tj. indeks diskriminativnosti ajtema
DP = (G D)/n, pri cemu je G frekvencija pozitivnih odgovora u grupi sa najviim ukupnim skorom. . .
DP se krece u rasponu od 1 do +1
116. Stanislav Fajgelj April 2006. 116 Diskriminativnost stavke KTT Danas se kao pokazatelj diskriminativnosti koristi korelacija stavke sa ukupnim skorom, tj. korelacija ajtemtotal
Najcece se koriste r ili njegova modifikacija rpbis, ili rbis
Faktorsko opterecenje, takode
Korelacija sa spoljanjim standardom, takode
117. Stanislav Fajgelj April 2006. 117 Diskriminativnost stavke KTT Korekcija ajtem-total korelacije uklanjanjem tog ajtema iz ukupnog skora
Diskriminativnost je povezana sa teinom: vrlo laki i vrlo teki ajtemi ne mogu imati visoku ajtem-total korelaciju (osim sa rbis)
118. Stanislav Fajgelj April 2006. 118 Diskriminativnost stavke KTT Visoko diskriminativne stavke su redundantne (testleti)
Nisko diskriminativne stavke su beskorisne
Stavke sa visokim razlikama u diskriminativnosti se seku Lordov paradoks
119. Stanislav Fajgelj April 2006. 119 Diskriminativnost stavke KTT Biraju se ajtemi cije su diskriminativnosti u opsegu umerenih koeficijenata npr. 0,30 do 0,80.
Ako se kao koeficijent koristi r i ako se koristi korekcija, minimalna prihvatljiva vrednost je 0,30
Medutim, postoje miljenja da su prihvatljivi i nii, ali i vii koeficijenti
120. Stanislav Fajgelj April 2006. 120 Diskriminativnost testa KTT Nije teorijski i prakticno cvrsto utemeljena
Zavisi od: duine testa, greaka merenja, distribucije skorova i namene testa (normativni ili kriterijumski)
Distribucija skorova testa zavisi od ajtemskih teina i njihovih interkorelacija
121. Stanislav Fajgelj April 2006. 121 Homogenost testa Alternativni naziv:
jednodimenzionalnost
Svojstvo testa:
Da se cela njegova prava varijansa moe objasniti delovanjem samo jedne osobine, ili
Da svi njegovi ajtemi imaju samo jedan zajednicki predmet merenja zajednicko jezgro
122. Stanislav Fajgelj April 2006. 122 Homogenost stavke Moe se definisati kao ucece zajednickog predmeta merenja u njenoj varijansi
Ne koristi se cesto kao merno svojstvo
123. Stanislav Fajgelj April 2006. 123 Homogenost testa Tautologije i semanticka homogenost nisu homogenost
Potpuna homogenost nije moguca (psihometrijska dogma i drugi razlozi)
Medutim, homogenost dramaticno olakava evaluaciju testa
Multidimenzionalnost, potrebna za dobro ocenjivanje, postie se koricenjem baterije jednodimenzionalnih testova
124. Stanislav Fajgelj April 2006. 124 Homogenost i prosecna korelacija Savreno homogen test je skup paralelnih indikatora cije su greke nulte intekorelacije su jedinicne
Savreno heterogen test je skup paralelnih indikatora ciji su pravi skorovi nulti interkorelacije su nulte
Dakle, na ocenu homogenosti po KTT uticu greke merenja a to nije poeljno
Zato prosecna interajtemska korelacija nije dobra mera homogenosti
125. Stanislav Fajgelj April 2006. 125 Homogenost kroz faktorski model Test je homogen ako fituje jednofaktorski model
Test je homogen ako u njegovoj pravoj (ili ukupnoj) varijansi ubedljivo najvie ucestvuje prvi faktor glavna komponenta
126. Stanislav Fajgelj April 2006. 126 Ocenjivanje homogenosti u KTT Faktorska analiza je optimalna alatka za analizu dimenzionalnosti testa
Ako ima vie faktora slicne duine:
Ako su korelirani, moguca je hijerarhijska faktorska analiza
Mogu da predstavljaju facete iste osobine
Koeficijenti homogenosti se obicno zasnivaju na odnosu varijanse prvog faktora prema ukupnoj varijansi
127. Stanislav Fajgelj April 2006. 127 Pogadanje Samo u oblasti kognitivnog testiranja
Klasicna definicija podrazumeva slepo pogadanje, odnosno jednake verovatnoce biranja alternativa
Abbottova formula:
Tt = T [P / (k 1)]
Korekcija nema efekta kada je korelacija T i P jedinicna, tj. kada ispitanik pokua da rei sve zadatke
128. Stanislav Fajgelj April 2006. 128 Pogadanje U stvarnosti, pogadanje nije slepo
Tee da pogadaju loi ispitanici na tekim ajtemima
Ispitanici koriste testovnu mudrost i ne pogadaju na slepo
Postoje testovna anksioznost i nepaljivost koje mogu delovati u razlicitim uslovima primene testa
129. Stanislav Fajgelj April 2006. 129 Umanjivanje efekta pogadanja Klasicna preporuka je da se: a) ispitanicima dadne instrukcija protiv pogadanja i b) da se primeni Abbottova formula
Suprotno, postoji i preporuka da se od ispitanika trai da pokuaju da ree svaki zadatak
130. Stanislav Fajgelj April 2006. 130 Umanjivanje efekta pogadanja Danas se preporucuje sledece:
Koristiti PVI
Paljivo formulisati distraktore
Koristiti PKO sa dopunjavanjem
Dati dobro uputstvo, obezbediti pravilnu atmosferu. . .
Ako se daje instrukcija protiv pogadanja (ili suprotna), mora biti jasna i precizna
Test mora biti prilagoden uzorku ne preteak (ali ni prelak)
Primeniti 3P TAO model
131. POUZDANOST - RELIJABILNOST
132. Stanislav Fajgelj April 2006. 132 Pouzdanost i valjanost
133. Stanislav Fajgelj April 2006. 133 Tipovi pouzdanosti Po nacinu ocenjivanja (izracunavanja):
Pouzdanost interne konzistencije
Pouzdanost testa i retesta
Pouzdanost alternativnih formi
Pouzdanost slaganja (pr)ocenjivaca
134. Stanislav Fajgelj April 2006. 134 Tipovi pouzdanosti Po nacinu ocenjivanja (izracunavanja):
Pouzdanost interne konzistencije
Pouzdanost testa i retesta
Pouzdanost alternativnih formi
Pouzdanost slaganja (pr)ocenjivaca
135. Stanislav Fajgelj April 2006. 135 Definicije pouzdanosti testa U zavisnosti od toga kako se ocenjuje izracunava:
Interna konzistencija: stepen konzistencije ajtema
Test retest: stepen stabilnosti tokom vremena
Alternativne forme: stepen ekvivalencije formi
Slaganje procenjivaca stepen slaganja - objektivnost
136. Stanislav Fajgelj April 2006. 136 Psihometrijski i statisticki Pouzdanost je mera odsustva greaka merenja
Opte formule za racunanje pouzdanosti:
137. Stanislav Fajgelj April 2006. 137 Svojstvo testa ili podataka? Iako se moe definisati i za ajteme, u praksi se koristi prvenstveno kao merno svojstvo testa
Neki testovi jesu manje, a neki vie pouzdani, ali:
pouzdanost se uvek odnosi na podatke iz kojih je izracunata
138. Stanislav Fajgelj April 2006. 138 Pouzdanost interne konzistencije Izracunava se iz varijansi i kovarijansi stavki
Unutranja je, nisu potrebni nikakvi dodatni podaci
Poto se izracunava samo iz svojstava stavki testa, nekada se nazivala metodom analize stavki
139. Stanislav Fajgelj April 2006. 139 Koeficijent alfa Alfu je prvi predloio Guttman, ali se danas naziva po Cronbachu
Zasniva se na pretpostavkama: minimalno tau-ekvivalentni skup ajtema, aditivnost pravih skorova, normalna distribucija skorova
140. Stanislav Fajgelj April 2006. 140 Koeficijent alfa Alfa je dobra ocena pouzdanosti testa ukoliko njegovi ajtemi predstavljaju skup tau-ekivalentnih indikatora
Treba obratiti panju da u izrazu ne figuriu kovarijanse ili korelacije
Danas je to najcece koricen pokazatelj pouzdanosti
141. Stanislav Fajgelj April 2006. 141 Spearman-Brownov koeficijent Koeficijent koji se zasniva na podeli testa na m delova
Inicijalno je izveden za podelu na dva dela i poznat je kao split-half koeficijent
Pretpostavka: paralelni skup ajtema
U tom slucaju svi ajtemi koreliraju r
142. Stanislav Fajgelj April 2006. 142 Proricanje pomocu S-B koeficijenta
k = m2 / m1
m2 = nova duina testa, m1 = stara duina testa
rmm = nova ili potrebna pouzdanost
143. Stanislav Fajgelj April 2006. 143 Kuder-Richardsonova formula 20
Jednak je alfi, prilagodenoj binarnim ajtemima i rucnom racunanju
144. Stanislav Fajgelj April 2006. 144 Pouzdanost testa i retesta rtt = rvreme1,vreme2
Baziran je na modelu paralelnih indikatora, prema kome je pouzdanost indikatora jednaka korelaciji sa njemu paralelnim indikatorom
Isti ispitanici se testiraju istim testom nakon izvesnog vremena
Zato se naziva i koeficijentom stabilnosti
145. Stanislav Fajgelj April 2006. 145 Problem odredivanja vremenskog razmaka Ako je prekratak, deluju efekti redosleda, kao npr. memorija i veba, ali i zamor
Ako je predug, osobina se moe promeniti
Uvek mogu postojati mortalitet i senzitizacija
Okvirno za psiholoke testove: do 6 meseci kod dece i starih, do godinu dana kod odraslih
146. Stanislav Fajgelj April 2006. 146 Kada i zato je pogodan Kod testova brzine
Kod svih merenja u kojima stavke nisu jasno definisane:
Projektivni testovi
Ocenjivanje procenjivaca, npr. u analizi sadraja itd.
Posredno, odreduje se stabilnost konstrukta
147. Stanislav Fajgelj April 2006. 147 Pouzdanost alternativnih formi Alternativne forme su verzije testa koje su napravljene da budu jednake u pogledu onoga ta mere i kako mere
Alternativne forme su jednake ukoliko predstavljaju paralelne indikatore
U tom slucaju:
Korelacija izmedu alternativnih formi ima status koeficijenta pouzdanosti za obe forme
148. Stanislav Fajgelj April 2006. 148 Pouzdanost alternativnih formi Alternativne forme se zadaju istim ispitanicima sa kratkim razmakom (npr. do dve nedelje)
Ova pouzdanost ima status koeficijenta ekvivalentnosti
Pouzdanost ce biti korektna ukoliko su forme minimalno kongenericne
149. Stanislav Fajgelj April 2006. 149 Pouzdanost izmedu ocenjivaca Predstavlja je korelacija razlicitih ocenjivaca
Istovremeno, naziva se objektivnocu ili reproducibilnocu merenja
Problem izbora koeficijenta:
r nije dobar
dobri su intraklasni koefic. korelacije, Cohenov kappa...
150. Stanislav Fajgelj April 2006. 150 Pouzdanost u G teoriji
151. Stanislav Fajgelj April 2006. 151 Pouzdanost u G teoriji
152. Stanislav Fajgelj April 2006. 152 Pouzdanost u G teoriji
153. Stanislav Fajgelj April 2006. 153 Koeficijenti generalizabilnosti Koriste se intraklasni koeficijenti korelacije
Jedan od jednostavnih i uobicajenih je:
Relativno odlucivanje, nema gnedenja faceta, slucajna faceta
ICC(3,k) je jednak alfi, ICC(2,.) je za apsolutno odlucivanje, a ICC(1,.) za ugnedeni nacrt
154. Stanislav Fajgelj April 2006. 154 Koeficijenti generalizabilnosti Izracunavaju se u zavisnosti od vrste univerzuma, tipa faceta, tipa odluka itd.
Mogu se interpretirati kao kvadrirana korelacija dobijenih skorova i skorova na univerzumu
? koeficijenti se koriste u D studiji da bi se ocenilo koje merenje je najpouzdanije, najgeneralizabilnije, na koje se moemo najvie osloniti
155. Stanislav Fajgelj April 2006. 155 Pouzdanost u Guttmanovom i faktorskom modelu merenja Po pravilu, kao procene varijanse greke, prave varijanse ili ukupne varijanse uzimaju se:
Svojstvene vrednosti faktora
Ima varijanse
Antiima varijanse. . .
I uvrtavaju u formule za alfu, S-B. . .
156. Stanislav Fajgelj April 2006. 156 Standardna greka merenja SGM sgm = sj (1 rjT2)1/2 = sj (1 rtt)1/2
Rasprenje dobijenih oko pravih skorova
Ocena pravog skora sa M=0 i s2=rtt:
zT* = zjrtt1/2
Interval poverenja: T* ± zcsgm (simetrican oko pravog skora)
157. Stanislav Fajgelj April 2006. 157 Standardna greka merenja Po osnovnoj KTT, SGM je jednaka za sve skorove
U stvarnosti, nije jednaka za sve skorove
Po novijoj KTT, distribucija ekstremnih pravih skorova je veoma asimetricna
Zato je SGM najveca kod srednjih skorova, a najmanja kod ekstremnih
158. Stanislav Fajgelj April 2006. 158 Indeks pouzdanosti
rjT je indeks pouzdanosti, korelacija dobijenog i pravog skora
Iako je slican faktorskom opterecenju, koeficijentu diskriminativnosti ili koeficijentu validnosti, ne moe se izjednaciti
159. Stanislav Fajgelj April 2006. 159 Fisherova informativnost Slobodno: varijansa dovoljnog skora osobine ?
SGM nije aditivna jer se iskazuje u jedinicama merenja
I(?) = 1 / SGM2
SGM = 1 / I(?)1/2
I(?) je aditivna, reciprocna je (kvadratu) SGM i osnovni je pokazatelj preciznosti (pouzdanosti) merenja u TAO
160. Stanislav Fajgelj April 2006. 160 SGM i I(?) u TAO SGM je u 1PL modelima, za binarni ajtem jednaka SG proporcije:
sgij = {1 / [pij(1 pij)]}1/2
Ona je najmanja kada je pij = 0,5
Ajtem ce imati pij = 0,5 kada je uparen sa ispitanikovom ?
sgij se mogu sabrati za sve ajteme i ispitanike kada se prethodno pretvore u I(?)
161. Stanislav Fajgelj April 2006. 161 SGM i I(?) u TAO
Kada se ajtemske SGM saberu za citav test, dobije se sledeca slika
162. Stanislav Fajgelj April 2006. 162 SGM i I(?) u TAO
163. Stanislav Fajgelj April 2006. 163 SGM i I(?) u TAO Po TAO, merenje je najpreciznije, najpouzdanije u zoni umerenih skorova, a najmanje precizno u zoni ekstremnih skorova
164. Stanislav Fajgelj April 2006. 164 Prihvatljive vrednosti rtt Obicno:
SB = a = faktorski = Guttmanov
Razlike su utoliko vece to skup ajtema vie odstupa od modeliranog (paralelnog ili tau-ekvivalentnog)
Takode: ICC(3,.) = ICC(2,.) = ICC(1,.)
165. Stanislav Fajgelj April 2006. 165 Prihvatljive vrednosti rtt Pouzdanost interne konzistencije je obicno via od alternativnih formi
Pouzdanost alternativnih formi je cesto via od testa i retesta
Ako je razlika veca od 0,20: ili forme nisu kongenericne, ili konstrukt nije trajan, ili uslovi zadavanja testa nisu bili isti...
166. Stanislav Fajgelj April 2006. 166 Prihvatljive vrednosti rtt Za internu konzistenciju donja granica alfe je 0,70
To odgovara tumacenju da test ima 70% prave varijanse, da dva paralelna indikatora dele 50% varijanse, da je separacioni odnos 1,5 itd.
Iznad 0,83 se smatra visokom, a iznad 0,90 vrlo visokom
Ipak, sve zavisi od namene merenja, vrste testa, uzorka-populacije, tipa konstrukta itd.
167. Stanislav Fajgelj April 2006. 167 Prihvatljive vrednosti rtt Kad god je moguce, treba uzeti u obzir informativnost, SGM i intervale poverenja
Uvek treba imati u vidu da nemaju svi skorovi istu SGM
U tom smislu prednost ima TAO jer egzaktno izracunava SGM za svaki skor
168. Stanislav Fajgelj April 2006. 168 Nova pravila merenja TAO nas uci da nemaju svi skorovi jednaku SGM
Takode, kraci testovi mogu biti pouzdaniji ako su upareni sa ispitanicima, tj. prilagodeni njihovom nivou osobine. . .
169. Stanislav Fajgelj April 2006. 169 Korekcija za atenuaciju Po KTT samo pravi skorovi mogu da koreliraju
Dakle, varijable koreliraju onoliko koliko su pouzdane
r-koeficijenti se mogu korigovati vrednostima rtt da bi se ocenilo koliko koreliraju pravi skorovi, tj. kolika bi se korelacija dobila kada ne bi bilo greaka merenja
170. VALJANOST - VALIDNOST
171. Stanislav Fajgelj April 2006. 171 Valjanost U formalnoj teoriji merenja svojstvo merne skale da verno odraava stepen prisustva osobine koja se meri
U praksi veoma razudeno, kompleksno i razlicito definisano svojstvo testa
U TAO obuhvacena je objektivnocu merenja
172. Stanislav Fajgelj April 2006. 172 Tri aspekta, vida ili znacenja validnosti Sadrinska validnost
Da li test sadri reprezentativan uzorak ponaanja iz domena koji se meri
Kriterijumska validnost
Da li je test koreliran sa nekom eksternom varijablom - kriterijumom
Konstruktivna validnost
Da li test meri onu osobinu za koju je namenjen
173. Stanislav Fajgelj April 2006. 173 Valjanost uvodne napomene ta se prihvata kao definicija crte: domen, kriterijum ili konstrukt
U Standardima... AERA i APA definiu valjanost kao stepen u kome podaci i teorija potkrepljuju interpretaciju testnih skorova
Tipovi validnosti su samo razliciti izvori podataka
Test mora biti valjan na sva tri nacina
Implicitno, merena osobina je ono to moe da povee sve nacine odredivanja valjanosti
174. Stanislav Fajgelj April 2006. 174 Konstruktivna valjanost Odgovara na pitanje: TA TEST MERI?
U istorijskom smislu najmlada je
Osim u evaluaciji testova igra vanu ulogu u proveri i stvaranju naucnih teorija i konstrukata
Alternativni nazivi: hipoteticka, simptomatska, faktorska, interna. . .
Univerzalna je, moe da se ocenjuje na svim vrstama testova, u svim primenama
175. Stanislav Fajgelj April 2006. 175 Istorijat konstruktivne valjanosti Ona je najmlada zato to je bihejviorizam odbijao uvodenje konstrukata, mentalistickih pojmova i znacenja stavki
I danas postoji funkcionalisticki pristup psihometriji po kome je skor testa zbir ajtemskih odgovora koji treba da obavi neki posao a ne da izmeri crtu
176. Stanislav Fajgelj April 2006. 176 ta su konstrukti Razvojem bihejviorizma nastao je pojam hipotetickog konstrukta (MacCorquodale i Meehl)
To je osobina, svojstvo, stanje, zakljuceni entitet npr. znanje
Hipoteticki konstrukt se ne vidi i korespondira sa dananjim pojmom
latentne varijable
177. Stanislav Fajgelj April 2006. 177 Ocenjivanje konstruktivne valjanosti Ne postoje jedinstveni postupci za njeno ocenjivanje
Najpoznatija tehnika je do danas ostala faktorska analiza
Medutim, to nije dovoljno i stvoreni su razliciti postupci u cilju bolje operacionalizacije kriterijumske validacije
Pre svega: nomoloka mrea i konvergentna i diskriminativna valjanost
178. Stanislav Fajgelj April 2006. 178 Problemi konstruktivne validacije Osnovni problem je to se paralelno sa proverom valjanosti testa vri i provera konstrukta
Problemi definicije konstrukta: latentna ili emergentna varijabla, osobina ili stanje, osobina ili sindrom. . .
Problemi provere konstrukta: homogenost, diskriminativnost, fizioloki korelati. . .
179. Stanislav Fajgelj April 2006. 179 Nomoloka mrea Invencija Cronbacha i Meehla koja je trebala da olaka kako konstruktivnu validaciju, tako i proveru konstrukta
Nomoloka mrea se prede oko jednog osnovnog konstrukta
Nomoloka mrea je sistem koji povezuje konstrukte i podatke, a na osnovu zakona, tacnije predikcija, relacija i korelacija
to mrea sadri vie konstrukata, podataka i njihovih veza, smatra se da bolje dokazuje osnovni konstrukt
180. Stanislav Fajgelj April 2006. 180 Klasicne metode za utvrdivanje konstruktivne valjanosti Korelacija sa drugim varijablama
Razlike izmedu grupa, npr. niskih i visokih
Studija interne strukture testa
Studija promena izmedu administracija testa
Studija procesa
Faktorska analiza
181. Stanislav Fajgelj April 2006. 181 Kriterijumska valjanost Odgovara na pitanje: DA LI TEST MOE DA ZAMENI MERENJE NEKE AKTIVNOSTIOSOBINE?
Ta aktivnost ili osobina se naziva kriterijumom
Dakle, kao da se kriterijum uzima kao predmet merenja testa
Alternativni nazivi: pragmatska, prakticna, empirijska, statisticka. . .
182. Stanislav Fajgelj April 2006. 182 Vremenski odnos testa i kriterijuma Kriterijum je u buducnosti prediktivna ili prognosticka valjanost
Kriterijum je u sadanjosti konkurentna, simultana ili dijagnosticka valjanost
Kriterijum je u prolosti postdiktivna valjanost
183. Stanislav Fajgelj April 2006. 183 ta je kriterijum Kriterijum je varijabla koja se mora meriti
Za to merenje vae isti principi kao i za svako drugo merenje: pouzdanost, validnost, diskriminativnost, teina. . .
Obicno se kriterijum definie kao emergentna varijabla uspenost u sportu, stanje zdravlja itd.
184. Stanislav Fajgelj April 2006. 184 Vrste kriterijuma Razlicite mogucnosti podele:
s obzirom na vreme buduci, sadanji i proli
s obzirom na oblast uspenost, sklonost povredama
po bliskosti i neposrednosti ultimativni, posredni i neposredni
po specificnosti opti i specificni
teorijski i stvarni
po metrijskim karakteristikama
185. Stanislav Fajgelj April 2006. 185 Merenje kriterijuma Operacionalizacija obicno zahteva
Redukciju
Prelaz sa teorijskog na stvarni
Prelaz sa neposrednog na posredni
Cilj je da se kriterijumske varijable mogu izmeriti to pouzdanije, valjanije i jednostavnije
186. Stanislav Fajgelj April 2006. 186 Problemi merenja kriterijuma Pouzdanija mera test, validira se manje pouzdanom merom procenom
Cirkularnost ili kontaminacija testovi se koriste i za merenje kriterijuma
Kriterijum je pogreno operacionalizovan: nije potpun, ili nije relevantan
187. Stanislav Fajgelj April 2006. 187 Osnovni nacrti kriterijumske validacije Longitudinalni
Primimo sve i pratimo uspenost
Istovremeni, konkurentni ili simultani
poredimo uspene i neuspene radnike
Na osnovu uspeha u obuci
Unakrsna validacija
sa drugim testovima, ispitanicima, aktivnostima...
188. Stanislav Fajgelj April 2006. 188 Koeficijenti validnosti Postojanje koeficijenta validnosti cini ovaj tip validnosti jedinstvenim
Koeficijent validnosti je mera asocijacije testa i kriterijuma
Izbor koeficijenta zavisi od broja i prirode testnih i kriterijumskih varijabli
U multivarijatnom slucaju redukcija dimenzionalnosti
189. Stanislav Fajgelj April 2006. 189 Faktori koji uticu na visinu koeficijenta validnosti Pouzdanost testa i kriterijuma korekcija za atenuaciju
Restrikcija opsega
Moderatorske i medijatorske varijable
Duina testa (uticaj na pouzdanost)
Oblik distribucije i priroda veze. . .
190. Stanislav Fajgelj April 2006. 190 Selekcija i klasifikacija kao psihometrijski problem U prvom koraku treba formirati to detaljniji opis delatnosti za koju se bira ZVSO (znanja, vetine, sposobnosti, osobine licnosti)
Na osnovu toga se moe vriti selekcija, profesionalna orijentacija i klasifikacija
191. Stanislav Fajgelj April 2006. 191 Selekcioni dijagrami
192. Stanislav Fajgelj April 2006. 192 Dijagrami selekcije a pogreno odbaceni
b pravilno primljeni
c pravilno odbaceni
d pogreno primljeni
Bazna stopa - teina posla - proporcija uspenih bez selekcije: (a + b)/n
Strogost selekcije: (b + d)/n
Stopa promaaja: (a + d)/n
193. Stanislav Fajgelj April 2006. 193 Dijagrami selekcije Selekcioni kolicnik: broj mesta / broj prijavljenih
Na uspenost selekcije uticu koeficijent validnosti, selekcioni kolicnik i bazna stopa
Na njih psiholog ne moe uticati
Psiholog moe uticati na strogost selekcije - Xc
194. Stanislav Fajgelj April 2006. 194 Korisnost selekcije Vana je prediktivna ili finansijska korisnost koja je neposredna, ali i posredna, ona koja se tice motivacije...
Korisnost u celini zavisi od validnosti, selekcionog kolicnika i 4 proporcije
195. Stanislav Fajgelj April 2006. 195 Inkrementalna validnost Informacija koju test dodaje vec postojecim informacijama
Sa gledita regresije, prediktivniji ce biti oni testovi koji ne koreliraju sa ostalima
Treba ukljuciti onaj test koji ima najvecu semiparcijalnu korelaciju sa kriterijumom (najveci porast R)
196. Stanislav Fajgelj April 2006. 196 Sadrinska valjanost Odgovara na pitanje: DA LI SU STAVKE U TESTU REPREZENTATIVAN UZORAK STAVKI IZ DOMENA CRTE KOJA SE MERI?
Alternativni nazivi su: logicka, intrinsicka (kolidira sa konstruktivnom) ili cirkularna, pa i relevantnost ili reprezentativnost testa
Pojavna ili prividna valjanost su slicne, ali u drugom kontekstu
197. Stanislav Fajgelj April 2006. 197 Sadrinska validnost Univerzum se prihvata kao predmet merenja testa
Sadrinska validnost se odreduje:
Deduktivno (u principu)
Tokom konstrukcije testa i pre njegove primene
Sadrinska validnost je osnovni zahtev koji se postavlja pred testove postignuca
198. Stanislav Fajgelj April 2006. 198 Konstrukcija sadrinski validnog testa postignuca Definicija domena-univerzuma
Nastavne celine - deskriptori
Kriticna znanja
Mentalni procesi, kompetencije. . .
Populacija testa ajtemima
199. Stanislav Fajgelj April 2006. 199 Konstrukcija sadrinski validnog testa postignuca Treba teiti da svaki deskriptor bude pokriven vlastitim malim testom (stavke razlicite teine)
Celine trebaju biti pokrivene ajtemima balansirano
Timovi koji piu stavke moraju biti ujednaceni, obuceni i moraju imati dobra uputstva
PVI - PKO, testleti. . .
200. Stanislav Fajgelj April 2006. 200 Kvantifikacija sadrinske validnosti Vrlo teko iz prakticnih i teorijskih razloga
Prakticni razlozi nakon to prikupimo podatke, po pravilu je kasno
Moguci izlaz: pilot testiranje
Teorijski razlozi sadrinska validnost ne podrazumeva homogenost
Frekvencijska analiza i procenjivanje kvaliteta ajtema
201. Stanislav Fajgelj April 2006. 201 Pojavna i prividna valjanost Engl. face validity se tretira i prevodi na razlicite nacine
U smislu: pojavna, ocigledna ili valjanost na izgled, predstavlja ocenu strucnjaka da li test izgleda kao da meri ono to treba da meri
U smislu: prividna valjanost, oznacava ono to laici, posebno ispitanici misle da test meri
202. Stanislav Fajgelj April 2006. 202 Ugroavanje validnosti Strategije odgovaranja kao osobine licnosti generalizabilne na druge situacije
Odgovaracka pristrasnost situaciono specificna, nije generalizabilna
Odgovaracki stilovi generalizabilni
Slucajne greke nisu generalizabilne
203. Stanislav Fajgelj April 2006. 203 Ugroavanje validnosti od strane ispitanika Socijalno poeljno odgovaranje
Izbegavanje ili preferencija ekstremnih odgovora
Nepaljivost, zbunjenost, neodlucnost
Pogadanje, uspavanost, brzanje
Testovna mudrost, prepisivanje
204. Stanislav Fajgelj April 2006. 204 Ugroavanje validnosti od strane instrumenta Pozitivne i negativne formulacije
Poloaj stavke u testu, ajtemski kontekst
Diferencijalno funkcionisanje
205. Stanislav Fajgelj April 2006. 205 Ugroavanje validnosti od strane uslova primene Hawthorne efekat
Efekat zamora
Efekat transfera
206. Stanislav Fajgelj April 2006. 206 Ajtemski kontekst Okolni, posebno prethodni ajtemi uticu na odgovaranje
Najcece se deava ako su stavke nejasne ili dvosmislene, pa ispitanik protumaci njihovo znacenje na osnovu okolnih ajtema
207. Stanislav Fajgelj April 2006. 207 Halo efekt efekt oreola Tendencija da procenjivac sudi o postignucu na nezavisnim dimenzijama na osnovu opteg utiska o kandidatu
Tendencija da ocena kandidata na jednoj osobini utice na ocenu na drugoj osobini
Nesposobnost da se razlikuju konceptualno razliciti i nezavisni aspekti ponaanja
208. Stanislav Fajgelj April 2006. 208 Socijalna poeljnost Najceca odgovaracka strategija
Vrlo prisutna i vrlo teko otklonjiva
Teko je razdvojiti od crta: lane moralnosti, anksioznosti, krutosti, konformizma, autoritarnosti. . .
U selekciji se moe tretirati kao adaptiranost i moe povecavati prediktivnu validnost
209. Stanislav Fajgelj April 2006. 209
210. SKOROVANJE TESTA-OCENJIVANJE OSOBINE
211. Stanislav Fajgelj April 2006. 211 Ukupni sumacioni skor Dobija se sabiranjem ajtemskih odgovora (ili prebrojavanjem, ako su dihotomni)
Moe biti ponderisan
Smislen je samo ako je test jednodimenzionalan (ali postoji problem sloenih osobina)
Ukupni skorovi pripadaju minimalno ordinalnom nivou merenja
212. Stanislav Fajgelj April 2006. 212 Ocenjivanje osobine u TAO Sloeni matematicki postupci, iterativni, bazirani na ML, Bayesovoj teoremi...
Iskazuje se u logitima ili z-skorovima, dakle na istoj skali kao i teina ajtema
TAO mere mogu biti jednake ukupnom skoru (u 1P modelima), ali ne moraju (u 2P i 3P modelima)
Izvorno su intervalne i specificno objektivne
213. Stanislav Fajgelj April 2006. 213 Skorovanje nejednakih testova Kompozitni skorovi i profili
Prvi korak mora biti jednacenje testova
Drugi korak je formiranje obicnog ili ponderisanog kompozita
Ako testovi imaju isti predmet merenja, samo razlicit format, zadatak je laki
Ako testovi nemaju isti predmet merenja, kompozitni skor ima smisla samo u okviru neke prakticne namene
214. Stanislav Fajgelj April 2006. 214 Ponderisanje Jednake teine
Nejednake teine
Optimalno
Neoptimalno, obicno apriorno
Autoponderisanje veci doprinos imaju sabirci koji imaju vecu varijansu
Optimalno ponderisanje: regresiono, kanonicko, diskriminaciono, faktorsko...
215. Stanislav Fajgelj April 2006. 215 Profili to su indikatori vie korelirani, to ima vie osnova za kompozitni skor, a manje za profil
Individualni i grupni kontekst tip
Profili sadre tri osnovne informacije: nivo, rasprenje i oblik
Analiza profila se koristi za ocenjivanje slicnosti profila: korelacija, ICC, Euklidova distanca itd.
216. JEDNACENJE TESTOVA
217. Stanislav Fajgelj April 2006. 217 Jednacenje testova Ako testovi mere istu stvar cilj je formiranje ekvivalentnih skorova
Ako testovi mere razlicite stvari cilj je formiranje komparabilnih skorova
Nastojimo da postignemo da skorovi sa jednog testa mogu da poslue umesto skorova sa drugog testa
To se moe postici samo sa manjim ili vecim uspehom nikad potpuno
218. Stanislav Fajgelj April 2006. 218 Nacrti jednacenja Nacrt sa jednom grupom oba testa se zadaju istoj grupi
Nacrt sa ekvivalentnim grupama grupe se izjednace
Nacrti sa neekvivalentnim grupama nacrti sa zajednickim jezgrom ili sidrom
Zajednicki ajtemi
Zajednicki ispitanici
Spiraljenje
219. Stanislav Fajgelj April 2006. 219 Transformacije za jednacenje Linearno jednacenje
L(Y) = (sy / sx)X + My (sy / sx)Mx
Ekvipercentilno jednacenje
Jednacenje u TAO
Jednacenje pravih skorova
Jednacenje dobijenih skorova
220. Stanislav Fajgelj April 2006. 220
221. KONSTRUKCIJA TESTA
222. Stanislav Fajgelj April 2006. 222 Konstrukcija testa Konstrukcija testa je kolektivni poduhvat
Nema jednog nacina, pristupa i recepta za konstrukciju testa
Svaki revidirani, prevedeni, skraceni... test treba tretirati kao nov test
223. Stanislav Fajgelj April 2006. 223 Glavne faze konstrukcije testa Priprema i plan
Definicija varijable
Operacionalizacija varijable
Izbor vrste i formata testa i stavki
Pisanje stavki
Pisanje uputstva, primera i vebi
Probna (pilot) testiranja
224. Stanislav Fajgelj April 2006. 224 Faze konstrukcije testa Primena na konstrukcionom uzorku
Ajtem analiza
Konacan izbor stavki
Primena na normativnom uzorku
Odredivanje mernih svojstava
Izrada normi
Pisanje prirucnika
Revizije testa
225. Stanislav Fajgelj April 2006. 225 Definicija varijable Definicija predmeta merenja
Na osnovu teorije i iz teorije se izvode predikcijeponaanja, induktivni nacin
Prikupljaju se ponaanja ili simptomi, piu se stavke, pa se analizom dedukuju osobine
Eklekticki, kombinacijom teorija i postojecih stavki
Obicno mora postojati ciljna populacija
226. Stanislav Fajgelj April 2006. 226 Odredivanje vrste i formata Banka ajtema, fiskni test, adaptivni test, racunarski test, prevedeni test, modifikovani test, normativni ili kriterijumski. . .
Namena testa (istraivacka, selekciona, klinicka...)
Konacna ciljna populacija(e)
Nacin primene (grupno, individualno)
227. Stanislav Fajgelj April 2006. 227 Pisanje stavki U principu timski posao
To uvodi probleme sastavljanja tima, organizacija rada i rukovodenja
Pisanje stavki nije posao psihometriste, ali psihometrijska znanja su nephodna
Prevodenje stranih testova
Lake i teke stavke
Trik pitanja. . .
228. Stanislav Fajgelj April 2006. 228 Ajtem analiza Analiziraju se ajtemi i odreduju njihova merna svojstva, ali se odreduju i merna svojstva testa u celini
Teina, diskriminativnost, faktorska valjanost, fitovanje, DIF. . .
Najbolje je koristiti i KTT i TAO pristup
Na osnovu ajtem analize se vri konacan izbor ajtema
229. Stanislav Fajgelj April 2006. 229 Faktorska ajtem analiza Optimalno orude za evaluaciju ajtema i testa u celini
Problem izbora koeficijenata korelacije: r, rpbis, f, rbis, rtet,
Problem izbora faktorskog reenja: ML, ima faktorska analiza, FA pune informacije...
Problem izbora broja faktora i vrste rotacije. . .
230. Stanislav Fajgelj April 2006. 230 Izrada normi Normativni uzorak odreduje vrednost testa
Norme su osnova za objektivnu interpretaciju testnih skorova
Vrste normi:
Opte ili nacionalne
Specificne ili posebne norme
Lokalne, uzrasne, razredne, kolske...
231. Stanislav Fajgelj April 2006. 231 Normiranje Normiranje putem transformacije
Standardni ili z-skorovi
IQ skorovi
T skorovi...
Fraktilne ili percentilne norme
Fraktil ili percentil je skor
Fraktilni ili percentilni rang je %
232. Stanislav Fajgelj April 2006. 232