290 likes | 443 Views
OCENJEVANJE ZANESLJIVOSTI TESTA. “V kolikšni meri na testne dosežke vplivajo slučajne napake?”. Klasična testna teorija (teorija pravega dosežka):. X = T + E T = E(X) r TE = 0. Koeficient zanesljivosti:. Merski modeli: odnos med pravimi dosežki na
E N D
OCENJEVANJE ZANESLJIVOSTI TESTA “V kolikšni meri na testne dosežke vplivajo slučajne napake?”
Klasična testna teorija (teorija pravega dosežka): X = T + E T = E(X) rTE = 0
Merski modeli: odnos med pravimi dosežki na različnih meritvah (postavkah, testih) izbira & interpretacija postopka ocenjevanja zanesljivosti
1. Kongenerični model: Pravi dosežki pri različnih meritvah so popolnoma korelirani (= testi / postavke merijo isto lastnost), T in X imajo lahko različne M in SD.
2a. V bistvu (esencialno) t - enakovredni model: • Kongenerični model + • meritve imajo enake prave variance, • meritve imajo lahko različne dejanske M in SD.
2b. t - enakovredni model: • Kongenerični model + • pravi dosežki (in s tem prave variance) na različnih meritvah so enaki; • meritve imajo lahko različne dejanske SD, vendar enake M.
3. Vzporedni model: • t - enakovredni model + • meritve imajo enake variance napak in zato enake dejanske aritmetične sredine in variance.
Preverjanje predpostavk merskih modelov: • pregled aritmetičnih sredin, varianc, kovarianc in korelacij, • konfirmatorna faktorska analiza.
NAČINI OCENJEVANJA ZANESLJIVOSTI 1. ponovno testiranje, 2. enakovredne oblike, 3. notranja skladnost.
1. PONOVNA MERITEV (RETEST) • Test po določenem času ponovno apliciramo. • Zanesljivost = korelacija med dosežki na obeh testiranjih. • Meritvi morata biti vzporedni (ni vpliva učenja, lastnost se ni spremenila).
2. ENAKOVREDNI OBLIKI • Imamo vsaj dve inačici testa. • Meritvi morata biti vzporedni (ni sistematičnega vpliva vzorčenja nalog ter vaje oz. učenja). • Zanesljivost = korelacija med dosežki na obeh testiranjih.
3. NOTRANJA SKLADNOST (INTERNA KONSISTENTNOST) • Test razdelimo na več (od 2 do n) eksperimentalno neodvisnih delov. • Če ti deli merijo isto lastnost, so nepopolne korelacije posledica napake merjenja. • Zadostuje eno testiranje (dele testa obravnavamo kot ločene meritve).
Cronbachov a koeficient: “Kovariance med postavkami so odraz prave variance postavk.”
Prednosti koeficienta a: • enostavno izračunljiv in razumljiv, • vzorčni a je nepristranska ocena populacijskega a, • znana vzorčna porazdelitev.
Pomanjkljivost koeficienta a: a je enak zanesljivosti le, če so postavke vsaj v bistvu t-enakovredne;sicer je ocena spodnje meje zanesljivosti.Vendar: a je razmeroma dobra ocena zanesljivosti, če test ni izrazito multidimenzionalen.
Poseben primer a za dihotomno točkovane postavke je Kuder-Richardsonov obrazec št. 20
Dihotomne postavke z enakimi težavnostmi: Kuder-Richardsonov obrazec št. 21 Če so M oz. SD postavk različne, je KR21 nižji od KR20.
Zanesljivost časovno omejenih testov: 1. merjenje odgovornih časov ali 2. test razdelimo na več delov in jih ločeno apliciramo.
Spearman-Brownov obrazec: odnos med zanesljivostjo in dolžino testa. • Ocena zanesljivosti, če: • združimo n vzporednih postavk, • test podaljšamo s homogenimi postavkami, • iz testa izločimo naključno izbrane postavke.
Spearman-Brownov obrazec = a za standardizirane oz. vzporedne postavke
Razpolovitveni koeficient zanesljivosti: 1. test razdelimo na dva enaka dela (npr. parne in neparne postavke); 2. izračunamo skupni dosežek za vsak del posebej;
3a. Varianci obeh delov približno enaki: Spearman-Brownov obrazec. 3b. Varianci obeh delov različni: Guttmanov razpolovitveni koeficient.
Hoytov postopek dvosmerna analiza variance: 1. faktor - osebe, 2. faktor - postavke. Notacija: N = št.subjektov n = št.postavk / ocenjevalcev Xs. = povprečni odgovor osebe s X.o = povprečni odgovor na postavki o / povprečna ocena ocenjevalca o, X.. = povprečje vseh odgovorov, Ts., T.o = skupni dosežek, vsota po postavki T.. = skupna vsota
Viri variance: 1. med subjekti: 2. med postavkami / ocenjevalci:
3. interakcija - rezidual: 4. skupna varianca:
Postopek je uporaben tudi pri dihotomnih postavkah, vendar lahko F - test izvedemo le, če so postavke na intervalni lestvici.
Spodnja meja intervala zaupanja za populacijski a: Fa = vrednost F porazdelitve pri N-1 in (N-1)(n-1) stopnjah svobode pri želenem p.
Zanesljivost sestavljenih dosežkov (kadar je zanesljivost komponent večja od korelacije z drugimi komponentami) Standardizirane vrednosti: