OCENJEVANJE ZANESLJIVOSTI TESTA

OCENJEVANJE ZANESLJIVOSTI TESTA “V kolikšni meri na testne dosežke vplivajo slučajne napake?”

Klasična testna teorija (teorija pravega dosežka): X = T + E T = E(X) rTE = 0

Koeficient zanesljivosti:

Merski modeli: odnos med pravimi dosežki na različnih meritvah (postavkah, testih) izbira & interpretacija postopka ocenjevanja zanesljivosti

1. Kongenerični model: Pravi dosežki pri različnih meritvah so popolnoma korelirani (= testi / postavke merijo isto lastnost), T in X imajo lahko različne M in SD.

2a. V bistvu (esencialno) t - enakovredni model: • Kongenerični model + • meritve imajo enake prave variance, • meritve imajo lahko različne dejanske M in SD.

2b. t - enakovredni model: • Kongenerični model + • pravi dosežki (in s tem prave variance) na različnih meritvah so enaki; • meritve imajo lahko različne dejanske SD, vendar enake M.

3. Vzporedni model: • t - enakovredni model + • meritve imajo enake variance napak in zato enake dejanske aritmetične sredine in variance.

Preverjanje predpostavk merskih modelov: • pregled aritmetičnih sredin, varianc, kovarianc in korelacij, • konfirmatorna faktorska analiza.

NAČINI OCENJEVANJA ZANESLJIVOSTI 1. ponovno testiranje, 2. enakovredne oblike, 3. notranja skladnost.

1. PONOVNA MERITEV (RETEST) • Test po določenem času ponovno apliciramo. • Zanesljivost = korelacija med dosežki na obeh testiranjih. • Meritvi morata biti vzporedni (ni vpliva učenja, lastnost se ni spremenila).

2. ENAKOVREDNI OBLIKI • Imamo vsaj dve inačici testa. • Meritvi morata biti vzporedni (ni sistematičnega vpliva vzorčenja nalog ter vaje oz. učenja). • Zanesljivost = korelacija med dosežki na obeh testiranjih.

3. NOTRANJA SKLADNOST (INTERNA KONSISTENTNOST) • Test razdelimo na več (od 2 do n) eksperimentalno neodvisnih delov. • Če ti deli merijo isto lastnost, so nepopolne korelacije posledica napake merjenja. • Zadostuje eno testiranje (dele testa obravnavamo kot ločene meritve).

Cronbachov a koeficient: “Kovariance med postavkami so odraz prave variance postavk.”

Prednosti koeficienta a: • enostavno izračunljiv in razumljiv, • vzorčni a je nepristranska ocena populacijskega a, • znana vzorčna porazdelitev.

Pomanjkljivost koeficienta a: a je enak zanesljivosti le, če so postavke vsaj v bistvu t-enakovredne;sicer je ocena spodnje meje zanesljivosti.Vendar: a je razmeroma dobra ocena zanesljivosti, če test ni izrazito multidimenzionalen.

Poseben primer a za dihotomno točkovane postavke je Kuder-Richardsonov obrazec št. 20

Dihotomne postavke z enakimi težavnostmi: Kuder-Richardsonov obrazec št. 21 Če so M oz. SD postavk različne, je KR21 nižji od KR20.

Zanesljivost časovno omejenih testov: 1. merjenje odgovornih časov ali 2. test razdelimo na več delov in jih ločeno apliciramo.

Spearman-Brownov obrazec: odnos med zanesljivostjo in dolžino testa. • Ocena zanesljivosti, če: • združimo n vzporednih postavk, • test podaljšamo s homogenimi postavkami, • iz testa izločimo naključno izbrane postavke.

Spearman-Brownov obrazec = a za standardizirane oz. vzporedne postavke

Razpolovitveni koeficient zanesljivosti: 1. test razdelimo na dva enaka dela (npr. parne in neparne postavke); 2. izračunamo skupni dosežek za vsak del posebej;

3a. Varianci obeh delov približno enaki: Spearman-Brownov obrazec. 3b. Varianci obeh delov različni: Guttmanov razpolovitveni koeficient.

Hoytov postopek dvosmerna analiza variance: 1. faktor - osebe, 2. faktor - postavke. Notacija: N = št.subjektov n = št.postavk / ocenjevalcev Xs. = povprečni odgovor osebe s X.o = povprečni odgovor na postavki o / povprečna ocena ocenjevalca o, X.. = povprečje vseh odgovorov, Ts., T.o = skupni dosežek, vsota po postavki T.. = skupna vsota

Viri variance: 1. med subjekti: 2. med postavkami / ocenjevalci:

3. interakcija - rezidual: 4. skupna varianca:

Postopek je uporaben tudi pri dihotomnih postavkah, vendar lahko F - test izvedemo le, če so postavke na intervalni lestvici.

Spodnja meja intervala zaupanja za populacijski a: Fa = vrednost F porazdelitve pri N-1 in (N-1)(n-1) stopnjah svobode pri želenem p.

Zanesljivost sestavljenih dosežkov (kadar je zanesljivost komponent večja od korelacije z drugimi komponentami) Standardizirane vrednosti:

OCENJEVANJE ZANESLJIVOSTI TESTA

OCENJEVANJE ZANESLJIVOSTI TESTA

Presentation Transcript

La scienza in testa

‘Meglio una testa ben fatta che una testa ben piena’

Resenja testa iz ALKOHOLA

Chuck Testa

OCENJEVANJE ZANESLJIVOSTI TESTA

OCENJEVANJE NA DELOVNEM MESTU-WBA

Valjanost (dijagnostičkog) testa ROC analiza

Ocenjevanje znanja

Moneta testa croce

Testa en ”stå” jetski !

Mešalnik za pripravo testa

SENZORIČNO OCENJEVANJE SIROV

Ocenjevanje

Le mani nella testa

Uppdrag 7 Testa med jod

OCENJEVANJE NA DELOVNEM MESTU-WBA

OCENJEVANJE NA DELOVNEM MESTU-WBA

OCENJEVANJE IN NAPREDOVANJE V JAVNEM SEKTORJU (Ljubljana, 29.1.2010)

Model za ocenjevanje podjetniških projektov OVE

NAČRTOVANJE PREVERJANJE IN OCENJEVANJE ŠAH 3

Uvod v ocenjevanje literature

Secure Programming Joe Testa