670 likes | 1.34k Views
BİR ÖLÇME ARACINDA BULUNMASI GEREKEN NİTELİKLER. BİR ÖLÇME ARACINDA BULUNMASI GEREKEN NİTELİKLER. * Geçerlik * Güvenirlik * Kullanışlılık. HATA KAYNAKLARI. 1. Ölçmeciden kaynaklanan 2. Ölçme aracından kaynaklanan 3. Ölçülen özellikten kaynaklanan
E N D
BİR ÖLÇME ARACINDA BULUNMASI GEREKEN NİTELİKLER * Geçerlik * Güvenirlik * Kullanışlılık
HATA KAYNAKLARI 1. Ölçmeciden kaynaklanan 2. Ölçme aracından kaynaklanan 3. Ölçülen özellikten kaynaklanan 4. Ölçmenin yapıldığı gruptan kaynaklanan 5. Ölçülen özellikten kaynaklanan
1. Ölçmeciden Kaynaklanan Hatalar • Ölçmeyi yapan kişinin kişisel özellikleri, • Öznel puanlama eğilimi, dikkatsizliği, yorgunluğu vb. • Puanlayıcının kendine ait yorumları, puanlayıcı kanıları, farklı bakış açıları, (Aynı kâğıtlar, değişik puanlayıcılar tarafından puanlandığında puanlayıcılar arasındaki görüş, bakış açısı ve yorumlama farklılıkları olabileceğinden dolayı, aynı kişi tarafından farklı zamanlarda yapılan puanlamalarda puanlayıcıların içinde bulunduğu koşullar ölçme sonuçlarına hata karışmasına sebep olabilir.)
1. Ölçmeciden Kaynaklanan Hatalar Puanlamanın nesnel olmaması, öznel kanılara dayalı olması hata kaynağıdır. Bir testten elde edilen puanların, puanlayıcıya ve puanlama zamanına göre değişmemesi; puanlamadaki tesadüfi hataların azlığını yani, testin puanlama güvenirliğinin yüksekliğini gösterir.
2. Ölçme Aracından Kaynaklanan Hatalar • Ölçme aracının; Yeterli duyarlılıkta olmaması, bozuk ya da hatalı üretilmiş olması Ölçme aracının yapısından gelen hata kaynaklarından birisi testi oluşturan maddelerin örneklemidir. Ölçütleri davranış ve kapsam bakımından homojen maddelerden oluşan bir test, hetorojen maddelerden oluşan bir testten daha güvenilirdir. Hataya neden olan bir diğer faktör testte yer alan maddelerin kapsamı yeterince örnekleyememesidir.
3. Ölçme Ortamdan Kaynaklanan Hatalar • Testin uygulanışı sırasında sınavın uygulandığı dersliğin; sıcaklığı, ışık, havalandırma, gürültü düzeyi, sınav düzeninin kopya çekmeye uygun olması
4. Ölçmenin Yapıldığı Gruptan Kaynaklanan Hatalar • Ölçmenin yapıldığı gruba ait bireylerin; ölçme işlemi yaparken içinde bulundukları motivasyon, heyecan, stres, uykusuzluk, dikkat dağınıklığı, ölçme işlemi yapılmadan önce geçirilen kaza, şok, tartışma vb. olumsuz yaşantılar,
5. Ölçülen Özellikten Kaynaklanan Hatalar Ölçülen özelliğin, ölçüm yapılan ortamın fiziki şartlarına uygun olmaması, ölçülen özelliğin tam olarak belirlenmemiş olması, bu özelliğin zamanla değişiyor olması vb.
ÖLÇMEDE HATATÜRLERİ • Sabit Hatalar • Sistemli Hatalar • Rastgele (Tesadüfi) Hatalar
Sabit Hatalar Bir ölçümden diğer ölçüme değişmeyen hatalardır. Başka bir ifade ile her bir ölçme için miktarı değişmeyen hatalara sabit hata denir. * Bakkal terazisinin her nesneyi gerçek ağırlığından her ölçümde 50 gr fazla göstermesi * Bir öğretmenin her okuduğu cevap kâğıdına 5 puan fazla vermesi * Hatalı üretim sonucu 1000 gr üretilmesi gereken bir ağırlık 999 gr olarak üretilmişse her yapılan tartımda 1/1000 oranında sabit hata verecektir. * 2 cm eksik üretilen bir cetvelin yapılan her ölçümde 2 cm eksik ölçüm yapması • Sabit hata ölçme aracının geçerliğini etkileyen hata türüdür.
Sistematik Hatalar • Ölçülen büyüklüğe, ölçmeciye veya ölçme koşullarına ve belli durumlara bağlı olarak miktarı değişen hatalardır. • Kişi ölçme işinde yanlı davrandığında ortaya çıkan hata türüdür. Bu nedenle bu tür hatalara yanlılık da denir. * Bir öğretmen bayan öğrencilere, erkek öğrencilerden fazla puan veriyorsa bu sistematik hatadır. * Derse devam eden öğrencilere, devam etmeyenlerden daha fazla puan veriliyorsa sistematik hatadır. • İki (2) cm eksik üretilmiş bir cetvel ölçüm içinde kullanılmışsa ve bu ölçüm birden fazla yapılmışsa hata miktarı ölçüm aracının kullanım sayısına bağlı olarak artacaktır. Eğer ölçüm aracı iki kez kullanılmışsa 2 x 2 = 4 cm 5 kez kullanılmışsa 5 x 2 = 10 cm hata verecektir.
Sistematik Hatalar • + Ölçme aracından kaynaklanan ve miktarı değişen hatalar sistematik hatalardır. • + Gerek sistematik gerek sabit hatalarda ölçme sonuçlarına karışan hatanın miktarı, yönü ve kaynağı bellidir. • + Sistematik hata ölçme aracının geçerliliğini etkileyen hata türüdür. 2008Bir sınavda her öğrenciye 5 puan fazla verilmesi ------ hataya örnektir. Öğrencilerin puanlarını, aldıkları puanların yüzde 10'u kadar artırmak ise ------- hataya örnek olabilir. Bu parçadaki boşluklara, aşağıdakilerin hangisindeki sözcükler sırasıyla getirilmelidir? A) rastgele - sabit B) rastgele-sistematik C) sabit-sistematik D) sabit - rastgele E) sistematik - sabit
Tesadüfi Hatalar Ölçme sonuçlarına tesadüfen karışan, kaynağı, miktarı ve yönü kesin olarak belli olmayan hatalardır. Ölçmenin yapıldığı ortam, ölçmeyi yapan kişinin dikkatsizliği, ölçme aracı vb. gibi birçok hata kaynağından gelen bir hata türüdür. * Öğretmenin sınav kâğıtlarını dikkatsizce okuyup öğrencilerine düşük ya da yüksek not vermesi * Tesadüfî hatalar ölçme sonuçlarına bazen pozitif, bazen negatif yönde karışabilir. Bu nedenle tesadüfî hatalar kontrol edilemez. * Tesadüfî hatalar ölçmenin güvenirliğini etkileyen hatalardır. * Ölçme sonucunda elde edilen veriler üç tür hatayı da içerebilir.
GEÇERLİK • Bir ölçme aracının ölçmeyi amaçladığı özelliği başka herhangi bir özellikle karşılaştırmadan, doğru olarak ölçebilme derecesidir. • Başka bir deyişle, bir ölçme aracının geliştirilmiş bulunduğu konuda amaca hizmet etmesidir. • Ölçme aracında bulunması gereken en önemli özelliktir. • Geçerlik katsayısı ( 0.oo ) ile ( + 1.oo) arasında değerler alır. • Geçerliğin iki önemli öğesi vardır: Uygunluk - Güvenirlik
GEÇERLİK TÜRLERİ *Kapsam geçerliği *Ölçüt Geçerliği Yordama geçerliği Uygunluk geçerliği Zamandaş geçerliği *Yapı geçerliği *Görünüş geçerliği
KAPSAM GEÇERLİĞİ • Bir bütün olarak testin ve testteki her bir maddenin amaca ne derece hizmet ettiğidir. • Bir testin kapsam geçerliği; o testteki toplam maddelerin ölçülecek davranışları ve konu içeriğini örnekleme derecesine ve testteki her bir maddenin ölçmek istediği davranışı ne derece iyi ölçtüğüne bağlıdır. • Bir testin kapsam geçerliği 2 ana yaklaşımla belirlenebilir : • Mantıksal ya da rasyonel yaklaşım • İstatistiksel yaklaşım
KAPSAM GEÇERLİĞİ Mantıksal yaklaşım Mantıksal olarak kapsam geçerliğini belirlemede, testteki her bir maddenin ve bir bütün olarak testteki maddelerin dağılımının, testin ölçmeye yöneldiği davranışlarla konuları kapsayıp kapsamadığına bakılır. * Testteki maddelerin dağılımının belirtke tablosundaki dağılıma uygun olup olmadığına; * Her bir maddenin, diğer maddelerce ölçülenlerden farklı bir davranışı ölçmeye yönelip yönelmediğine ve * Ölçmeye yöneldiği davranışı ölçmedeki elverişliliğine bakılır. Bir bütün olarak testin ve testteki her bir maddenin ölçmek istenileni ölçüp ölçmediği hakkında bu kişilerce ileri sürülen görüşlere göre, test üzerinde bazı değişiklikler yapılabilir. * Test, aynı dersi okutan başka öğretmenlere, * Konuyu iyi bilen kişilere, * Ölçme değerlendirme uzmanlarına inceletilebilir.
KAPSAM GEÇERLİĞİ İstatistiksel yaklaşım İki farklı şekilde uygulanır: • Bir alanda daha önce geliştirilmiş olan ve o alanın geçerlik ölçüsü olarak kabul edilen, eldeki öğrencilerin seviyesine uygun bir test seçilir. Aynı alanda sonradan geliştirilen yeni test, kapsamı geçerli olarak kabul edilen önceki testle kıyaslanır (Korelasyon Katsayısı). . b) Geliştirilmiş olan bir test; testin geliştirildiği konuda başarılı ve başarısız olarak ayrılan iki gruba uygulanır. O testten başarılı grubun aldığı puanların ortalaması başarısız grubun aldığı puanların ortalamasından anlamlı derecede büyükse test geçerlidir.
KAPSAM GEÇERLİĞİ İstatistiksel yaklaşım • 2010Bir öğretmen yılsonunda, sözlü sınav puanlarını da dikkate alarak öğrencileri değerlendirmektedir. Öğrencilerin sözlü sınav puanlarını ise her ders sonunda sorduğu sorulara verilen cevaplara birer puan vererek elde etmektedir. Bu öğretmenin, öğrencilere her ders sonundaki değerlendirmelerin toplamıyla sözlü sınav notu vermesinin en önemli nedeni aşağıdakilerden hangisidir? A) Öğrencileri ders çalışmaya teşvik etmek B) Öğrenciler arasında rekabet yaratmak C) Sınavın kapsam geçerliğini artırmaya çalışmak D) Sınava ilişkin kaygı düzeyini azaltmak E) Bireyler arası farkları ortaya koymak
YORDAMA GEÇERLİĞİ Yordama; istatistiksel teknikler kullanılarak ve bilinenlerden yararlanılarak, bilinmeyen durumlar hakkında yapılan geleceğe yönelik tahminlerde bulunma işlemidir. Eğitimsel anlamda yordama; genellikle bir testten alınan puanlara dayanılarak, bireylerin belli bir programdaki ya da işteki başarılarını önceden kestirme işlemidir.
YORDAMA GEÇERLİĞİ Bir testin yordama geçerliği; o testten elde edilen puanlarla, testin yordamak için düzenlendiği değişkenin doğrudan ölçüsü olan ve daha sonradan elde edilen ölçüt arasındaki korelasyondur. Buradaki korelasyon katsayısı ise yordama geçerliği katsayısı olarak adlandırılır ve ne kadar büyükse, o oranda yüksek yordama geçerliğine işaret eder.
YORDAMA GEÇERLİĞİ • 2007Pazarlama elemanları seçiminde kullanılmak üzere bir test geliştirilmiş ve işe alımlarda bu test uygulanmıştır. Daha sonra, işe alınan elemanların ilk aydaki başarılı satış sayıları ile işe girişte aldıkları test puanları arasındaki uyum incelenmiştir. Yukarıda belirtilen inceleme, uygulanan testin hangi özelliği hakkında bilgi verir? A) Yordama geçerliği B) Yapı geçerliği C) Kapsam geçerliği D) İç tutarlığı E) Puanlayıcılar arası güvenirliği
B. Zamandaş (Uygunluk) Geçerliği - Bir ölçüte dayalı geçerlik belirlenirken, ölçütten elde edilen puanlar, ölçme aracından elde edilen puanlarla (yordayıcı puan) aynı zamanda veya daha önceden elde edilmişse, bu puanlar arasındaki korelasyona dayalı geçerliğe; zamandaş geçerliği adı verilir. - Zamandaş geçerliğini belirlemek için kullanılacak ölçüt veya ölçüt takımları; yordayıcı (geçerliği belirlenecek ölçme aracı) ile aynı anda veya çok yakın zamanda verilen ve aynı veya benzer değişkenleri ölçtüğü bilinen bir testten alınan puanlar, öğretmen görüşleri veya notları, daha önceki yıllara ait okul başarısını temsil eden notlar olabilir. * yüksek öğretim geçiş sınavının (YGS) zamandaş geçerliğini belirleme (Bireylerin orta öğretim kurumlarındaki derslere ait başarı puanları ortalaması (OÖBP) ölçüt olarak kabul edilebilir. YGS'den elde edilen puanlarla, OÖBP (ölçüt puanlar) arasındaki korelasyon hesaplanarak zamandaş geçerliği belirlenebilir.
4. Yapı Geçerliği Yapı, birbiriyle ilgili olduğu düşünülen belli öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür. Bir testin yapısını geçerleme süreci; temelde, testin maddelerine verilen cevaplar arasındaki ilişkilerin analizine dayanır.
4. Görünüş geçerliği, bir testin gerçekten ne ölçtüğüyle değil, onun ne ölçüyor göründüğüyle ilgilidir. Bir testin görünüş geçerliği, o testin ölçmek istediği şeyi ölçüyor görünmesidir.
5. Sonuçsal Geçerlik * Yapılandırmacı bilgi felsefesinin öğrenme ve öğretme süreçleri üzerindeki etkisine bağlı olarak ortaya çıkmıştır. * Öğrencinin öğrenme ve öğretme sürecine etkin katılımını, kendi öğrenme düzeyini sorgulayarak yönetebilmesini, öğrenme ile değerlendirme etkinliklerinin iç içe kullanılmasını gerekli kılan alternatif değerlendirme yaklaşımlarıyla ilgilidir. * Geçerlik kavramı öz, akran, ortak ve biriktirim değerlendirme gibi alternatif değerlendirme yaklaşımlarının amaçlarını da içerecek şekilde genişletilmiştir.
+ Sonuçsal geçerlikle ilgili dikkat edilmesi gereken önemli bir nokta, daha çok değerlendirme işleminin geçerliğinin sorgulandığıdır. • + Başarı testlerinde öncelikli olarak aranan geçerlik türü kapsam geçerliğidir. • + Psikolojik testlerde yani ilgi, tutum, zekâ, yetenek vb. testlerde öncelikli olarak aranan geçerlilik türü yapı geçerliğidir. • + Alternatif ölçme değerlendirme araçlarında (portfolyo, performans, rubrik, öz, akran değerlendirme vb) öncelikli olarak aranan geçerlik türü sonuçsal geçerliktir.
ÖLÇMEDE GEÇERLİLİĞİ ETKİLEYEN FAKTÖRLER 1. Testte yer alan bütün sorular ölçülmek istenen özellikle ilgili olmalıdır. 2. Test kapsam bakımından uygun olmalıdır. Çok dar veya geniş kapsamı olan testlerin geçerliliği düşüktür. 3. Ölçüm yaparken dış etkenlerden etkilenmeden işlemleri yürütmek geçerliliği yükseltir. 4. Testin çok kolay veya zor olması geçerliği düşürür. 5. Cevaplama için verilen süreye dikkat edilmelidir. 6. Şıklı soruların cevaplarının alt alta gelmesi geçerliği düşürür. 7. Ölçme işlemine karışan sabit ve sistematik hatalar geçerliği düşürür. 8. Sınavda ölçülecek davranışları uygun maddeler ile ölçmek geçerliği artırır.
ÖLÇMEDE GEÇERLİLİĞİ ETKİLEYEN FAKTÖRLER 9. Sınavın ölçmeyi hedeflediği özelliklerden başka özellikleri ölçmesi geçerliği düşürür. (Matematik sınavında yazı güzelliğine puan verilmesi) 10. Soru belirsizliği geçerliği düşürür. 11. Madde ayırt edicilik gücü arttıkça geçerlik artarken, ayırt edicilik gücü azaldıkça geçerlik düşer. 12. Puanlama yanlılığı geçerliği düşürür. 13. Sınavlarda kopya çekilmesi geçerliği düşürür. 14. Öğretmen tarafından aynı soruların farklı sınıflarda ve yıllarda kullanımı geçerliği düşürür.
BİR TESTİN GEÇERLİLİGİNİ ARTIRMA YOLLARI *. Her soru ölçmek istediğimiz davranışlardan en az birini ortaya çıkarıcı ve ölçücü olacak biçimde hazırlanmalıdır. *. Her soru, ölçülen davranışa sahip olanlarla olmayanları ayırıcı biçimde hazırlanmalıdır. *. Geçerlilik özelliğini sağlamak için testi muhakkak güvenilir biçimde hazırlamak gerekir. Çünkü güvenilir olmayan test, zaten geçerli de değildir. * Test, ders programını hem kapsayıcı, hem de dengeli biçimde temsil edici nitelikte hazırlanmalıdır. *. Testin güçlük derecesi ile geçerlilik özelliği arasında yakın ilişki vardır. Testin zorluk derecesi puanların kullanılış amacına göre değişecektir. Genel olarak; soruların; % 10'u çok zor, % 20'si zor, % 40'ı vasat, % 20'si kolay ve % 10'u çok kolay olacak tarzda hazırlanırsa, sınavın geçerliliği yükselir.
* Aynı sorular hiç değişmeden yıllarca üst üste kullanılmamalıdır. *. Öğrencilere sınavdan önce ipucu olabilecek bilgiler vermek ya da bir kısım soru yazdırıp içinden bazılarını sormak da geçerliliği düşürür. *. Cevap kâğıtlarının puanlanmasında ortaya çıkacak bir yanlışlık (Dikkatsizlik ya da yanlı davranma) da geçerliliği düşürür. * Sınavda kopya yapılması da geçerliliği düşürür. ********** 2009Bir araştırmacı çoklu zekâ alanlarını ölçmek amacıyla geliştirdiği çok boyutlu testi, dil bilimi, matematik, resim, heykel, müzik, beden eğitimi, iletişim, psikoloji bölümlerindeki öğrencilere uygulamıştır. Uygulama sonucunda farklı bölümlerdeki öğrencilerin kendi alanıyla ilgili sorulardan yüksek, diğer alanlardaki sorulardan ise daha düşük puan aldıklarını saptamıştır. • Buna göre, ölçme aracı için aşağıdakilerden hangisi söylenebilir? A) Amaca hizmet etme derecesi düşüktür. B) Hata düzeyi düşüktür. C) Geçerliği yüksektir. D) Kullanışlılığı yüksektir. E) Güvenirliği düşüktür.
GÜVENİRLİK Ölçüm sonuçlarının her ölçüm yapıldığında aynı olması, ölçmenin hatadan arınık olması durumudur. Ölçme aracının, ölçmeyi amaçladığı özelliği ne kadar duyarlı ve tutarlı ölçtüğü ölçmede güvenirliği belirler. * Güvenilir bir ölçme aracı, aynı özellikle ilgili olarak arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonucu verir. * Güvenilir bir test aynı gruba iki ya da üç kez uygulandığında yaklaşık olarak gruptaki her kişi her uygulamada aynı puanı almalıdır. * Bir ölçme işlemine ne kadar fazla hata karışırsa, ölçmedeki tutarlılık ve kararlılık o oranda ortadan kalkacaktır. * Ölçme hatası ile ölçme aracının özelliklerinden biri olan güvenirlik arasında ters bir ilişki vardır. Hata miktarı arttıkça güvenirlik düşer.
GÜVENİRLİK * 100 cm olması gereken bir cetvel hatalı üretim sonucu 98 cm üretilmişse bu ölçüm aracı ile yapılan ölçüm güvenilir kabul edilir. Fakat bu ölçüm geçerli değildir. * Bir testin ölçmek istediği özelliği doğru olarak ölçebilmesi için, o testin, ilkin, söz konusu özelliği tutarlı olarak ölçmesi gerekir. * Güvenirlik geçerliğin tek güvencesi değildir. Son derece güvenilir bir test, kullanıldığı maksat için çok küçük bir geçerliğe sahip olabilir. Güvenirlik bir ölçme aracının kararlılığı ve tutarlılığı ile ilgilidir. • 1. Bir ölçme sonucu, içindeki tesadüfî hataların azlığı oranında güvenilir sayılır. • 2. Güvenirlik bir bakıma ölçme sonuçlarının tesadüfî hatalardan arınıklık derecesidir. • 3. Güvenirlik ölçmelerin duyarlılık derecesini ifade eden kavramdır. • 4. Güvenirlilik katsayısı hemen her zaman (O) ile (+1) arasında değişir.
GÜVENİRLİK Ölçmede güvenirliği belirleyen üç temel özellik 1. Duyarlılık * Ne kadar az hata yapılırsa duyarlılık o kadar fazla olur. * Ölçme aracının birimi ne kadar küçük olursa o oranda hassas ölçüm yapar. * Altın tartarken kg yerine miligram kullanılması veya sınavda az soru yerine çok soru sorulması duyarlılığı arttırır. • 2. Tutarlılık * Bir özellik, bir çok kez aynı ölçüm aracı ile ölçüldüğünde aynı veya çok yakın değerler veriyorsa o kadar tutarlıdır. • 3. Kararlılık * Bir nitelik aynı araçlarla birden fazla ölçüldüğünde, birbirinden farklı olmayan sonuçlar çıkarsa, ölçme aracı kararlıdır.
GÜVENİRLİK KESTİRME YOLLARI 1. Test - Tekrar Test Yöntemi (Kararlılık Katsayısı) 2. Eşdeğer Formlar Yöntemi (Paralel Testler Yöntemi - Eşdeğerlik Katsayısı) 3. Eşdeğer Yarılama Yöntemi (Bir testin iki yarıya bölünmesi yöntemi-iç tutarlılık katsayısı) 4. İç Tutarlılık Yöntemi (Iç tutarlılık katsayısı) 5. Kuder - Rıchardson 20 Ve 21 Formülleri (KR-20 ve KR-21) 6. Cronbach Alfa
1. Test - Tekrar Test Yöntemi (Kararlılık Katsayısı) Bir testin aynı cevaplayıcı grubuna belirli bir zaman aralığı bırakılarak iki defa uygulanmasıdır. • Bu yaklaşım, "iki uygulama arasında geçen zaman içerisinde ölçülen özelikte önemli değişikliğin olmadığı" sayıltısına dayanır. Bu sayıltının karşılanabilmesi için iki ölçüm arsında geçen süre önemlidir. Yani, süre ne kadar kısalırsa korelasyon o kadar yüksek; süre ne kadar uzarsa korelasyon da o kadar düşük çıkabilir. • İki uygulama arasında geçen süre, ne hatırlanacak kadar kısa ne de testle ölçülen özelikler bakımından öğrencilerin değişebileceği kadar uzun tutulmalıdır. • Bu yöntem daha çok ilgi - tutum - yetenek testlerinde uygulanır. Çünkü ilgi - tutum - yetenek iki ölçümde değişmez.
2007Lisedeki bir rehber öğretmen öğrencilerin mesleki ilgilerini belirlemek için mesleki ilgi envanteri geliştirmiştir. Güvenirliğini belirlemek için bu envanteri aynı öğrencilere altı hafta arayla iki kez uygulamış ve iki uygulamadan elde edilen ölçüler arasındaki ilişkiyi (korelasyon) 0,45 bulmuştur. • Aşağıdakilerden hangisi, bu korelasyon değerinin düşüklüğü için gerekçe olarak gösterilemez? A) Ölçülen özellik kolay değişme gösteren bir yapıdadır. B) iki uygulamanın koşulları birbirinden oldukça farklıdır. C) Öğrenciler maddelere yanıt verirken gerçekçi davranmamışlardır. D) Sorular her okumada farklı anlamlara gelebilmektedir. E) iki uygulama arasında geçen süre çok kısadır.
2. Eşdeğer Formlar Yöntemi (Paralel Testler Yöntemi - Eşdeğerlik Katsayısı) * İki eşdeğer formu aynı cevaplayıcı grubuna aynı anda veya kısa zaman aralığı bırakılarak uygulanır. * İki uygulama arasındaki korelasyon katsayısı hesaplanır. Bulunan katsayı "eşdeğerlik katsayısı" olarak bilinir. * Bulunan katsayının yüksek oluşu her iki formun da güvenilir olduğuna, düşük oluşu her iki formun da güvenirliğinin düşük olduğuna işaret eder.
3. Eşdeğer Yarılama (Testin iki yarıya bölünmesi) (İç Tutarlılık Katsayısı) Yöntemi Aynı testin iki ayrı formu (50 soruluk testin 1-25 numaralı soruların sonuçları ile 26 - 50 numaralı soruların sonuçları) veya tek numaralı soruların (1,3,5,7, ...) sonuçları ile çift numaralı soruların (2, 4, 6, 8, ...) sonuçlarının korelasyonunun hesaplanarak güvenirliğin bulunmasıdır. • Test güvenirliği tahmin işinde en çok kullanılan yöntemdir. • Bu yöntem testin iç tutarlılık katsayısını verir.
5. Kuder - Rıchardson 20 Ve 21 Formülleri İçindeki her bir maddenin güçlük derecesi, yani her bir maddeye doğru cevap veren öğrencilerin oranı (p) hesaplanan bir testin güvenirliğini tahmin için, duruma göre Kuder Richardson 20 ve 21 formüllerinden birisi kullanılabilir. Kuder-Richardson formülleri, testteki her bir maddenin aynı değişkeni ölçtüğü, yani testin ölçtüğü şeyin homojen olduğu sayıltısına dayanır.
KR-20 FORMÜLÜ * KR-20 iç tutarlılık güvenirliği teste yer alan her bir maddenin madde güçlük indekslerinin bilinmesi durumunda kullanılabilir. * KR-20 yöntemiyle bir testin bütün maddelerinin birbiriyle ne kadar tutarlı olduğu kestirilebilir. * Kuder-Richardson 20 formülü, sadece doğru cevaplandırılan maddelere (1) bir puan vererek, yanlış cevaplandırılan ve boş bırakılan maddelere ise (O) sıfır puan vererek puanlanan testlere uygulanabilir. * Eğer testteki maddeler farklı ağırlıklarla puanlanmışsa veya test puanları şans başarısı için düzeltilmişse KR-20 formülü kullanılmaz.
KR-20 FORMÜLÜ Kuder-Richardson 20 formülü ile elde edilen değerlerle ilgili şu yorumlar yapılabilir: • Elde edilen değer yüksekse (1.oo’e yakınsa), maddeler arasındaki iç tutarlılık oldukça yüksektir. • Bu güvenirlik katsayısına göre, * Test puanlarının tesadüfî hatalardan arınık olduğu; * Test maddelerinin homojen olduğu; * Testle ölçülen değişkenin tek boyutlu olduğu; * Test maddelerinin birbiriyle uyumlu olduğu ve aynı değişkeni ölçtüğü; * Testin uygulandığı grubun heterojen olduğu; * Yapı geçerliliğinin yüksek olduğu yorumları yapılabilir.
KR - 21 FORMÜLÜ Bir testteki maddelerin güçlük dereceleri birbirinden önemli ölçüde farklı değilse, yani testteki tüm maddelerin güçlük derecelerinin eşit olduğu düşünülürse, o testin güvenirliğini tahmin için KR-21 formülü kullanılabilir. Bu formülün bir sınırlılığı vardır: Eğer testteki maddeler güçlük bakımından birbirlerinden oldukça farklı ise, bu formül, güvenirlik katsayısının alt sınırını verir. Bu yüzden KR-21 formülüyle bulunan değeri iyi bir güvenirlik tahmini kabul edebilmek için testteki maddelerden bazılarının aşırı derecede güç olmaması gerekir.
Hız testlerinde iç tutarlılık katsayısı yanıltıcı sonuç verir. Cevaplama hızı, testte önemli bir etkense, yani öğrencilerin çoğunluğu her bir maddeye cevaplama zamanı bulamamışsa, KR formülleriyle tahmin edilen güvenirlik katsayısı olduğundan büyük çıkar. * Bu formüller, testin bütünü öğrencilerin yüzde 90'ınca cevaplandırılmadıkça kullanılmamalıdır. * Testteki bütün maddelerin aynı güçlük derecesinde farz edilerek KR - 20 formülünden, onun özel hali olan KR - 21 simgesiyle bilinen formül çıkartılmıştır.
KR-20 ve KR-21 FORMÜLLERİ ARASINDAKİ İLİŞKİ * KR-21 ile hesaplanan güvenirlik katsayısı, KR20 ile hesaplanan güvenirlik katsayısından her zaman küçüktür. * KR-21 ile hesaplanan güvenirlik katsayısı KR20 ile hesaplanan güvenirlik katsayısından küçük çıktığı için; bir güvenirlik için KR-21 ile hesaplanan değer testin güvenirlik katsayısının alt sınırı olarak kabul edilir. * Bir testin güvenirlik katsayısı ister KR-20 ile ister KR-21 ile hesaplansın, yapılacak yorum değişmez. * KR-20= 0,95 ve KR-21 = 0,90 ise her iki sonuç için de testin iç tutarlılık katsayısının yani güvenirliğinin yüksek olduğu yorumu yapılır.
KR-20 ve KR-21 FORMÜLLERİ ARASINDAKİ İLİŞKİ KR-20 ve KR-21 güvenirlik katsayısı yüksek ise aşağıdaki yorumlar yapılabilir: * Uygulanan test tesadüfi hatalardan arınıktır. * Ölçülen değişken tek boyutludur. * Testin uygulandığı grup heterojen yapıdadır. * Testi oluşturan maddeler homojendir. * Testin yapı geçerliği yüksektir.
Ölçmede güvenirliği artırmak için dikkat edilecek hususlar 1. Test sorularının sayısı arttıkça güvenirlilik artar. • SORU 50 maddelik ölçme testinin güvenirlik katsayısı r = 0,75 olarak bulunmuştur. Bu teste aynı güçlük düzeyinde 25 madde daha eklenirse madde eklenmiş testin güvenirlik katsayısı ( r ) kaça çıkmış olur? N = 75 / 50 = 1,5 Sperman Brown 23: r = . n . r . 1 + (n – 1) . r Sperman Brown 23: r = . 1,5 . 0,75 . = 0,81 1 + (1,5 – 1) . 0,75 2. Test uygulanacak kişilerin seviyesine ne kadar uygunsa güvenirlilik o kadar yüksektir. 3. Sınav soruları yönergesi ne kadar açık ve anlaşılır olursa güvenirlik o kadar artar.