1 / 72

tes

tes tes tes

e_zhaexact
Download Presentation

tes

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern Dosen Pengampu: Didik Setyawarno, M.Pd SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

  2. PRAKTIKUM 1 ANALISIS VALIDITAS DAN RELIABILITAS BUTIR SECARA KLASIK A.Tujuan Mahasiswa mampu untuk menganalisis butir dari data politomi maupun dikotomi untuk menentukan nilai validitas dan reliabilitasnya. B.Dasar Teori Validitas alat ukur adalah ketepatan alat ukur dengan hal yang diukur. Ada beberapa jenis validitas alat ukur, yaitu: (1) Validitas isi (content validity), (2) validitas konstruksi (construct validity), (3) validitas ramalan (predictive validity), dan (4) validitas sama saat (concurrent validity). Uji validitas secara empiris dilakukan melalui uji coba instrument kepada responden. Jika datanya berbentuk politomi misal data angket dan soal uraian, maka analisis validitas dilakukan dengan menggunakan teknik korelasi Product Moment dengan rumus berikut. ?∑?? − (∑?)(∑?) √(?∑?2− (∑?)2)(?∑?2− (∑?)2) Keterangan: N = banyaknya kasus atau sampel X = skor butir tes Y = skor total Data yang berbentuk dikotomi misal data soal pilihan ganda dengan benar skor 1 dan salah skor 0, maka analisis validitas dengan menggunakan teknik Korelasi Point Biserial, dengan rumus sebagai berikut. ???= ????=??− ?? √? ? ?? Keterangan: = koefisien korelasi point biserial = rerata skor dari subjek yang menjawab betul bagi butir yang dicari validitasnya = rerata skor total = standar deviasi dari skor total = proporsi peserta didik yang menjawab betul (banyaknya peserta didik yang menjawab betul dibagi dengan jumlah seluruh peserta didik) = proporsi peserta didik yang menjawab salah (q = 1 – p) Suatu butir tes dinyatakan valid jika nilai r hitung (rxy atau rpbi) lebih besar daripada r tabel dengan taraf signifikansi atau taraf kekeliruan secara umum 5% (rhit > rtab dengan taraf signifikansi 5%), namun beberapa ada yang menggunakan lebih ketat lagi yaitu 1%. Reliabilitas alat ukur adalah keterandalan alat ukur atau keajegan alat ukur; artinya, kapanpun alat ukur itu digunakan akan menghasilkan hasil ukur yang relatif tetap. Ada beberapa jenis reliabilitas, yaitu: (1) konsistensi internal, (2) stabilitas, dan (3) ekuivalen. Reliabilitas konsistensi internal alat ukur dapat dihitung dengan menggunakan rumus Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21), dan Teknik Belah Dua. KR-20 ini secara khusus untuk menghitung reliabilitas tes yang datanya dikotomi misalnya soal pilihan ganda dengan skor benar 1 dan salah 0, dengan rumus sebagai berikut. rpbi Mp Mt st p q 1

  3. ? − 1)(???2− ∑?? ? ) ?1.1= ( 2 ??? Keterangan : = koefisien reliabilitas tes = proporsi testee yang menjawab betul = proporsi testee yang menjawab salah = banyaknya testee = varian total tes = p x q = banyak butir tes Jika taraf kesulitan butir tes homogen, maka analisis yang digunakan adalah KR – 21, dengan rumus sebagai berikut. ? ? − 1)(1 −?(? − ?) Keterangan: r1.1 = reliabilitas tes M = rata-rata hitung k = banyak butir SD2t = varian total tes Varian merupakan kuadrat dari simpangan baku atau standar deviasi. Nilai standar deviasi dapat dihitung dengan rumus sebagai berikut. r1.1 p q n SD2t pq k ) ?1.1= ( 2 ?.??? ???= √?∑?2− (∑?)2 ?(? − 1) Keterangan: SDt n = simpangan baku (standar deviasi) = jumlah responden Jika datanya berbentuk politomi misal data angket atau soal uraian, maka digunakan rumus Alpha- Cronbach, dengan rumus sebagai berikut. ? ? − 1)(???2− ∑??? Keterangan : r1.1 = koefisien reliabilitas perangkat tes k = banyak butir tes 2 i SD = varians skor tiap butir (item) SD = varian skor total Untuk menentukan derajat reliabilitas tes, dapat digunakan kriteria sebagai berikut. ≤ 0,20 : sangat rendah 0,20 ≤ 0,40 : rendah 0,40 ≤ 0,60 : sedang 0,60 ≤ 0,80 : tinggi 0,80 ≤ 1,00 : sangat tinggi 2 ) ?1.1= ( 2 ??? 2 tot 2

  4. C.Data Butir Soal dan Angket 1.Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan dikerjakan oleh 20 siswa Nomor butir Tes Objektif Responden 1 2 3 4 5 1 1 1 1 1 1 2 0 0 0 0 0 3 0 0 0 0 0 4 1 0 1 1 1 5 0 1 1 1 0 6 1 1 1 1 1 7 0 1 0 0 1 8 1 1 0 0 1 9 0 1 1 0 0 10 1 1 1 0 1 11 1 1 1 1 0 12 0 1 0 0 1 13 0 0 0 0 0 14 1 1 0 1 1 15 1 1 1 1 1 16 0 1 1 1 0 17 0 1 1 1 0 18 1 1 1 1 1 19 0 0 1 1 0 20 0 1 1 0 1 2.Data jawaban dari angket (1 = sangat tidak setuju/ STS, 2 = tidak setuju/TS, 3 = netral/N, 4 = setuju/S, dan 5 = sangat setuju/SS) yang terdiri dari 10 pernyataan dan diisi oleh 20 peserta Nomor Butir Angket Responden 1 2 3 4 1 3 4 3 2 2 2 4 3 4 3 4 4 4 3 4 3 4 4 3 5 2 3 2 4 6 4 3 4 4 7 3 3 4 4 8 4 4 3 4 9 3 4 3 4 10 2 4 4 2 11 2 3 4 3 12 3 2 1 4 13 4 3 2 5 14 4 4 3 4 15 3 4 4 3 16 4 4 4 4 17 3 3 4 4 18 4 4 5 4 19 3 5 4 5 20 3 5 4 5 6 1 0 0 1 0 1 0 1 0 1 1 1 0 1 1 0 0 1 0 1 7 1 0 0 1 0 1 0 1 0 1 1 0 0 1 1 1 0 1 1 0 8 1 1 0 1 0 1 1 1 0 0 1 0 0 0 1 1 1 1 0 0 9 1 0 0 0 0 1 1 1 0 0 1 0 0 1 1 1 0 1 0 1 10 1 0 0 1 0 0 0 1 0 1 1 0 0 1 1 1 1 1 1 1 5 4 4 4 3 3 4 4 4 5 3 2 5 4 4 3 4 4 5 5 5 6 3 3 4 3 4 4 3 4 4 3 4 4 4 4 4 4 4 3 4 4 7 3 4 4 3 2 5 3 4 3 2 2 3 4 4 3 3 2 2 2 2 8 3 4 4 3 4 5 4 4 3 3 2 3 3 4 4 4 4 4 5 5 9 3 4 4 3 2 5 3 3 4 4 4 4 2 3 4 5 4 5 4 4 10 3 3 4 3 3 5 4 5 4 3 2 4 4 4 4 3 4 4 3 3 3

  5. D.Prosedur Kerja dan Alat Bantu 1.Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat validitas dan reliabilitas yang sesuai dengan jenis data. 2.Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya. 3.Buatlah tabel yang bisa membantu dalam menganalisisnya. 4.Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir. E.Analisis Data dengan Aplikasi Excel 1.Analisis validitas butir objektif/ PG Nomor butir Tes Objektif Responden 1 2 3 4 1 1 1 1 1 2 0 0 0 0 3 0 0 0 0 4 1 0 1 1 5 0 1 1 1 6 1 1 1 1 7 0 1 0 0 8 1 1 0 0 9 0 1 1 0 10 1 1 1 0 11 1 1 1 1 12 0 1 0 0 13 0 0 0 0 14 1 1 0 1 15 1 1 1 1 16 0 1 1 1 17 0 1 1 1 18 1 1 1 1 19 0 0 1 1 20 0 1 1 0 P q Rerata Benar Rerata total SD tot rpbi r tabel Status Butir VALID 2.Analisis validitas butir angket Nomor Butir Angket Responden 1 2 3 4 1 3 4 3 2 2 2 4 3 4 3 4 4 4 3 4 3 4 4 3 5 2 3 2 4 6 4 3 4 4 7 3 3 4 4 8 4 4 3 4 9 3 4 3 4 10 2 4 4 2 5 1 0 0 1 0 1 1 1 0 1 0 1 0 1 1 0 0 1 0 1 6 1 0 0 1 0 1 0 1 0 1 1 1 0 1 1 0 0 1 0 1 7 1 0 0 1 0 1 0 1 0 1 1 0 0 1 1 1 0 1 1 0 8 1 1 0 1 0 1 1 1 0 0 1 0 0 0 1 1 1 1 0 0 9 1 0 0 0 0 1 1 1 0 0 1 0 0 1 1 1 0 1 0 1 10 1 0 0 1 0 0 0 1 0 1 1 0 0 1 1 1 1 1 1 1 Total 5 4 4 4 3 3 4 4 4 5 3 6 3 3 4 3 4 4 3 4 4 3 7 3 4 4 3 2 5 3 4 3 2 8 3 4 4 3 4 5 4 4 3 3 9 3 4 4 3 2 5 3 3 4 4 10 3 3 4 3 3 5 4 5 4 3 Total 4

  6. 11 12 13 14 15 16 17 18 19 20 2 3 4 4 3 4 3 4 3 3 3 2 3 4 4 4 3 4 5 5 4 1 2 3 4 4 4 5 4 4 3 4 5 4 3 4 4 4 5 5 2 5 4 4 3 4 4 5 5 5 4 4 4 4 4 4 4 3 4 4 2 3 4 4 3 3 2 2 2 2 2 3 3 4 4 4 4 4 5 5 4 4 2 3 4 5 4 5 4 4 2 4 4 4 4 3 4 4 3 3 Kore- lasi r tabel Status 3.Analisis reliabilitas butir soal objektif/ PG Nomor butir Tes Objektif (yang dimasukkan adalah butir yang valid) Responden No. Soal No. Soal 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Banyak butir k P q pq Sigma pq Varians total KR-20 VALID No. Soal No. Soal No. Soal No. Soal Total 4.Analisis reliabilitas butir angket Responden 1 2 3 4 Nomor butir angket (yang dimasukkan adalah butir yang valid) No.Butir No.Butir No.Butir No.Butir No.Butir No.Butir No.Butir Total 5

  7. 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 k Var total Var butir Sigma varbut Alpha- Cronbach F.Kesimpulan Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh. 6

  8. LAMPIRAN 1. TABEL NILAI-NILAI r PRODUCT MOMENT/POINT BISERIAL Taraf Signifikansi N 5% 1% 5% 0,997 0,999 27 0,381 0,950 0,878 0,959 29 0,367 0,811 0,917 30 0,361 0,754 0,874 31 0,355 0,707 0,834 32 0,349 0,666 0,798 33 0,344 0,632 0,765 34 0,339 0,602 0,735 35 0,334 0,576 0,708 36 0,329 0,553 0,684 37 0,325 0,532 0,661 38 0,320 0,514 0,641 39 0,316 0,497 0,623 40 0,312 0,482 0,606 41 0,308 0,468 0,590 42 0,304 0,456 0,575 43 0,301 0,444 0,561 44 0,297 0,433 0,549 45 0,294 0,423 0,537 46 0,291 0,413 0,526 47 0,288 0,404 0,515 48 0,284 0,396 0,505 49 0,281 0,388 0,496 50 0,279 Taraf Signifikansi Taraf Signifikansi 5% 0,266 0,254 0,244 0,235 0,227 0,220 0,213 0,207 0,202 0,195 0,176 0,159 0,148 0,138 0,113 0,098 0,088 0,080 0,074 0,070 0,065 0,062 N N 1% 0,487 0,478 0,470 0,463 0,456 0,449 0,442 0,436 0,430 0,424 0,418 0,413 0,408 0,403 0,398 0,393 0,389 0,384 0,380 0,376 0,372 0,368 0,364 0,361 1% 0,345 0,330 0,317 0,306 0,296 0,286 0,278 0,270 0,263 0,250 0,230 0,210 0,194 0,181 0,148 0,128 0,115 0,105 0,097 0,091 0,086 0,081 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 55 60 65 70 75 80 85 90 95 100 125 150 175 200 300 400 500 600 700 800 900 1000 0,990 28 0,374 7

  9. PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern Dosen Pengampu: Didik Setyawarno, M.Pd SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

  10. PRAKTIKUM 2 ANALISIS TARAF KESUKARAN DAN DAYA BEDA BUTIR SOAL DAN TES A.Tujuan Mahasiswa mampu untuk menganalisis butir soal pilihan ganda (data dikotomi) untuk menentukan indek daya beda dan taraf kesukaran butir soal dan instrumen. B.Dasar Teori 1.Taraf Kesukaran Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta didik untuk menjawab soal yang digunakan untuk tes; artinya, tes tersebut akan lebih banyak dapat dijawab benar oleh peserta didik yang pandai dan lebih banyak dijawab salah oleh peserta didik yang bodoh. Tingkat kesukaran butir tes merupakan bilangan yang menunjukkan proporsi peserta ujian (testee) yang dapat menjawab betul butir soal tersebut. Sedangkan tingkat kesukaran perangkat tes adalah bilangan yang menunjukkan rata-rata proporsi testee yang dapat menjawab seluruh (perangkat) tes tersebut. Rumus tingkat kesukaran instrumen tes untuk soal bentuk pilihan ganda maupun uraian sebagai berikut. ??=∑?? ? Keterangan : Pp P n Tingkat kesukaran tiap butir soal berbentuk pilihan ganda, dihitung dengan rumus : = = = tingkat kesukaran perangkat tes tingkat kesukaran tiap butir banyaknya butir tes ??=?? ? Keterangan : Pi nB n = tingkat kesukaran butir tes pilihan ganda nomor i = banyaknya subyek yang menjawab soal dengan betul = jumlah subyek (testee) seluruhnya Pada tingkat kesukaran soal tes esai/uraian, dihitung dengan menggunakan rumus: ??=?? ̅ ?? Keterangan : Pi ?? ̅ sm = tingkat kesukaran butir tes uraian nomor i = rata-rata skor butir soal = skor maksimal setiap butir yang ditetapkan Kriteria tingkat kesukaran (P) : 0,00 – 0,30 = sukar 0,31 – 0,70 = sedang* 0,71 – 1,00 = mudah Referesni lain ada yang menyatakan bahwa tes yang baik adalah tes yang memiliki taraf kesukaran antara 0,25 – 0,75. 1

  11. 2.Daya Beda Daya pembeda tes adalah kemampuan tes untuk membedakan antara peserta didik yang pandai (kelompok atas) dan bodoh (kelompok bawah); artinya, jika tes tersebut diberikan kepada anak yang tergolong pandai akan lebih banyak dapat dijawab dengan benar, sedangkan jika diberikan kepada peserta didik yang tergolong bodoh akan lebih banyak dijawab salah. Daya pembeda tes yang baik adalah antara 20% - 80% atau antara 30% - 70%. Daya beda butir tes ialah kemampuan butir tes tersebut membedakan antara testee kelompok atas (pinter) dan testee kelompok bawah (lemah). Daya beda perangkat tes adalah rata-rata kemampuan tiap butir tes membedakan antara testee kelompok atas (pinter) dan testee kelompok bawah (lemah). Rumus untuk menghitung tingkat daya beda tes berbentuk pilihan ganda atau uraian sebagai berikut. ??=∑(??− ??) ? Keterangan : Dp = Daya beda instrumen tes n = jumlah butir tes Rumus untuk menghitung daya beda butir tes berbentuk pilihan ganda adalah sebagai berikut : ??= Keterangan: Di = Daya beda butir soal nomor i nBA = jumlah subyek yang menjawab betul pada kelompok atas nBB = jumlah subyek yang menjawab betul pada kelompok bawah nA = jumlah subyek kelompok atas nB = jumlah subyek kelompok bawah Rumus untuk menghitung daya beda butir tes berbentuk uraian adalah sebagai berikut : ??=?? ̅?− ?? ̅? =∑?? ? ??? ??−??? ?? atau ??= ??− ?? ?? Keterangan: Di ?? ̅? ?? ̅? sm = Daya beda butir soal nomor i = rata-rata skor kelompok atas pada butir soal nomor i = rata-rata skor kelompok bawah pada butir soal nomor i = skor maksimal setiap butir yang ditetapkan Kriteria Daya Beda (D) : 0,00 – 0,19 = kurang baik 0,20 – 0,39 = cukup baik 0,40 – 0,70 = baik 0,71 – 1,00 = sangat baik * Jika “D” negatif, soal tersebut sangat buruk dan harus dibuang. 2

  12. C.Data Butir Soal 1.Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan dikerjakan oleh 20 siswa Nomor butir Tes Objektif Responden 1 2 3 4 5 1 1 1 1 1 1 2 0 0 0 0 0 3 0 0 0 0 0 4 1 0 1 1 1 5 0 1 1 1 0 6 1 1 1 1 1 7 0 1 0 0 1 8 1 1 0 0 1 9 0 1 1 0 0 10 1 1 1 0 1 11 1 1 1 1 0 12 0 1 0 0 1 13 0 0 0 0 0 14 1 1 0 1 1 15 1 1 1 1 1 16 0 1 1 1 0 17 0 1 1 1 0 18 1 1 1 1 1 19 0 0 1 1 0 20 0 1 1 0 1 2.Data jawaban dari soal uraian dengan skor maksimal seragam (minimal 0 dan maksimal 5) dari 10 butir soal uraian yang diisi oleh 20 peserta Nomor Butir Uraian Responden 1 2 3 4 5 1 3 4 3 2 4 2 2 4 3 4 4 3 4 4 4 3 4 4 3 4 4 3 3 5 2 3 2 4 3 6 4 3 4 4 4 7 3 3 4 4 4 8 4 4 3 4 4 9 3 4 3 4 5 10 2 4 4 2 3 11 2 3 4 3 2 12 3 2 1 4 5 13 4 3 2 5 4 14 4 4 3 4 4 15 3 4 4 3 3 16 4 4 4 4 4 17 3 3 4 4 4 18 4 4 5 4 5 19 3 5 4 5 5 20 3 5 4 5 5 6 1 0 0 1 0 1 0 1 0 1 1 1 0 1 1 0 0 1 0 1 7 1 0 0 1 0 1 0 1 0 1 1 0 0 1 1 1 0 1 1 0 8 1 1 0 1 0 1 1 1 0 0 1 0 0 0 1 1 1 1 0 0 9 1 0 0 0 0 1 1 1 0 0 1 0 0 1 1 1 0 1 0 1 10 1 0 0 1 0 0 0 1 0 1 1 0 0 1 1 1 1 1 1 1 6 3 3 4 3 4 4 3 4 4 3 4 4 4 4 4 4 4 3 4 4 7 3 4 4 3 2 5 3 4 3 2 2 3 4 4 3 3 2 2 2 2 8 3 4 4 3 4 5 4 4 3 3 2 3 3 4 4 4 4 4 5 5 9 3 4 4 3 2 5 3 3 4 4 4 4 2 3 4 5 4 5 4 4 10 3 3 4 3 3 5 4 5 4 3 2 4 4 4 4 3 4 4 3 3 3

  13. D.Prosedur Kerja dan Alat Bantu 1.Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat kesukaran perangkat tes, tingkat kesukaran butir tes, daya beda perangkat tes, dan daya beda butir tes yang sesuai dengan jenis data. 2.Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya. 3.Buatlah tabel yang bisa membantu dalam menganalisisnya. 4.Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir. E.Analisis Data dengan Aplikasi Excel 1.Analisis tingkat kesukaran dan daya beda butir objektif/ PG Nomor butir Tes Objektif Responden 1 2 3 4 5 Data diurutkan dari total skor tertinggi ke terendah (1-10 atau setengah dari jumlah peserta tes adalah kelompok atas) 11-20 atau setengah dari jumlah peserta tes berikutnya adalah kelompok bawah Kelompok atas menjawab benar Kelompok bawah menjawab benar Jumlah benar pada semua kelompok Tingkat Kesukaran Daya Beda Kualitas Butir Baik 6 7 8 9 10 Total 4

  14. 1.Analisis tingkat kesukaran dan daya beda soal uraian Responden 1 2 Data diurutkan dari total skor tertinggi ke terendah (1-10 atau setengah dari jumlah peserta tes adalah kelompok atas) 11-20 atau setengah dari jumlah peserta tes berikutnya adalah kelompok bawah Rata-rata kelompok atas menjawab benar Rata-rata kelompok bawah menjawab benar Rata-rata menjawab benar pada semua kelompok Tingkat Kesukaran Daya Beda Kualitas Butir Baik Nomor butir Tes Objektif 4 5 3 6 7 8 9 10 Total F.Kesimpulan Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh. 5

  15. PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern Dosen Pengampu: Didik Setyawarno, M.Pd SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

  16. PRAKTIKUM 3 ANALISIS DISTRAKTOR/ KEBERFUNGSIAN PENGECOH DAN INDEK SENSITIVITAS BUTIR A.Tujuan Mahasiswa mampu untuk menganalisis distraktor atau keberfunsian pengecoh pada butir soal pilihan ganda dan indek sensitivitas butir. B.Dasar Teori 1.Distraktor atau Pengecoh Pengecoh atau distractor yang baik adalah pengecoh yang dapat mengecoh peserta didik untuk memilih jawaban pada butir soal; artinya, pengecoh tersebut dapat mengecoh peserta didik atau paling sedikit pengecoh tersebut dipilih oleh 2% atau 3% dari peserta tes. Pengecoh yang baik (efektif) ialah pengecoh yang dipilih oleh minimal 2-3% dari pengikut tes (ada beberapa referensi mengatakan minimal 5% sudah dikatakan efektif). Berikut diberikan contoh cara menghitung efektifitas pengecoh untuk 1 butir tes objektif yang memiliki 4 option a,b,c, dan d. Pilihan Kelompok atas Kelompok bawah Jumlah Jumlah (%) A* 2 6 8 40% B 6 1 7 C 0 0 0 0% D 1 4 5 *kunci 10 10 20 A 35% 25% 100% Kunci jawaban betul untuk soal di atas adalah pilihan jawaban (A). Pilihan jawaban b, c, dan d sebagai pengecoh. Pada umumnya sebuah pengecoh yang baik dapat mengundang jawaban lebih besar jumlahnya pada peserta didik kelompok lemah, dan lebih sedikit pada kelompok pandai. Pilihan jawaban b, sebagai pengecoh tidak efektif, sebab menarik jawaban lebih banyak dari kelompok peserta didik pandai. Kejadian itu disebabkan karena distractor (b) membingungkan. Pilihan jawaban c sama sekali tidak efektif, karena tidak dapat menarik jawaban seorangpun. Pilihan jawaban d dipandang telah memenuhi fungsinya, sebab dapat mengundang jawaban oleh peserta didik kelompok pandai yang lebih stedikit. 2.Indek Sensitivitas Tes Indeks sinsitivitas butir pada dasarnya merupakan ukuran seberapa baik butir soal atau perangkat tes untuk membedakan antara siswa yang telah dan yang belum mengikuti kegiatan pembelajaran. Prosedur penentuan sensitivitas pembelajaran dengan cara memberikan pre-test dan post-test kepada kelompok siswa yang sama. Rumus untuk menghitung indek sensitivitas adalah selisih dari jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses pembelajaran (posttest) dengan jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses pembelajaran (pretest). Dengan demikian sensitivtas instrumen tes merupakan rerata dari sensitivitas setiap butir soal yang ada di instrumen tes dan dapat dihitung dengan rumus sebagai berikut. ??=∑?? ? Keterangan = indek sensitivitas perangkat tes = indek sensitivitas butir soal atau item = jumlah butir soal di perangkat tes Indeks sensitivitas butir soal pilihan ganda dengan skor benar 1 dan salah 0 dapat dihitung dengan menggunakan rumus berikut. ??=??− ?? sp si n ? 1

  17. Keterangan = indek sensitivitas butir soal atau item nomor i = jumlah siswa yang mengikuti tes = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses pembelajaran (posttest) = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses pembelajaran (pretest) Indeks sensitivitas butir soal uraian dengan skor maksimal sm dapat dihitung dengan menggunakan rumus berikut. ??=?? si t rA rB ̅̅̅ − ?? ?? ̅̅̅ Keterangan = indek sensitivitas butir soal atau item nomor i = jumlah skor maksimal butir = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses pembelajaran (posttest) = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses pembelajaran (pretest) Indeks sensitivitas butir yang efektif berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir menunjukkan semakin besar keberhasilan pembelajarannya. C.Data Butir Soal 1.Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 5 nomor dan dikerjakan oleh 16 siswa. si sm xA xB NOMOR SOAL 3 C B B B C B C B A A B C B C B B SISWA 1 A B B A A B A A A A A A B A A B 2 B C A B B B B C C B B B B B C C 4 A C C C A C A D C C C A C A D C 5 C D D A C A A A A A A C A A A D 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Adapun kunci jawaban untuk butir soal di atas sebagai berikut. No Kunci 2

  18. 1 2 3 4 5 A B B C D 2.Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3. Jawaban Butir Soal Pretest 1 2 3 4 1 1 2 1 0 2 2 2 1 0 3 1 1 2 2 4 1 1 1 1 5 1 1 2 2 6 1 2 1 1 7 1 0 2 0 8 1 2 0 2 9 1 2 1 1 10 1 1 2 2 11 1 2 1 1 12 1 2 1 0 13 1 1 2 2 14 1 2 1 1 15 1 0 2 2 16 1 2 1 2 17 1 2 1 1 18 1 2 1 0 19 1 1 0 1 20 1 2 0 1 3.Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0. Jawaban Butir Soal Pretest 1 2 3 4 5 1 0 1 1 0 1 2 1 1 1 0 1 3 0 1 0 1 0 4 1 0 1 1 1 5 1 1 1 1 1 6 0 1 0 1 0 7 1 1 0 1 1 8 0 1 1 0 1 9 1 1 0 1 1 10 1 1 0 1 1 11 1 1 1 1 0 Jawaban Butir Soal Postest 2 3 2 2 2 2 1 0 2 2 2 2 2 1 0 2 2 2 2 0 2 2 0 1 2 2 2 2 1 1 2 2 2 2 1 0 2 2 2 0 2 2 Siswa Siswa 5 0 1 1 1 1 2 2 2 0 1 2 0 1 1 2 2 0 0 1 1 1 1 1 1 2 1 2 1 1 1 1 2 0 2 2 2 0 2 2 2 2 4 2 2 2 0 2 2 2 2 2 2 2 0 2 2 1 2 2 0 2 2 5 2 0 2 2 1 2 2 2 2 1 2 2 1 2 2 1 2 0 2 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Jawaban Butir Soal Posttest 2 3 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 Siswa Siswa 1 1 1 1 1 0 1 1 1 0 1 1 4 1 1 1 1 0 1 1 1 1 1 1 5 1 1 1 1 1 1 1 1 0 1 1 1 2 3 4 5 6 7 8 9 10 11 3

  19. 12 13 14 15 16 17 18 19 20 0 1 1 1 0 1 1 0 0 1 0 1 1 1 0 1 1 1 0 1 0 1 1 1 1 1 0 1 1 1 1 0 1 1 0 1 0 1 1 0 1 1 0 1 0 12 13 14 15 16 17 18 19 20 1 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 D.Prosedur Kerja dan Alat Bantu 1.Analisis Distraktor a.Koreksilah jawaban siswa dengan kunci jawaban dan berilah skor yang benar 1 dan yang salah 0. b.Buatlah tabel yang bisa membantu dalam menganalisisnya. c.Jumlahkan skor yang diperoleh oleh setiap siswa dan bagilah menjadi dua kelompok atas dan bawah. d.Hitunglah distribusi jawaban setiap siswa untuk setiap butir soal dan nyatakan dalam prosentase. e.Bandingkan hasil hitungan dari distribusi jawaban dengan acuan untuk menentukan status keberfungsian pengecoh. 2.Analisis Indek Sensitivitas Butir a.Gunakan rumus yang berlaku untuk menghitung indek sensitivitas butir dan perangkat butir dengan bantuan aplikasi excel b.Buatlah tabel yang bisa membantu dalam menganalisisnya. c.Hitunglah indek sensitivitas setiap butir dan perangkat instrument baik soal bentuk pilihan ganda maupun uraian. d.Bandingkan indeks sensitivitas butir yang telah dihitung dengan kriteria bahwa butir yang efektif berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir menunjukkan semakin besar keberhasilan pembelajarannya. E.Analisis Data dengan Aplikasi Excel 1.Analisis kelompok atas dan bawah untuk butir objektif/ PG Nomor butir Tes Objektif 1 2 3 Data diurutkan dari total skor tertinggi ke terendah (1-10 atau setengah dari jumlah peserta tes adalah kelompok atas) 11-20 atau setengah dari jumlah peserta tes berikutnya adalah kelompok bawah Responden Total 4 5 6 7 8 9 10 4

  20. Analisis keberfungsian pengecoh pada butir PG No Butir Pilihan 1 Kelompok atas Kelompok bawah Jumlah Kesimpulan 2 Kelompok atas Kelompok bawah Jumlah Kesimpulan A B* C D *kunci DAN SETERUSNYA 2.Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3. Jawaban Butir Soal Pretest 1 2 3 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 xB si sp 3.Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0. Jawaban Butir Soal Pretest 1 2 3 4 5 1 2 3 Jawaban Butir Soal Postest 2 3 Siswa Siswa 5 1 4 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 xA Jawaban Butir Soal Posttest 2 3 Siswa Siswa 1 4 5 1 2 3 5

  21. 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 rA rB rA-rB si sp F.Kesimpulan Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh. 6

  22. PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern Dosen Pengampu: Didik Setyawarno, M.Pd SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

  23. PRAKTIKUM 4 PENENTUAN INDEKS PERSETUJUAN KAPPA A.Tujuan Mahasiswa mampu untuk menghitung indeks persetujuan dan indeks Kappa dalam menganalisis instrument butir soal baik dengan dua kali pelaksanaan tes maupun dengan sekali pelaksanaan tes. B.Dasar Teori 1.Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes Indeks keandalan yang direkomendasikan untuk tes beracuan kriteria adalah (a) koefisien persetujuan (agreement coefficient), (b) koefisien kappa. Dua koefisien ini mengukur konsistensi dari klasifikasi berhasil- gagal (mastery-nonmastery) antarkedua pelaksanaan ujian atau pengadministrasian tes. Indeks tersebut memerlukan interpretasi yang berbeda dibanding koefisien keterandalan tradisional KR 20, KR 21, atau Alpha-Cronbach yang menggunakan koefisien korelasi skor butir dengan skor total. Pengklasifikasian berhasil-gagal pada kedua pelaksanaan tes dan pengadministrasian tes dapat diringkas sebagaimana pada Tabel 1. Tabel 1. Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes Pelaksanaan Tes 2 Berhasil Gagal Pelaksanaan Tes 1 Berhasil A B (A + B) Gagal C D (C + D) (A + C) (B + D) N Koefisien persetujuan adalah proporsi penempuh tes yang secara konsisten tergolongkan ke dalam kelompok yang berhasil dan yang gagal dari kedua-dua pengadministrasian pengujian tes. Koefisien persetujuan menunjuk nilai poyang dihitung dengan rumus sebagai berikut. ?? = ( ? + ?) Keterangan: A = jumlah penempuh tes kelompok yang berhasil di kedua pengadministrasi tes D = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes N = jumlah peserta tes di kedua pengadministrasian tes Batas atas dari koefisien persetujuan adalah 1,00, yang tercapai jika klasifikasi-klasifikasi di kedua-dua pengadministrasian tes bersifat konsisten untuk semua penempuh tes dimasing-masing kelompok. Batas bawah dari koefisien persetujuan dapat dihitung dengan rumus sebagai berikut. ??????? = [( ? + ?)(? + ?) + ( ? + ?)(? + ?)] Keterangan: B = jumlah penempuh tes kelompok yang berhasil di pengadministrasi tes pertama tetapi gagal di pengadministrasi tes kedua C = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes pertama tetapi berhasil di pengadministrasi tes kedua Batas bawah (pchance) merupakan proporsi klasifikasi-klasifikasi yang konsisten secara kebetulan jika hasil mastery-nonmastery pada pengadministrasian tes yang kedua dengan sepenuhnya tidak terikat pada pengadministrasin tes yang pertama dimana besarnya pchance≥ 0,50. Koefisien kappa (K) dapat dihitung dengan rumus sebagai berikut. ? ?? 1

  24. ? = ?? − ??????? ? − ??????? Koefisien kappa merupakan proporsi klasifikasi-klasifikasi yang konsisten yang sesuai dengan harapan dan yang secara kebetulan. Batas atas dan batas bawah dari koeifisen kappa adalah 1,00 dan 0,00, yang terjadi ketika hasil-hasil pada kedua pengadministrasian tes bertutur-turut di dalam persetujuan yang sempurna atau bebas secara penuh. 2.Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes Penentuan indeks persetujuan dan indeks Kappa dengan satu pengadministrasian tes dapat dilakukan dengan menggunakan tabel nilai taksiran (Approximate Values) dari koefisien persetujuan (Agreement Coefficient) dan nilai taksiran (Approximate Value) dari Koefisien Kappa (Kappa Coefficient) sebagaimana Tabel 2 dan Tabel 3 terlampir. Prosedur yang harus dilakukan dengan metode ini yaitu: a.menghitung nilai standard score atau z score (z) dari skor penggalan (cutoff score) dari tes yang dinyatakan sebagai suatu skor patokan/ kriteria b.menghitung nilai reliabilitas tradisional KR 20, KR 21, atau Alpha-Cronbach (r) Nilai hitung dari standard score atau z score (z) dan r dapat dihitung dari data yang sudah diadministrasi dalam satu kali pelaksanaan. Nilai (z) dapat dihitung dengan menggunakan persamaan berikut. |?| =? − 0,5 − ?̅ ?? Keterangan: = skor penggalan mentah dari tes = skor rata-rata yang diperoleh siswa = simpangan baku Nilai 0,5 pada persamaan diatas merupakan suatu koreksi kekontinuan yang dibangun dari fakta dalam tables nilai taksiran (Approximate Values) dari koefisien persetujuan (Agreement Coefficient) dan nilai taksiran (Approximate Value) dari Koefisien Kappa (Kappa Coefficient) yang diperoleh dengan memperkirakan skor tes mengikuti distribusi diskret untuk diubah menjadi distribusi normal yang kontinum. Distribusi z hasil perhitungan berbentuk distribusi normal dan menggunakan tanda mutlak, sehingga besarnya koefisien persetujuan atau koefisien kappa selalu bernilai positif. Jadi, dengan memberikan tanda mutlak untuk z dapat menggunakan Tabel 3 dan 4. dalam Tabel 2 dan 3, dapat diperoleh dengan menggunakan indeks reliabilitas tradisional seperti koefisien keandalan Kuder- Richardson (K-R) atau alfa-Cronbach. Tabel 2. Nilai Taksiran dari Koefisien Persetujuan Reliabilitas Tradisional (r) .10 .20 . 3 0 .40 .50 .00 .53 .56 .60 .63 .67 .10 .53 .57 .60 .63 .67 .20 .54 .57 .61 .64 .67 .30 .56 .59 .62 .65 .68 .40 .58 .60 .63 .66 .69 .50 .60 .62 .65 .68 .71 .60 .62 .65 .67 .70 .73 .70 65 .67 .70 .72 .75 .80 .68 .70 .72 .74 .77 .90 . 7 I .73 .75 .77 .79 1.00 .75 .76 .77 .77 .81 c ?̅ ?? Keandalan skor tes r, yang muncul di IzI .60 .70 .71 .71 .72 .73 .74 .76 .77 .79 .81 .83 .70 .75 .75 .75 .76 . 8 0 .86 .77 .81 . 8 7 .78 .82 .79 .83 .80 .84 .82 .85 .84 .87 .85 .80 80 .80 .80 . 8 6 .80 .90 .86 .86 .87 .88 .89 .90 .90 .91 2

  25. 1.10 1.20 1.30 .78 .80 .83 .79 .80 .81 .62 .84 .81 .84 .86 .83 .85 .67 .85 .86 .88 .87 .88 .90 .89 .90 .91 .92 93 .94 85 1.40 1.50 1.60 1.70 1.80 1.90 2.00 .86 .88 . 8 8 .89 .90 .90 .90 .92 .92 .92 .93 .93 .94 .95 .95 .95 .96 .96 .96 .86 .87 .88 .90 .91 .93 .94 .95 .96 .89 .90 .92 .93 .94 .95 .96 .90 .91 .93 .94 .95 .96 .97 .91 .97 .93 95 .95 .96 .97 .93 .94 .95 .95 .96 .97 .97 .95 .95 .96 .97 .97 .98 .98 Tabel 3. Nilai Taksiran dari Koefisien Kappa Reliabilitas Tradisional (r) .10 .20 .30 .40 .06 .13 .19 .26 .06 .13 .19 .26 .06 .13 .19 .26 .06 .12 .19 .26 .06 .12 .19 .25 .06 .12 . 1 8 .25 .06 .12 .18 .24 .05 .11 .17 .24 .05 .11 .17 .23 .05 .10 .16 .22 1.00 .05 .10 .15 .21 1.10 .04 .09 .14 .20 1.20 .04 .08 .14 .19 1.10 .04 .08 .13 .18 1.40 .03 .07 .12 .17 1.50 .03 .07 .11 .16 1.60 .03 .06 .10 .15 1.70 .02 .05 .09 .14 1.90 .02 .05 .08 .13 1.90 .02 .04 .08 .12 2.00 .02 .04 .07 .11 |z| .50 .33 .33 .33 .33 .32 .32 .31 .31 .30 .29 .28 .27 .26 .25 .23 .22 .21 .20 .16 .17 .16 .60 .41 .41 41 .40 .40 .40 .39 .38 .37 .36 .35 .34 .33 .32 .31 .29 .28 .27 .25 .24 .22 .70 .49 .49 .49 .49 .48 .48 .47 .47 .46 .45 .44 .43 .42 .41 .39 .30 .37 .35 .34 .32 .31 .8O .59 .59 .59 .59 .58 .58 .57 .57 .56 .55 .54 .53 .52 .51 .50 .49 .47 .46 .45 .43 .42 .58 .90 .71 .71 .71 .71 .71 .70 .70 .70 .69 .68 .68 .67 .66 .65 .64 .63 .62 .61 .60 .59 .00 .10 .20 .30 .40 .50 .60 .70 .60 .90 3.Interpretasi koefisien persetujuan (agreement coefficient) dan koefisien kappa Suatu tes dikatakan memiliki keandalan yang baik adalah jika memiliki koefisien persetujuan po≥ 0,86 meskipun demikian juga bergantung pada penempatan skor penggalan sebagai skor patokan dan skor rata-rata yang diperoleh dari tes yang bersangkutan. Nilai po = 0,86 berpasangan dengan situasi di mana harga |z| = 0,00, yang menyiratkan bahwa separuh dari penempuh ujian adalah menguasai dan separuh lainnya tidak menguasai. Interpretasi koefisien kappa sebagaimana Tabel 4. 3

  26. Tabel 4. Interpretasi Koefisien Kappa Indeks Kappa <0,20 Rendah/Poor 0,21 – 0,40 Lumayan/ Fair 0,41 – 0,60 Cukup/ Moderate 0,61 – 0,80 Kuat/ Good >0,80 Sangat Kuat/ Very good Agreement Selain itu, suatu tes yang diterapkan dalam suatu kelas pada periode yang penuh (misalnya 1 semester) dapat menggunakan nilai koefisien kappa sebesar 0,35 sampai 0,50 atau lebih dari itu. C.Data Butir Soal 1.Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes Jawaban Butir Soal Pengujian 1 1 2 3 4 5 1 0 1 1 0 1 2 1 1 1 0 1 3 0 1 0 1 0 4 1 0 1 1 1 5 1 1 1 1 1 6 0 1 0 1 0 7 1 1 0 1 1 8 0 1 1 0 1 9 1 1 0 1 1 10 1 1 0 1 1 Keterangan: 0 = gagal, dan 1=berhasil. 2.Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes Gunakan data praktikum 1 tentang penentuan validitas dan reliabilitas untuk data dikotomi. Skor penggalan mentah dari tes tersebut adalah 7 di mana semua butir telah dinyatakan valid (taraf signifikansi 5%). D.Prosedur Kerja dan Alat Bantu 1.Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes a.Kelompokkan kategori jawaban siswa berhasil dan gagal b.Hitung nilai koefisien persetujuan po dan batas bawah dari koefisien persetujuan pchance c.Hitung nilai koefisien kappa (K) d.Interpretasikan hasil hitungan Anda dengan acuan yang ada diteori 2.Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes a.Hitung nilai z-score dengan menggunakan rumus yang berlaku dimana skor penggalan mentah dari tes tersebut adalah 7. b.Gunakan Tabel 2 dan 3. c.Interpretasikan hasil hitungan Anda dari tabel tersebut dengan acuan yang ada diteori untuk menghitung koefisien persetujuan po dan koefisien kappa (K) Jawaban Butir Soal Pengujian 2 1 2 3 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 0 1 0 1 1 1 Siswa Siswa 4 1 1 1 1 0 1 1 1 1 1 5 1 1 1 1 1 1 1 1 0 1 1 2 3 4 5 6 7 8 9 10 4

  27. E.Analisis Data dengan Aplikasi Excel 1.Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes Siswa Butir Pengujian 1 1 1 2 3 Dst 10 1 2 2 3 Dst 10 Dst 1 5 2 3 Dst 10 Hasil Akhir A = B = C = D = Pengujian 2 1 1 Kategori C A 0 1 ?? = ( ? + ?) ? ??????? = [( ? + ?)(? + ?) + ( ? + ?)(? + ?)] ? = ?? − ??????? ? − ??????? ?? 2.Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes |?| =? − 0,5 − ?̅ ?? F.Kesimpulan Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh. 5

  28. PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern Dosen Pengampu: Didik Setyawarno, M.Pd SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

  29. PRAKTIKUM 5 ANALISIS BUTIR DENGAN MENGGUNAKAN SPSS (PENDEKATAN KLASIK) A.Tujuan Mahasiswa mampu menganalisis butir soal (data dikotomi) dan angket (data politomi) serta menghiung koefisien Kappa dengan menggunakan aplikasi SPSS untuk menentukan kualitas butir soal dan angket. B.Aplikasi SPSS untuk Analisis Butir Aplikasi statistika terapan dalam bidang evaluasi pembelajaran maupun penelitian yang dapat digunakan sangatlah banyak, misalnya: SPSS, Iteman, AnBuso, Quest, dll. Aplikasi tersebut sangat familiar dikalangan pendidik yang dapat digunakan untuk menganalisis butir soal, sehingga mengetahui kualitas butir soal tersebut dan mampu meningkatkan mutu soal yang telah ditulis. Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan. Aspek yang di analisis dalam butir soal meliputi: tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif) atau frekuensi jawaban pada setiap pilihan jawaban. SPSS adalah aplikasi untuk melakukan analisis statistik. SPSS adalah singkatan dari Statistical Package for the Social Sciences. SPSS software pertama kali dibuat dan dimiliki oleh perusahaan SPSS Inc. Namun dalam perjalanannya pada tahun 2009 hingga sekarang, SPSS telah diakuisisi oleh perusahaan IBM. Maka versi terbaru dari SPSS, sejak SPSS versi 20, namanya telah berubah menjadi IBM SPSS. Dalam hal ini pada tahun 2017, versi terbaru dari SPSS adalah IBM SPSS versi 25. Kegunaan SPSS dalam penelitian adalah untuk olah dan analisis statistik. Banyak sekali analisis yang dapat dikerjakan dengan aplikasi tersebut, antara lain: Uji deskriptive, Regresi Linear, Regresi Logistik, Analisis Faktor, Uji Normalitas, Uji F dan Uji T, Independent T Test, ANOVA, MANOVA, ANCOVA, Uji Non Parametris yang banyak sekali macamnya seperti Mann Whitney U Test, wilcoxon signed rank test, spearman, kendall tau, dll. Bahkan dapat juga digunakan untuk pembuatan grafik, seperti Histogram, Normal PP, Detrend PP, Boxplot, dll. Untuk uji instrumen atau uji validitas dan uji reliabilitas, SPSS juga dapat melakukannya dengan fitur yang lengkap. SPSS mempunyai user interface atau antar muka yang sangat user friendly alias mudah dipahami pengguna, mudah digunakan dan hasilnya atau output SPSS sangatlah menarik dengan tampilan yang luar biasa apabila dibandingkan dengan aplikasi statistik lainnya. Kelebihan SPSS yang lainnya adalah database. Dimana SPSS memiliki sistem database tersendiri dan dapat dijalankan atau dihubungkan dengan aplikasi lainnya, semisal aplikasi excel. Hal ini sangat dimungkinkan bagi para pengguna, sebab database SPSS termasuk dalam golongan ODBC, sehingga dapat dijalankan perintahnya atau dihubungkan dengan berbagai macam aplikasi yang berbasil SQL. C.Data Butir Soal Analisislah butir soal pilihan ganda dan angket sebagaimana terlampir. D.Prosedur Analisis dengan SPSS 1.Uji Instrumen Angket (Data Politomi) Validitas suatu butir pertanyaan dapat dilihat pada hasil output SPSS pada tabel dengan judul Item- Total Statistic. Kevalidan masing-masing butir pertanyaan dapat dinilai dari Correlated Item-Total Correlation masing-masing butir pertanyaan. Suatu variabel dikatakan valid apabila nilai r-hitung yang merupakan nilai dari Correlated Item-total Correlation > dari r-tabel. Nilai r-tabel dapat diperoleh melalui df (degree of freedom) = n – k, dimana n merupakan jumlah responden, dan k merupakan jumlah butir pertanyaan dalam suatu variabel. Alpha yang dipergunakan dalam penelitian adalah 5%. Perhatikan hasil rekap data kuisioner berikut.

  30. Tabel Hasil Rekap Data Kuisioner Motivasi Belajar 3 4 3 4 4 3 4 4 4 3 4 4 3 4 4 3 3 4 3 3 4 3 4 4 4 4 4 4 3 4 4 Responden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1 4 3 4 4 3 3 4 5 3 4 4 3 4 4 3 3 4 3 3 4 4 4 3 4 4 4 4 2 4 4 2 4 3 4 4 3 3 4 4 4 4 4 3 4 4 3 3 4 3 3 3 3 4 3 3 4 4 4 2 4 4 4 4 3 4 3 3 3 4 4 3 4 4 3 3 4 4 3 4 3 3 3 3 4 4 4 4 4 4 2 4 3 5 4 3 4 4 3 3 4 4 4 4 4 3 4 4 3 3 4 3 3 3 3 4 3 3 4 4 4 2 2 3 6 1 3 1 1 3 2 1 2 1 1 1 3 4 1 1 1 3 3 2 1 1 1 3 3 2 2 2 3 2 1 Penyelesaian a.Buka aplikasi SPPS dan pilih variable view di bagian bawah kiri. Ketik A1 sampai dengan A6 pada kolom name untuk pertanyaan kuisioner aspek motivasi belajar. Isikan pada kolom label yaitu pertanyaan 1 sampai dengan pertanyaan 6. b.Klik Data View dan masukkan data hasil kuisioner A1 sampai A6.

  31. c.Klik menu Analyze, pilih Scale →Reliability Análisis. d.Pindahkan seluruh Pertanyaan, mulai A1 sampai A6 ke kotak item melalui tombol tanda panah diantaranya. e.Klik tombol statistic, kemudian klik item, scale, dan scale if item deleted.

  32. f.Selanjutnya klik continue dan Ok. Hasil analisis dengan SPSS akan dihasilkan untuk validitas dapat di lihat di tabel item-total statistics sebagai berikut. Item-Total Statistics Corrected Item- Cronbach's Alpha if Item Deleted Scale Mean if Item Deleted Scale Variance if Item Deleted Total Correlation pertanyaan 1 pertanyaan 2 pertanyaan 3 pertanyaan 4 pertanyaan 5 pertanyaan 6 16.00 16.10 15.97 16.13 16.20 17.77 3.310 3.403 3.689 3.568 3.476 5.909 .678 .700 .699 .606 .573 -.347 .437 .440 .470 .478 .480 .900 g.Menentukan nilai r-tabel dengan melihat nilai df (degree of freedom) = n – k, dimana k adalah jumlah butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka df = 30-6 = 24. Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan alpha 5%, diperoleh r table sebesar 0,404. h.Membandingkan nilai r hitung dengan r tabel sebagai berikut. 1) r hitungA1 sebesar 0,678 > r table0,404, kesimpulan valid. 2) r hitungA2 sebesar 0,700 > r table0,404, kesimpulan valid. 3) r hitungA3 sebesar 0,699 > r table0,404, kesimpulan valid. 4) r hitungA4 sebesar 0,606 > r table0,404, kesimpulan valid. 5) r hitungA5 sebesar 0,573 > r table0,404, kesimpulan valid. 6) r hitungA6 sebesar -0,347 < r table 0,404, kesimpulan tidak valid. i.Menghapus pertanyaan yang tidak valid (nomor 6) dari variable view di SPSS (klik kanan pilih clear). j.Melakukan uji validitas kembali untuk pertanyaan yang valid, seperti langkah langkah diatas. Hasil uji validitas untuk Item Total Statistics sebagai berikut. Item-Total Statistics Corrected Item- Total Correlation Cronbach's Alpha if Item Deleted Scale Mean if Item Deleted Scale Variance if Item Deleted pertanyaan 1 pertanyaan 2 pertanyaan 3 14.13 14.23 14.10 3.637 3.702 4.231 .808 .855 .734 .866 .855 .885

  33. pertanyaan 4 pertanyaan 5 14.27 14.33 3.995 3.816 .693 .695 .891 .892 k.Menentukan nilai r-tabel dari pertanyaan yang valid melalui df (degree of freedom) = n – k, dimana k merupakan jumlah butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka df = 30-5 = 25. Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan alpha 5%, diperoleh r table sebesar 0,396. l.Membandingkan nilai r hitungdengan r tabel dari tabel hasil analisis terakhir sebagai berikut. 1) r hitungA2 sebesar 0,808 > r table0,396, kesimpulan valid. 2) r hitungA5 sebesar 0,855 > r table0,396, kesimpulan valid. 3) r hitungA6 sebesar 0,734 > r table0,396, kesimpulan valid. 4) r hitungA7 sebesar 0,693 > r table0,396, kesimpulan valid. 5) r hitungA8 sebesar 0,695 > r table0,396, kesimpulan valid. m.Menyimpulkan bahwa tujuh indikator pertanyaan variabel A yaitu motivasi dalam riset pembelajaran IPA di SMP kelas 7 memiliki r hitungyang lebih besar dari nilai r tabletelah valid. Langkah uji reliability sama dengan langkah uji validitas. Poin yang berbeda adalah output SPSS yang menjadi dasar penilaian validitas dengan output SPSS yang menjadi dasar penilaian Reliabilitas. Uji validitas dilakukan dengan memperhatikan output Item total statistik, sedangkan uji reliabilitas dengan memperhatikan output Reliability Statistics pada kolom Cronbach’s Alpha. Reliabilitas suatu konstruk variabel dikatakan baik jika memiliki nilai Cronbach’s Alpha > dari 0,60. Dengan menggunakan data pada contoh di atas maka prosedur analisis reliabilitas instrumen sebagai berikut. Penyelesaian a.Buka aplikasi SPSS dan masukkan data variabel A yang sudah valid, seperti terdapat pada contoh di atas. b.Klik menu analyze pilih scale, kemudian klik realiability analysis. c.Memindahkan seluruh pertanyaan ke kolom item dengan menggunakan tombol tanda panah yang berada diantaranya.

  34. d.Klik tombol statisitik, kemudian aktifkan item, scale, dan scale if item deleted. e.Klik continue dan OK. Hasil output SPSS dapat dilihat di tabel realibility statistics sebagai berikut. Reliability Statistics Cronbach's Alpha N of Items .900 5 Pengukuran yang reliabel akan menunjukkan instrumen yang dapat menghasilkan data yang dipercaya. Reliabilitas suatu konstruk variabel dikatakan baik jika memiliki nilai Cronbach’s Alpha > dari 0,60. Maka berdasarkan hasil ini dapat dilihat bahwa Cronbach’s Alpha 0.900 > dari 0,60. Hal ini berarti instrumen sudah dapat dikatakan reliabel. 2.Data Dikotomi Analisis butir soal tes berbentuk pilihan ganda (dengan benar skor 1 dan salah 0) merupakan cara untuk mengetahui kualitas soal yang diujikan secara statistik. Analisis butir soal tes memiliki empat kriteria, yaitu: a.Validitas b.Reliabilitas c.Tingkat Kesukaran d.Daya Pembeda Untuk mempermudah dalam analisis ini dapat dilakukan dengan menggunakan salah satu aplikasi komputer SPSS for Windows. Berikut cara analisis menggunakan aplikasi SPSS tersebut. a.Membuka aplikasi SPSS, klik Variable View dan isikan variable semua butir soal yang akan dianalisis.

  35. b.Klik Data View, isikan hasil koreksian ke SPSS (Misal jawaban benar = 1, dan jawaban salah = 0, jumlah = jumlah jawaban benar). c.Uji Validitas: 1)Pilih menu Analyze --> Correlate --> Bivariate 2)Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, soal_8, dan jumlah ke Kotak “Variables”.

  36. 3)Klik Pearson, Two-tailed, dan Flag significant correlation 4)Klik OK

  37. Berikut hasil analisis validitas butir soal pilihan ganda. Correlations soal_3 .102 .779 10 .000 1.000 10 1 soal_1 soal_2 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah soal_1 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 .000 1.000 10 .250 .486 10 .500 .141 10 .408 .242 10 .408 .242 10 .000 1.000 10 .667* .035 10 .612 .060 10 .327 .356 10 .218 .545 10 .535 .111 10 .764* .010 10 .802** .005 10 .500 .141 10 -.200 .580 10 .816** .004 10 .500 .141 10 .816** .004 10 .655* .040 10 -.408 .242 10 .408 .242 10 -.250 .486 10 -.102 .779 10 -.167 .645 10 -.356 .312 10 -.408 .242 10 .430 .215 10 .407 .243 10 .702* .024 10 .814** .004 10 .868** .001 10 .819** .004 10 .769** .009 10 -.037 .919 10 10 soal_2 .000 1.000 10 .102 .779 10 .250 .486 10 .408 .242 10 .327 .356 10 .500 .141 10 -.408 .242 10 .430 .215 10 1 10 soal_3 .000 1.000 10 .500 .141 10 .000 1.000 10 .218 .545 10 -.200 .580 10 .408 .242 10 .407 .243 10 10 soal_4 .408 .242 10 .667* .035 10 .535 .111 10 .816** .004 10 -.250 .486 10 .702* .024 10 1 10 soal_5 .612 .060 10 .764* .010 10 .500 .141 10 -.102 .779 10 .814** .004 10 1 10 soal_6 .802** .005 10 .816** .004 10 -.167 .645 10 .868** .001 10 1 10 soal_7 .655* .040 10 -.356 .312 10 .819** .004 10 1 10 soal_8 -.408 .242 10 .769** .009 10 1 10 jumlah -.037 .919 10 1 10 *. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed). Analisis: Hasil pada kolom "Jumlah" jika nilai sig. (2-tailed) < ½ 0,05 atau sig. (2-tailed) < 0,025 menyatakan butir soal tersebut Valid. Contoh untuk soal nomor 1, nilai sig = 0,215, dimana nilai tersebut > 0,025, maka soal nomor 1 dinyatakan tidak valid. Soal nomor 5, nilai sig. (2-tailed) = 0,001, dimana nilai tersebut <0,05, maka soal nomor 5 dinyatakan valid.

  38. d.Uji Reliabilitas: 1)Pilih menu Analyze --> Scale --> Reliability Analysis. 2)Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak “Items” 3)Pada kolom Model pilih Alpha, klik Statistics, pilih Item, dan klik Continue. 4)Klik OK. Hasil analisis uji reliabilitas dapat dilihat di tabel Reliability Statistic sebagai berikut. Reliability Statistics Cronbach's Alpha N of Items .734 8 Analisis: Berdasarkan nilai Cronbach's Alpha pada tabel Reliability Statistics diperoleh nilai 0,734 dimana nilai ini ditafsirkan dengan kriteria 0,800 - 1,000 = Sangat tinggi 0,600 - 0,799 = Tinggi 0,400 - 0,500 = Cukup 0,200 - 0,399 = Rendah

  39. > 0,200 = Sangat rendah Hasil analisis dapat disimpulkan tes ini memiliki tingkat reliabilitas tinggi. e.Uji Tingkat Kesukaran 1)Pilih menu Analyze --> Descriptive Statistics --> Frequencies. 2)Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak “Variable(s)” 3)Klik Statistics, Klik Mean, dan Klik Continue 4)Klik OK

  40. Hasil analisis tingkat kesukaran sebagai berikut. Statistics soal_4 soal_1 soal_2 soal_3 soal_5 soal_6 soal_7 soal_8 N Valid Missing 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 Mean .8000 .5000 .6000 .2000 .4000 .3000 .5000 .6000 Analisis : dari hasil yang ditunjukkan nilai MEAN pada tabel statistcs ditafsirkan pada rentang tingkat kesukaran, yaitu 0.00 – 0.20 => Sangat Sukar 0.21 – 0.40 => Sukar 0.41 – 0.60 => Sedang 0.61 – 0.80 => Mudah 0.81 – 1.00 => Sangat Mudah Misal soal nomor satu, diperoleh nilai Mean = 0,8000 yang berarti tingkat kesukaran soal nomor satu adalah mudah. Soal nomor empat, diperoleh nilai Mean = 0,2000 yang berarti tingkat kesukaran soal nomor satu adalah sangat sukar. f.Uji Daya Pembeda Untuk menentukan daya pembeda, maka nilai perhitungan yang digunakan adalah rhitung pada SPSS yang dibandingkan dengan kriteria : 0.40 – 1.00 = Soal baik 0.30 – 0.39 = Soal diterima dan diperbaiki 0.20 – 0.29 = Soal diperbaiki 0.00 – 0.19 = Soal ditolak R hitung dapat dilihat dari nilai Pearson Correlation pada uji validitas yang telah dilakukan sebelumnya. Berikut tabel hasil analisis validitas butir soal untuk mengetahui daya beda butir soal pilihan ganda. Correlations soal_1 soal_2 soal_3 soal_4 soal_1 Pearson Correlation 1 .000 .102 Sig. (2-tailed) 1.000 .779 N 10 10 10 soal_2 Pearson Correlation .000 1 .000 Sig. (2-tailed) 1.000 1.000 N 10 10 10 soal_3 Pearson Correlation .102 .000 1 Sig. (2-tailed) .779 1.000 N 10 10 10 soal_4 Pearson Correlation .250 .500 .408 Sig. (2-tailed) .486 .141 .242 N 10 10 10 soal_5 Pearson Correlation .408 .000 .667* Sig. (2-tailed) .242 1.000 .035 N 10 10 10 soal_6 Pearson Correlation .327 .218 .535 Sig. (2-tailed) .356 .545 .111 N 10 10 10 soal_7 Pearson Correlation .500 -.200 .816** Sig. (2-tailed) .141 .580 .004 N 10 10 10 soal_8 Pearson Correlation -.408 .408 -.250 Sig. (2-tailed) .242 .242 .486 N 10 10 10 jumlah Pearson Correlation .430 .407 .702* .814** soal_5 .408 .242 soal_6 .327 .356 soal_7 .500 .141 soal_8 -.408 .242 jumlah .430 .215 .250 .486 10 .500 .141 10 .408 .242 10 10 10 10 10 10 .000 1.000 10 .667* .035 10 .612 .060 10 .218 .545 10 .535 .111 10 .764* .010 10 .802** .005 10 -.200 .580 10 .816** .004 10 .500 .141 10 .816** .004 10 .655* .040 10 .408 .242 10 -.250 .486 10 -.102 .779 10 -.167 .645 10 -.356 .312 10 -.408 .242 10 .407 .243 10 .702* .024 10 .814** .004 10 .868** .001 10 .819** .004 10 .769** .009 10 -.037 .919 10 1 10 .612 .060 10 .764* .010 10 .500 .141 10 -.102 .779 10 1 10 .802** .005 10 .816** .004 10 -.167 .645 10 .868** 1 10 .655* .040 10 -.356 .312 10 .819** 1 10 -.408 .242 10 .769** 1 10 -.037 1

  41. Sig. (2-tailed) N .215 10 .243 10 .024 10 .004 10 .001 10 .004 10 .009 10 .919 10 10 *. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed). Analisis: Hasil yang diperoleh untuk soal nomor satu pada kolom jumlah adalah 0,430 yang berarti soal baik. 3.Koefisien Kappa Koefisien Kappa merupakan ukuran yang menyatakan konsistensi pengukuran yang dilakukan dua orang penilai (Rater) atau konsistensi antar dua metode pengukuran atau dapat juga mengukur konsistensi antar dua alat pengukuran. Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes Pelaksanaan Tes 2 Benar Salah Pelaksanaan Tes 1 Benar A B (A + B) Salah C D (C + D) (A + C) (B + D) N Langkah – langkah untuk mendapatkan koefisien Kappa dengan SPSS adalah sebagai berikut: a.Definisikan data pada Variabel View. Disini akan dibuat tiga variabel, yaitu Tes 1 dan Tes 2. Skala data untuk variabel Tes 1 dan Tes 2 adalah Scale. Berikan kode pada kolom Values. Untuk variabel Tes 1 yang terdiri dari dua kategori Benar = 2, Salah = 1 Untuk variabel Tes 2 yang terdiri dari dua kategori Benar = 2, Salah = 1 Kategori ditetukan berdasarkan instrument yang digunakan oleh peneliti, memungkinkan terdiri dari tiga atau lebih kategori. Misal: Sangat Baik = 4, Baik = 3, Cukup = 2, Kurang = 1 b.Memasukan data kedalam SPSS

  42. c.Pilih Anlyze, Descriptive Statistics, lalu klik Crosstabs Kotak dialog Crosstabs, pindahkan Tes1 ke Row(s) dan Tes 2 ke Colum(s) Klik Statistics, pada kotak dialog Crosstabs:Statistics yang muncul centang Kappa d.Klik Cells, pada kotak dialog Crosstabs:Statistics yang muncul centang Total di bawah Percentages  tekan Continue e.Klik Continue, lalu Ok Output yang muncul sebagai berikut. Tes_1 * Tes_2 Crosstabulation Tes_2 Salah Benar Total Tes_1 Salah Count % of Total Count % of Total Count % of Total 20 10 30 40.0% 20.0% 60.0% Benar 5 15 20 10.0% 30.0% 40.0% Total 25 25 50 50.0% 50.0% 100.0%

  43. Symmetric Measures Asymptotic Standard Errora Approximate Significance Approximate Tb Value Measure of Agreement N of Valid Cases a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Dari output diatas diperoleh nilai koefisein cohen’s kappa sebesar 0,400. Ini berarti terdapat kesepakatan yang lumayan/ fair Antara pelaksanaan Tes 1 dengan Tes 2 terhadap peserta. Nilai signfikansinya dapat dilihat pada kolom Approx. Sig dengan nilai signifikansi sebesar 0,004. Karena nilai signifikansi kurang dari taraf signifikansi yang digunakan 5 % (0,004<0,05), maka hipotesis awal dditerima sehingga dapat disimpulkan terdapat kesepakatan yang signfikan antar pelaksanaan Tes 1 dan Tes 2 pada taraf signfikansi 5 %. E.Kesimpulan Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan berdasarkan hasil analisis tersebut. Kappa .400 50 .127 2.887 .004

  44. PANDUAN PRAKTIKUM TEORI RESPON BUTIR Analisis Butir dengan Pendekatan Klasik dan Modern Dosen Pengampu: Didik Setyawarno, M.Pd SEPTEMBER-DESEMBER, 2018 JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281

  45. PRAKTIKUM 6 ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ITEMAN 4.3 A.Tujuan Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi Iteman 4.3 untuk menentukan kualitas butir soal B.Iteman 4.3 ITEMAN (Item and Test Analysis) adalah perangkat lunak komputer (software) yang dibuat khusus untuk menganalisa butir soal atau suatu tes yang dilakukan. ITEMAN merupakan analisis butir empirik dengan model pendekatan klasik yang berguna untuk menentukan kualitas butir soal atau sebuah tes. Hasil dari analisi butir soal meliputi tingkat kesukaran, daya beda, dan statistik penyebaran jawaban. Selain menghasilkan statistik butir soal/tes, program ini juga menghasilkan statistik tes yang meliputi realibilitas tes, kesalahan pengukuran atau standard error dan distribusi skor. Beberapa istilah penting yang ada dihasil analisis dengan Iteman (Iteman 3) sebagai berikut. a.Seq. No adalah nomor urut butir soal dalam file data. b.Scala-item adalah nomor urut butir soal dalam skala (tes/subtes) c.Prop. Correct adalah proporsi siswa( peserta tes) yang menjawab benar butir soal. Nilai ekstrim (mendekati nol atau satu) menunjukan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk peserta tes. Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal. d.Biser adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi biserial. Nilai positif menunjukan bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi dalam tes/skala tersebut. Sebaliknya nilai negatif menunjukan bahwa peserta tes yang menjawab benar butir soal, memperoleh skor yang relatif rendah dalam tes/skala tersebut. Untuk statistik pilihan jawaban (alternative) korelasi biserial negatif sangat tidak dikehendaki untuk kunci jawaban dan sangat dikehendaki untuk pilihan jawaban yang lain (pengecoh). e.Point-biser adalah juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan menggunakan koefisien korelasi point-biserial. Penafsirannya sama dengan statistik biserial. f.Statistik pilihan jawaban (alternative) memberikan informasi yang sama dengan statistik butir soal. Perbedaannya adalah bahwa statistik pilihan jawaban dihitung secara terpisah. Untuk setiap piihan jawaban dan didasarkan pada dipilih tidaknya alternatif tersebut, bukan pada benarnya jawaban. Tanda (*) yang muncul di sebelah kanan hasil analisis menunjukan kunci jawaban. Istilah yang perlu dipahami untuk membaca hasil analisis sebagai berikut. 1.N of items adalah jumlah butir soal dalam tes. 2.N of examines adalah jumlah peserta tes yang digunakan dalam analisis. 3.Mean adalah skor rata-rata peserta tes. 4.Variance adalah varian dari distribusi skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes. 5.Std. Dev adalah deviasi standar dari distribusi skor peserta tes. 6.Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk distribusi skor peserta tes. 7.Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi normal. 8.Minimun adalah skor terendah peserta tes dalam tes/skala tersebut. 9.Maximum adalah skor tertinggi peserta tes dalam tes/skala tersebut. 10.Median adalah skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut. 11.Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas tes/skala. Koefisien alpha bergerak dari 0,0 sampai 1,0. 12.SEM adalah kesalahan pengukuran standar untuk setiap tes/skala. SEM merupakan estimit dari deviasi standar kesalahan pengukuran dalam skor tes.

  46. 13.Mean P adalah rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam tes/skala. 14.Mean item-Tot nilai rata-rata indeks daya pembeda dari semua soal dalam tes/skala yang diperoleh dengan menghitung nilai rata-rata point biserial dari semua soal dalam tes/skala. 15.Mean-Biserial adalah juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung nilai rata-rata korelasi biserial dari semua butir soal dalam tes/skala. 16.Scale intercorrelation adalah indeks korelasi antara skor-skor peserta tes yang diperoleh dari setiap subtes/subskala. C.Data Butir Soal Analisislah butir soal pilihan ganda sebagaimana terlampir. D.Prosedur Analisis dengan Iteman 4.3 1.Memasukan Butir Soal Pada Ms. Excel Gambar 6.1 Entry Butir Soal Silahkan Entry hasil jawaban soal pilihan ganda siswa, pada microsoft excel. Model entry dibuat seperti pada tampilan gambar 6.1 a.Memasukan Hasil Butir Soal dari Ms. Excel menuju Notepad Gambar 6.2 Cara Copy Butir Soal Pada Ms.Excel Langkah 1 Block area seperti pada gambar 6.2, kemudian klik kanan pada mouse, pilih menu “copy” b.Buka aplikasi “notepad” di File Program anda, tampilan notepad seperti pada gambar 6.3 berikut, Gambar 6.3 Aplikasi Notepad

  47. c.Setelah aplikasi “Notepad” aktif. Klik cursor mouse pada area “Notepad”, selanjutnya klik kanan mouse dan pilih menu “paste”.Sehingga entry data yang sudah di inputkan pada Ms.Excel muncul pada lembar kerja “Notepad” . Tampilan “notepad” setelah di “paste” seperti pada gambar 6.4 berikut. Gambar 6.4 Copy Paste dari Excel di Notepad d.Mengatur “spasi” butir soal yang di entry di lembar kerja “Notepad” dilakukan dengan cara melakukan “block” pada “spasi” butir soal seperti pada gambar 6.5. Gambar 6.5 Memblock spasi pada Notepad e.Selanjutnya arahkan cursor mouse pada area yang di “block”. Kemudian “klik” kanan mouse, dan pilih “copy” Selanjutnya pada tool bar, terdapat menu “edit”, kemudian “klik” sehingga muncul pilihan menu “Replace”. Pilihlah menu “Replace” tsb, sehingga muncul tampilan seperti pada gambar 6.6. Gambar 6.6 Membuka menu replace Pada menu “Replace” terdapat 2 kolom yang beridentitas “find what” dan ”Replacewith” . selanjutnya, letak kan cursor mouse pada kolom “findwhat”. Kemudian “klik” kanan mouse dan pilih menu “paste” atau pakai “Ctrl+V”. tampilannya seperti pada gambar 6.7 berikut.

  48. Gambar 6.7 Mengganti Ukuran Spasi Pada Notepad f.Jika sudah di “paste”, selanjutnya pilih dan klik menu “ReplaceAll”, sehingga spasi pada notepad akan berubah menjadi lebih rapat seperti pada gambar 6.8. Untuk menghilangkan menu “Replace” pilihlah menu “Cancel” atau tanda silang (X) Selanjutnya akan tampil seperti pada gambar 6.9. Gambar 6.8 dan 6.9 Mengganti Ukuran Spasi dan Meluruskan Butir Soal g.Selanjutnya meluruskan butir soal dalam satu kolom Gambar 6.10 Meluruskan Butir Soal h.Jika hasil entry sudah lurus dan rapi, maka simpan file anda dengan cara pilih dan klik menu “file” dan pilih “SaveAs”. Beri nama lembar kerja notepad tsb (contoh: Butir Jawaban). Kemudian klik “Save” dengan format “txt”.

  49. 2.Memasukan Kunci Jawaban Butir Soal dari Ms. Excel menuju Notepad Formula identitas kunci jawaban software iteman 4.3 Item01 Keterangan: Item01 = Nomor Butir Soal A = Kunci Jawaban 5 = Alternatif opsi jawaban (A, B, C, D, E) 1 = Domain Y = Ketentuan Perintah analisis masing-masing butir (Y= Yes; N=No) M = Jenis analisis (M=multiple choice, R= Rating Scale, P= Partial Scale) A 5 1 Y M Gambar 6.11. Formula Kunci Jawaban di Excel a.Pada gambar 6.11 merupakan tampilan formula kunci jawaban pada Ms.Excel. Kemudian “block” formula jawaban tersebut seperti pada gambar 6.12, selanjutnya “klik” kanan mouse, pilih “copy” atau “Ctrl+C” Gambar 6.12. Formula Kunci Jawaban di Excel yang di Copy b.Setelah formula kunci sukses di copy, maka silahkan buka sofware “notepad”, kemudian letakkan cursor pada area/lembar kerja notepad. Selanjutnya Kemudian “klik” kanan mouse dan pilih menu “paste” atau pakai “Ctrl+V”. Tampilan lembar kerja notepad akan seperti gambar 6.13

  50. Gambar 6.13 Hasil entry Formula kunci jawaban pada notepad c.Jika langkah memasukan formula kunci jawaban di software notepad telah selesai. Maka langkah selanjutnya simpan file anda dengan cara pilih dan klik menu “file” dan pilih “SaveAs”. Beri nama lembar kerja notepad tersebut (contoh: Kunci Jawaban), kemudian klik “Save” dengan format “txt”. d.Periksa data yang telah disimpan dalam folder anda, jika penyimpanan sukses, terdapat 2 macam “file Notepad” yaitu (file butir jawaban dan Kunci Jawaban). Tampilkan seperti pada gambar 6.14 Gambar 6.14 Penyimpanan File Notepad 3.Menganalisis menggunakan Software Iteman 4.3 a.Buka sofware Iteman 4.3 Gambar 6.15. Software Iteman 4.3 b.Lihat toolbar pada sisi atas tedapat pilihan menu toolbar (file ; input format; scoring options; output options). Pilih menu “inputformat”. Sehingga Tampilannya seperti pada gambar 6.16

More Related