240 likes | 560 Views
STATISTIK NONPARAMETRIK Kuliah 3: Uji Chi-Square untuk Goodness of Fit dan Uji Kolmogorov -Smirnov (Satu Populasi ) Dosen : Dr. Hamonangan Ritonga , MSc Sekolah Tinggi Ilmu Statistik Jakarta Tahun 2013. Pendahuluan.
E N D
STATISTIK NONPARAMETRIKKuliah 3: Uji Chi-Square untuk Goodness of Fit danUjiKolmogorov-Smirnov (Satu Populasi) Dosen:Dr. HamonanganRitonga, MScSekolahTinggiIlmuStatistik JakartaTahun 2013
Pendahuluan • Uji Chi-squares (2) merupakan salah satu uji statistik yang sering digunakan dalam statistik, diantaranya digunakan untuk: 1) apakah frekuensi observasi berbeda secara signifikan terhadap frekuensi ekspektasi. 2) apakah dua variabel independen atau tidak 3) apakah data sampel mengikuti distribusi hipotesis tertentu, seperti distribusi normal, binomial, poison, dll.
Pendahuluan • Distribusi Chi-squares (2) Jika x1 , x2 ,..., xv adalah variabel random yang memiliki distribusi normal, sementara z1 , z 2,…zv merupakan variabel random standarnya atau z1 N (0,1) maka z 2 1 akan memiliki derajat bebas v. • Bentuk Fungsi Probability 2 • Jika v variabel random adalah independen, maka distribusi 2 memiliki rata-rata dan varians: E(2) = v 2 = 2v sehingga nilai derajat bebas merupakan parameter suatu distribusi 2
Uji Chi-Squares (goodness of fit) • Uji Chi-square (2) goodness of fit satu sampel adalah teknik statistik yang digunakian untuk menguji hipotesis deskriptif bila dalam populasi terdiri dari dari dua atau lebih kelas, dan datanya berbentuk nominal. Uji statistik ini menekankan pada perbedaan frekuensi subjek, objek, atai respon yang masuk pada kategori yang bervariasi. • Contoh kasius: 1) Sekelompok pasien dikelompokkan menurut jenis penyakit tertentu, dan peneliti ingin mengetahui apakah tipe penyakit tertentu lebih sering terjadi dari penyakit lain. 2) Anak-anak dikategorikan menurut jenis permainan, dan peneliti ingin mengetahui apakah jenis permainan berbeda dalam frekuensi. 3) masyarakat dapat dikategorikan menurut respon terhadap sesuatu: “apakah lebih senang” , “sama saja”, atau “menolak” s, dan peneliti ingin mengetahui apakah respon masysrakat verbeda dalam frekuensi. • Uji yang sesuai dengan kasus diatas adalah Uji Chi Square Goodness of Fit. Uji ini digunakan untuk menguji apakah frekuens observasi berbeda secara signifikan terhadap frekuensi ekspektasi (harapan).
Uji Chi-Squares (goodness of fit) • MetodeUji Chi-square (2) goodness of fit satu sampel: Untukmembandingkanfrekuensiobservasidenganfrekuensiekspektasi, kitaharusterlebihdahulumenentukanfrekuensiekspektasi. Hipothesis Ho menyatakanproporsiobjek yang masukpadasetiapkategori yang diasumsukanterjadipadapopulasi. • Hipotesis Ho dapatdiujidenganstatistikberikut: Dimana: Oi = frekuensiobservasipadakategorike i Ei = frekuensiekspektasipadakategorike i K= jumlahkategori N=jumlahobservasi Statistikinimengikutidistribusi 2dengandegress of freedom = k-1 (Tabel C Lampiran)
Uji Chi-Squares (goodness of fit) • Contoh 1: Kasus dua kategori Suatu organisasi ingin mengetahui apakah wanita mempunyai peluang yang sama dengan pria untuk menjadi kepala desa di desa A . Untuk itu dilakukan penelitian. Populasi penelitian adalah masyarakat yang memenuhi sayara memilih di desa A. Calon kades ada dua orang, wanita dan pria. Sampel diambil secara random sebanyak 300 orang, ternyata dari sampel tersebut 200 orang memilih calon kades pria dan 100 orang memilih calon kades wanita. Lakukan pengujian apakah ada perbedaan frekuensi observasi dan frekuensi ekspektasi dengan taraf nyata 5 %.
Uji Chi-Squares (goodness of fit) Langkah-langkah yang diakukan: • Tentukan Ho dan Ha Ho: frekuensi jumlah memilih calon kades pria dan wanita adalah sama (Kades pria dan wanita berpeluang sama untuk dipilih jadi kades) Ha: frekuensi jumlah pemilih calon kades pria dan wanita tidak sama • Tentukan taraf nyata () = 0,05 atau 5 % • Tentukan Statistik Uji: Uji Chi-squares (2) goodness of fit satu sampel AlternPatif Pilihan Oi Ei (Oi – Ei) (Oi-Ei) 2 (Oi-Ei) 2 /Ei Pria 200 150 50 2500 16,67 Wanita 100 150 -50 2500 16,67 Jumlah 300 300 0 5000 33,33 Jadi: 2obs = 33,33
Uji Chi-Squares (goodness of fit) • Tentukan Kriteria Keputusan: Jika 2obs > 2df, Tolak Ho • Keputusan 2obs = 33,33 df = k-1 = 2-1 = 1; =0,05 2df, = 3,84 (Lihat Tabel C pada Handbook) Jadi Tolak Ho Masyarakat di Desa A cenderung memilih pria sebagai Kades Saran: Kelompok wanita sebaiknya tidak mencalonkan diri sebagai calon kades
Uji Chi-Squares (goodness of fit) • Koreksi Yates untuk kontinuitas Dalam pengujian dengan distribusi 2,nilainya dihitung dari distribusi teoritis asli yang kontinu, sedangkan observasi kita adalah dari data diskrit. Ada kecenderungan pendugaan tersebut over estimate, khususnya untuk derajat bebas 1, dengan demikian nilai 2obsakan meningkatkan kemungkinan menolak Ho, sehingga perlu mengoreksi nilai 2obskebawah. (Oi-Ei-1/2) 2 2obs= ---------------- sehingga pada contoh sebelumnya 2obs= 32,67 Ei Kesimpulan: 2obs (32,67) > 2df, = 3,841 Tetap Tolak Ho Catatan: Jika derajat bebas lebih dari 1, penyesuaian dengan koreksi Yates tidak diperlukan.
Uji Chi-Squares (goodness of fit) Contoh 2: Kasuslebihdariduakategori Tabelberikutadalahfrekuensiobservasidanekspektasi 4 macam penyakit yang ditemuidisuatudaerah: Uji apakah frekuensi observasi dan ekspektasi berbeda secara signifikan pada = 5 %
Uji Chi-Squares (goodness of fit) Jika k = 2 untukUji Chi- Squares goodness of fit untuk satu sampel akanakuratpadafrekuensiekspektasi 5 ataulebih. Jikahanyaada 2 kategoridenganfrekuensi < 5, maka Kategori yang berdekatanperludigabung, sepertipengelompokan barupadatabelberikut:
Uji Chi-Squares (goodness of fit) Langkah-langkah yang diakukan: • Tentukan Ho dan Ha Ho: frekuensi obesrvasi dan ekspektasi penyakit adalah sama Ha: frekuensi obesrvasi dan ekspektasi penyakit adalah tidak sama • Tentukan taraf nyata () = 0,10 atau 10 % • Tentukan Statistik Uji: Uji Chi-squares (2) goodness of fit satu sampel Jenis Penyakit Oi Ei (Oi – Ei) (Oi-Ei) 2 (Oi-Ei) 2 /Ei A 3 6 -3 9 1,5 B 5 6 -1 1 0,17 C dan D 9 5 4 16 3,2 Jadi: 2obs = 4,87
Uji Chi-Squares (goodness of fit) • Tentukan Kriteria Keputusan: Jika 2obs > 2df, Tolak Ho • Keputusan 2obs = 4,87 df = 3-1 = 3-1 = 2; =0,10 2df, = 4,61 (Lihat Tabel C pada Handbook) Jadi Tolak Ho Ada perbedaan yang signifikan antara frekuensi ekspektasi dan observasi dari penyakit-penyakit di daerah tersebut.
Uji Chi-Squares (goodness of fit) • Soal Latihan 1: Dilakukan pelemparan suatu mata uang sebanyak 50 kali, diperleh hasil sebagai berikut: Obs& ekspektasi Kepala Ekor Jumlah Observasi 22 28 50 Ekspektasi 25 25 50 Lakukan pelemparan mata uang tersebut jujur atau tidak pada taraf nyata 5 %.
Uji Chi-Squares (goodness of fit) • Soal Latihan 1: Dilakukan pelemparan suatu mata uang sebanyak 50 kali, diperleh hasil sebagai berikut: Obs& ekspektasi Kepala Ekor Jumlah Observasi 22 28 50 Ekspektasi 25 25 50 Lakukan pengujian apakah pelemparan mata uang tersebut jujur atau tidak pada taraf nyata 5 %. • Soal Latihan 2: Sebuah dadu dilempar 60 kali dengan hasil: Mata 1 2 3 4 5 6 Muncul 12 8 13 12 7 8 Lakukan pengujian apakah dadu seimbang pada taraf nyata 5 %
Uji Chi-Squares (goodness of fit) • Soal Latihan 3: Suatu perusahaan cat mobil ingin mengetahui warna cat apa yang harus lebih banyak diproduksi. Untuk itu perlu dilakukan penelitian. Berdasarkan pengamatan selama 1 minggu di jalan protokol terhadap mobil-mobil pribadi ditemukan 1000 berwarna biru, 900 berwarna merah, 600 berwarna putih, dan 500 berwarna lainnya. Lakukan pengujian apakah ada perbedaan nyata terhadap pemilihan warna mobil pada taraf nyata 5 %
Uji Kolmogorov-Smirnov satu sampel • Uji Kolmogorov-Smirnov satu sampel adalah uji goodness of fit lain, untuk mengetahui kesesuaian antara distribusi nilai sampel (nilai yang diobservasi) dan beberapa distribusi teoritis yang ditentukan. • Dalam hal ini ingin diketahui apakah skor pada suatu sampel berasal dari populasi yang mempunyai distribusi teoritis. • Secara singkat uji ini mencakup menentukan distribusi frekuensi komulatif yang diobservasi terjadi sesuai distribusi teoritis. Distribusi teroritis merepresentasikan yang akan diharapkan melalui Ho.
Uji Kolmogorov-Smirnov satu sampel • Metode Misalkan Fo (X) adalah fungsi distribusi komulatif frekuensi relatif (comulative relative frequency distribution function), distribusi teoritis dibawah Ho. Untuk setiap nilai X, nilai dari Fo (X) adalah proporsi kasus yang diharapkan mempunyai skor lebih kecil atau sama dengan X. Selanjutnya S N (X) adalah diistribusi komulatif frekuensi relatif yang diobservasi dari sampel N. Jika setiap Xi setiap adalah kemungkinan skor, maka S N (Xi) =Fi/N, dimana Fi adalah jumlah observasi yang lebih kecil atau sama sengan Xi. Fo (Xi) adalah ekspektasi proporsi observasi yang lebih kecil atau sama dengan Xi.
Uji Kolmogorov-Smirnov satu sampel • Metode Ketika Ho benar, , maka perbedaan antara S N (Xi) dan Fo(Xi) kecil diantara batasan kesalahan random. • Uji Kolmogorov-Smirnov memfokuskan pada deviasi terbesar. Deviasi nilai absolut terbesar dari Fo(Xi) - S N (Xi) disebut Maksimum Deviasi D, dengan persamaan: D = max Fo(Xi) - S N (Xi) I = 1,2,…,N Distribusi sampling dari D dibawah Ho dapat dilihat pada Tabel F (Lampiran Buku). Perhatikan, jika N > 35 nilai kritis D ditentukan baris terakhir dari Tabel F.
Uji Kolmogorov-Smirnov satu sampel • Contoh Selama beberapa tahun seorang peneliti mempelajari deviasi dari variasi kejadian mogok kerja. Data berikut adalah deviasi dari mogok (dalam hari) dari tahun 1965 di Negara Inggris yang dikumpulkan, dianalis, dan diprediksi berdasarkan model matematis. Tabel dibawah ini menggambarkan distribusi komulatif frekuensi dari N=840 deviasi mogok. Juga diberikan pada tabel komulatif frekuensi yang diprediksi berdasarkan model matematis. Uji apakah distribusi dari durasi mogok mengikuti prediksi model matematis
Uji Kolmogorov-Smirnov satu sampel Langkah-langkah yang diakukan: • Tentukan Ho dan Ha Ho: distribusi dari durasi mogok mengikuti prediksi model matematis Ha: distribusi dari durasi mogok yang diobservasi tidak sama dengan yang diprediksi dengan model matematis. • Tentukan taraf nyata () 0,05 atau 5 % • Tentukan Statistik Uji: Uji Kolmogorov-Smirnov Peneliti ingin membandingkan distribusi observasi skor dari skala ordinal dengan distribusi teoritis skor
Uji Kolmogorov-Smirnov satu sampel Langkah-langkah yang diakukan: • Distribusi sampling. Nilai Kritis D, yaitu nilai maksimum deviasi absolut antara observasi dan prediksi dari distribusi komulatif dapat dilihat pada Tabel F. • Daerah Tolak. Tolak bila nilai D > nilai kritis 6) Keputusan: Nilai maksimum D = 0,015. Karena N.35, harus digunakan pendekatan sampel besar. Dengan N=840 , nilai kritis D adalah 1.36/840 =0,047. Karena nilai D < nilai kritis, kita tidak menolak Ho, data observasi adalah dari data populasi oleh model teoritis.