490 likes | 749 Views
PERTEMUAN KE-3. Statistika Nonparametrik. FITRI CATUR LESTARI, M. Si. 2013. Analisis Pembelajaran. korelasi. banyak populasi. 2 populasi. 1 populasi. Sekilas tentang Kenormalan. Bagaimana mendeteksi kenormalan secara sederhana? Boxplot, Histogram, Scatter Plot, Stem and Leaf Plot
E N D
PERTEMUAN KE-3 Statistika Nonparametrik FITRI CATUR LESTARI, M. Si. 2013
Analisis Pembelajaran korelasi banyak populasi 2 populasi 1 populasi
Sekilas tentang Kenormalan • Bagaimana mendeteksi kenormalan secara sederhana? • Boxplot, Histogram, Scatter Plot, Stem and Leaf Plot • Bagaimana mendeteksi kenormalan secara tidak sederhana? • Alat uji • Bagaimana jika data berdistribusi tidak normal? • Transformasi, perbanyak data, metode statistik nonparametrik • Bisa jadi ketidaknormalan disebabkan oleh outlier. Bagaimana solusinya? • Buang outlier, metode anti outlier
Fungsi dan Esensi • Fungsi: • Membandingkan distribusi frekuensi kumulatif hasil pengamatan (sampel) dengan distribusi frekuensi kumulatif yang diharapkan(teoritis) • Esensi • Apakah sampel yang kita ambil berasal dari populasi yang memiliki distribusi normal? -goodness of fit- • Tidak hanya distribusi normaluniform, poisson, eksponensial • Skala: minimal ordinal (Siegel,51)
Prosedur • Urutkan datanya dari yang terkecil sampai terbesar • Buat distribusi frekuensi kumulatif relatifS(X) • Hitung zstandarisasi • Hitung distribusi frekuensi kumulatif teoritis (berdasarkan kurve normal)F(X) • Hitung selisih poin (b) dengan poin (d) • Hitung D=selisih maksimum poin (e) (nilai paling besar pada poin (e)) • Bandingkan dengan D tabel(Ho ditolak jika D>Dtabel) • Ada juga yang menggunakan simbol T
Contoh • Suatu perusahaan penerbangan ingin mengetahui apakah keterlambatan waktu take-off pesawat-pesawat terbang di pelabuhan udara X berdistribusi normal. Dari sampel 11 keterlambatan yang terjadi diketahui (dalam jam): Dari studi-studi pelabuhan udara lainnya dipertimbangkan bahwa keterlambatan take-off di pelabuhan udara x akan mempunyai mean 3 jam dengan simpangan baku 1 jam. Apakah data tersebut berdistribusi normal? • Bedanya dengan Lilifors
Penyelesaian • = 0,1795 Ho data berdistribusi normal • Alpha 10%Dtabeln=11 ____ 0,352 • Data menyebar normal SN(Xi) F0(Xi)
CONTOH LAGI • Berdasarkanpenelitiantentangintensitaspeneranganalami yang dilakukanterhadap 18 sampelrumahsederhana, rata-rata pencahayaanalami di beberaparuangandalamrumahpada sore harisebagaiberikut ; 46, 57, 52, 63, 70, 48, 52, 52, 54, 46, 65, 45, 68, 71, 69, 61, 65, 68 lux. Selidikilahdengan α = 5%, apakah data tersebut di atasdiambildaripopulasi yang berdistribusi normal ?
SPSS-Cara 1 • Kolmogorov-Smirnov dari menu Analyze > Descriptive Statistics > Explore
Fungsi dan Esensi Fungsi: Membandingkan fungsi distribusi random variabel pengamatan dengan fungsi distribusi normal Esensi Apakah sampel yang kita ambil berasal dari populasi yang memiliki distribusi normal? -goodness of fit- Tidak hanya distribusi normal
Formula • Ho menyatakan proporsi sebuah obyek jatuh pada tiap kategori pada populasi yang diduga • pj*=peluang suatu observasi X termasuk dalam kelas j (j=1,…,c) • Ei= pj*.N tidak boleh kecil nilainya karena distribusinya cenderung tidak Chi Square • Cohran menyarankan Ei jangan kurang dari 1 dan tidak lebih dari 20% Ei kurang dari 5 • Yarnold • Tolak Ho jika T>X1-alpha Siegel, 45
Siegel • The size of df reflects the number of “observations” which are free to vary after certain restrictions have been placed on the data • df: k-1 dengan Ei=N/k
CONTOH-Uniform • Hipotesis: • Ho: Data berdistribusi uniform • H1: Data tdk berdistribusi uniform • Stat uji: X2 • Alpha=1% • Distribusi sampling: dist X2 df=k-1=8-1=7 • Daerah penolakan: • Ho ditolak jika prob. Atau p-value <=0.01 • Keputusan: • X2 hit =16.3 Terima Ho • Tapi kalau alpha 5% Tolak Ho Tabel 1%=18.475 Tabel 5%=14.067
CONTOH-Normal • X2=8.36 • X2 tabel=14.07 Terima Ho: data berdistribusi normal • Catatan: Derajat bebas
Ekspektasi yang terlalu kecil • Df=1 (k=2)minimal Ei=5 • Df>1 (k>2) tidak digunakan jika: • Lebih dari 20% Ei nya <5 • Ada Ei<1 • Penggabungan kategori p50 • Jika sudah dikombinasikan/gabung masih Ei nya <5 maka gunakan uji binomial
Contoh • Apakah data di bawah ini berdistribusi normal dengan mean 30 dan varians 100?
Penyelesaian • w0.25 w0.5 w0.75tabel • X0.25=30+10(-0.6745)=23.255 • X0.50=30 • X0.75=36.745 • Kelas 1 <=23.255 • Kelas 2 23.255<x<=30 • Kelas 3 30<x<=36.745 • Kelas 4 >36.745
Oj=8,4,3,5 • T=2.8 • Alpha 0.05tolak Ho jika T>7.815
Rules of Thumbs • Pilih interval dimana Ekspektasinya : N/k • Jumlah kategori ditentukan sedemikian rupa sehingga Ekspektasinya antara 6-10 untuk sampel besar (>200)
K-S tidak tergantung pada pengelompokan seperti pada Chi-Square (CS) • Jika sampel sedikit, maka K-S lebih powerful • K-S dapat digunakan pada sampel kecil sekalipun • Chi Square membutuhkan data skala nominal • K-S membutuhkan data distribusi kontinu • KS dan CS bisa digunakan untuk data berskala ordinal • Presisi KS lebih tinggi karena pada CS terdapat pengelompokan. • Pada sampel kecil, KS adalah eksak sedangkan CS hanya pendekatan eksak.
Terdapat beberapa keuntungan dan kerugian relatif uji kesesuaian Kolmogorov-Smirnov dibandingkan dengan uji kesesuaian Kai Kuadrat, yaitu: • Data dalam Uji Kolmogorov-Smirnov tidak perlu dilakukan kategorisasi. Dengan demikian semua informasi hasil pengamatan terpakai. • Uji Kolmogorov-Smirnov bisa dipakai untuk semua ukuran sampel, sedang uji Kai Kuadrat membutuhkan ukuran sampel minimum tertentu. • Uji Kolmogorov-Smirnov tidak bisa dipakai untuk memperkirakan parameter populasi. Sebaliknya uji Kai Kuadrat bisa digunakan untuk memperkirakan parameterpopulasi,dengan cara mengurangi derajat bebas sebanyak parameter yang diperkirakan. • Uji Kolmogorov-Smirnov memakai asumsi bahwa distribusi populasi teoritis bersifat kontinu.
Metode Lilliefors Untuk Uji Normalitas • Uji lilliefors digunakan bila ukuran sampel (n) lebih kecil dari 30. • Misalkan sampel acak dengan hasil pengamatan : x1 ,x2 , …,xn. Akan diuji apakah sampel tersebut berasal dari populasi berdistribusi normal atau tidak?
Langkah-langkah pengujian: • Rumuskan Hipotesis: • Ho : sampel berasal dari populasi berdistribusi normal • H1 : sampel tidak berasal dari populasi berdistribusi normal • Tentukan α : taraf nyata • Susun tabel berikut: • Data diurutkan dari terkecil ke terbesar • Cari rata-rata, simpangan baku sampel • Lakukan standarisasi normal (z=(xi–x) /s) • Hitung peluang F(zi ) = P(zi) • Hitung proporsi yang lebih kecil atau sama dengan zi -> S( zi) • Hitung | F(zi) – S(zi) | • Statistik Uji : • Nilai terbesar dari | F(zi) -S(zi) | • Dengan α tertentu tentukan titik kritis L • Kriteria uji : tolak Ho jika Lo >= Ltabel , terima dalam hal lainya.
PR • Cari soal dan penyelesaian (sebanyak mungkin) dari buku referensi (cantumkan sumbernya) ttg uji liliefors. • Kerjakan menurut kelompok bulan lahir: • Kelompok 1: Januari-Maret • Kelompok 2: April-Juni • Kelompok 3: Juli-September • Kelompok 4: Oktober-Desember • Ketik dan kumpulkan lewat email setelah di compile oleh PJ • Deadline Senin, tgl 8 April 2013
Uji Kenormalan TEKNIS ! Fitri Catur Lestari, M. Si. 2013
Metode Kolmogorov Smirnov • Persyaratan : • Data berskala interval atau ratio (kuantitatif) • Data tunggal/belumdikelompokkanpada table distribusifrekuensi • Dapatuntuk n besarmaupun n kecil. • D = max |Fr – Fs| • Tolak Ho jika D > D (α,n) • Fr = nilai Z • Fs = probabilitaskumulatifempiris
Soal : Suatu penerapan tentang berat badan peserta pelatihan kebugaran fisik/jasmani dengan sampel sebanyak 27 orang diambil secara random, didapatkan data sebagai berikut : 78, 78, 95, 90, 78, 80, 82, 77, 72, 84, 68, 67, 87, 78, 77, 88, 97, 89, 97, 98, 70, 72, 70, 69, 67, 90, 97 kg. Selidikilah dengan α= 5%, apakah data tersebut diambil dari populasi yang berdistribusi normal ?
Penyelesaian : Hipotesis: Ho : Data berdistribusi normal H1 : Data tidak berdistribusi normal α = 0,05 Statistik uji dan hitung: X = 81,2963 SD = 10,28372 Dhitung: nilai |Fr-Fs| tertinggisebagaiangkapengujinormalitas, yaitu 0, 1440
Daerah kritis : Ho ditolak jika Dhitung>Dn(α) = D27(0,05) = 0,254. Keputusan : Terima Ho karena 0,1440 < 0,254 Kesimpulan : Dengantingkatkepercayaan 95%, dapatdiperkirakanbahwa data beratbadanpesertapelatihankebugarandiperolehdaripopulasiygberdistribusi normal.
Metode Goodness-of-fit Metode Chi square atauχ2untukuji Goodness of Fit Distribusi Normalmenggunakanpendekatanpenjumlahanpenyimpangan data observasitiapkelasdengannilai yang diharapkan. Rumus :
Tabel : • Persyaratan : • Data bersusunberkelompokataudikelompokkandalam table distribusifrekuensi • Cocokuntuk data dengankebanyakanangkabesar (n > 30) • Setiapselharusterisi, yang Ei kurangdari 5 digabungkanlebih baik jika ada referensi
Jika χ2 > nilai χ2tabel, maka Ho ditolak Contoh : Data tinggi badan Selidikidengan α = 5%, apakah data diatasberdistribusi normal ?
Penyelesaian : Hipotesis: Ho : Data berdistribusi normal H1 : Data tidak berdistribusi normal Alpha= 5% Statistik uji dan hitung: X = 165,3 ; SD = 10,36
χ2 = 0,1628 Daerah kritis: Ho ditolak jika χ2hitung> χ2tabel Df = (k - 3) = (5 – 3) = 2 Nilai table χ20,05; 2 = 5,991 Keputusan: Karena | 0,1628 | < | 5,991 | maka Ho diterima Kesimpulan: Dengantingkatkepercayaan 95%, dapatdiperkirakanbahwatinggibadanmasyarakatkalimastahundiambildaripopulasi yang berdistribusi normal.