350 likes | 636 Views
Analisa Data Statistik Chap 10b: Hipotesa Testing (Proporsi). Agoes Soehianie, Ph.D. Test Statistik Berkenaan dengan Proporsi 1 Populasi.
E N D
Analisa Data StatistikChap 10b: Hipotesa Testing (Proporsi) Agoes Soehianie, Ph.D
Test Statistik Berkenaan dengan Proporsi 1 Populasi Situasi : Dari sampel diketahui proporsi “sukses” adalah p, ingin diketahui apakah proporsi di populasi P. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah: Dengan q=1-p
Contoh Sebuah obat hipertensi yg biasa dipakai orang dipercaya efektif 60%. Sampel random 100 penderita hipertensi yg diberi obat jenis baru ternyata 70 orang mengalami perbaikan.Apakah cukup bukti untuk menyatakan bahwa obat baru tsb lebih baik dibandingkan obat yg biasa dipakai? Pergunakan tingkat signifikan 5%.
Solusi 1. H0:p=0.6 dan H1: p > 0.6 2. α = 0.05 3. Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α=0.05 adalah z=1.645 Tolak H0 jika Z> 1.645 4. Hitung statistik: diketahui p=0.7, q=1-p=0.3, n=100 5. Keputusan : Tolak H0 sebab Zhitung > 1.645 6. Kesimpulan: Obat baru lebih efektif
Solusi 1. H0:p=0.6 dan H1: p > 0.6 2. α = 0.05 3. Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α=0.05 adalah z=1.645 Tolak H0 jika Z> 1.645 4. Hitung statistik: diketahui p=0.7, q=1-p=0.3, n=100 5. Keputusan : Tolak H0 sebab Zhitung > 1.645 6. Kesimpulan: Obat baru lebih efektif
Test Statistik Berkenaan dengan Proporsi 2 Populasi Situasi : Dari sampel ukurannya cukup besar yg berasal dari 2 populasi diketahui proporsi “sukses” adalah p1 dan p2, ingin diketahui apakah proporsi di populasi juga sama P1=P2.. Asumsikan ukuran sampel yg besar dapat dipergunakan aproksimasi distribusi normal. Variabel statistik untuk ditest adalah: Dengan q=1-p. JIka yg diperiksa adalah H0: P1=P2, maka standard deviasi di rumus diatas bisa diperbaiki dg menggunakan Pooled estimate bagi p. Dalam hal ini p1=p2=p dengan p adalah nilai proporsi bersama dari sampel: Dengan x1 dan x2 adalah banyaknya “sukses” Di sampel 1 dan 2.
Test Statistik Berkenaan dengan Proporsi 2 Populasi Dengan ini maka rumus bagi variabel Z adalah:
Contoh Sebuah pabrik kimia akan didirikan di batas kota dekat dengan desa. Sebuah survei dilakukan untuk mengetahui penerimaan penduduk kota dan desa thd rencana pembangunan tsb. Dari sampel random 500 penduduk desa 240 menyetujuinya, sedangkan dari 200 penduduk kota yg disampel sebanyak 120 menyetujuinya. Periksalah apakah persentase penduduk kota yg menyetujui pendirian pabrik tsb lebih besar daripada penduduk desa pada tingkat signifikan 5%.
Solusi 1. H0:P1 = P2 dan H1: P1 > P2 dengan P1 : proporsi penduduk kota yg setuju, dan P2 proporsi pdd desa yg setuju. 2. α = 0.05 3. Daerah kritis (1 ekor, distribusi normal) dengan Z: ` nilai kritis Z untul α=0.05 adalah z=1.645 Tolak H0 jika Z> 1.645
Solusi 4. Perhitungan Dari sampel diperoleh p1= 120/200=60% ; p2=240/200=48%. Pooled estimate p: 5. Keputusan: Karena Z > 1.645, maka Ho ditolak 6. Kesimpulan : Persentase pdd kota yg setuju > persentase pdd desa
Test Statistik Berkenaan dengan Variansi 1 Populasi Situasi : Dari sampel dengan variansi S2 yg berasal dari populasi normal ingin diperiksa apakah variansi populasinya = σ02. Variabel statistik untuk di test adalah χ2 : Adalah variable chi-squares dengan derajat kebebasan v=n-1. Sebagai catatan test ini sangat bergantung pada asumsi normalitas penyimpangan dari normalitas berakibat pada ketidak akurasian hasilnya.
Soal Pabrik aki mobil menyatakan bahwa umur akinya memiliki standard deviasinya 0.9 tahun, dan distribusi umur akinya normal. Untuk memeriksa kebenaran klaimnya sampel random 10 aki ditest ternyata standard deviasinya 1.2 tahun. Melihat hasil ini apakah cukup bukti untuk menyatakan bahwa standard devias umur akinya > 0.9 tahun. Periksalah dengan tingkat signifikan 5%
Solusi 1. Hipotesa H0: σ2 = 0.92 H1: σ2 > 0.92 2. α= 0.05 3. Daerah kritis : Variabel statistik untuk dites adalah: Dari tabel nilai kritis χ20.05(v=10-1) = 16.919. Tolak H0 jika χ2> 16.919 4. Perhitungan
Solusi 5. Keputusan Karena χ2< 16.919 maka H0 tidak bisa ditolak pada tingkat signifikan 5%. Sebenarnya selisihnya terlalu tipis, untuk membuat kesimpulan yg kuat! 6. Kesimpulan Tidak cukup bukti untuk menyatakan bahwa standard deviasi aki produksi pabrik tsb > 0.9.
Test Statistik Berkenaan dengan perbandingan Variansi 2 Populasi Situasi : Sampel dari dua buah populasi memiliki variansi S12 dan S22 yg berasal dari populasi normal ingin diperiksa apakah variansi kedua populasi sama H0 : σ12 = σ22 Variabel statistik untuk di test adalah F : Adalah variable dengan distribusi F yg memiliki derajat kebebasan v1 =n1 -1 (pembilang) dan v2=n2-1(penyebut).
Contoh Sampel dari dua buah populasi memiliki variansi dan Dengan masing-masing ukuran sampelnya n2= 12 dan n1=10. Periksalah kebenaran hipotesa H0 : yaitu kedua sampel berasal dari populasi dengan variansi yang sama, terhadap, H1:` pada tingkat signifikan 10%
Solusi Ini adalah test 2 ekor, akan tetapi karena kita sudah susun s1>s2 maka nanti hanya perlu diperiksa ekor kanannya saja! 1. Hipotesa: H0 : H1: 2. α= 0.1 3. Daerah kritis Variabel statistik untuk ditest : F = s12/s22 dari tabel distribusi F untuk v1=10-1=9 dan v2=12-1=11, bagi nilai α/2 = 0.05 adalah F0.05 (9,11) = 2.90 Tolak H0, jika F > 2.90 4. Perhitungan: F = s12/s22 = 25/16 = 1.56 5. Keputusan Karena F < 2.90 tidak bisa menolak H0 pada tingkat signifikan 10%. 6. Kesimpulan, Kedua sampel berasal dari populasi dengan variansi yg sama!
Test statistik untuk kecocokan thd distribusi teoretik Situasi: Ingin diketahui seberapa mirip distribusi data yg diperoleh di dalam sampel terhadap distribusi teoretis yg diasumsikan dimiliki oleh populasi asal sampel tsb. Test ini disebut goodness of fit test. Test statistiknya adalah chi-squares: Dengan Ok adalah frekuensi sampel yg terobservasi, Ek adalah frekuensi teoretis (expected) untuk sel yang sama (k). Derajat kebebasannya v=N-1 Hipotesa yg diuji adalah H0: Distribusi sampel = distribusi teoretis (nilai chi-squares kecil) terhadap H1 : distribusi sampel menyimpang dari distribusi teoretis (nilai chi-squares besar)
Contoh. Sebuah dadu bermuka 6 dilemparkan sebanyak 120 kali, hasilnya adalah sbb: Muka dadu 1 2 3 4 5 6 frek (obs) 20 22 17 18 19 24 frek (exp) 20 20 20 20 20 20 distribusi teoretis (expected ) f(x) =1/6 dengan x=1,2,3,…6, sehingga untuk 120 kali pelemparan frek (teoretis) = 1/6*120=20 untuk tiap mata dadu. 1. Hipotesa H0: Distribusi frekuensi mata dadu sesuai distribusi teoretis H1: Distribusi frekuensi mata dadu menyimpang dari teoretis
Contoh. 2. Tingkat signifikan Misal diambil α=5%. 3. Daerah kristis Variabel statistik untuk diuji: dengan v=N-1=6-1=5. Nilai kritis, menurut tabel χ20.05(v=5) = 11.070. Tolak H0, jika χ2 > 11.070 4. Perhitungan
Contoh. 4. Perhitungan 5. Keputusan Karena χ2< 11.070maka H0 tidak bisa ditolak pada tingkat signifikan 5%. 6. Kesimpuan: Tidak bisa dikatakan bahwa distribusi frekuensi kemunculan mata dadu berasal dari populasi yg menyimpang dari distribusi teoretis yg seharusnya. Atau tidak cukup bukti menyatakan dadunya tidak fair!
Test untuk independensi (data kategorikal) Situasi: Ingin diketahui independensi antara dua buah variabel kategorikal. H0: Tidak ada hubungan (dua buah variabel tsb independen) H1 : Ada hubungan antara kedua buah variabel Sebagai distribusi teoretisnya adalah berdasarkan H0 yaitu distribusi yg akan terjadi jikalau kedua variabel yg diperiksa independen. Sedangkan test statistik yg dipergunakan adalah χ2 :
Contoh. Ingin diketahui apakah tingkat pendapatan berpengaruh pada opini terhadap rencana reformasi perpajakan yg akan dilakukan pemerintah. Untuk itu dilakukan sampling terhadap 1000 orang wajib pajak. Kepada mereka ditanyakan apakah setuju dengan reformasi perpajakan yg akan dilakukan. Hasilnya ditabelkan dalam tabel kontingensi berikut ini:
Contoh. Periksalah hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, dengan tingkat signifikan 5%.
Solusi. 1. Hipotesa H0: tidak ada hubungan antara tingkat pendapatan dan opini thd reformasi perpajakan, H1: Ada hubungan …. 2. α = 5%. 3. Daerah kritis Variabel untuk ditest: dengan derajat kebebasan v= (row-1)*(col-1)= (2-1)*(3-1)=2 Nilai kritis, dari tabel χ0.052(ν=2)=5.991 Tolak H0, jika χ2> 5.991
Solusi. 4. Perhitungan Menentukan frekuensi teoretis tiap cell berdasarkan asumsi bahwa variabel pendapatan independen thd variabel opini, sehingga probabilitas untuk cell dengan pendapatan Pa dan opini Ob akan diberikan oleh: P (Pa ∩ Ob)= P(Pa)*P(Ob) Jika total datanya N, maka expected frequency untuk cell tsb adalah: n (Pa ∩ Ob)= P(Pa)*P(Ob) * N Bagaimana menentukan Pa dan Ob dari tabel kontingensi? Misal dari data, jumlah org yg pendapatannya a,b dan c masing-masing na, nb dan nc. Maka, probabilitas menemukan 1 orang dengan pendapatan a adalah : P(Pa) = na/(na+nb+nc), dst.
Solusi. 4. Perhitungan Disebelah kiri adalah tabel yg diperlukan untuk menghitung expected frequency, sebelah kanan adalah hasilnya : expected frequency. Contoh perhitungan expected freq. orang yg berpendapatan rendah dan setuju. P(rendah) = 336/1000 P(setuju)=598/1000 n(rendah dan setuju) = P(rendah)*P(setuju)*1000= = 336/1000*598/1000*1000 = 200.9
Solusi. 4. Perhitungan Untuk menghemat perhitungan tidak perlu semua dihitung, misalkan seluruh baris “setuju” dihitung, maka jumlah expected yg di baris “tidak” bisa diperoleh dengan pengurangan. Contoh expected freq. yg pendapatan rendah dan tidak setuju: n(rendah & tidak) = 336 – n(rendah & setuju) = 336 – 200.9=135.1 Tahap berikutnya menghitung chi-squares: 5. Keputusan Karena χ2> 5.991 maka cukup bukti untuk menolak H0 6. Kesimpulan Ada hubungan antara variabel pendapatan dan opini.
Catatan 1. Metoda ini bekerja baik jika jumlah expected freq di tiap cell ≥ 5. 2. Untuk mempermudah perhitungan biasanya dalam tiap cell dicantumkan observed freq dan expected freq.
Test Beberapa Proporsi Sekaligus Situasi: Ingin diketahui apakah proporsi untuk “sukses” di berbagai populasi semuanya sama. Jadi H0 : P1=P2=P3=… H1: paling tidak ada 1 proporsi yg tidak sama Variabel testnya adalah chi-squares:
Contoh Sebuah pabrik yg memiliki 3 shift pekerja ingin mengetahui apakah persentase produk yg cacat dari berbagai shift tersebut sama. Sampel data disusun dalam tabel berikut ini: Pergunakan tingkat signifikan 2.5% untuk memeriksa apakah persentase yg cacat sama di segala shift.
Solusi 1. Hipotesa H0 : p1=p2=p3 H1: tidak semua p1,p2 dan p3 sama 2. α=0.025 3. Daerah Kritis Test statistiknya : dengan derajat kebebasan v= (2-1)*(3-1)=2 Nilai kritis, dari tabel diperoleh χ0.0252(v=2) = 7.378 Tolak H0 jika χ2> 7.378
Solusi 4. Perhitungan Perhitungan expected frequency seperti contoh-contoh sebelumnya. Sehingga chi-squares bisa dihitung: Χ2 = 6.23
Solusi 5. Keputusan Karena χ2 <7.378, maka H0 tidak bisa ditolak. 6. Kesimpulan Tidak cukup bukti untuk menyatakan bahwa ada perbedaan proporsi produksi yg cacat di berbagai shift yg berbeda