490 likes | 1.51k Views
Persampelan dan Analisis Data. Oleh Mohammad Khatim Hasan. Statistik. Takrifan: Peralatan 6M bagi pemanipulasian data mengumpul, mengelas, meringkas, menyusun, menganalisis dan mentakrif data kuantitatif supaya kebolehpercayaan keputusan analisis dapat dinilai secara objektif.
E N D
Persampelan dan Analisis Data Oleh Mohammad Khatim Hasan
Statistik • Takrifan: Peralatan 6M bagi pemanipulasian datamengumpul, mengelas, meringkas, menyusun, menganalisis dan mentakrif data kuantitatif supaya kebolehpercayaan keputusan analisis dapat dinilai secara objektif. • Ada dua: statistik berperihalan & aruhan
Pengkelasan Jenis data • Perwakilan: kuantitatif & kualitatif • Bentuk: diskret & selanjar • Tahap ukuran: • nominal: boleh dikategori: ada nama @label tertentu: X boleh disusun. • Oridinal: boleh disusun ikut tertib tapi perbezaan tak dapat ditafsirkan dgn jelas • Selang: boleh disusun, perbezaan dapat ditafsirkan & termasuk bacaan negatif • Nisbah: boleh disusun, perbezaan dapat ditafsirkan & bermula dgn sifar
Sumber data dan kaedah pungutan data • Ada 2: sumber primer & sekunder • Sumber primer: ujikaji berekabentuk, bancian dan soal selidik, pemerhatian. • Sumber sekunder: sumber terbitan
Populasi dan sampel • Populasi:set unit yang biasanya terdiri dari manusia, objek ataupun peristiwa yang ingin dikaji. • Sampel: subset unit-unit dalam populasi.
Kaedah Persampelan • Dengan kebarangkalian: Persampelan rawak ringkas, bersistem, berstrata dan berkelompok. • Tanpa kebarangkalian: persampelan selesa, berkuota, bola salji dan sukarela.
Pengujian Hipotesis Oleh Mohammad Khatim Hasan
Pengenalan • Statistik yang membolehkan penyelidik membuat keputusan bagi sesuatu masalah yang dikaji ialah statistik aruhan / pentakbiran. • Penyataan mengenai ciri suatu populasi menerusi tatacara pentakbiran berstatistik dinamakan hipotesis berstatistik. • Hipotesis berstatistik sebenarnya cuba untuk menganggar suatu parameter populasi dengan bantuan maklumat dari sampel.
Sambungan… • Hipotesis statistik adalah satu kenyataan yang dibuat tentang suatu populasi Kenyataan ini mungkin benar atau tidak Kebenaran kenyataan tersebut dibuat menggunakan ujian hipotesis
Kepentingan& Keperluan Penting untuk menguji adakah perbezaan yang wujud diantara data dalam sampel dan populasi adalah benar-benar berbeza atau berbeza secara kebetulan sahaja. Keputusan dapat dibuat dengan fakta saintifik.
Takrif • Takrif • Hipotesis statistik adalah suatu pernyataan atau anggapan yang mungkin benar atau tidak terhadap suatu populasi atau lebih (Walpole, 1990).
Catatan: • Ho cenderung untuk di tolak. Ini bermaksud, kita seboleh-bolehnya hendak menolaknya kecuali terdapat bukti yang cukup kuat dari sampel yang menafikan penolakannya. Penolakan Ho tidak bermakna pernyataan dalam hipotesis tersebut palsu tetapi ia bermaksud bukti yang diperolehi dari sampel tidak mencukupi untuk menerimanya. Begitu juga sebaliknya.
Ralat Jenis 1 dan 2 Ø2 jenis ralat yang wujud dalam ujian hipotesis. ØRalat jenis I berlaku jika kita menolak H0 apabila dalam keadaan sebenar, ia benar dan Øralat jeis II berlaku apabila kita tidak menolak H0 sedangkan dalam keadaan sebenar, ia palsu. ØKb (Ralat Jenis I ) = dan Kb (Ralat Jenis II) =
Secara matematik • = kb (Ralat jenis I ) • = kb ( tolak H0| H0 benar ) • dan • = kb (Ralat jenis II) • = KB (Tidak tolak H0| H0 palsu)
Sambungan Ø dipanggil aras keertian dalam ujian hipotesis, dan ( 1- )100% dipanggil aras keyakinan. ØNilai samada 0.01 , 0.05 , 0.10 ditentukan oleh penyelidik. ØJika = 0.05 , maka kita yakin sebanyak 95% bahawa keputusan ujian adalah benar. • Kita mahukan nilai dan sekecil yang mungkin.
Langkah-langkah pengujian • Penyataan hipotesis • Taburan • Aras keertian • Statistik Ujian • Kawasan Penolakan • Pengiraan statistik ujian • Keputusan • Kesimpulan
Hipotesis nol dan alternatif ØPerlu ditentukan sebelum ujian hipotesis dapat dijalankan. ØHipotesis Nol • oSimbol Ho. • oMesti yang membawa maksud kesamaan. • oJadi ada 3 kemungkinan: sama ada = atau atau .
Sambungan • o Contoh: Ho: = RM 2,000.00 sebulan. atau Ho: Purata pendapatan penduduk Bandar baru Bangi adalah RM2,000.00 sebulan.
sambungan ØHipotesis Alternatif • oSimbol Ha.atau H1 • o Mesti membawa maksud ketaksamaan. • o Jadi ada 3 kemungkinan: sama ada atau < atau >. • o Diterima jika Ho ditolak.
Sambungan Contoh: Ha: RM2,000.00 sebulan atau Ha: Purata pendapatan penduduk Bandar Baru Bangi bukan RM2,000.00 sebulan. Perhatikan!!! o Pernyataan dalam Ho dan Ha tidak boleh bertindan.
Ho Ha = atau < atau > < > Jadual pemilihan Ho dan Ha.
Taburan Ø Taburan data sampel perlu di kenalpasti terlebih dahulu untuk membolehkan kita menggunakan statistik ujian yang betul. Ø Bagi data yang diambil dari taburan normal, taburan sampel nya juga normal. Bagi data yang diambil dari taburan bukan normal, teorem had memusat diperlukan. Ø Ujian kenormalan juga boleh digunakan untuk menguji adakah data tertabur secara normal.
Teorem Had Memusat • Bagi Min 1 sampel (2 sampel) Pertimbangkan satu populasi dengan min dan varians 2 . Katakan X1, X2,…..,Xn satu sampel rawak saiz n (n1 dan n2) yang diambil daripada populasi tersebut. Untuk n besar iaitu n 30 (n1 30 dan n2 30), taburan pensampelan bagi min sampel , X akan menghampiri normal iaitu X N(,2/n)
Teorem Had Memusat Bagi Perkadaran 1 sampel (2 sampel) taburan persampelan bagi akan menghampiri normal bagi saiz sampel yang cukup besar. Untuk kes perkadaran, saiz sampel akan dianggap besar jika np dan nq (n1p1, n2p2, n1q1 dan n2q2) kesemuanya perlu lebih besar dari 5.
Beberapa kaedah lain • oBina histogram • oBina plot batang-daun • oKira pekali kepencongan dan kepuncakannya. • oGunakan hubungan min, mod dan median dengan bentuk taburan. • oAtau gunakan perisian untuk menguji kenormalan data.
Aras Keertian ØAras keertian bagi suatu ujian adalah kebarangkalian melakukan ralat jenis I . ØJika kita menggunakan =0.01, bermaksud jika Ho benar, kebarangkalian kita menolak hipotesis ini adalah bersamaan dengan 0.01.
Statistik Ujian ØJika sekiranya data tidak tertabur secara normal, kita perlu menggunakan ujian tak berparameter. Jika tertabur secara normal, boleh guna ujian berparameter.
Beberapa jenis ujian berparameter • o Ujian Z • o Ujian t • o Anova • o Ujian F • o Pekali Korelasi Pearson
oUjian tanda Ujian Pangkat bertanda Wilcoxon oUjian U-Mann-Whitney Ujian Jumlah Pangkat Wilcoxon oUjian Kruskal-Wallis Kkorelasi Pearson o Ujian Larian oUjian Friedman OUjian Kolmogorov-Smirnov oUjian McNemar oKorelasi Pangkat Spearman Beberapa jenis ujian tak berparameter
Tetapi • Ujian yang boleh digunakan dalam teknik berparameter dan tak berparameter ialah ujian Khi-kuasa dua.
Kawasan Penolakan Ø Ada 3 jenis hujung ujian: o 2 hujung o 1 hujung sebelah kiri o 1 hujung sebelah kanan Ø Bergantung kepada Ha. Ø Kawasan penolakan adalah kawasan yang membolehkan Ho di tolak???
Nilai Kritikal • Nilai pemisah diantara kawasan penolakan dan kawasan penerimaan. Keputusan Kesimpulan
Contoh Masaalah Seorang penyelidik ingin menguji kelajuan enjin gelintar yang dibina untuk mencapai maklumat yang dikehendaki. Satu pengujian telah dijalankan ke atas 10 perkataan dan hasilnya adalah seperti di bawah (dalam saat) 2 1 3 1 2 0.5 0.9 0.8 1 0.7 Pembangun enjin tersebut mendakwa yang enjin tersebut boleh mencapai maklumat sebanyak-banyaknya 1 saat.
Hipotesis • H0: min kelajuan data sebanyak-banyaknya 1 saat • Ha: min kelajuan lebih dari 1 saat • Taburan • Jenis data selang • Bilangan data 10 • Bilangan sampel1 • taburan t
Statistik Ujian • dengan d.k=n-1 • aras keertian • katakan kita ingin menguji pada aras keertian 5% • Kawasan penolakan • dari Ha di dapati ujian adalah ujian satu hujung. • d.k.=10-1=9 • Dari jadual taburan t didapati nilai kritikalnya ialah 1.833 • Jadi Ho akan ditolak sekiranya nilai kiraan > 1.833
Kiraan • Sebelum mengira nilai t, kita perlu kira dahulu min dan sisihan piawai bagi data di atas, • Hasil dari kiraan didapati min=1.29 dan sisihan piawai=0.785211 • di dapati nilai t kiraan < nilai kritikal, jadi H0 tidak ditolak. • Kesimpulan • Kita yakin sebanyak 95% bahawa tidak ada cukup bukti untuk menolak dakwaan yang menyatakan enjin gelintaran yang baru dibina ini mempunyai kelajuan capaian yang tinggi iaitu selewat-lewatnya 1 saat.
Analisis Menggunakan Excel • ‘Install’kan analisis data ke dalam Excel • Beberapa langkah perlu diambil • Pilih Tool • Pilih Add-ins • Tandakan Analysis ToolPak • Klik OK • Ikut arahan untuk meng’install’ ‘Data Analysis’
Setelah di ‘install’… • Pilihan ‘Data Analysis’ akan wujud dalam menu ‘Tool’.
Contoh Penggunaannya • Menguji keberkesanan kaedah pengajaran • H1: Kaedah Pengajaran Berkesan • Hipotesis • Ho: Kaedah Pengajaran Tidak Berkesan • Taburan • Taburan t • Aras keyakinan • 0.05
Sambungan… • Statistik Ujian • Ujian t berpasangan • Kawasan Penolakan • Jika nilai-p (satu hujung) lebih kecil daripada aras keyakinan tolak H0
Perhatikan • Data
Keputusan • Oleh kerana nilai-p satu hujung = 0.399483> 0.05, maka H0 tidak ditolak. Kesimpulan • Kita yakin sebanyak 95% bahawa kaedah pengajaran itu tidak berkesan.