460 likes | 730 Views
VARIABEL & DATA SET DALAM PENELITIAN STATISTIK. Prinsip prosedur statistik. 2 of 45. Prinsip Prosedure Statistik :. Menarik kesimpulan tentang populasi dengan menggunakan informasi yang berasal dari sampel. Alasan sampel:. Effisiensi: waktu, tenaga, biaya Sensus bersifat destruktif
E N D
VARIABEL & DATA SET DALAM PENELITIAN STATISTIK
Prinsip prosedur statistik 2 of 45 Prinsip Prosedure Statistik: Menarik kesimpulan tentang populasi dengan menggunakan informasi yang berasal dari sampel Alasan sampel: • Effisiensi: waktu, tenaga, biaya • Sensus bersifat destruktif • Populasi tak terbatas • Populasi terbatas tapi tidak mungkin dilakukan sensus
Prosedur Statistik 3 of 45 Populasi (N) Parameter Asumsi Estimasi & Uji Ambil sampel Sampel (n) Statistik Kalkulasi
Penelitian di mata statistician • Dilihat dari sudut pandang penelitian, dua bahasan utama dalam statistika: • Sampel survey : dibahas bagaimana cara mendapatkan sampel data shg bisa digunakan untuk mengambil kesimpulan tentang populasi (teknik sampling & design survey) • Statistical Research : dibahas bagaimana data digunakan untuk menginvestigasi hubungan sebab dan pengaruh antar 2 buah variabel atau lebih Dilihat dari sudut pandang matematik/statistik, bisa dikatakan bahwa tujuan akhir dari semua research atau scientific analysis adalah untuk merumuskan/menemukan pola hubungan matematikantar variables of interest
Contoh Penelitian Statistik Dokter mungkin ingin mengetahui pola hubungan antar beberapa variable seperti umur, berat badan, tinggi badan, jenis kelamin dan tekanan darah pasien Ekonom mungkin tertarik untuk meneliti bagaimana pengaruh tingkat pendidikan, jenis kelamin, jenis pekerjaan terhadap penghasilan tenaga kerja Ahli kependudukan pengaruh tingkat pendidikan, jenis kelamin, jenis pekerjaan thd fertilitas perempuan usia subur Ahli pertanianingin mengetahui pengaruh pupuk, pestisida, curah hujan, jenis benih terhadap produktivitas tanaman padi Ahli gizi: Pengaruh berat badanwaktu lahir terhadap berat waktu dewasa Peternak: Pengaruh jenis pakan terhadap berat karkas hewan ternak dll…
Komponen penelitian statistik • Experimental unit : unit terkecil yang menjadi perhatian dalam suatu penelitian • Variabel : adalah ciri-ciri/characteristik yang diukur/didentifikasi dari setiap experimental unit dalam suatu penelitian • Populasi : Koleksi keseluruhan object atau item yang menjadi perhatian pada suatu penelitian statistik. Individual object dalam suatu populasi disebut experimental unit atau subject. • Sampel : Proporsi tertentu yang terbatas (subset) dari populasi yang digunakan untuk mempelajari karakteristik tertentu dari populasinya. • Data set : koleksi hasil pengukuran suatu variabel (dari suatu sampel maupun populasi)
Data set berdasarkan muatan variabelnya Univariate : data set dimana hanya ada satu variabel yg diukur/diidentifikasipada setiap experimental unit Bivariate : data set dimana terdapat duavariabel yg diukur/diidentifikasi pada setiap experimental unit Data set Multivariate : data set dimana terdapat > duavariabel yg diukur/diidentifikasi pada setiap experimental unit
Data set berdasarkan tipe variabelnya Categorical : disebut juga qualitative variabel adalah variabel yang nilainya hanya digunakan untuk klasifikasi atau kategorisasi Contoh: gender, jurusan, jenis pekerjaan, agama, status perkawinan, status pekerjaan Tipe variabel Diskrit : adalah variabel numerik yang dapat diasumsikan sbg bilangan terbatas atau tidak terbatas tapi countable (nilainya dapat diasosiasikan dengan counting number 1,2,3,…yaitu nilainya bisa di hitung) Contoh: banyaknya anak dlm rumah tangga, frekuensi peminjaman buku oleh mahasiswa Numerical Variabel Kontinu : nilai numerik yang dapat mengambil nilai berapa saja dalam suatu selang bilangan real Contoh : umur, pendapatan rumah tangga, berat badan, index prestasi
Komponen penelitian statistik • Experimental unit : unit terkecil yang menjadi perhatian dalam suatu penelitian • Variabel : adalah ciri-ciri / characteristik yang dapat diukur pada setiap experimental unit dalam suatu penelitian • Data set : koleksi hasil pengukuran suatu variabel (dari suatu sampel maupun populasi) • Populasi: Koleksi keseluruhan object atau item yang menjadi perhatian pada suatu penelitian statistik. Individual object dalam suatu populasi disebut experimental unit atau subject. • Sampel : Proporsi tertentu yang terbatas (subset) dari populasi yang digunakan untuk mempelajari karakteristik tertentu dari populasinya.
KONSEP DASAR PROBABILITY ( BRIEF REVIEW )
Konsep probability • Dalam percakapan sehari-hari, probability sering diterjemahkan sebagai ukuran kepercayaan akan terjadinya suatu event: • “Hari ini kemungkinan besar akan hujan” • “Saya nggak begitu yakin kalau dia bakal naik kelas” Interpretasi praktis dari probability (sebenarnya pernyataan peluang akan terjadinya suatu event) Joint Prob. ”Hari ini kemungkinan besar akan terjadi hujan disertai banyak petir” “Kalau dia nggak belajar, saya nggak yakin dia bakal naik kelas” Prob. bersyarat
Definisi probability # element A Prob (A)= # element S 12 of 45 Untuk memahami konsep probablity dalam konteks experiment statistik diperlukan pemahaman konsep berikut: Sample space (S): Himpunan dari keseluruhan event yang mungkin terjadi pada suatu experiment Misalkan: S : sampel space dari suatu experiment A : Event tertentu terkait dg hasil experiment Probability dari event A, ditulis P(A) adalah:
Definisi probability • Aksioma probability untuk event A dalam sampel space S:
2 bola scr acak Seluruh hasil yg mungkin: P( )=? P(☆ )=? P(☆ )=3/6 P( )=1/6 1 dari 6 kemungkinan Probability ”bola yg terambil adalah merah dan kuning” : Probability ”bola kuning terambil” : : Sample space Event Review Prob.: Notasi & Terminologi Subset of S
Probability: Notasi & Terminologi Experiment : dua buah coin dilempar bersama Bergantung pada characteristik yg menjadi perhatian kita, pada experimen yg sama mungkin saja didefinisikan sample space yg berbeda: Banyaknya head (H) yg muncul Experiment : Waktu tahan hidup dari suatu lampu listrik Continuous sample space Jika waktu pengamatan cukup dihitung ke satuan jam terdekat: Discrete sample space
Probability: Notasi & Terminologi Misal pada experiment di atas, T= waktu nyala lampu Z= intensitas terang yg diproduksi Beberapa definisi konseptual: • Probabilistik/statistical experiment memiliki karakteristik sbb: • Hasil/outcome-nya tidak bisa diprediksikan sebelumnya • Seluruh kemungkinan hasil/outcome-nya (S) bisa didefinisikan EventA adalah himpunan bagian dari sample space S, termasuk himpunan kosong dan S itu sendiri
Probability: Notasi & Terminologi Event Space: Dalam beberapa kasus, keseluruhan subsets of S mungkin terlalu luas untuk dibicarakan probabilitynya, diperlukan pembatasan (event space) Jika F adalah koleksi dari subset S, maka F disebut sbg event space jika: • S dan point set ada di dalam F • Jika A adalah element F maka complement A juga element F • Jika A1,A2,…adalah element F, maka gabungannya juga merupakan element dari F
(i) ; dimana (ii) dan (iii) Jika A1, A2, … mutually exclusive Probability: Definisi formal Jika diketahui suatu experiment dengan sample space S, maka tujuan utama dari suatu probability modeling adalah untuk menghubungkan setiap event A dengan sebuah bialangan real P(A) disebut probability dari A, yang menyatakan besarnya peluang bahwa event A akan terjadi jika experiment dilakukan Definisi probability: Suatu fungsi P yg didefinisikan di dalam F, disebut fungsi probability dalam (S,F) jika: Tiga komponen (P,S,F) disebut probability space
Probability: Notasi & Terminologi Bagaimana mengaitkan setiap event di dalam sample space dengan probabilitasnya?
Probability: Random variable Suatu random variable X, adalah fungsi yang mengaitkan setiap element S dengan suatu bilangan real Contoh: Sebuah dadu 4 sisi (1,2,3,4) dilempar sebanyak dua kali X= variable yg menyatakan nilai max yg muncul Tentu saja hasil dari percobaan ini tidak bisa kita prediksi, tapi kita bisa mendefinisikan himpunan dari semua nilai yang mungkindan mendefinisikan random variable S dan X dapat diilustrasikan sbb:
(1,4) (2,4) (3,4) (4,4) (1,3) (2,3) (3,3) (4,3) Event (1,2) (2,2) (3,2) (4,2) (1,1) (2,1) (3,1) (4,1) 1 2 3 4 1 2 3 4 Konsep prob. dlm eksperimen stat. (2)
Konsep prob. dlm eksperimen stat. (3) CDF dari r.v. X dapat didefinisikan sbb: 1 2 3 4
Asumsi ttg distribusi populasi (1) Populasi (N=100 orang) Umur <20 (10) Umur >60 (15) Umur 21-30 (20) Umur 51-60 (25) Umur 31-50 (30) Jika interval umur dipersempit dan N semakin besar, maka distribusinya akan cenderung normal (Cukup beralasan untuk diasumsikan Normal) Variable of interest : Umur Event of interest: Kel. umur
Normal Metode Parametrik Dist. Lainnya Metode Non Parametrik Tidak diasumsikan Asumsi ttg distribusi populasi (2) Karena size populasi yg menjadi obyek penelitian (N) pada umumnya besar, maka secara teori cukup reasonable untuk mengasumsikan bahwa distribusi populasi induk dari suatu sampel adalah normal (Gaussian distribusi) Dalam praktek: Asumsi ttg distribusi suatu Populasi
Mean & Variance suatu R.V. Definisi: Jika X adalah suatu random variable yg berdistribusi maka, mean (nilai harapan) X didefinisikan sebagai: Dan Variance X adalah:
Probability: Spesial Distribusi Contoh Permasalahan
Probability: Spesial Distribusi Diaplikasikan pertama kali oleh astronom asal Jerman Frederich Gauss shg dikenal sebagai distribusi Gauss
Probability: Spesial Distribusi Persamaan eksponential untuk distribusi Gauss adala sbb: Normal Standard (ditabulasikan untuk memudahkan dalam penggunaan distNormal)