250 likes | 543 Views
METODE STATISTIKA. BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD. Variabel Kuantitatif. Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif. Variabel Kuantitatif. Variabel Kuantitatif. Apa yang terjadi jika ukuran sampel lebih besar? Perubahan histogram?.
E N D
METODE STATISTIKA BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD M. Yahya Ahmad
Variabel Kuantitatif • Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif. M. Yahya Ahmad
Variabel Kuantitatif M. Yahya Ahmad
Variabel Kuantitatif • Apa yang terjadi jika ukuran sampel lebih besar? • Perubahan histogram? M. Yahya Ahmad
Variabel Kuantitatif • Distribusi data dari beberapa variabel dapat berbentuk simetris. Terutama jika ukuran sampel semakin besar. M. Yahya Ahmad
Bagaimana Membandingkan Distribusi Bila terdapat dua atau lebih kelompok data maka fokuskan perhatian kepada: • Titik tengah (Center). Secara grafis titik tengah dari suatu sebaran data adalah titik dimana kira-kira separuh dari observasi berada di salah satu sisinya. • Penyebaran data (Spread). Sebaran menggambarkan variabilitas data. Jika sebaran cukup luas. Maka spread dikatakan besar. Tetapi jika data berkelompok pada sekitar suatu nilai tertentu maka dikatakan sebarannya kecil. • Bentuk (Shape). Betuk sebaran data dapat digambarkan dalam kategori kesimetrian (symmetry), kecondongan (kewness), banyaknya puncak, dan sterusnya. • Karakter yang tidak biasa (Unusual features). Hal-hal yang biasa seperti adanya kesenjangan (tidak ada data) dan pencilan (outliers). M. Yahya Ahmad
Sebaran Normal • Sebaran ini digunakan untuk mewakili sebaran dari nilai-nilai yang harus diamati, jika kita melibatkan semua anggota populasi. • Oleh karena itu sumbu Y dari Sebaran Normal disebut probabilitas. • Suatu histogram menunjukkan nilai sebaran yang diamati dalam sebuah sampel. • Suatu pemetaan Normal menunjukkan nilai sebaran yang dianggap bahwa nilai tersebut dapat muncul di dalam populasi dimana sampel diambil. M. Yahya Ahmad
Sebaran Normal • Kita dapat menggunakan sebaran Normal untuk menjawab pertanyaan seperti: • Berapa peluang orang dewasa yang menderita glycemia pada level < atau = 50 mg/100 ml? • Kita dapat menjawab, dengan mengambil persentase pengamatan terhadap lelaki dewasa, dengan tingkat glycemia < 150 mg/100 ml. M. Yahya Ahmad
Sebaran Normal Baku • Sebaran Normal digambarkan dengan formula yang cukup rumit, namun sekarang telah dipublikasikan tabel yang dapat menentukan luas area di bawah kurva normal yang dinamakan sebagai Sebaran Normal Baku. • Di dalam sebaran noral baku, nilai tengahnya adalah 0 dan simpangan baku adalah ±1. • Tabel sebaran normal baku biasanya terdapat di dalam lampiran buku-buku statistika. • Dengan berkembangnya perangkat lunak komputer, perhitungan luas area di bawah kurva normal sudah sangat mudah dilakukan, M. Yahya Ahmad
-1 0 +1 Sebaran Normal Baku • Bila Z=0.00 maka luas area di bawah kurva normal adalah 0.5 • Bila Z = 1.00 maka luas area di bawa kurva normal adalah 0.159 atau 0.841 M. Yahya Ahmad
-1 0 +1 Sebaran Normal Baku • Jika kita buatkan bentangan luas area di bawah kurva. Maka area di luar bentangan tersebut merupakan sisa (complementary) dari seluruh luas area. M. Yahya Ahmad
Sebaran Bukan Normal • Tidak semua variabel kuntitatif memiliki sebaran yang normal. • Jika kita ukur tingkat glycemia dalam 10 orang: maka terlihat sebarannya memiliki kecondongan. • Dengan kondisi ini dapatkah kita sebut sebarannya normal? M. Yahya Ahmad
Sebaran Binom • Variabel acak binom (binomial random variable) merupakan jumlah keberhasilan x di dalam n percobaan yang diulang-ulang dari suatu percobaan binomial. Distribusi Peluang (probability distribution) dari variabel acak binom disebut sebagai binomial distribution (juga dikenal dengan Bernoulli distribution). M. Yahya Ahmad
Sebaran Binom • Menggambarkan peluang (probability) dari suatu kejadian yang memiliki karakteristik hany dua nilai, misalnya peluang terpilihnya dua warna dalam pengambilan (merah atau putih); peluang orang menjawab pertanyaan “ya: atau “tidak”. • Gambar berikut ini menggambarkan sebaran probalitas dari jumlah lelaki di dalam sekelompok orang yang terdiri dari 10 orang. Ini merupakan variabel binom, karena kemungkinan pemilihannya hanya ada dua, yaitu lelaki atau bukan lelaki. M. Yahya Ahmad
Sebaran Binom • Sebaran binom memiliki sifat-sifat sebagai berikut: • Nilai tengah (mean) dari distribusi binom (μx) sama dengan n * P . • Ragam atau variance (σ2x) adalah n * P * ( 1 - P ). • Simpangan baku atau standard deviation (σx) adalah akar pangkat dua dari [ n * P * ( 1 - P ) ]. M. Yahya Ahmad
Sebaran Binom • Berapa besar peluang dimana sekurang-kurangnya lahir satu bayi lelaki dalam tiga kelahiran? • Kombinasi yang mungkin terjadi: • LPP, PLP, PPL, LLP, LPL, LLP, LLL. • Untuk menghitung probabilitas dalam masing-masing kombinasi akan memakan banyak waktu. • Kombinasi yang mungkin terjadi di dalam kelahiran adalah 8, yaitu: LPP, PLP, PPL, LLP, LPL, LLP, LLL, PPP. M. Yahya Ahmad
Sebaran Chi-Square Sebaran chi-square memiliki sifat-sifat sebagai berikut: • Nilai tengah dari sebaran sama dengan jumlah derajat bebasnya: μ = v. • Ragam sama dengan dua kali derajat bebas: σ2 = 2 * v • Ketika derajat bebas lebih besar atau sama dengan 2, maka nilai maksimum untuk Y terjadi manakala Χ2 = v - 2. • Ketika derajat bebas meningkat, kurva chi-square mendekati kurva distribusi normal. M. Yahya Ahmad
Sebaran Chi-Square M. Yahya Ahmad
Probabilitas Kumulatif dan Sebaran Chi-Square • Jika dibuatkan suatu kurva sebaran chi-square maka luar areal di bawah kurva sama dengan 1. Luas areal yang berada di bawah kurva antara 0 dan nilai chi-square tertentu merupakan probabilitas kumulatif yang terkait dengan nilai chi-square. Sebagai contoh dalam gambar berikut ini, daerah yang diarsir mewakili peluang kumulatif yang berkaitan dengan nilai chi-square statistik yang sama dengan A; yaitu probablitas dimana nilai nilai chi-square statistik akan berada antara 0 dan A. M. Yahya Ahmad
Probabilitas Kumulatif dan Sebaran Chi-Square M. Yahya Ahmad
Contoh Penggunaan Chi-Square • Dengan menggabungkan dalam satu peta kita dapat memahami secara lebih baik hubungan antara dua sebaran. Dalam contoh berikut ini kita gunakan empat kemungkinan dari kombinasi antara curah hujan dan produksi suatu tanaman gandum • Low rainfall, low yield • Low rainfall, high yield • High rainfall, low yield • High rainfall, high yield M. Yahya Ahmad
Contoh Penggunaan Chi-Square • Catat jumah kejadian dalam suatu tabel freksuensi dari observasi yang dilakukan dalam bentuk matriks seperti tercantum di bawah ini M. Yahya Ahmad
Contoh Penggunaan Chi-Square • Buatkan tabel nilai frekuensi yang diharapkan dengan menggunakan statistik probabilitas (% High rain * # of high yield cells) • Row total * column total / table total M. Yahya Ahmad
Menterjemahkan Hasil Chi Square • Nol menunjukkan tidak ada hubungan • Nilai yang besar menunjukkan hubungan yang kuat • Atau, suatu tabel dapat digunakan untuk mengetahu apakah nilai tertentu secara statistik berbeda nyata atau tidak berbeda nyata • Fakta yang didapatkan dari data di atas menunjukkan adanya korelasi antara kedua variabel, namun TIDAK MENJELASKAN pertanyaan MANGAPA hal itu terjadi • Dalam analisis ini kita hanya mennjelaskan adanya keterkaitan atau tidak adanya keterkaitan antara dua hal. Untuk menjelaskan mengapa hal tersebut terjadi dibutuhkan analisis lainnya yaitu analisis hubungan sebab-akibat M. Yahya Ahmad
Jika tidak memiliki nilai Chi-Square • Gunakan nilai Yule’s Q • Nilai Yule’s Q sra –1 dan +1 • Jika nilainya 0 menunjukkan tidak ada hubungan. • Nilai +1 menunjukkan hubungan yang posiitif • Nilai –1 menunjukkan hubungan negatif M. Yahya Ahmad