1.08k likes | 2.01k Views
PENGANTAR STATISTIKA INDUSTRI. Statistika. Statistika : Definisi & Tujuan. Statistika adalah ilmu yang berkaitan dengan pengumpulan , pengolahan , presentasi (deskritif) , dan interpretasi ( inferensi ) data Secara ilmiah dalam kerangka proses
E N D
Statistika: Definisi & Tujuan Statistika adalah ilmu yang berkaitan dengan • pengumpulan, • pengolahan, • presentasi (deskritif), dan • interpretasi (inferensi) data Secara ilmiah dalam kerangka proses • pengambilan keputusan yang berkaitan dengan adanya ketidakpastian (resiko) dan variasi.
StatistikaDeskriptif vs Inferensi • Statistika deskriptifdigunakan apabila peneliti hanya bertujuan mendapatkan ringkasan datayang dimilikinya. Ringkasan ini meliputi lokasi pemusatan data, variabilitas data, dan karakteristik umum distribusi data. • Statistika inferensidigunakan apabila peneliti ingin membuat suatu kesimpulantertentu atas karakteristik/hubungan antar beberapa variabel dalam populasi, diberikan jika hanya memiliki data sampel.
StatistikaDeskriptifvsInferensi • StatistikInferensi • - Memperkirakandan • meramalkannilai • parameter populasi • - Mengujihipotesis • tentangnilai • parameter populasi • - Membuatkeputusan • StatistikDeskriptif • Collect • Organize • Summarize • Display • Analyze Tidakdilakukangeneralisasi Inferensiberdasarkanketerbatasaninformasi sample
Statistika Inferensi • Statistikainferensi: • Mendugadanmeramalkan (estimasi) nilai parameter populasi... • Mengujihipotesisnilai parameter populasi... • Mengambilkeputusan... Berdasarkan statistik sampel yang diambil dari sejumlah terbatas (tidak lengkap) informasi sampel Observasipadasebagianpopulasi Melakukangeneralisasiterhadappopulasi...
Populasi vs Sampel Oleh karenanya, lingkup ‘data’ dapat dikategorikan sebagai: • populasimerupakan kumpulan semua individu dari jenis objek yang menjadi perhatian penelitian, dan • sampel adalah bagian dari populasi yang dapat dikumpulkan oleh peneliti (sebatas kemampuannya dalam melakukan pengumpulan data). Besaran populasi disebut parameter, sedangkan besaran sampel disebut statistik.
Estimatoradalah statistik yang digunakan untuk mengestimasi parameter populasi. Estimasi dari sebuah parameter adalah nilai numerik tertentu (dari statistik sampel) yang diperoleh melalui sampling. Titik estimasi adalah sebuah nilai yang digunakan untuk mengestimasi sebuah parameter populasi. Statistik vs Parameter Statistiksebagai estimator parameter • Parameter populasiadalah ukuran karakteristik populasi. • Statistikadalahukurankarakteristiksampel.
Rata-rata populasi () Distribusifrekuensipopulasi X X X X X X X X X X X X X X X X X X Titiksampel Sample mean ( ) Distribusi dan rata-rata Perbedaan antara rata-rata sampel dengan rata-rata populasi disebut bias
Sampling Statistika Deskriptif Populasi Sampel Inferensi Proses Sampling & Inferensi Kaitan populasi dan sampel, serta proses sampling, proses inferensi & statistika deskriptif:
Proses Sampling & Inferensi • Dapat disimpulkan bahwa statistika berkaitan dengan proses pengambilan sampel (sampling) sehingga dapat dilakukan penyajian dan peringkasan data (statistika deskriptif) atau lebih jauh lagi dilakukan pendugaan dan pengujian nilai parameter populasi (statistika inferensi).
Sensus vs Sampling Sebuahmetoda survey yang mencakupseluruhanggotapopulasidisebutsensus. Sementarateknikuntukmengumpulkaninformasidarisebagianpopulasidisebutsampling.
Sampel Random Sederhana • Sampling dari populasi dilakukan secara random, sedemikian sehingga setiap sampel berukuran sama (n) memiliki kesempatan yang sama untuk diambil atau dipilih • Sebuah sampel yang diambil dengan cara tersebut disebut sebuah sampel random sederhana atau sample random.
Pengambilan Sampel • Pada statistika inferensi, pengambilan sampel menentukan hasil inferensi. • Idealnya sampel diambil secara random. • Pengambilan sampel yang tidak tepat dapat menyebabkan bias systematic error
Pengambilan Sampel Setiap data sampel yang diambil dapat mencakup: • Nilai sebenarnya (true value), • Kesalahan sistematis, dan • Kesalahan acak (random). Data sampel = true value + kesalahan sistematis + kesalahan acak
Pengambilan Sampel Data sampel = true value + kesalahan sistematis + kesalahan acak Statistika membantu peneliti untuk mengetahui komponen-komponen nilai data sampel tersebut.
Pengambilan Sampel • Data sampel selalu mengandung kesalahan karena adanya “ketidak-pastian (error)”, Ekspektasi [error] = variansi + (bias)2 • Variansi (kesalahan acak) berkaitan dengan masalah kepresisian. • Bias (kesalahan sistematis) berkaitan dengan masalah akurasi.
Presisi ukuran seberapa jauh suatu tools memberi hasil yang konsisten variasi data coefficient standard error/koefisien kesalahan baku Akurasi: seberapa tepat suatu tools mengukur apa yang seharusnya diukur jarak yang diukur dari target ketepatan menentukan sample dalam menggambarkan karakteristik populasi Sample akurasi tinggi: kesimpulan dari sample menggambarkan karakteristik populasi.
Representative sample • Sample yang sebesar mungkin mewakili karakteristik populasi dikatakan sebagai representative sample. • Besarnya dugaan keterwakilan populasi dalam sampel dinyatakan dengan (1-α). Notasi α selanjutnya disebut: • tingkat keyakinan (confidence) dalam melakukan pendugaan atau estimasi, dan • tingkat pembedaan (significance) dalam melakukan pengujian hipotesis nilai parameter populasi (juga dikenal sebagai kesalahan tipe pertama).
Statistika dan permasalahannya • Kecil kemungkinan karakteristik sampel persis sama dengan karakteristik populasi. • Teori probabilitas membantu kita dalam melakukan penarikan kesimpulan atas dugaan atau hipotetis yang terkait dengan karakteristik populasi.
Statistika dan permasalahannya • Peran statistika dan teori probabilitas dalam proses deduksi dan induksi: Hipotesis 1 Deduksi Konsekuensi Modifikasi (hipotesis 2) Induksi Fenomena Eksperimen Data
Statistika dan permasalahannya Secaraalamiahseoranganakdapatmemilikidugaan (hipotesis 1) bahwawarnamerahumumnyapanasdanwarnabiruumumnyadingin. Kemudiandiamendapatpengalaman (deduksi) bahwaternyataapiberwarnabirudarikompor gas lebihpanasdariapiberwarnamerah (konsekuensi). Hal inimerubahdugaanawalnya (induksi) sehinggadiamemperolehdugaanbaru (hipotesis 2). Dengancarainimanusiabelajarsecaraalamiahdaripengalaman yang dihadapi.
Statistika dan permasalahannya Proses deduksi & induksi ini dapat “diciptakan” melalui eksperimen dengan memanfaatkan statistika dan probabilitas sehingga dapat diperoleh data atau estimasi untuk mempercepat proses belajar (tidak perlu menunggu kejadian alamiah).
Statistika dan permasalahannya Kerangka pemikiran kesisteman dan statistika: Proses Variasi Data Perbaikan Kerangka kerja ini dikenal sebagai Statistical Thinking (Statistical Division ASQ) yang digunakan sebagai acuan dalam implementasi statistika di dunia nyata. Falsafah kesisteman Analisis Tindakan & resiko
Skala pengukuran Ada empat type skala, yaitu: • Nominal • Ordinal • Interval • Ratio
Skala pengukuran • Skala Nominal – group ataukelas • Jeniskelamin • Skala Ordinal – urutan • Ranking • Skala Interval – perbedaan, selisih, jarak • Temperatur • SkalaRasio – perbandingan • Ongkos per unit
Statistika Deskriptifdistribusi frekuensi & ukuran statistik
Presentasi Data Grafik/diagram penyampaian informasi data berupa angka secara visual • Line Chart/ Diagram Garis • Histograms/Diagram Batang • Frequency Polygon/Diagram Frekuensi • Ogives/Distribusi Frekuensi Kumulatif • Pie Chart/ Diagram Lingkaran
Sifat Kelompok Data • Mutually exclusive tidak overlapping – sebuah observasi hanya ada dalam sebuah kelompok • Exhaustive setiap observasi ditempatkan dalam sebuah kelompok • Equal-width (if possible) kelompok pertama dan terakhir dapat berbeda
Distribusi Frekuensi • Frekuensidarisetiapkelompok • jumlahobservasidalamsetiapkelompok • Jumlahfrekuensiadalahjumlahobservasi, yaitu • N untukpopulasi • n untuksampel • Kelompok midpoint adalahnilaitengahkelompok, kelasatau interval • Frekuensirelatifadalahprosentasedari total observasidalamsetiapkelompok • jumlahfrekuensirelatif = 1
Distribusi Frekuensi Waktuoperasiperakitankendaraanbermotor • Contohfrekuensirelatif: 30/184 = 0.163 • Jumlahfrekuensirelatif = 1
Distribusi Frekuensi Kumulatif Frekuensikumulatifdarisetiapkelompokadalahjumlahfrekuensidarikelompoksebelumnya .
Distribusi frekuensi Tahapanpenyusunan: • Menghitungjumlahkelas interval (k), denganrumus (Sturges) : k = 1 + 3,3 Log n dimana : k = Jumlahkelas interval n = Jumlah data • MenghitungRentang Data (R) R = Nilai data maksimum – Nilai data minimum • MenghitungPanjangKelas Interval (p), denganrumus : p = R/k • TabelDistribusiFrekuensi :
Ukuran Statistik UkuranPemusatan 1. Rata-rata (Mean) 2. Nilai Tengah (Median) 3. Modus UkuranLetak 1. Kuartil 2. Desil 3. Persentil UkuranPenyebaran 1. Jangkauan (Range) 2. Variasi (Variance) 3. Simpangan Baku (Standard deviation) Ukuran Lain 1. Skewness 2. Kurtosis
UkuranPemusatan– Rata-rata • Untuk data tunggal dimana : xi = Nilaidari data n = Jumlah data ataubanyaknya data didalam sample • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : dimana : fi = Frekuensiuntukkelas interval ke-i xi = Nilaitengah x0 = Nilaitengah yang akandiberi coding ci= Variabel coding untukkelas interval ke-i p = Panjangkelas interval
UkuranPemusatan– Median • Untuk data tunggal dimana: xi = Nilaitengahdari data n = Jumlah data ataubanyaknya data didalam sample • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : dimana : Li = Batas bawahkelas median, yaitukelasdimana median akanterletak. p = Panjangkelas interval n = Jumlah data F = Frekuensikumulatifsebelumkelas median f = Frekuensikelasberisi median
UkuranPemusatan– Modus • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : dimana : Li = Batas bawahkelas modus, yaitukelas interval denganfrekuensi terbanyak p = Panjangkelas interval b1 = Selisihfrekuensikelas modus denganfrekuensikelassebelumnya b2 = Selisihfrekuensikelas modus denganfrekuensikelassesudahnya
UkuranLetak– Kuartil ukuranletak yang membagisuatudistribusimenjadi 4 bagian yang sama, sesudahdisusunmenuruturutannilainya. • Untuk data tunggal: • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : dimana : Li = Batas bawahkelasKi, yaitukelas interval dimanaKiakanterletak n = Jumlah data p = Panjangkelas interval F = FrekuensikumulatifsebelumkelasKi f = FrekuensikelasKi
UkuranLetak– Desil ukuranletak yang membagisuatudistribusimenjadi 10 bagian yang samabesarnya. • Untuk data tunggal: • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : dimana : Li = Batas bawahkelas Di, yaitukelas interval dimana Di akanterletak n = Jumlah data p = Panjangkelas interval F = Frekuensikumulatifsebelumkelas Di f = Frekuensikelas Di
UkuranLetak– Persentil ukuranletak yang membagisuatudistribusimenjadi 100 bagian yang sama. • Untuk data tunggal: • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : dimana : Li = Batas bawahkelas Pi, yaitukelas interval dimana Pi akanterletak n = Jumlah data p = Panjangkelas interval F = Frekuensikumulatifsebelumkelas Pi f = Frekuensikelas Pi
UkuranPenyebaran– Variansi & Simpangan Baku • Untuk data tunggal: • Untuk data berkelompok (data yang disusundalamdaftardistribusifrekuensi) : Dimana: xi = Nilaitengah f = Frekuensi yang sesuai dengannilaitengah n = Jumlahfrekuensi Sehingga Standar Deviasi (Simpangan Baku) adalah :
Ukuran Lain Skewness Ukurankesimetrisandistribusi data Kemiringanataukecenderungandistribusi data Kurtosis Ukurankedataranataukeruncingandistribusi data KurvaSimetrisKurva Miring keKiriKurva Miring keKanan (0) (-) (+) (A) Leptokurtik (B) Platikurtik (C) Mesokurtik
Teknik Penarikan Sampel (Sampling) Proses mendapatkan sampel dari populasi mencerminkan populasi kesimpulan dari sampel= kesimpulan dari populasi Masalah dalam bagaimana proses pengambilan sampel Satuan sampling: segala sesuatu yang dijadikan satuan (unit) yang nantinya akan menjadi objek penelitian. Daftar yang berisi satuan-satuan sampling yang ada dalam sebuah populasi, yang berfungsi sebagai dasar untuk penarikan sample.
Metode Penarikan Sample • Berdasarkan proses pemilihannya. • a. Sampling with replacements • b. Sampling without replacements • 2. Berdasarkan peluang pemilihannya. • a. Probability sampling • b. Non-probability sampling
Non-Probability Sampling • Convenience/accidental sampling: sample diambil secara spontanitas mudah dan murah • Judgement/purposive sampling: sample diambilberdasarkankarakteristik yang ditentukanolehtujuanpenelitian • Quota sampling: = (2), kuota (jatah) danjumlah sample tertentumirip stratified tapitidakacak • Snow ball sampling: =(2), populasikecildanspesifikteknikberantai (sample berikutditentukan sample sebelumnya) biayarelatifkeciltapi bias/penyimpanganbesar.
Probability Sampling Random sampling: sampel (ni) diambilsecararandomdaripopulasi (Ni). Systematic sampling: sampeldiambilsecararandomuntukpertama kali, danselanjutnyadiambilsecarasistematis. Random dari 5 titik sampel pertama Sistematis setiap 5 titik sampel
Group 1 2 3 4 5 6 7 Population Distribution Sample Distribution Stratified sampling: sampel random (ni) dipilihdarisetiapkelompokpopulasi (Ni). Cluster sampling: observasidilakukanpada m cluster dari M cluster populasi.
Prosedur Sampling • Menentukanpopulasi target • Menentukan area populasi • Menentukanukuranpopulasi • Membuatkerangka sampling • Menentukanukuran sample • Menentukan teknik dan rencana pengambilan sample • Melakukan pengambilan sample