650 likes | 885 Views
Probabilitas. Abdullah Basuki R.,S.Si,M.T http://www.abdullahbasuki.wordpress.com abasoke@yahoo.com. Terminologi. Teori Probabilitas – didasarkan pada konsep dari suatu eksperimen random
E N D
Probabilitas Abdullah Basuki R.,S.Si,M.T http://www.abdullahbasuki.wordpress.com abasoke@yahoo.com Kuliah Statistika Dasar (TKC116)
Terminologi • Teori Probabilitas – didasarkan pada konsep dari suatu eksperimen random • Random– fenomena/eksperimen dimana keluaran individual tidak pasti tetapi ada distribusi yg regular dari keluaran utk jumlah pengulangan yang banyak • Probabilitas – proporsi berapa kali suatu keluaran spesifik akan muncul dlm suatu serie pengulangan yang panjang dari suatu eksperimen
Apakah Probabiltas? • Frekuensi relatif jangka panjang • Jika melempar coin, frekuensi relatif dari “head” tidak menentu utk 2, 5 atau 10 pelemparan • Jika pelemparan suatu coin dilakukan bbrp ribu kali, frekuensi relatif tetap stabil • Probabilitas matematis adalah idealisasi dari apa yg terjadi thd frekuensi relatif setelah pengulangan sejumlah tak hingga eksperimen random
Probabilitas dari “Head” • Probabilitas didasarkan pd frekuensi relatif jangka panjang
Model Probabilitas • Sample Space- set dari semua keluaran (outcomes) yg mungkin dari eksperimen random (S) • Event – suatu keluaran (outcome) atau satu set outcomes dari suatu eksperimen • Ukuran Probabilitasadalah suatu bilangan atau fungsi yg memetakan dari events pada sample space ke bilangan real antara 0 dan 1 • Probabilitas dari semua outcomes yg mungkin (yaitu sample space) harus sama dg 1
Model Probabilitas • Contoh:Pelemparan (toss) suatu dadu • Sample Space:S ={1,2,3,4,5,6} • Event:A ={muncul angka genap}, B ={muncul angka ganjil}, D={muncul angka 2} • Ukuran Probabilitas: P(A) = 0,5; P(B) = 0,5; P(D) = 1/6
Aturan-Aturan Probabilitas • Probabilitas dari sembarang event P(A) hrs memenuhi 0 < P(A) < 1 • Complement Rule= complement dari sembarang event A adalah event A tdk terjadi P(Ac) = 1 - P(A) Contoh: Lempar suatu dadu: S = {1,2,3,4,5,6}; mis A = {2,4}, Ac = {1,3,5,6}; P(A) = 1/3; P(Ac) = 1-1/3 = 2/3 • Addition Rule= utk dua events A dan B yg terpisah/ disjoint (no common outcomes) P (A or B) = P(A) + P (B) Contoh: Lempar suatu dadu: S = {1,2,3,4,5,6}; mis A = {2}, B = {1,3,5}; P(A or B) = P(A) + P(B) = 1/6 + 1/2 = 2/3
Aturan-Aturan Probabilitas • Multiplication Rule= dua events A dan B adalah independent, jika diketahui bhw salah satu terjadi/muncul tdk mengubah probabilitas yg lain muncul P (A and B) = P(A)*P(B) Contoh: Lempar sepasang dadu S = {(1,1),(1,2),….(6,6)} 36 kemungkinan outcomes mis A ={dadu pertama 6} = {(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} mis B = {dadu kedua 1} = {(1,1),(2,1),(3,1),(4,1),(5,1),(6,1)} Maka P(A) = 6/36 = 1/6; P(B) = 6/36 = 1/6 dan P(dadu pertama 6, dadu kedua 1) = P(A and B) = 1/36 = P(A) P(B) menunjukan independence
Aturan-Aturan Probabilitas • Multiplication Rule Contoh dari kasus Dependent: lempar sepasang dadu S = {(1,1),(1,2),….(6,6)} 36 kemungkinan outcomes mis A ={dadu pertama 6} = {(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} mis B = {jumlah dadu pertama & kedua =9} = {(3,6),(4,5),(5,4),(6,3)} Maka P(A) = 6/36 = 1/6; P(B) = 4/36 = 1/9 dan P(dadu pertama 6, jumlah = 9) = P(A and B) = 1/36 tdk sama P(A) P(B) = 1/54 menunjukan dependence
Aturan-Aturan Probabilitas • Contoh: suatu web site memp tiga server A, B, dan C, yg dipilih secara independent dg probabilitas: P(A) = ¼, P(B) = ½, P(C)= ¼. (a) Cari probabilitas A atau B dipilih P(A or B) = ¼ + ½ = 3/4 (b) Cari probabilitas A tdk dipilih P(Ac) = 1 – P(A) = ¾ (c) Cari probabilitas server A dipilih dua kali P(AA) = P(A)P(A) = 1/16 (d) Cari probabilitas urutan seleksi server ABCA P(ABCA) = P(A)P(B)P(C)P(A) = (1/4)(1/2)(1/4)(1/4) = 1/128
Conditional Probability • Utk dua event A dan B probabilitas dari event A diberikan bhw event B telah terjadi dinyatakan: P(A|B) dan ditentukan dg P (A|B) = P(A and B)/P(B) Contoh: Lempar satu dadu S = {1,2,3,4,5,6}. mis A ={2}, B={bil genap} = {2,4,6}, P(A|B) = P(A and B)/P(B) = (1/6)/(1/2) = 1/3
Bayes Rule • Utk dua event A dan B yg mempartisi sample space, yaitu (A atau B) = S dan event ketiga C ditentukan di atas A dan B Contoh: Lempar sepasang dadu S = {(1,1) (1,2), …. (6,6)} 36 kemungkinan outcomes. Mis A ={jumlah dadu 9 atau lebih besar}, A = {(6,3),(5,4), (4,5), (3,6), (6,4), (5,5), (4,6), (6,5), (5,6), (6,6)} B = Ac = {jumlah dadu 8 atau kurang} = {(1,1) , (1,2,) ….(6,2), …(2,6)} --- cat P(A) = 10/36 dan P(B) = 26/36
Bayes Rule • Mis C event jumlah dari dadu adalah bil genap {2,4,6,8,10,12}, P(C|A) =4/10 dan P(C|B) = 14/26
Latihan Soal • Suatu kantong berisi empat bola putih dan tiga bola hitam sedangkan kantong kedua berisi tiga bola putih dan lima bola hitam. Satu bola diambil dari kantong pertama tanpa melihatnya dan dimasukkan ke kantong kedua, berapakah peluang mengambil sebuah bola hitam dari kantong kedua? 2. Peluang seorang lelaki yg telah kawin menonton suatu film seri di tv adalah 0.4 dan peluang seorang wanita yg telah kawin menonton film yg sama 0.5. peluang seorang lelaki menoton film tsb bila istrinya menonton adalah 0.7. hitunglah • Peluang sepasang suami istri menonton film tsb • Peluang seorang istri menonton film tsb bila suaminya menonton film • Peluang paling sedikit seorang dari sepasang suami istri menonton film tsb
Random Variables • Suatu random variable X adalah suatu variable dimana harganya tergantung pd outcome dari suatu eksperimen random didefinisikan pd sample space S • Contoh: Mis X, bilangan jumlah dari head pd pelemparan dua coin yg fair. Sample space S dari eksperimen adalah: S ={(t,t),(t,h),(h,t),(h,h)} dimana t menunjukan tail dan h menunjukan head
Random Variables • Suatu random variable X dikarakteristikan oleh salah satu: • probability density function (pdf): f(x) • cumulative density function (cdf): • Contoh: perhatikan random variable X, yg merupakan jumlah head pd pelemparan dua coin • f(x) diberikan dg P{X = 0} = .25; P{X=1} = .5 ; P{X=2} = .25 • F(x) diberikan dg
Probability Density Function • Formula matematis • Memperlihatkan semua harga, X, & frekuensi, f(X) • f(X) adalah probability density function (pdf) • Properties • Area di bawah kurva = 1 • Mean (µ) • Standard Deviation ()
Tipe-Tipe Random Variables • Suatu random variable Xadalah suatu variable dimana harganya tergantung pd outcome dari suatu eksperimen random didefinisikan pd sample space S • Jika Sadalah terbatas (finite) atau dp dihitung (countable) Xadalah suatu discrete random variable (mis., jumlah head pd pelemparan dua coin) • Jika Sadalah kontinyuXadalah suatu random variable kontinyu (mis., waktu antar queries ke suatu server database)
Tipe-Tipe Random Variables • Jika Xdiscrete random variables maka • Jika Xcontinuous random variables maka
Discrete Random Variables • Discrete Random Variables yg umum: • Bernoulli, Geometric, Binomial dan Poisson • Bernoulli– memodelkan eksperimen spt toss suatu coin • X adalah suatu indicator function • X = 1 sukses; X = 0 gagal Spt coin toss dg probabilitas p mendpkan head, 1-p mendpkan tail
Discrete Random Variables • Geometric – memodelkan jumlah percobaan X sampai sukses pertama pd suatu deretan percobaan Bernoulli trials P{X = x} = f(x) = (1-p)x-1p; dimana x = 1,2,3, … Mean = 1/p Variance = (1-p)/p2 Sbg contoh, memodelkan jumlah tail yg terlihat sblm head pertama pd suatu deretan coin tosses
Discrete Random Variables • Binomial – memodelkan jumlah sukses Xpd npercobaan/trials. Mis pmenyatakan probabilitas sukses pd 1 trial, probabilitas dari ksukses diberikan dg Mean = np, Variance = np(1-p) Tabel pd textbook memp macam-macam harga dari P(X = k)
Continuous Random Variable • Continuous Random Variables yg umum: • Exponential, Uniform, Normal • Exponential – memodelkan waktu antar kedatangan, lama waktu pelayanan (mis., waktu dari panggilan telepon), mis Xsuatu exponential random variable dg mean a.
Continuous Random Variable • Uniform– memodelkan kasus “equally likely”. Mis. X uniform random variable antara adan b– yaitu Xakan mempunyai harga antara adan bdengan kemungkinan “equally likely”
Continuous Random Variable • Normal – Normal random variable memodelkan fenomena random alamiah utk jumlah yg besar. Mis Xsuatu normal random variable • Standard Normal Z adalah kasus dimana: Mean = 0, Variance = 1.
Z Scores & Probability • Normal Distribution • Hubungan langsung antara persentase dan probabilitas • Persentase dari kurva normal dp di- rephrased sbg problem probabilitas
Z Scores & Probability • Berapakah probabilitas bhw pekerja pabrik yg dipilih random akan melaksanakan test dibawah 81 seconds atau diatas 75 seconds? • Suatu konsultan menyelidiki waktu diperlukan pekerja pabrik utk assemble suatu part stlh mereka ditraining • Konsultan menentukan bhw waktu dlm detik terdistribusi normal dg mean µ = 75 seconds dan standard deviation = 6 seconds. P(X<x) = P(Z <z) dimana z = (x- µ)/
Moments • Ekspektasi E[x]atau mean atau first moment dari suatu random variable X di definisikan dg Moment lebih tinggi didp dg mengganti x dg xn
Variance, Mode, Quantile • Variance didefiniskan sbg • Mode adalah titik dimana f(x) adalah maximum • Quantile – quantile dari X ditulis x adalah titik pd X dimana F(x)= • Cat. 0,5 quantile disebut median dimana 50% harga pd kedua sisi
Aturan-Aturan untuk Random Variables • Aturan utk Means • Suatu transformasi linier dari suatu random variable menghasilkan suatu linear scaling dari mean. Yaitu jika X adalah suatu random variable dg mean µXdan a dan b adalah konstanta maka jika Y = aX + b mean dari Y diberikan oleh µY = aµX + b • Mean dari sum dari suatu set dari random variables adalah sum dari individual mean. Yaitu jikaf X dan Y adalah random variables maka µX+Y = µX + µY
Aturan-Aturan untuk Random Variables • Aturan utk Variances • Suatu transformasi liniear dari suatu random variable menghasilkan suatu squared scaling dari variance. Yaitu jika X adalah suatu random variable dg variance x2dan a dan b adalah konstanta maka jika Y = aX + b variance dari Y diberikan oleh y2 = a2x2 • Variance dari sum dari suatu set dari independent random variables adalah sum dari individual variances. Yaitu jika X dan Y adalah random variables maka x+y2= x2+ y2
Statistical Inference • Menggunakan teori probabilitas utk membuat kesimpulan mengenai suatu populasi dari data sampel • Tdk dp memperoleh data dari setiap anggota populasi maka menguji suatu sampel random dari populasidan berdasarkan statistik dari sampel menyimpulkan mengenai parameter dari populasi
Statistical Inference • Statistical Inference: menggunakan statistik dari suatu sampel random utk menyimpulkan mengenai parameter dari suatu populasi • Sbg contoh menguji mean x dari sampel utk menyimpulkan mean dari populasi µ • Perlu mengerti bagaimana perubahan statistik dengan tiap sampel • Sample Distribution: distribusi probabilitas dari suatu statistik (spt mean, standard deviation) dari semua sampel yg mungkin dari ukuran yg sama dari suatu populasi
Distribusi Sampel dariCounts dan Proportions • Perhatikan suatu sampel random tetap (fixed) ukuran n dari observasi independen dari suatu populasi. Tiap observasi jatuh kedalam satu dari dua kategori, “sukses” atau “gagal” • Probabilitas suatu “sukses” (p) sama utk tiap observasi • Probabilitas suatu “gagal” (1-p) • Mis X menyatakan count dari jumlah sukses dalam suatu sampel ukuran n. X memp distribusi Binomial
Distribusi Sampel dariCounts dan Proportions • Ingat distribusi Binomial memodelkan jumlah sukses X dlm n percobaan Bernoulli dan memp. Mean = np, Variance = np(1-p) • Dg n bertambah besar distribusi dari X mendekati distribusi Normal dg mean dan variance
Distribusi Sampel dariCounts dan Proportions • Utk estimasi probabilitas atau proportion dari suatu populasi p kita uji sample proportion: dimana X adalah jumlah dari “sukses” dlm suatu sampel ukuran n • adalah estimasi unbiased dari population proportion p. • Jika ukuran sampel n besar, mendekati suatu distribusi Normal dg
Sample Distribution of Means • Perhatikan suatu sampel random ukuran tetap n dari suatu populasi dg mean µdan standard deviation . Distribusi dari sample mean x (jika dihasilkan dari repeated random samples) memp. mean = µdan standard deviation • Jika populasi memp. distribusi Normal maka distribusi dari sample mean adalah Normal • Dari Central Limit Theorem – distribusi dari suatu sum dari random variables mendekati distribusi Normal jika jumlah terms dlm sum menjadi besar
Central Limit Theorem • Central limit theorem menyatakan bhw dg bertambah besarnya ukuran sampel n, tdk tergantung pd distribusi populasi, distribusi dari sample mean mendekati distribusi Normal utk ukuran sampel yg besar, dg mean = µ dan standard deviation =
Tipe-Tipe Statistical Inference • Confidence Intervals: mengestimasi harga suatu parameter populasi dg suatu harga rentang • Berapakah mean IQ dari mahasiswa SIT ITB? • Berapakah proporsi dari switches pd suatu network perlu perbaikan? • Hypothesis Testing: menilai bukti yg disediakan data menyetujui suatu claim mengenai populasi • Apakah mean IQ dari mhs SIT ITB sama dg dg IQ populasi secara umum? • Apakah proporsi switches yg memerlukan perbaikan pd jaringan Telkom berbeda dg proporsi pd jaringan Indosat?
Point Estimation • Menyediakan harga tunggal/single value, mis., sample mean, sample proportion • Berdasarkan observasi dari 1 sample • Tdk memberikan informasi mengenai seberapa dekat harga point estimate thd parameter populasi yg tdk diketahui • Contoh: Sample mean X = 22.9 adalah point estimate dari mean populasi yg tdk diketahui µ
Interval Estimation • Menyediakan nilai interval (a, b) dimana parameter populasi µ diprediksi berada • Interval berdasarkan observasi dari 1 sampel • Memberikan informasi mengenai seberapa dekat dari estimasi ke parameter populasi yg tdk diketahui • Dp dinyatakan sbg • Atau dinyatakan dlm terms probabilitas, (confidence level)
Level of Confidence • Nilai adalah probabilitas bhw parameter tidak berada dalam interval (a,b) • 100(1 - ) % adalah confidence level dan adalah kemungkinan bhw parameter populasi yg tdk diketahui jatuh dlm interval (a,b) • Nilai tipikal adalah = .1, .05, .01 yg memberikan confidence levels masing-masing 90%, 95%, dan 99% • Contoh: Mean populasi yg tdk diketahui terletak antara 50 & 70 dg 95% confidence
Confidence Interval utkPopulation Mean • Asumsi • Standard deviation populasi diketahui • Ukuran sampel ncukup besar shg hasil central limit theorem dp diaplikasikan dan sample mean distribution dp diperkirakan dg distribusi normal. Aturan umum (Rule of thumb) utk ukuran sampel adalah (n ≥ 30) • 100(1-) % confidence interval pd sample mean diberikan oleh