630 likes | 857 Views
統計學 : 應用與進階 第 6 章 : 常用的連續隨機變數. 均勻隨機變數 指數隨機變數 指數隨機變數與 Poisson 隨機變數之間的關係 常態隨機變數. 均勻隨機變數. 如果隨機變數 X 的實現值在區間 [l , h] 中的任何次區間 (subinterval) 的機率值為該次區間佔 [l , h] 區間之比率 , 則稱隨機變數 X 為在 [l , h] 間的均勻隨機變數 (uniform random variables), 或稱隨機變數 X 服從均勻分配 (uniform distribution), 我們以 X ∼ U[l , h] 表示之.
E N D
統計學: 應用與進階 第6 章: 常用的連續隨機變數
均勻隨機變數 • 指數隨機變數 • 指數隨機變數與Poisson 隨機變數之間的關係 • 常態隨機變數
均勻隨機變數 • 如果隨機變數X 的實現值在區間[l , h] 中的任何次區間(subinterval) 的機率值為該次區間佔[l , h] 區間之比率, 則稱隨機變數X 為在[l , h]間的均勻隨機變數(uniform random variables),或稱隨機變數X 服從均勻分配(uniform distribution), 我們以X ∼ U[l , h] 表示之
均勻隨機變數 • 機率密度函數
均勻隨機變數重要性質X ∼ U[l , h] • X 的CDF: • 若X ∼ U[0, 1], 稱之為標準均勻隨機變數(standard uniform random variables), 其CDF為
均勻隨機變數重要性質X ∼ U[l , h] • X 的期望值: • X 的變異數:
均勻隨機變數重要性質X ∼ U[l , h] • X 的中位數: x0.5 = E(X) • 因此, 我們可以解出 亦即均勻隨機變數的中位數等於期望值
均勻隨機變數線性變換不變性 • 若X ∼ U[0, 1] • 且Y = aX + b, a > 0 • 則 Y ∼ U[b, a + b]
均勻隨機變數線性變換不變性 • 若X ∼ U[0, 1] • 且W = (h − l )X + l • 則 W ∼ U[l , h] • 任何一個一般化的均勻隨機變數W ∼ U[l , h],我們都可以將W 寫成標準均勻隨機變數 X ∼ U[0, 1] 的線性函數: W = (h − l )X + l
均勻隨機變數線性變換不變性 • 若W ∼ U[l , h] • 且Z = aW + b, a > 0 • 則 Z ∼ U[al + b, ah + b]
均勻隨機變數的應用 • 網購賣家的底價為$10,000 • 競標對手的出價為X, 簡單假設 X ∼ U[10000, 15000] • 試問 • 如果你出價$12,000, 試問你網購成功的機率? • 如果你出價$14,000, 試問你網購成功的機率? • 如果你想要極大化你的網購成功機率, 請問你該 出價多少?
指數隨機變數 • 在間斷隨機分配中, 我們介紹過Poisson 分配,衡量的是一段期間內, 事件發生次數的機率, 譬如說, 一小時內出現的公車班次 • 相對應的, 我們也可以衡量兩班公車之間的等待時間, 而刻劃等待時間的機率分配即為指數分配
指數隨機變數 • 我們稱隨機變數X 為一指數隨機變數(exponential random variables), 如果其機率密度函數為 supp(X) = {x|x ∈ [0,∞)}, 並以X ∼ exp(θ)表示之
指數隨機變數的CDF • x 分鐘內公車會到達 • 至少要等x 分鐘公車才會到達
標準指數隨機變數 • 若W ∼exp(1), 則
指數隨機變數的不變性(invariance under positive scaling) • 若W ∼ exp(1) • 且 X = θW, θ > 0, • 則 X ∼ exp(θ) E(X)=E(θW)= θ E(1)= θ V(X)=V(θW)= θ2E(1)= θ2
θ的意義 • 指數隨機變數除了用來刻劃「等待時間」, 也可用來刻劃「存續時間」(length of life or duration) • 因此, 參數 θ = E(X) 除了可以詮釋為預期等待時間, 也可以看做是預期存續時間, 或稱預期壽命
指數隨機變數的無憶性 • 若X ∼ exp(θ), P(X > m + n|X > m) = P(X > n) • 譬如說, 你已經在站牌底下等了m 分鐘的公車,此時, 阿慶也加入等公車的行列。顯而易見的,無論是你或阿慶, 至少再等n 分鐘後公車才來的機率是相同的 • 也就是說, 給定你已經等了m 分鐘, 然後你得至少再等n 分鐘的條件機率P(X > m + n|X > m) 等同於阿慶至少再等n分鐘的非條件機率P(X > n)
指數隨機變數vs. Poisson 隨機變數 • 指數分配與Poisson 分配猶如一體的兩面, Poisson 分配, 衡量的是一段期間內, 事件發生次數的機率, 而指數分配衡量的是兩接連事件發生之間的等待時間 • 令T 代表從零時(原點) 開始直到第一次事件發生的等待時間。舉例來說, T 代表今天第一班公車到來前的等待時間
指數隨機變數vs. Poisson 隨機變數 • 等待時間T 的機率分配為: • F(t) = P(T ≤ t) = 1 − P(T > t) = 1 − P(在[0, t] 的區間內沒有公車抵達)
指數隨機變數vs. Poisson 隨機變數 • 假設根據過去經驗, 單位時間[0, 1] 內, 平均有 λ輛的公車會抵達, (亦即[0, t] 期間有t 輛的公車會抵達) • 令X 代表在[0, t] 的區間內公車的抵達班次,根據Poisson 分配, 其機率為
指數隨機變數vs. Poisson 隨機變數 • 因此, 在[0, t] 的區間內沒有公車抵達(X = 0)的機率就是 P(X = 0) = P(在[0, t] 的區間內沒有公車抵達) = • 從而,F(t) = 1 − P(在[0, t] 的區間內沒有公車抵達) = 1 −
Exponential Distribution Example Example: Customers arrive at the service counter at the rate of 15 per hour. What is the probability that the arrival time between consecutive customers is less than three minutes? • The mean number of arrivals per hour is 15, so • λ = 1/θ=60/4=15 • Three minutes is 0.05 hours • P(arrival time < .05) = 1 – e-λX = 1 – e-(15)(0.05) = 0.5276 • So there is a 52.76% probability that the arrival time between successive customers is less than three minutes
Example • Suppose the earthquakes occur in the eastern part of Taiwan un accordance with the assumptions of the Poisson probability distribution at a rate of 2per day. • Find the probability that at least 3 earthquakes occur during the next 2 days. • Find the probability distribution of the time, starting from now , until the next earthquake.
Example • Ans: • λ = 2次/天 表示在未來兩天發生地震的次數
Example • Ans: • 令T表從現在開始到下次地震發生所需時間
常態分配(normal distribution) 又稱Gaussian分配(Gaussian distribution)。這是因為德國數學家Johann Carl Friedrich Gauss (1777–1855)在常態分配的發展歷史中, 佔有決定性的地位 • Gauss 導出了常態分配作為量測誤差的機率分配。到了十九世紀中葉, 常態分配已被視為自然界各種觀察所必見的分配, 在大多數的情況下,觀測值資料的次數分配(empirical distribution)多近似於常態分配, 是故此分配以「常態」命名之
常態隨機變數 • X 為期望值E(X) = μ, 變異數Var (X) = 的常態隨機變數, 若其機率密度函數為 supp(X) = {x| −∞ < x < ∞}, = 3.14159為圓周率, 一般以X ∼ N(μ,) 表示之 • 參數μ 既是X 的期望值, 也是中位數與眾數
有關常態分配的幾個重要事實 • 常態分配機率密度函數為鐘型(bell shapedcurve) • 常態分配機率密度函數的最大值為Φ(μ) (亦即期望值等於眾數) • 常態分配機率密度函數對稱於期望值, 期望值左右兩側密度函數下的面積分別為1/2 (亦即期望值等於中位數) • 常態分配機率密度函數尾端部分趨近於±∞ • μ 增加(減少) 使整個機率密度函數右移(左移)
標準常態隨機變數 • 將常態隨機變數X 標準化 則稱Z 為標準常態隨機變數(standard normalrandom variables), 具有機率密度函數為
標準常態隨機變數 • 我們以Z ∼ N(0, 1) 表示之
我們通常以希臘字母 與 分別代表標準常態隨機變數的機率密度函數與分配函數:
有關標準常態分配的幾個重要數字 • 若X ∼ N(0, 1), 則 • P(X ∈ ± 1 ) = 0.683 • P(X ∈ ± 2) = 0.955 • P(X ∈ ± 3) = 0.997 • P(X ∈ ± 1.64 )= 0.90 • P(X ∈ ± 1.96) = 0.95 • P(X ∈ ± 2.58) = 0.99
標準常態隨機變數的機率值之計算 • 對於標準常態隨機變數Z ∼ N(0, 1), 給定a > 0, 我們可以透過查表計算Φ(a) = P(Z ≤ a) 的機率值 • 以下常態分配的對稱性質可以幫助我們查表: • P(Z ≤ 0) = P(Z ≥ 0) = 0.5 • P(Z ≤ −a) = P(Z ≥ a) • P(−a ≤ Z ≤ 0) = P(0 ≤ Z ≤ a)
Normal Distribution Probability Probability is area under curve! ( ) f x x c d
s = 1 m = 0 1.96 Z The Standard Normal Table: P(0 < z< 1.96) Standardized Normal Probability Table (Portion) .06 Z .04 .05 1.8 .4671 .4678 .4686 .4750 .4750 1.9 .4738 .4744 2.0 .4793 .4798 .4803 2.1 .4838 .4842 .4846 Shaded area exaggerated Probabilities
s = 1 .3962 .3962 m = 0 The Standard Normal Table:P(–1.26 z 1.26) Standardized Normal Distribution P(–1.26 ≤ z ≤ 1.26) = .3962 + .3962 = .7924 Z –1.26 1.26 Shaded area exaggerated
s = 1 .5000 .3962 m = 0 The Standard Normal Table:P(z > 1.26) Standardized Normal Distribution P(z > 1.26) = .5000 – .3962 = .1038 Z 1.26
s = 1 .4973 .4772 m = 0 The Standard Normal Table:P(–2.78 z –2.00) Standardized Normal Distribution P(–2.78 ≤ z ≤ –2.00) = .4973 – .4772 = .0201 –2.78 –2.00 Z Shaded area exaggerated
s = 1 .4834 .5000 m = 0 The Standard Normal Table:P(z > –2.13) Standardized Normal Distribution P(z > –2.13) = .4834 + .5000 = .9834 Z –2.13 Shaded area exaggerated
Standardized Normal Distribution s = 1 m = 0 Z One table! Standardize the Normal Distribution Normal Distribution s m X
Normal Distribution Standardized Normal Distribution s s = 10 = 1 .0478 m m = 0 .12 Z = 5 6.2 X Shaded area exaggerated Non-standard Normal μ = 5, σ = 10: P(5 < X< 6.2)
Normal Distribution Standardized Normal Distribution s s = 10 = 1 .0478 m m = 0 Z 3.8 = 5 X -.12 Shaded area exaggerated Non-standard Normal μ = 5, σ = 10: P(3.8 X 5)
Normal Distribution Standardized Normal Distribution s s = 10 = 1 .1664 .0832 .0832 Z 2.9 5 7.1 X -.21 0 .21 Shaded area exaggerated Non-standard Normal μ = 5, σ = 10: P(2.9 X 7.1)
Standardized Normal Distribution Normal Distribution s = 1 s = 10 .5000 .3821 .1179 m = 0 .30 Z m = 5 8 X Shaded area exaggerated Non-standard Normal μ = 5, σ = 10: P(X 8)
Normal Distribution Standardized Normal Distribution s s = 10 = 1 .1179 .0347 .0832 m m Z = 5 X = 0 7.1 8 .21 .30 Shaded area exaggerated Non-standard Normal μ = 5, σ = 10: P(7.1 X 8)