280 likes | 428 Views
常態分配與信賴區間. 假設現在是市長選舉期間,甲候選人想要知道自己目前的支持率,於是委託民調公司作支持率的民意調查。假設全部的合格選民有一百萬人,民調公司準備用簡單隨機抽樣的方式,選出一千個合格選民來詢問他們的支持意向,再藉此推論甲候選人的支持率。這樣一來,所有的合格選民就是此次抽樣調查的母體,而所選出的一千人就是此抽樣調查的一個樣本。. A . 常態分配
E N D
常態分配與信賴區間 假設現在是市長選舉期間,甲候選人想要知道自己目前的支持率,於是委託民調公司作支持率的民意調查。假設全部的合格選民有一百萬人,民調公司準備用簡單隨機抽樣的方式,選出一千個合格選民來詢問他們的支持意向,再藉此推論甲候選人的支持率。這樣一來,所有的合格選民就是此次抽樣調查的母體,而所選出的一千人就是此抽樣調查的一個樣本。
A. 常態分配 前面談到的甲候選人支持率的民意調查,事實上可以轉換成估計銅板正面的機率的問題。我們可假設甲候選人目前實際的支持率為p,也就是一百萬的合格選民中支持甲候選人的有 人。那麼任選一位合格選民,其將會回答支持甲候選人的機率顯然為p。因此,簡單隨機抽樣調查一千個合格選民就相當於丟擲一枚正面機率為p的銅板一千次的試驗,而推論甲候選人支持率的問題就相當於推論銅板正面之機率的問題,所以接下來會詳細討論丟擲銅板的試驗。
現在將丟擲公正銅板20次的正面次數的機率分配圖呈現如下圖1.現在將丟擲公正銅板20次的正面次數的機率分配圖呈現如下圖1. 圖1.
上面的直方圖左右是對稱的,並且在正面次數為10的位置機率最大。進一步將每個直立長方形的頂邊的中點以連續的平滑曲線連接起來,就會呈現出下面像鐘形的曲線(圖2)。上面的直方圖左右是對稱的,並且在正面次數為10的位置機率最大。進一步將每個直立長方形的頂邊的中點以連續的平滑曲線連接起來,就會呈現出下面像鐘形的曲線(圖2)。 圖2.
其實不只公平銅板的正面次數機率分配圖會形成鐘形的圖,有偏差的銅板也會有類似的表現,只是圖形不再完全對稱,請看以下對於正面機率 的銅板丟擲20次所作的正面次數機率分配圖(圖3)。 圖3
像上面的鐘形曲線在統計上是很常見的。事實上,重複作某試驗,將各種結果的相對次數百分比作成分配圖,就會出現上面的鐘形曲線。 像上面的鐘形曲線在統計上是很常見的。事實上,重複作某試驗,將各種結果的相對次數百分比作成分配圖,就會出現上面的鐘形曲線。 附錄一亂數表的設計使得0,1,2,……,9等10 個阿拉伯數字出現的機率均等,因此若令1,3,5,7,9對應到銅板正面,而0,2,4,6,8對應到銅板反面,就可以利用亂數表來模擬丟擲公平銅板的試驗。 現在就利用亂數表來模擬丟擲公正銅板20次的試驗。我們將操作50回,並記錄每回正面出現的次數,然後計算各種正面次數在50回中所佔的百分比,製成直方圖後與圖1作比較,看看實驗值與理論值符合與否。
為了方便起見,先選亂數表的第1行的各列(共25列)的第1個數字作起始數字,然後分別在各列向右依次取20個數字,再計算各組的奇數的個數(奇數對應到正面)。像第1列的前20個數字依次為1306, 1189, 5731, 3968, 5606。其中奇數有1, 3, 1, 1, 9, 5, 7, 3, 1, 3, 9, 5等共12個,這表示此回模擬丟銅板20次共得12次正面。仿照這樣的方式,經計算得各組的奇數個數分別為12, 7, 6, 10, 8, 10, 10, 8, 10, 10, 14, 9, 10, 10, 10, 8, 12, 9, 11, 11, 14, 9, 12, 9, 11。現在再以第21行的各列(共25列)的第1個數字為開頭,分別在各列向右依次取20個數字,再計算各組的奇數的個數。經計算得各組的奇數個數依次為10, 8, 10, 10, 16, 11, 13, 12, 9, 10, 12, 8, 12, 7, 8, 10, 4, 9, 7, 6, 12, 4, 13, 9, 12。
以下是將上面求得的50個數字統計整理所製成的分配次數百分比的統計表(表1):以下是將上面求得的50個數字統計整理所製成的分配次數百分比的統計表(表1): 表1 將上面的統計表以直方圖表示如下: 圖4
上面的直方圖仍是以橫軸坐標為10時最高,並且大致以其為對稱中心,若與圖1比較,實驗值與理論值頗相符合。這裡也請注意到,因為圖1與4都是機率分配的直方圖,所以各直立長方形的面積總和都是1。如果將橫軸改成標示正面次數的比例(即 ),並適當調整各直立長方形的高度(即將原高度乘以20),使得各長方形的面積不變,則圖1就變成以下的圖5,此時各長方形頂邊中點以平滑曲線連接所形成的鐘形曲線似乎與直方圖更吻合了。 圖5
前面提到的鐘形曲線圖一般常用來表示常態分配(normal distribution)。理論上,常態分配是一種連續型隨機變數的機率分配,上面的丟銅板試驗的正面次數並非連續型的隨機變數,看起來並不相關,但事實上兩者是非常有關聯性的。為了說明兩者的關聯性,先來介紹常態分配曲線的幾個性質(圖6)。 1. 曲線是左右對稱的,在對稱軸的兩側其高度逐漸遞減(但無限延伸)。對稱軸的兩側的曲線上各有一點P與Q,其左右的曲線凹口方向上下相反,稱為反曲點(圖7)。
2. 對稱軸與橫軸相交的位置記作 (讀作mu),是此常態分配的期望值;反曲點與對稱軸的距離記作 (讀作sigma),是此常態分配的標準差。常態分配的位置與形狀分別由 和 來決定(圖7)。 3. 68-95-99.7規律(圖7): (1)橫軸上與 相距在一個標準差(即 )以內的部分到曲線之間的面積 約為0.68。 (2)橫軸上與 相距在兩個標準差(即2 )以內的部分到曲線之間的面 積約為0.95(更精確的值約為0.9545)。 (3)橫軸上與 相距在三個標準差之內的部分到曲線之間的面積約為 0.997。
有了常態分配曲線的概念之後,現在可以來討論丟擲銅板多次,其正面次數的機率分配與常態分配之間的關係。假設銅板正面的機率為p,今丟擲n次,並令表示出現正面的次數,因此 就是出現正面的比例。數學上有了常態分配曲線的概念之後,現在可以來討論丟擲銅板多次,其正面次數的機率分配與常態分配之間的關係。假設銅板正面的機率為p,今丟擲n次,並令表示出現正面的次數,因此 就是出現正面的比例。數學上 可以證明:當n夠大時, 的機率分配圖大致上與 , 的 常態分配曲線相符合。以下是 , 時 的機率分配圖 , 的常態分配曲線放在一起的情形(圖8): 圖8
將上述結果與常態分配的68-95-99.7規律配合起來就有以下的結果:將上述結果與常態分配的68-95-99.7規律配合起來就有以下的結果:
信賴區間 前面討論如何以常態分配曲線來逼近丟擲銅板時正面次數的機率分配。現在讓我們回到本節開頭時所關心的問題,那就是如何由丟擲銅板多次所呈現的結果來推論銅板正面的機率。假設銅板正面的機率為p,但我們並不知道(也就是只有「天知道」)。現在準備丟擲n次,然後統計出現正面的次數 X,接著計算正面出現的比例 。先前在3-2節的結果與本節前半部的知識都告訴 我們:當n夠大時, 與 p 接近的機率頗大,這個結果提示我們 p 就在 的附近的機率很大,其實先前的知識曾經給出頗為精確的估算,例如 。
不過上面的式子在p不知道的情況下,也就不能求得 ,因而 與 p 相差多少就不清楚了。幸好,當n大時, 幾乎都在 p 附近且 的變動也很小,所以若將 中的 p 以 取代,我們仍可以證明 ,也就是說,
我們說:區間 會包含p的機率為0.95(或寫成95%)。統計學上的說法就是:我們說:區間 會包含p的機率為0.95(或寫成95%)。統計學上的說法就是: 是p的一個95% 信心水準(confidence level)的信賴區間(confidence interval)。
一般人對於95%會發生的事件應該有極大的信心它會發生。現在就讓我們利用前面所作的50回丟擲公正銅板20次所得的結果(表1),來驗證此理論是否有效。因為丟擲20次,所以 ,每回的模擬都可以得到一個正面次數x,進而得到一個區間 由前面的統計表知道:
由上面的統計表可知:所得的區間會包含 的佔全部區間 (50個)的94%,這個數值與信心水準95%相當接近。
如上述已建構好信賴區間之後,接著進行實際的試驗,這裡就是丟擲銅板n次的試驗。假設得到正面次數為x,於是就對應到一個關於p的95%信心水準的信賴區間: 。 請注意,我們無法確定所得的信賴區間是否包含 p 值,但我們確是從一堆區間中隨機選出一個區間,這堆區間中的95%有包含 p 值。
一般常直接用 作為 p 的估計值,但須報告誤差範圍,因此會這樣作報告:p 值為 ,在95%的信心水準下,誤差為 。例如,某次抽樣調查甲候選人的支持率,經抽樣1000人,其中有345人表示支持,因此 而 因此我們可以這樣作報告:甲候選人的支持率是34.5%,在95%的信心水準下,誤差為 。
例題1. 為推行某項公共政策,政府先委託民意調查機構作調查。假設電話訪問1200位成年人,其中有453位表示贊成,有522位表示反對,225位沒有意見,請試以95%信心水準為此次調查作一個報告。 解:抽樣的樣本數為 ,贊成者、反對者與無意見者所佔比例依次為 ,即0.3775,0.435,0.1875。所以贊成、反對、無意見各佔37.75%,43.5%,18.75%。但報告時須說明信心水準與誤差, 若採95%信心水準,誤差一般採 的最大值, 即 時所對應的誤差值 。故可作以下的報告:贊成、反對、無意見者各佔37.75%,43.5%,18.75%,在95%信心水準下,誤差為 。
有時我們需要像99%這樣高的信心水準,此時的信賴區間是 有時我們需要像99%這樣高的信心水準,此時的信賴區間是 但此時的區間寬度變大了,也就是誤差變大了,這樣對於實際p值的描述也就變得較不明確,為了縮小誤差,一個補救的辦法就是增加n,也就是增大樣本數,請看以下的例題。
例題2. 某項重要民生議題各方意見分歧,政府決定委託民調公司作民意調查,為求慎重,要求在95%信心水準下,至多只能有的誤差。試問此次抽樣調查的樣本數至少需要多少才能滿足上述要求? 解:設樣本數為n,在95%信心水準下的誤差是 , 今要求此誤差至少多為 , 即 , 經化簡得 的最大值為 , 所以n至少是 才能保證誤差至少是 。 一般而言,提高信心水準會使得信賴區間變寬,而模糊了對於p值的判讀,但若增加抽樣的樣本數,則可以彌補上述的缺點。
標準常態分配 理論上,常態分配是一種連續型的機率分配,現在以期望值 且 標準差這種稱為標準常態分配(standard normal distribution)為例子說明如下:設Z是一個具有標準常態分配的隨機變數,那麼對於任何兩個實數a,b (設 ),Z會介於 a 和 b 之間的機率就是在標準常態分配曲線下方和區間[a, b]之間的面積(圖9)。例如,Z會介於 和1之間的機率是0.68,而介於 和2之間的機率則是0.95。
對於一般具有期望值 和 標準差的常態分配的隨機變數 X 而言,可以證明 就會具有標準常態分配。因此 會介於 和1之間的機率是0.68,也就是說X會介於 和 之間的機率是0.95,X會介於 和 之間的機率是0.997,這就是68-95-99.7規律的由來。另外,x會介於 和 之間的機率為99%,此可用來建立99%信心水準的信賴區間。