第 8 章

第 8 章 區間估計

統計實例 • Food Lion 於 1957 年成立時的名稱是 Food Town，目前已是美國最大的連鎖超市之一，在美國的東南部 11 州共有 1,200 家分店。 • Food Lion 建立了七類存貨組合的 LIFO 指標，包括雜貨、紙類/家用品、寵物用品、美容保健產品、乳品、香菸/菸草，以及啤酒/酒。 • 最近一年，美容保健產品類的 LIFO 指標是 1.015，以 95% 的信賴水準，Food Lion 求算樣本估計值的邊際誤差是 0.006。 • 母體的 LlFO 指標的 95% 區間估計值是 1.009 到1.021。此種準確度是很理想的。第8章區間估計第292頁

第 8 章區間估計 • 8.1 母體平均數：σ 已知 • 8.2 母體平均數：σ 未知 • 8.3 樣本大小的決定 • 8.4 母體比例第8章區間估計第291頁

邊際誤差與區間估計值 點估計量的值不會恰好等於母體參數值。區間估計值 (interval estimate)通常是由點估計值加或減某個值求得，我們稱這個加減值是邊際誤差 (margin of error)。區間估計值的一般形式是：點估計值 邊際誤差區間估計值可以讓我們瞭解：點估計值與母體參數值的接近程度。第8章區間估計第292頁

邊際誤差與區間估計值 母體平均數的區間估計值的通式如下：第8章區間估計第292-293頁

8.1 母體平均數：σ 已知 • 為了求算母體平均數的區間估計值，必須知道母體的標準差 σ 或樣本的標準差 s 以計算邊際誤差。 • σ 很少是已知的數值，但歷史資料或其他某些可用的訊息，讓我們得以在抽樣前取得母體標準差的優良估計值。 • 在此情況下，可視母體標準差已知，我們稱此為 σ 已知 (σ known)的情況。第8章區間估計第293頁

母體平均數的區間估計：σ 已知 • 母體平均數的區間估計值：σ 已知其中：為樣本平均數1 -α為信賴係數 zα/2為右尾面積α/2 的標準常態分配的 z值 σ為母體標準差 n 為樣本大小第8章區間估計第296頁

邊際誤差與區間估計：σ已知(實例) • CJW 例子中的歷史資料顯示，滿意度分數的母體是標準差 σ＝20 的常態分配。第8章區間估計第293-294頁圖8.1

邊際誤差與區間估計：σ已知(實例) • 利用標準常態分配表，我們可以發現有 95% 的常態分配隨機變數的值會落在離平均數 ±1.96 個標準差內。因為的抽樣分配是常態分配，因此，有 95% 的值必須落在 μ ±1.96σ內。CJW 的例子中，的抽樣分配是常態分配，標準誤 σ ＝ 2。因為 ±1.96σ＝1.96(2)＝3.92。我們的結論是：樣本大小為 n＝100 而得到的樣本平均數會有95% 落在母體平均數 ±3.92 的範圍內 (見圖 8.2)。第8章區間估計第294頁

邊際誤差與區間估計：σ已知(實例) 第8章區間估計第294頁圖8.2

邊際誤差與區間估計：σ已知(實例) • 以 CJW 為例，如果以 3.92 為邊際誤差，可以用 ±3.92 來計算 μ 的區間估計值。為了解釋區間估計值的意義，我們先假定選取三個不同的隨機樣本，每個樣本都有 100 名CJW 的顧客，第一個樣本的樣本平均數是圖 8.3 的。由圖 8.3 可看出，自加減 3.92 得到的區間會涵蓋母體平均數 μ 。如果隨機樣本得到的如圖 8.3 所示，可以看到顯然不等於，但是自加減 3.92 得到的區間仍會涵蓋母體平均數。然而，若第三個樣本平均數是圖 8.3 的，情況又是如何？我們可看出此情況下的± 3.92 而形成的區間並未涵蓋母體平均數 μ 。因為落在抽樣分配的右尾，而且距離 μ 超過 3.92。第8章區間估計第294-295頁

邊際誤差與區間估計：σ已知(實例) • 圖 8.3 陰影區內的任何樣本平均數所建立的區間，都會包含母體平均數 μ 。由於所有可能的樣本平均數有 95% 都落在陰影區，所以將樣本平均數加或減3.92 所形成的所有區間，有 95% 會包含母體平均數 μ 。第8章區間估計第295頁

邊際誤差與區間估計：σ已知(實例) 第8章區間估計第295頁圖8.3

邊際誤差與區間估計：σ已知(實例) • 假定最近一個月裡，CJW 的品管團隊調查 100 位顧客，得到的樣本平均滿意度分數是＝82，以 ± 3.92計算區間估計值，可以得到 82 ± 3.92。因此，以最近一個月的樣本資料得到的區間估計值是 82－3.92＝78.08 到 82＋3.92＝85.92。由於以 ±3.92 建立的各種區間估計值中，有 95% 的區間估計值會包含母體平均數，因此，我們可以說有 95% 的信心，78.08 到 85.92 的區間會包含母體平均數 μ 。我們也可以說，這個區間是在 95% 的信賴水準 (confidence level)下建立的。其中，0.95稱為信賴係數 (confidence coefficient)，區間 78.08 到 85.92 則稱為 95% 信賴區間 (confidence interval)。第8章區間估計第295頁

邊際誤差與區間估計：σ已知(實例) • 我們運用式 (8.1) 來建立 CJW 的 95% 信賴區間。95% 信賴區間，其信賴係數是 (1－ α)＝0.95，因此， α＝0.05。利用標準常態分配的機率表，右尾面積是 α/2＝0.05/2＝0.025，z0.025＝1.96。CJW 的樣本平均數是＝82， σ＝20，樣本大小 n＝100。我們可以得到因此，利用式(8.1)，邊際誤差是 3.92，95% 的信賴區間是82－3.92＝78.08到 82＋3.92＝85.92。第8章區間估計第296頁

邊際誤差與區間估計：σ已知(實例) • 雖然95% 的信賴水準很常使用，但其他如 90% 及 99% 的信賴水準也很常見。最常見的信賴水準之zα/2值整理在表8.1。第8章區間估計第296頁表8.1

邊際誤差與區間估計：σ已知(實例) • 使用這些值及式 (8.1) ，CJW 問題的 90% 信賴區間是 • 因此，在 90% 的信賴水準下，邊際誤差是 3.29，信賴區間是 82－3.29＝78.71 到82＋3.29＝85.29。同樣地，99% 的信賴區間是因此，在 99% 的信賴水準下，邊際誤差是 5.15，信賴區間是 82－5.15＝76.85 到85＋5.15＝87.15。 • 比較90%, 95% 及99% 三種信賴水準，我們可以看到，信賴水準提高時，信賴區間的寬度也會增加。第8章區間估計第296頁

邊際誤差與區間估計：σ已知(實例) • 實際樣本數大部分的實際應用中，以式 (8.1) 建立母體平均數的信賴區間時，樣本大小n ≥ 30 就已足夠。如果母體不是常態分配，但大致上對稱，樣本大小至少為 15，也可以利用式 (8.1) 得到良好的近似信賴區間。樣本更小時，只有分析人員相信或可以假定母體分配至少是近似常態時，才能使用式 (8.1)。第8章區間估計第297頁

8.2 母體平均數：σ 未知 • 如果不能在抽樣前假定母體標準差 σ 已知，就要以樣本標準差 s 來估計母體標準差。 • 此種情況稱為 σ未知 (σunknown)的情況。 • 若以 s 來估計 σ ，邊際誤差及母體平均數的區間估計值是根據稱為 t 分配 (t distribution)的機率分配求算而得。第8章區間估計第298-299頁

t分配 t 分配是由一群類似的機率分配所組成的。任一 t 分配都有其特定的參數，即所謂的自由度 (degrees of freedom)。可能有自由度為1、自由度為 2、自由度為 3 等等不同的 t 分配。第8章區間估計第299頁

t 分配 當自由度增加時，t 分配和標準常態分配的差距將愈來愈小，圖 8.4 顯示 t 分配在自由度 10 和 20 時與標準常態分配圖的比較。當自由度較高時，t 分配較不分散，且更接近標準常態機率分配。另外也請注意，t 分配的平均數為 0。第8章區間估計第299頁

t 分配 第8章區間估計第299頁圖8.4

t 分配 • 我們將以 t 的右下標表示 t 分配右尾的機率，正如 z0.025 表示標準常態分配右尾面積為 0.025 所對應的值一樣，t0.025代表 t 分配右尾面積為 0.025 所對應的 t 值。通常，我們以 tα/2表示 t 分配右尾面積為 α /2 時所對應的 t 值 (見圖 8.5)。第8章區間估計第299頁

t 分配 第8章區間估計第299頁圖8.5

t 分配 • 表 8.2 為 t 分配表，本表亦收錄於本書附錄中。當 t 分配的自由度為 10 時，則 t0.025＝2.228；同理，t分配的自由度是 20 時，t0.025＝2.086。當自由度不斷地增加，則 t0.025 愈逼近 z0.025＝1.96。 • T 分配表中自由度為無限大(∞)的對應欄位中可發現標準常態分配的 z值。假如自由度大於 100，就可用自由度無限大的 t值來近似。 • 自由度超過 100 的 t 分配，標準常態 z值是很好的近似值。第8章區間估計第299.301頁

t 分配 標準常態 z值第8章區間估計第300頁表8.2

t 分配 第8章區間估計第300頁表8.2

母體平均數的區間估計：σ 未知 • 區間估計其中： 1 -α= 信賴係數 tα/2 =自由度為 n - 1，而右尾面積為α/2 所對應的 t 值 s = 樣本標準差第8章區間估計第301頁

母體平均數的區間估計：σ未知(實例) • 某個研究調查了美國家庭的信用卡帳戶餘額，以瞭解信用卡債務的情形。研究中共有 85 個家庭的信用卡帳戶資料的餘額，如表 8.3。 • 因為沒有任何歷史資料，我們並不知道信用卡帳戶餘額的母體標準差，因此，必須利用樣本標準差 s來估計母體標準差 σ。接下來，我們要建立母體平均數的 95% 信賴區間。第8章區間估計第301頁

母體平均數的區間估計：σ未知(實例) 第8章區間估計第302頁表8.3

母體平均數的區間估計：σ未知(實例) • 首先，利用表8.3的資料算出樣本平均數＝ $5,900，樣本標準差 s ＝$3,058。信賴水準是95%，樣本大小是 85，自由度為 n－1＝84，查附錄B表 2 得t0.025＝1.989，套用式(8.2)可得母體平均數的區間估計因此，母體平均數的點估計值是 $5,900，邊際誤差是 $660，95% 信賴區間是5900－660＝$5240 到 5900＋660＝$6560。第8章區間估計第301-302頁

母體平均數的區間估計：σ未知 • 如果母體是常態分配，式 (8.2) 的區間估計公式可以適用於任何大小的樣本，並產生確切的區間估計值。 • 如果母體不是常態分配，則式 (8.2) 只是區間估計的近似值。此種情況下，近似值的近似程度則視母體的分配及樣本大小而定。第8章區間估計第302頁

母體平均數的區間估計：σ未知 • 大部分的實際應用中，以式 (8.2) 建立母體平均數的信賴區間時，樣本大小n ≥ 30 就已足夠。 • 但是，如果母體分配有嚴重的偏態或是離群值，許多統計學者會建議最好將樣本大小增加到 50 或更多。 • 如果母體不是常態分配，但大致上對稱，樣本大小至少為 15，也可以用式 (8.2) 得到良好的近似信賴區間。 • 但在樣本更小時，只有分析人員相信或可以假定母體分配至少是近似常態時，才能使用式(8.2)。第8章區間估計第302頁

母體平均數的區間估計：σ未知使用小樣本(實例)母體平均數的區間估計：σ未知使用小樣本(實例) • 以 Scheer 工業公司訓練計畫之評估為例，說明小樣本下之區間估計的推算過程。Scheer 工業公司的製造經理想要利用電腦來輔助訓練公司的維修人員，希望經由電腦訓練可減少訓練時間。為了評估這種訓練方式，該經理希望能夠估計在電腦輔助下的平均訓練時間。 • 假設管理者同意 20 名員工接受這項新的訓練，每一位員工所需的訓練天數如表 8.4 所示，樣本資料的直方圖如圖 8.7 所示。第8章區間估計第303頁

母體平均數的區間估計：σ未知使用小樣本(實例)母體平均數的區間估計：σ未知使用小樣本(實例) 第8章區間估計第303頁表8.4

母體平均數的區間估計：σ未知使用小樣本(實例)母體平均數的區間估計：σ未知使用小樣本(實例) 第8章區間估計第303頁圖8.7

母體平均數的區間估計：σ未知使用小樣本(實例)母體平均數的區間估計：σ未知使用小樣本(實例) • 計算出的樣本平均數和樣本標準差如下。查表得知自由度為 n－1＝19 時，t0.025＝2.093，運用式 (8.2) 可求得 95% 信賴區間的估計值。因此，母體平均數之點估計值為 51.5 天，邊際誤差是 3.2 天，母體平均數之 95%信賴區間為 51.5－3.2＝48.3 天到 51.5＋3.2＝54.7 天。第8章區間估計第303-304頁

母體平均數的區間估計：σ未知區間估計程序總整理母體平均數的區間估計：σ未知區間估計程序總整理 • 圖 8.8 列出兩種情況下的母體區間估計程序。大部分的實際應用中，樣本大小 n ≥ 30就已足夠。 • 如果母體是常態或近似常態分配，即使樣本大小不到 30 也可使用。但是 σ 未知的情況，如果母體有嚴重的偏態或是有離群值，樣本大小最好為 n ≥ 50。第8章區間估計第304頁

母體平均數的區間估計：σ未知區間估計程序總整理母體平均數的區間估計：σ未知區間估計程序總整理第8章區間估計第304頁圖8.8

8.3 樣本大小的決定 令E = 所要的邊際誤差。 E值是使用者在特定信賴水準下願意接受的邊際誤差。第8章區間估計第308頁

母體平均數區間估計的樣本大小 • 邊際誤差母體平均數區間估計所需的樣本數第8章區間估計第308頁

母體平均數區間估計的樣本大小 • 即使 σ 未知，如果先前已有 σ 的初始值或計畫值(planning value)，仍可使用式(8.3)。實務上有下列方式可供選擇： • 利用前側實驗獲得的母體標準差作為 σ 的計畫值。 • 利用前測實驗獲得的樣本標準差作為 σ 的計畫值。 • 利用判斷或「最佳猜測法」來決定 σ 值。例如，先估計母體的最大值與最小值，最大值與最小值的差距可作為全距的估計值，再將全距除以 4 作為標準差的約略估計值，以作為母體 σ 的計畫值。第8章區間估計第308頁

母體平均數區間估計的樣本大小(實例) • 在一個美國租車費用的調查中發現，租用中型汽車的平均費用是每天 $55。假設原先執行這項調查的公司想要執行另一項新的調查，以估計現階段在美國租用一輛中型汽車一天所需的費用。在設計此項新的研究時，計畫主持人特別指定在估計每天租車費的母體平均數時，必須採用的邊際誤差為 $2，信賴水準則為 95%。 • 我們可以瞭解到計畫主持人所指定的邊際誤差 E＝2，而 95% 的信賴水準表示 z0.025＝1.96。第8章區間估計第308頁

母體平均數區間估計的樣本大小(實例) • 如此，只需要得到母體標準差 σ 的計畫值，即可算出符合條件的樣本大小。此時，一位分析師看過先前研究的樣本資料後，得到樣本標準差為 $9.65，將此值當作 σ 的計畫值，可得如此，此項新的研究至少需要 89.43 個中型汽車日租金的樣本大小，才能滿足計畫主持人之邊際誤差為 $2 的要求。在這個例子中，算出的 n 值有小數點，我們採無條件進位法，因此，建議的樣本數是 90 個中型汽車租金的樣本。第8章區間估計第308-309頁

8.4 母體比例 母體比例 p的區間估計值的通式是第8章區間估計第310頁

母體比例的區間估計 　的抽樣分配在計算邊際誤差時扮演關鍵角色。若np ≥ 5且 n(1－p) ≥ 5，則的抽樣分配會近似常態分配。第8章區間估計第310頁

母體比例的區間估計 第8章區間估計第310頁圖8.9

母體比例的區間估計 • 區間估計其中： 1 -α是信賴係數 zα/2為標準常態分配右尾面積α/2所對應的z值是母體比例第8章區間估計第311頁

第 8 章

第 8 章

Presentation Transcript