680 likes | 957 Views
第 8 章. 區間估計. 統計實例. Food Lion 於 1957 年成立時的名 稱是 Food Town ,目前已是美國 最大的連鎖超市之一,在美國的 東南部 11 州共有 1,200 家分店。 Food Lion 建立了七類存貨組合的 LIFO 指標,包括雜貨、紙類/家用品、寵物用品、美容保健產品、乳品、香菸/菸草,以及啤酒/酒。 最近一年,美容保健產品類的 LIFO 指標是 1.015 ,以 95% 的信賴水準, Food Lion 求算樣本估計值的邊際誤差是 0.006 。
E N D
第 8 章 區間估計
統計實例 • Food Lion 於 1957 年成立時的名 稱是 Food Town,目前已是美國 最大的連鎖超市之一,在美國的 東南部 11 州共有 1,200 家分店。 • Food Lion 建立了七類存貨組合的 LIFO 指標,包括雜貨、紙類/家用品、寵物用品、美容保健產品、乳品、香菸/菸草,以及啤酒/酒。 • 最近一年,美容保健產品類的 LIFO 指標是 1.015,以 95% 的信賴水準,Food Lion 求算樣本估計值的邊際誤差是 0.006。 • 母體的 LlFO 指標的 95% 區間估計值是 1.009 到1.021。此種準確度是很理想的。 第8章區間估計第292頁
E( ) = μ 的抽樣分配 • 簡單隨機樣本所產生的所有 可能值之平均數,也就是 的期望值 的期望值 其中: E( x ) = 的期望值 μ=母體平均數 • x-bar是母體平均數之不偏估計量
的標準差 無限母體 有限母體 • 若n/N ≤ 0.05 則稱為有限母體 • 通常被稱為有限母體校正因子(finite population correction factor)。 • 為平均數的標準誤 (standard error)
母體不是常態分配:如果母體不是常態分配,中央極母體不是常態分配:如果母體不是常態分配,中央極 限定理(central limit theorem)可以幫助我們決定 抽樣 分配的形狀。 母體為常態分配:很多情況下,我們可以合理地假設 母體為常態分配。如果母體是常態分配,無論樣本 大小, 的抽樣分配也是常態分配。
的抽樣分配 • 的抽樣分配是所有樣本比例 值的機率分配。 • 的期望值 其中: p =母體比例
的標準差 無限母體 有限母體 是母體的標準誤
簡單的例子 • CJW以簡單隨機抽樣方式,抽取每組樣本大小為100的顧客,進行顧客滿意度調查,其樣本平均數為82分,母體平均數也為82分,母體標準差為20,樣本平均數大於85.92分的機率為何?小於78.08的機率為何? • 呈上例,樣本平均數落在區間內(78.8<=X-bar<=85.92)的機率為何?
區間估計 • 以CJW的例子,我們可以說有95% 的信心,顧客滿意度會落在(母體平均數 μ) 78.08 到 85.92 的區間內。 • 利用機率原理的「隨機區間」來估計母數所在範圍的方法。 • 母體平均數 μ不變,但每次抽樣所得到的x-bar會不同,因此每次算出來的區間也會不同。
第 8 章 區間估計 • 8.1 母體平均數:σ 已知 • 8.2 母體平均數:σ 未知 • 8.3 樣本大小的決定 • 8.4 母體比例 第8章區間估計第291頁
邊際誤差與區間估計值 點估計量的值不會恰好等於母體參數值。 區間估計值 (interval estimate)通常是由點估計值加或減 某個值求得,我們稱這個加減值是邊際誤差 (margin of error)。區間估計值的一般形式是: 點估計值 邊際誤差 邊際誤差=機率值×標準差 第8章區間估計第292頁
區間估計值的意義 • 區間估計值讓我們瞭解:點估計值與母體參數值的 • 接近程度; • 區間估計值是以某一區間作為母體參數的估計範圍 • 「平均滿意度85分」與「平均滿意度介於75分至85分 • 」那一個包含母體參數值的機率大? 區間估計值包含母體參數值的「機率」,稱為「信賴水 準」,所得到的區間為「信賴區間」
邊際誤差與區間估計值 母體平均數的區間估計值的通式如下: 第8章區間估計第292-293頁
8.1 母體平均數:σ 已知 • 為了求算「母體平均數」的區間估計值,必須知道母體的標準差 σ 或樣本的標準差 s 以計算邊際誤差。 • σ 很少是已知的數值,但歷史資料或其他某些可用的訊息,讓我們得以在抽樣前取得母體標準差的優良估計值。 • 在此情況下,可視母體標準差已知,我們稱此為 σ 已知 (σ known)的情況。 第8章區間估計第293頁
母體平均數的區間估計:σ 已知 • 母體平均數的區間估計值:σ 已知 其中: 為樣本平均數1 -α為信賴係數 zα/2為右尾面積α/2 的標準常態分配的 z值 σ為母體標準差 n 為樣本大小 第8章區間估計第296頁
邊際誤差與區間估計:σ已知(實例) • CJW 例子中的歷史資料顯示,滿意度分數的母體是標準差 σ=20 的常態分配 (σ已知)。 • CJW以簡單隨機抽樣方式,抽取每組樣本大小為100的顧客,進行顧客滿意度調查,其平均滿意度分數(x-bar)之抽樣分配如下: 第8章區間估計第293-294頁 圖8.1
最近一次的調查,平均的滿意度分數為 x-bar= 82,試求顧客平均滿意度分數的95%信賴區間? • 將信賴水準改為90%與99 %時,其信賴區間為何?
邊際誤差與區間估計:σ已知(實例) 第8章區間估計第294頁
邊際誤差與區間估計:σ已知(實例) 第8章區間估計第295頁 圖8.3
邊際誤差與區間估計:σ已知(實例) • 假定最近一個月裡,CJW 的品管團隊調查 100 位顧客,得到的樣本平均滿意度分數是 =82,以 ± 3.92計算區間估計值,可以得到 82 ± 3.92。因此,以最近一個月的樣本資料得到的區間估計值是 82-3.92=78.08 到 82+3.92=85.92。由於以 ±3.92 建立的各種區間估計值中,有 95% 的區間估計值會包含母體平均數,因此,我們可以說有 95% 的信心,78.08 到 85.92 的區間會包含母體平均數 μ 。我們也可以說,這個區間是在 95% 的信賴水準 (confidence level)下建立的。其中,0.95稱為信賴係數 (confidence coefficient),區間 78.08 到 85.92 則稱為 95% 信賴區間 (confidence interval)。 第8章區間估計第295頁
邊際誤差與區間估計:σ已知(實例) • 雖然95% 的信賴水準很常使用,但其他如 90% 及 99% 的信賴水準也很常見。最常見的信賴水準之zα/2值整理在表8.1。 第8章區間估計第296頁 表8.1
邊際誤差與區間估計:σ已知(實例) • 使用這些值及式 (8.1) ,CJW 問題的 90% 信賴區間是 • 因此,在 90% 的信賴水準下,邊際誤差是 3.29,信賴區間是 82-3.29=78.71 到82+3.29=85.29。同樣地,99% 的信賴區間是 因此,在 99% 的信賴水準下,邊際誤差是 5.15,信賴區間是 82-5.15=76.85 到85+5.15=87.15。 • 比較90%, 95% 及99% 三種信賴水準,我們可以看到,信賴水準提高時,信賴區間的寬度也會增加。 第8章區間估計第296頁
邊際誤差與區間估計:σ已知(實例) • 實際樣本數 • 影響信賴區間大小的因素為何? 大部分的實際應用中,以式 (8.1) 建立母體平均數的 信賴區間時,樣本大小n ≥ 30 就已足夠。 如果母體不是常態分配,但大致上對稱,樣本大小至少 為 15,也可以利用式 (8.1) 得到良好的近似信賴區間。 樣本更小時,只有分析人員相信或可以假定母體分配 至少是近似常態時,才能使用式 (8.1)。 第8章區間估計第297頁
練習 • 5(p.298)
8.2 母體平均數:σ 未知 • 如果不能在抽樣前假定母體標準差 σ 已知,就要以樣本標準差 s 來估計母體標準差。 • 此種情況稱為 σ未知 (σunknown)的情況。 • 若以 s 來估計 σ ,邊際誤差及母體平均數的區間估計值是根據稱為 t 分配 (t distribution)的機率分配求算而得。 第8章區間估計第298-299頁
t分配 t 分配是由一群類似的機率分配所組成的。 任一 t 分配都有其特定的參數,即所謂的 自由度 (degrees of freedom)。 自由度: 是指當以樣本的統計量來估計總體的參數時,樣本中獨立或能自由變化的數據的個數稱為該統計量的自由度 可能有自由度為1、自由度為 2、自由度為 3 等等 不同的 t 分配。 第8章區間估計第299頁
t 分配 當自由度增加時,t 分配和標準常態分配的差距將 愈來愈小,圖 8.4 顯示 t 分配在自由度 10 和 20 時與 標準常態分配圖的比較。 當自由度較高時,t 分配較不分散,且更接近 標準常態機率分配。另外也請注意,t 分配的平均數 為 0。 第8章區間估計第299頁
t 分配 第8章區間估計第299頁 圖8.4
t 分配 • 我們將以 t 的右下標表示 t 分配右尾的機率,正如 z0.025 表示標準常態分配右尾面積為 0.025 所對應的值一樣,t0.025代表 t 分配右尾面積為 0.025 所對應的 t 值。通常,我們以 tα/2表示 t 分配右尾面積為 α /2 時所對應的 t 值 (見圖 8.5)。 第8章區間估計第299頁
t 分配 第8章區間估計第299頁 圖8.5
t 分配 • 表 8.2 為 t 分配表,本表亦收錄於本書附錄中。當 t 分配的自由度為 10 時,則 t0.025=2.228;同理,t分配的自由度是 20 時,t0.025=2.086。當自由度不斷地增加,則 t0.025 愈逼近 z0.025=1.96。 • T 分配表中自由度為無限大(∞)的對應欄位中可發現標準常態分配的 z值。假如自由度大於 100,就可用自由度無限大的 t值來近似。 • 自由度超過 100 的 t 分配,標準常態 z值是很好的近似值。 第8章區間估計第299.301頁
t 分配 標準常態 z值 第8章區間估計第300頁 表8.2
t 分配 第8章區間估計第300頁 表8.2
t 分配 第8章區間估計第300頁 表8.2
t 分配 第8章區間估計第300頁 表8.2
母體平均數的區間估計:σ 未知 • 區間估計 其中: 1 -α= 信賴係數 tα/2 =自由度為 n - 1,而右尾面積為α/2 所對應的 t 值 s = 樣本標準差 第8章區間估計第301頁
母體平均數的區間估計:σ未知(實例) • 某個研究調查了美國家庭的信用卡帳戶餘額,以瞭解信用卡債務的情形。研究中共有 85 個家庭的信用卡帳戶資料的餘額,如表 8.3。 • 因為沒有任何歷史資料,我們並不知道信用卡帳戶餘額的母體標準差,因此,必須利用樣本標準差 s來估計母體標準差 σ。接下來,我們要建立母體平均數的 95% 信賴區間(x-bar = $ 5,900, s =$3,058)。 第8章區間估計第301頁
母體平均數的區間估計:σ未知(實例) 第8章區間估計第302頁 表8.3
母體平均數的區間估計:σ未知(實例) • 利用表8.3的資料算出樣本平均數 = $5,900,樣本標準差 s =$3,058。信賴水準是95%,樣本大小是 85,自由度為 n-1=84,查附錄B表 2 得t0.025=1.989,套用式(8.2)可得母體平均數的區間估計因此,母體平均數的點估計值是 $5,900,邊際誤差是 $660,95% 信賴區間是5900-660=$5240 到 5900+660=$6560。 第8章區間估計第301-302頁
母體平均數的區間估計:σ未知 • 如果母體是常態分配,式 (8.2) 的區間估計公式可以適用於任何大小的樣本,並產生確切的區間估計值。 • 如果母體不是常態分配,則式 (8.2) 只是區間估計的近似值。此種情況下,近似值的近似程度則視母體的分配及樣本大小而定。 第8章區間估計第302頁
母體平均數的區間估計:σ未知 • 大部分的實際應用中,以式 (8.2) 建立母體平均數的信賴區間時,樣本大小n ≥ 30 就已足夠。 • 但是,如果母體分配有嚴重的偏態或是離群值,許多統計學者會建議最好將樣本大小增加到 50 或更多。 • 如果母體不是常態分配,但大致上對稱,樣本大小至少為 15,也可以用式 (8.2) 得到良好的近似信賴區間。 • 但在樣本更小時,只有分析人員相信或可以假定母體分配至少是近似常態時,才能使用式(8.2)。 第8章區間估計第302頁
母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) • Scheer 工業公司的製造經理想要利用電腦來輔助訓練公司的維修人員,希望經由電腦訓練可減少訓練時間。為了評估這種訓練方式,該經理希望能夠估計在電腦輔助下的平均訓練時間。 • 假設管理者同意 20 名員工接受這項新的訓練,每一位員工所需的訓練天數如表 8.4 所示,樣本資料的直方圖如圖 8.7 所示。試求其95% 信賴區間? 第8章區間估計第303頁
母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) 計算出的樣本平均數和樣本標準差如下 第8章區間估計第303頁 表8.4
母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) 第8章區間估計第303頁 圖8.7
母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) 查表得知自由度為 n-1=19 時,t0.025=2.093,運用式 (8.2) 可求得 95% 信賴區間的估計值。 因此,母體平均數之點估計值為 51.5 天,邊際誤差是 3.2 天,母體平均數之 95%信賴區間為 51.5-3.2=48.3 天到 51.5+3.2=54.7 天。 第8章區間估計第303-304頁
母體平均數的區間估計:σ未知區間估計程序總整理母體平均數的區間估計:σ未知區間估計程序總整理 • 圖 8.8 列出兩種情況下的母體區間估計程序。大部分的實際應用中,樣本大小 n ≥ 30就已足夠。 • 如果母體是常態或近似常態分配,即使樣本大小不到 30 也可使用。但是 σ 未知的情況,如果母體有嚴重的偏態或是有離群值,樣本大小最好為 n ≥ 50。 第8章區間估計第304頁
母體平均數的區間估計:σ未知區間估計程序總整理母體平均數的區間估計:σ未知區間估計程序總整理 第8章區間估計第304頁 圖8.8
8.3 樣本大小的決定 令E = 所要的邊際誤差。 E值是使用者在特定信賴水準下願意接受的邊際誤差。 第8章區間估計第308頁
母體平均數區間估計的樣本大小 • 邊際誤差 母體平均數區間估計所需的樣本數 利用區間估計法求n時,需假設X-bar符合常態分配。 第8章區間估計第308頁
母體平均數區間估計的樣本大小 • 即使 σ 未知,如果先前已有 σ 的初始值或計畫值(planning value),仍可使用式(8.3)。實務上有下列方式可供選擇: • 利用前側實驗獲得的母體標準差作為 σ 的計畫值。 • 利用前測實驗獲得的樣本標準差作為 σ 的計畫值。 • 利用判斷或「最佳猜測法」來決定 σ 值。例如,先估計母體的最大值與最小值,最大值與最小值的差距可作為全距的估計值,再將全距除以 4 作為標準差的約略估計值,以作為母體 σ 的計畫值。 第8章區間估計第308頁