1 / 67

第 8 章

第 8 章. 區間估計. 統計實例. Food Lion 於 1957 年成立時的名 稱是 Food Town ,目前已是美國 最大的連鎖超市之一,在美國的 東南部 11 州共有 1,200 家分店。 Food Lion 建立了七類存貨組合的 LIFO 指標,包括雜貨、紙類/家用品、寵物用品、美容保健產品、乳品、香菸/菸草,以及啤酒/酒。 最近一年,美容保健產品類的 LIFO 指標是 1.015 ,以 95% 的信賴水準, Food Lion 求算樣本估計值的邊際誤差是 0.006 。

orien
Download Presentation

第 8 章

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第 8 章 區間估計

  2. 統計實例 • Food Lion 於 1957 年成立時的名 稱是 Food Town,目前已是美國 最大的連鎖超市之一,在美國的 東南部 11 州共有 1,200 家分店。 • Food Lion 建立了七類存貨組合的 LIFO 指標,包括雜貨、紙類/家用品、寵物用品、美容保健產品、乳品、香菸/菸草,以及啤酒/酒。 • 最近一年,美容保健產品類的 LIFO 指標是 1.015,以 95% 的信賴水準,Food Lion 求算樣本估計值的邊際誤差是 0.006。 • 母體的 LlFO 指標的 95% 區間估計值是 1.009 到1.021。此種準確度是很理想的。 第8章區間估計第292頁

  3. E( ) = μ 的抽樣分配 • 簡單隨機樣本所產生的所有 可能值之平均數,也就是 的期望值 的期望值 其中: E( x ) = 的期望值  μ=母體平均數 • x-bar是母體平均數之不偏估計量

  4. 的標準差 無限母體 有限母體 • 若n/N ≤ 0.05 則稱為有限母體 •        通常被稱為有限母體校正因子(finite population correction factor)。 • 為平均數的標準誤 (standard error)

  5. 母體不是常態分配:如果母體不是常態分配,中央極母體不是常態分配:如果母體不是常態分配,中央極 限定理(central limit theorem)可以幫助我們決定 抽樣 分配的形狀。 母體為常態分配:很多情況下,我們可以合理地假設 母體為常態分配。如果母體是常態分配,無論樣本 大小, 的抽樣分配也是常態分配。

  6. 的抽樣分配 • 的抽樣分配是所有樣本比例  值的機率分配。 • 的期望值 其中: p =母體比例

  7.  的標準差 無限母體 有限母體 是母體的標準誤

  8. 簡單的例子 • CJW以簡單隨機抽樣方式,抽取每組樣本大小為100的顧客,進行顧客滿意度調查,其樣本平均數為82分,母體平均數也為82分,母體標準差為20,樣本平均數大於85.92分的機率為何?小於78.08的機率為何? • 呈上例,樣本平均數落在區間內(78.8<=X-bar<=85.92)的機率為何?

  9. 區間估計 • 以CJW的例子,我們可以說有95% 的信心,顧客滿意度會落在(母體平均數 μ) 78.08 到 85.92 的區間內。 • 利用機率原理的「隨機區間」來估計母數所在範圍的方法。 • 母體平均數 μ不變,但每次抽樣所得到的x-bar會不同,因此每次算出來的區間也會不同。

  10. 第 8 章 區間估計 • 8.1 母體平均數:σ 已知 • 8.2 母體平均數:σ 未知 • 8.3 樣本大小的決定 • 8.4 母體比例 第8章區間估計第291頁

  11. 邊際誤差與區間估計值 點估計量的值不會恰好等於母體參數值。 區間估計值 (interval estimate)通常是由點估計值加或減 某個值求得,我們稱這個加減值是邊際誤差 (margin of error)。區間估計值的一般形式是: 點估計值 邊際誤差 邊際誤差=機率值×標準差 第8章區間估計第292頁

  12. 區間估計值的意義 • 區間估計值讓我們瞭解:點估計值與母體參數值的 • 接近程度; • 區間估計值是以某一區間作為母體參數的估計範圍 • 「平均滿意度85分」與「平均滿意度介於75分至85分 • 」那一個包含母體參數值的機率大? 區間估計值包含母體參數值的「機率」,稱為「信賴水 準」,所得到的區間為「信賴區間」

  13. 邊際誤差與區間估計值 母體平均數的區間估計值的通式如下: 第8章區間估計第292-293頁

  14. 8.1 母體平均數:σ 已知 • 為了求算「母體平均數」的區間估計值,必須知道母體的標準差 σ 或樣本的標準差 s 以計算邊際誤差。 • σ 很少是已知的數值,但歷史資料或其他某些可用的訊息,讓我們得以在抽樣前取得母體標準差的優良估計值。 • 在此情況下,可視母體標準差已知,我們稱此為 σ 已知 (σ known)的情況。 第8章區間估計第293頁

  15. 母體平均數的區間估計:σ 已知 • 母體平均數的區間估計值:σ 已知 其中: 為樣本平均數1 -α為信賴係數 zα/2為右尾面積α/2 的標準常態分配的 z值 σ為母體標準差 n 為樣本大小 第8章區間估計第296頁

  16. 邊際誤差與區間估計:σ已知(實例) • CJW 例子中的歷史資料顯示,滿意度分數的母體是標準差 σ=20 的常態分配 (σ已知)。 • CJW以簡單隨機抽樣方式,抽取每組樣本大小為100的顧客,進行顧客滿意度調查,其平均滿意度分數(x-bar)之抽樣分配如下: 第8章區間估計第293-294頁 圖8.1

  17. 最近一次的調查,平均的滿意度分數為 x-bar= 82,試求顧客平均滿意度分數的95%信賴區間? • 將信賴水準改為90%與99 %時,其信賴區間為何?

  18. 邊際誤差與區間估計:σ已知(實例) 第8章區間估計第294頁

  19. 邊際誤差與區間估計:σ已知(實例) 第8章區間估計第295頁 圖8.3

  20. 邊際誤差與區間估計:σ已知(實例) • 假定最近一個月裡,CJW 的品管團隊調查 100 位顧客,得到的樣本平均滿意度分數是 =82,以 ± 3.92計算區間估計值,可以得到 82 ± 3.92。因此,以最近一個月的樣本資料得到的區間估計值是 82-3.92=78.08 到 82+3.92=85.92。由於以 ±3.92 建立的各種區間估計值中,有 95% 的區間估計值會包含母體平均數,因此,我們可以說有 95% 的信心,78.08 到 85.92 的區間會包含母體平均數 μ 。我們也可以說,這個區間是在 95% 的信賴水準 (confidence level)下建立的。其中,0.95稱為信賴係數 (confidence coefficient),區間 78.08 到 85.92 則稱為 95% 信賴區間 (confidence interval)。 第8章區間估計第295頁

  21. 邊際誤差與區間估計:σ已知(實例) • 雖然95% 的信賴水準很常使用,但其他如 90% 及 99% 的信賴水準也很常見。最常見的信賴水準之zα/2值整理在表8.1。 第8章區間估計第296頁 表8.1

  22. 邊際誤差與區間估計:σ已知(實例) • 使用這些值及式 (8.1) ,CJW 問題的 90% 信賴區間是 • 因此,在 90% 的信賴水準下,邊際誤差是 3.29,信賴區間是 82-3.29=78.71 到82+3.29=85.29。同樣地,99% 的信賴區間是 因此,在 99% 的信賴水準下,邊際誤差是 5.15,信賴區間是 82-5.15=76.85 到85+5.15=87.15。 • 比較90%, 95% 及99% 三種信賴水準,我們可以看到,信賴水準提高時,信賴區間的寬度也會增加。 第8章區間估計第296頁

  23. 邊際誤差與區間估計:σ已知(實例) • 實際樣本數 • 影響信賴區間大小的因素為何? 大部分的實際應用中,以式 (8.1) 建立母體平均數的 信賴區間時,樣本大小n ≥ 30 就已足夠。 如果母體不是常態分配,但大致上對稱,樣本大小至少 為 15,也可以利用式 (8.1) 得到良好的近似信賴區間。 樣本更小時,只有分析人員相信或可以假定母體分配 至少是近似常態時,才能使用式 (8.1)。 第8章區間估計第297頁

  24. 練習 • 5(p.298)

  25. 8.2 母體平均數:σ 未知 • 如果不能在抽樣前假定母體標準差 σ 已知,就要以樣本標準差 s 來估計母體標準差。 • 此種情況稱為 σ未知 (σunknown)的情況。 • 若以 s 來估計 σ ,邊際誤差及母體平均數的區間估計值是根據稱為 t 分配 (t distribution)的機率分配求算而得。 第8章區間估計第298-299頁

  26. t分配 t 分配是由一群類似的機率分配所組成的。 任一 t 分配都有其特定的參數,即所謂的 自由度 (degrees of freedom)。 自由度: 是指當以樣本的統計量來估計總體的參數時,樣本中獨立或能自由變化的數據的個數稱為該統計量的自由度 可能有自由度為1、自由度為 2、自由度為 3 等等 不同的 t 分配。 第8章區間估計第299頁

  27. t 分配 當自由度增加時,t 分配和標準常態分配的差距將 愈來愈小,圖 8.4 顯示 t 分配在自由度 10 和 20 時與 標準常態分配圖的比較。 當自由度較高時,t 分配較不分散,且更接近 標準常態機率分配。另外也請注意,t 分配的平均數 為 0。 第8章區間估計第299頁

  28. t 分配 第8章區間估計第299頁 圖8.4

  29. t 分配 • 我們將以 t 的右下標表示 t 分配右尾的機率,正如 z0.025 表示標準常態分配右尾面積為 0.025 所對應的值一樣,t0.025代表 t 分配右尾面積為 0.025 所對應的 t 值。通常,我們以 tα/2表示 t 分配右尾面積為 α /2 時所對應的 t 值 (見圖 8.5)。 第8章區間估計第299頁

  30. t 分配 第8章區間估計第299頁 圖8.5

  31. t 分配 • 表 8.2 為 t 分配表,本表亦收錄於本書附錄中。當 t 分配的自由度為 10 時,則 t0.025=2.228;同理,t分配的自由度是 20 時,t0.025=2.086。當自由度不斷地增加,則 t0.025 愈逼近 z0.025=1.96。 • T 分配表中自由度為無限大(∞)的對應欄位中可發現標準常態分配的 z值。假如自由度大於 100,就可用自由度無限大的 t值來近似。 • 自由度超過 100 的 t 分配,標準常態 z值是很好的近似值。 第8章區間估計第299.301頁

  32. t 分配 標準常態 z值 第8章區間估計第300頁 表8.2

  33. t 分配 第8章區間估計第300頁 表8.2

  34. t 分配 第8章區間估計第300頁 表8.2

  35. t 分配 第8章區間估計第300頁 表8.2

  36. 母體平均數的區間估計:σ 未知 • 區間估計 其中: 1 -α= 信賴係數 tα/2 =自由度為 n - 1,而右尾面積為α/2 所對應的 t 值 s = 樣本標準差 第8章區間估計第301頁

  37. 母體平均數的區間估計:σ未知(實例) • 某個研究調查了美國家庭的信用卡帳戶餘額,以瞭解信用卡債務的情形。研究中共有 85 個家庭的信用卡帳戶資料的餘額,如表 8.3。 • 因為沒有任何歷史資料,我們並不知道信用卡帳戶餘額的母體標準差,因此,必須利用樣本標準差 s來估計母體標準差 σ。接下來,我們要建立母體平均數的 95% 信賴區間(x-bar = $ 5,900, s =$3,058)。 第8章區間估計第301頁

  38. 母體平均數的區間估計:σ未知(實例) 第8章區間估計第302頁 表8.3

  39. 母體平均數的區間估計:σ未知(實例) • 利用表8.3的資料算出樣本平均數 = $5,900,樣本標準差 s =$3,058。信賴水準是95%,樣本大小是 85,自由度為 n-1=84,查附錄B表 2 得t0.025=1.989,套用式(8.2)可得母體平均數的區間估計因此,母體平均數的點估計值是 $5,900,邊際誤差是 $660,95% 信賴區間是5900-660=$5240 到 5900+660=$6560。 第8章區間估計第301-302頁

  40. 母體平均數的區間估計:σ未知 • 如果母體是常態分配,式 (8.2) 的區間估計公式可以適用於任何大小的樣本,並產生確切的區間估計值。 • 如果母體不是常態分配,則式 (8.2) 只是區間估計的近似值。此種情況下,近似值的近似程度則視母體的分配及樣本大小而定。 第8章區間估計第302頁

  41. 母體平均數的區間估計:σ未知 • 大部分的實際應用中,以式 (8.2) 建立母體平均數的信賴區間時,樣本大小n ≥ 30 就已足夠。 • 但是,如果母體分配有嚴重的偏態或是離群值,許多統計學者會建議最好將樣本大小增加到 50 或更多。 • 如果母體不是常態分配,但大致上對稱,樣本大小至少為 15,也可以用式 (8.2) 得到良好的近似信賴區間。 • 但在樣本更小時,只有分析人員相信或可以假定母體分配至少是近似常態時,才能使用式(8.2)。 第8章區間估計第302頁

  42. 母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) • Scheer 工業公司的製造經理想要利用電腦來輔助訓練公司的維修人員,希望經由電腦訓練可減少訓練時間。為了評估這種訓練方式,該經理希望能夠估計在電腦輔助下的平均訓練時間。 • 假設管理者同意 20 名員工接受這項新的訓練,每一位員工所需的訓練天數如表 8.4 所示,樣本資料的直方圖如圖 8.7 所示。試求其95% 信賴區間? 第8章區間估計第303頁

  43. 母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) 計算出的樣本平均數和樣本標準差如下 第8章區間估計第303頁 表8.4

  44. 母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) 第8章區間估計第303頁 圖8.7

  45. 母體平均數的區間估計:σ未知使用小樣本(實例)母體平均數的區間估計:σ未知使用小樣本(實例) 查表得知自由度為 n-1=19 時,t0.025=2.093,運用式 (8.2) 可求得 95% 信賴區間的估計值。 因此,母體平均數之點估計值為 51.5 天,邊際誤差是 3.2 天,母體平均數之 95%信賴區間為 51.5-3.2=48.3 天到 51.5+3.2=54.7 天。 第8章區間估計第303-304頁

  46. 母體平均數的區間估計:σ未知區間估計程序總整理母體平均數的區間估計:σ未知區間估計程序總整理 • 圖 8.8 列出兩種情況下的母體區間估計程序。大部分的實際應用中,樣本大小 n ≥ 30就已足夠。 • 如果母體是常態或近似常態分配,即使樣本大小不到 30 也可使用。但是 σ 未知的情況,如果母體有嚴重的偏態或是有離群值,樣本大小最好為 n ≥ 50。 第8章區間估計第304頁

  47. 母體平均數的區間估計:σ未知區間估計程序總整理母體平均數的區間估計:σ未知區間估計程序總整理 第8章區間估計第304頁 圖8.8

  48. 8.3 樣本大小的決定 令E = 所要的邊際誤差。 E值是使用者在特定信賴水準下願意接受的邊際誤差。 第8章區間估計第308頁

  49. 母體平均數區間估計的樣本大小 • 邊際誤差 母體平均數區間估計所需的樣本數 利用區間估計法求n時,需假設X-bar符合常態分配。 第8章區間估計第308頁

  50. 母體平均數區間估計的樣本大小 • 即使 σ 未知,如果先前已有 σ 的初始值或計畫值(planning value),仍可使用式(8.3)。實務上有下列方式可供選擇: • 利用前側實驗獲得的母體標準差作為 σ 的計畫值。 • 利用前測實驗獲得的樣本標準差作為 σ 的計畫值。 • 利用判斷或「最佳猜測法」來決定 σ 值。例如,先估計母體的最大值與最小值,最大值與最小值的差距可作為全距的估計值,再將全距除以 4 作為標準差的約略估計值,以作為母體 σ 的計畫值。 第8章區間估計第308頁

More Related