第 9 章

第 9 章 假設檢定 Part A (9.1-9.4)

統計實例 • 1827 年 John Morrell 公司成立於英國，是美國歷史最久的肉品製造商。 • 最近的一項市場研究調查了消費者對該公司的牛肉製品及另外兩種競爭品牌的偏好程度。在三種產品的比較檢驗中，被選中的消費者針對口味、外觀、香味，以及整體偏好進行評比。 • 這項研究的問題之一是，是否有 50% 以上的消費者偏好 Morrell 牛肉製品，以 p 表示偏好Morrell 牛肉製品的母體比例，研究問題的假設如下： Ho: p ≤ 0.50 Ha: p > 0.50 • 本章將介紹如何形成假設，以及進行諸如Morrell 公司所做的檢定。經由樣本資料的分析，我們可以決定是否支持或拒絕假設。 2 第9章假設檢定 Part A (9.1-9.4) 第328頁

第 9 章假設檢定 Part A • 9.1 建立虛無假設與對立假設 • 9.2 型 I 錯誤和型 II 錯誤 • 9.3 母體平均數：σ 已知 • 9.4 母體平均數：σ 未知 3 第9章假設檢定 Part A (9.1-9.4) 第329 - 350頁

虛無假設與對立假設 • 假設檢定主要內容在說明如何利用假設檢定，以決定要不要拒絕某項針對母體參數所建立的假設。 • 在假設檢定中，我們首先針對母體參數做一個暫時性的假設，此假設稱為虛無假設 (null hypothesis)，以 H0表示。 • 然後再建立另外一個假設，稱為對立假設(alternative hypothesis)，以 Ha表示，它與虛無假設的敘述剛好相反。 • 假設檢定的過程即在利用樣本資料檢驗 H0和 Ha兩個對立的敘述。 4 第9章假設檢定 Part A (9.1-9.4) 第329 - 330頁

9.1 建立虛無假設與對立假設 • 檢定研究的假設 • 檢定一項宣稱的有效性 • 決策時的檢定 • 虛無假設與獨立假設的各種形式 5 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 檢定研究的假設 • 研究的假設應表達為對立假設。 • 假若樣本資料顯示出應拒絕虛無假設，即可下結論說：此研究性的假設為真。 6 第9章假設檢定 Part A (9.1-9.4) 第330頁

建立虛無假設與對立假設 • 檢定研究的假設 • 某種款式的汽車平均每加侖汽油可行駛 24 哩，現有一製造研究小組發明一種新的化油器系統來增加每加侖汽油可行駛的哩程數。為了評估這種系統的好壞，該小組製造了幾個化油器，並安裝在汽車上進行哩程測試。該小組想要找到足夠的證據顯示新的化油器的確可以使哩程數超過 24 哩，即 μ＞ 24。一般而言，研究的假設常被定為對立假設，因此這個研究的虛無假設和對立假設即為 H0 : μ ≤ 24 Ha: μ > 24 7 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 如果樣本結果顯示不能拒絕 H0，則研究人員就不能認定新的化油系統可以增加哩程數；但如果樣本資料顯示可以拒絕 H0，則研究人員即可推論 Ha：μ ＞ 24 為真。有了這個結論，研究人員就有統計的支持，可認為新化油器的確可以增加哩程數，然後就可開始生產新的化油器系統。 8 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 檢定研究的假設 • 在諸如此類的研究中，虛無假設和對立假設的建立原則是，如果拒絕 H0，就是支持研究的假設，必須採取某些新的行動，因此研究的假設應表達為對立假設。 9 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 檢定一項宣稱的有效性 • 我們通常會對廠商的宣稱給予善意的回應，並將其敘述視為虛無假設。 • 假若樣本資料顯示出應拒絕虛無假設，即可下結論說：此宣稱為偽。我們通常會先對廠商的宣稱稱為偽。 10 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 檢定一項宣稱的有效性 • 某飲料製造商宣稱，他們的 2 公升容器中平均至少裝有 67.6 盎司的飲料。現抽出若干 2 公升裝的飲料，以檢定此一宣稱。在此類的假設檢定中，我們通常先假設廠商的宣稱為真，除非有證據顯示其為假。因此，這個例子的虛無假設與對立假設是 Ho: μ ≥ 67. 6 Ha: μ < 67. 6 如果樣本結果顯示不能拒絕 H0，則廠商的宣稱就得以成立；但若樣本結果顯示 H0可以被拒絕，即 Ha：μ < 67.6 為真，則可知廠商的宣稱是不正確的，2 公升飲料瓶的平均裝瓶重量小於 67.6 盎司，消費者可以進一步提出抗議。 11 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 檢定一項宣稱的有效性 • 在檢定某宣稱的有效性時，通常是在假設該宣稱為真的情況下，將此宣稱列為虛無假設，與此宣稱相反的狀況則為對立假設。因此，拒絕 H0 表示有統計上的證據讓我們質疑該宣稱的正確性。換言之，每當虛無假設被拒絕時，就該採取某些修正行動。 12 第9章假設檢定 Part A (9.1-9.4) 第329頁

建立虛無假設與對立假設 • 決策時的檢定 • 在檢定研究的假設或檢定宣稱的有效性時，如果拒絕 H0才會有進一步的行動。但在許多實例中，不論 H0被拒絕或不被拒絕都會採取行動。通常是發生在決策者必須在兩種可能的行動方案間做選擇的時候。 13 第9章假設檢定 Part A (9.1-9.4) 第330頁

建立虛無假設與對立假設 • 決策時的檢定 • 例如，在某批零件中，品管人員抽出部分為樣本，並藉以決定是否接受整批零件或因零件未符合規格而退回給供應商。假設零件規格長度平均為2 英寸，如果平均長度大於或小於 2 英寸，這些零件將在組裝時產生品質問題，因此虛無假設與對立假設如下。 H0 : μ ＝ 2 Ha: μ≠ 2 14 第9章假設檢定 Part A (9.1-9.4) 第330頁

建立虛無假設與對立假設 • 決策時的檢定 • 如果樣本結果顯示不能拒絕 H0，則品管人員沒有理由懷疑該批零件不符合規格，因此將接受整批零件。 • 如果樣本結果顯示拒絕 H0，表示該批零件並不符合規格，品管人員可將整批零件退回給供應商。 • 因此，在本例中，我們可以看到不論是拒絕 H0或不拒絕 H0，都會有所行動。 15 第9章假設檢定 Part A (9.1-9.4) 第330頁

虛無假設與對立假設的各種形式 • 母體參數的假設檢定共有三種可能形式：其中兩種在虛無假設中運用了不等式，另一種則使用等式。 • 就母體平均數的假設檢定而言，令 μ 代表虛無假設與對立假設所考慮的某一特定數值，一般而言，對於母體平均數 μ 的假設檢定有下列三種形式。單尾檢定 (左尾檢定) 單尾檢定 (右尾檢定) 雙尾檢定 16 第9章假設檢定 Part A (9.1-9.4) 第330頁

9.2 型Ⅰ和型Ⅱ錯誤 • 因為假設檢定是以樣本資料為基礎，所以必須容許錯誤的可能性。 • 型 I 錯誤是 H0為真，卻拒絕 H0。 • 顯著水準是在虛無假設中的等式關係為真時，犯下型 I 錯誤的機率。 17 第9章假設檢定 Part A (9.1-9.4) 第331頁

型Ⅰ和型Ⅱ錯誤 • 型 I 錯誤 • 當虛無假設中的等式關係為真時，犯型 I 錯誤的機率，稱為顯著水準 (level of significance)。 • 我們以希臘字母 α (alpha) 表示顯著水準，常用的 α 值是 0.05 及 0.01。 • 如果犯型 I 錯誤，必須付出極高的成本，則研究人員偏好較小的 α 值。只控制型 I 錯誤機率的假設檢定通常稱為顯著性檢定 (significance tests)。 18 第9章假設檢定 Part A (9.1-9.4) 第331 - 332頁

型Ⅰ和型Ⅱ錯誤 • 型 II 錯誤 • 型 II 錯誤是當 H0為偽，卻不拒絕 H0。 • 雖然大部分的假設檢定應用都會控制型 I 錯誤的機率，但是型 II 錯誤的機率則不一定在控制中。因此，假若我們決定不拒絕 H0，我們還是不能確定此決定有多大的信心。 • 統計學家通常建議我們用「不拒絕 H0」(do not reject H0)，而不用「接受 H0」(accept H0) 的陳述。 19 第9章假設檢定 Part A (9.1-9.4) 第332頁

型Ⅰ和型Ⅱ錯誤 事實 H0 為真 Ha 為真結論不接受H0 正確的結論型 II 錯誤型 I 錯誤正確的結論拒絕H0 20 第9章假設檢定 Part A (9.1-9.4) 第331頁表9.1

9.3 母體平均數：σ 已知 • 母體平均數的單尾檢定 (one-tailed tests)有以下兩種形式：左尾檢定右尾檢定 21 第9章假設檢定 Part A (9.1-9.4) 第334頁

母體平均數假設檢定的檢定統計量：σ 己知 母體平均數：σ 已知 22 第9章假設檢定 Part A (9.1-9.4) 第335頁圖9.1

母體平均數：σ 已知 • 左尾檢定的關鍵問題是：z 值必須多小，才能拒絕虛無假設？有兩個方法可以提供解答。 • 第一個方法使用檢定統計量 z值來計算稱為 p 值(p-value)的機率。P 值可衡量樣本支持(或不支持)虛無假設的程度，在已知的顯著水準下，可用以判定是否拒絕虛無假設。 • 第二種方法則需要先決定一個檢定統計量的值，稱為臨界值(critical value)。 23 第9章假設檢定 Part A (9.1-9.4) 第336頁

單尾檢定的p值法 • p值是機率，以檢定統計量計算而得，用以衡量樣本資料支持 (或不支持) 虛無假設的程度。由於 p值是機率，其值介於 0 與 1 之間。 • p值愈小，愈不支持虛無假設。較小的 p值表示，虛無假設為真時，得到此種樣本是較不尋常的。 • 若p 值 ≤ α，則拒絕H0。 24 第9章假設檢定 Part A (9.1-9.4) 第336 - 337頁

單尾檢定的臨界值法 • 在 σ 已知時，檢定統計量 z 的抽樣分配是標準常態分配。 • 我們可以用標準常態機率分配表以得到對應於左尾(或右尾)面積為α時的 z值。 • 假設檢定量的值建立在拒絕域稱為稱為檢定的臨界值拒絕法則為： • 左尾檢定：拒絕H0若z ≤ - z α • 右尾檢定：拒絕H0若 z ≥ z α 25 第9章假設檢定 Part A (9.1-9.4) 第338頁

假設檢定的步驟 步驟 1. 建立虛無與對立假設。步驟 2. 確認顯著水準。步驟 3. 蒐集樣本資料、計算檢定統計量的值。 • p 值法步驟 4. 運用檢定統計量的值求得 p 值。　步驟 5. 若 p 值 ≤ α ，則拒絕 H0。 26 第9章假設檢定 Part A (9.1-9.4) 第338頁

假設檢定的步驟 • 臨界值法步驟 4. 運用顯著水準決定臨界值與拒絕法則。　步驟 5. 運用檢定統計量的值與拒絕法則判定是否拒絕 H0。 27 第9章假設檢定 Part A (9.1-9.4) 第338頁

母體平均數：σ 已知 (實例) • 美國聯邦貿易委員會 (FTC) 定期檢驗製造商的宣稱或保證。例如，Hilltop 咖啡在其大罐裝咖啡上標示每罐內容物有 3 磅，FTC 瞭解 Hilltop 咖啡的製程不可能讓每罐咖啡恰好重 3 磅。但是，只要母體的平均重量至少 3 磅，消費者權益即受到保障。因此，FTC 將 Hilltop 在咖啡罐上的標籤所提供的訊息視為 Hilltop 的宣稱，即母體的平均裝填重量為每罐至少 3 磅。我們將說明 FTC 如何進行左尾檢定，以檢驗 Hilltop 的宣稱。 28 第9章假設檢定 Part A (9.1-9.4) 第334頁

母體平均數：σ 已知 (實例) • 步驟 1.建立適當的虛無和對立假設。 • 如果咖啡的母體平均裝罐重量大於 3 磅，則 Hilltop 的宣稱是正確的，所以這是虛無假設；但如果母體平均的裝罐重量小於 3 磅，則 Hilltop 的宣稱就不正確，這是對立假設。以 μ 代表母體的平均重量，則虛無與對立假設可表示為 H0 : μ ≥ 3Ha : μ < 3 29 第9章假設檢定 Part A (9.1-9.4) 第342頁

母體平均數：σ 已知 (實例) • 步驟 2.確認顯著水準 α • FTC的主管選擇以 0.01 為檢定的顯著水準。α＝0.01表示FTC的主管願意接受 0.01 的機率在虛無假設的等號(μ= 3)成立時，拒絕虛無假設。 • 步驟 3.蒐集樣本資料、計算統計檢定量的值 • 檢定統計量 • 樣本資料 30 第9章假設檢定 Part A (9.1-9.4) 第342頁

母體平均數：σ 已知 (實例) p值法 • 步驟 4. 運用檢定統計量的值求得 p 值 • 運用標準常態分配表可以發現，介於平均數及 z＝－2.67 之間的面積是0.4962。因此，p 值是 0.5000－0.4962＝0.0038。 • 步驟5.若p-值 ≤ α，則拒絕H0 • p 值是 0.0038，因此拒絕虛無假設。 31 第9章假設檢定 Part A (9.1-9.4) 第342頁

母體平均數：σ 已知 (實例) 32 第9章假設檢定 Part A (9.1-9.4) 第337頁圖9.2

臨界值法 步驟 4. 運用顯著水準決定臨界值與拒絕法則。運用標準常態分配表可以看到，對應於左尾面積 α ＝0.01 的 z＝－2.33 (見圖 9.3)。母體平均數：σ 已知 (實例) 33 第9章假設檢定 Part A (9.1-9.4) 第338頁圖9.3

母體平均數：σ 已知 (實例) • 步驟 5. 運用檢定統計量的值與拒絕法則判定是否拒絕 H0。 • 檢定統計量若小於等於－2.33，對應的 p 值將小於等於 0.01，我們就拒絕 H0。所以，Hilltop 咖啡研究中，顯著水準為 0.01 時的拒絕法則是若 z <－2.33，則拒絕 H0 • Hilltop 咖啡的例子中，＝2.92，檢定統計量 z＝－2.67，因為 z＝－2.67 ,－2.33，我們可以拒絕 H0，得到的結論是 Hilltop 咖啡有偷斤減兩的問題。 34 第9章假設檢定 Part A (9.1-9.4) 第338頁

雙尾假設檢定 • 假設檢定中，母體平均數的雙尾檢定 (two-tailed test)之一般形式如下： 35 第9章假設檢定 Part A (9.1-9.4) 第339頁

雙尾假設檢定的 p值法 • 雙尾檢定的 p值計算過程簡化為以下三個步驟 • 計算檢定統計量 z 的值。 • 如果檢定統計量的值在右尾 (z > 0) ，求出標準常態曲線下方，在 z 值以右的面積。如果檢定統計量的值在左尾 (z < 0)，求出標準常態曲線下方，在 z 值以左的面積。 • 將步驟 2 得到的面積 (即機率) 乘以 2，即為 p 值。 • 拒絕法則是：若p 值 ≤α，則拒絕H0 36 第9章假設檢定 Part A (9.1-9.4) 第341頁

雙尾假設檢定的臨界值法 • 利用比較檢定統計量 z與臨界值，以進行雙尾檢定。 • 查標準常態分配表可知檢定統計量的臨界值是 -zα/2與 zα/2。(位於分配表兩尾臨界值以外，由α/2 所對應的 z值) • 拒絕法則是：若z< -zα/2 或z>zα/2，則拒絕H0 37 第9章假設檢定 Part A (9.1-9.4) 第342頁

雙尾假設檢定(實例) • 美國高爾夫協會 (USGA) 為高爾夫球具擬定製造規格，所有球具、裝備皆需符合規格，才能在 USGA 舉辦的賽事中使用，MaxFlight 公司運用高科技製程生產高爾夫球，高爾夫球的平均移動距離是 295 碼。有時因製程調整不當，平均移動距離與 295 碼有所出入。 • 如果低於 295 碼，將與廣告所宣稱的不符，MaxFlight 擔心會失去訂單，不利銷售。 • 如果超過 295 碼，MaxFlight 的高爾夫球將被拒於 USGA 的賽事以外。 38 第9章假設檢定 Part A (9.1-9.4) 第339頁

雙尾假設檢定(實例) • MaxFlight 的品質管制計畫會定期抽取 50 個高爾夫球為樣本以監控製程。對每組樣本而言，假設檢定的目的在於決定是否要調整製程。我們要建立虛無假設與對立假設，首先假定製程正常，即高爾夫球的平均移動距離是 295 碼。此即為虛無假設，對立假設則是平均距離不等於 295 碼。 39 第9章假設檢定 Part A (9.1-9.4) 第339頁

雙尾假設檢定(實例) 40 第9章假設檢定 Part A (9.1-9.4) 第340頁圖9.4

雙尾假設檢定(實例) • 步驟 1. • 假設值 μ 0＝295，MaxFlight 假設檢定的虛無假設與對立假設分別是：H0 : μ = 295Ha : μ ≠ 295 • 步驟 2. • 品管小組選擇 α ＝0.05為檢定的顯著水準。 41 第9章假設檢定 Part A (9.1-9.4) 第343頁

雙尾假設檢定(實例) • 步驟3. • 統計檢定量 • 樣本資料：σ = 12 ，樣本大小 n =50, = 297.6 碼，因此統計檢定量是 42 第9章假設檢定 Part A (9.1-9.4) 第340頁

雙尾假設檢定- p值法(實例) p值法 • 步驟 4. • 雙尾檢定的 p值是P(z ≤ -1.53) + P(z ≥ 1.53)= 2(0.0630) = 0.1260 • 步驟 5. • 比較 p 值與顯著水準，以判斷是否拒絕虛無假設，顯著水準 α ＝0.05，因為 p 值＝0.1260 > 0.05，所以不拒絕 H0。由於不拒絕虛無假設，MaxFlight無須對製程進行調整。 43 第9章假設檢定 Part A (9.1-9.4) 第340頁

雙尾假設檢定- p值法(實例) 44 第9章假設檢定 Part A (9.1-9.4) 第341頁圖9.5

雙尾假設檢定-臨界值法(實例) 臨界值法 • 步驟 4. • 顯著水準 α ＝0.05，位於兩尾的臨界值以外的面積各為 α /2＝0.05/2＝0.025。 • 查標準常態分配表可知，檢定統計量的臨界值是－z0.025＝－1.96 與 z0.025＝1.96。 45 第9章假設檢定 Part A (9.1-9.4) 第341頁

雙尾假設檢定-臨界值法(實例) 46 第9章假設檢定 Part A (9.1-9.4) 第341頁圖9.6

雙尾假設檢定-臨界值法(實例) • 步驟 5. • 因此，運用臨界值法雙尾檢定的拒絕法則是若 z ≤ －1.96 或z ≥1.96，則拒絕H0 • 由於 MaxFlight 問題的假設檢定量為 z＝1.53，表示在 0.05 的顯著水準下，統計上的證據不支持拒絕虛無假設。 47 第9章假設檢定 Part A (9.1-9.4) 第342頁

區間估計與假設檢定的關係 48 第9章假設檢定 Part A (9.1-9.4) 第342頁表9.2

母體平均數的雙尾檢定-信賴區間檢定 • 自母體取簡單隨機樣本，以樣本平均數建立母體平均數 μ 的信賴區間 • 如果信賴區間包含假設值 μ0，不拒絕 H0；否則，拒絕 H0。 49 第9章假設檢定 Part A (9.1-9.4) 第343頁

母體平均數的雙尾檢定-信賴區間檢定 • 再以 MaxFlight 的假設檢定為例，雙尾檢定的假設如下在 α ＝0.05 的顯著水準下，檢定上述假設。我們抽出 50 顆高爾夫球為樣本，樣本平均數＝297.6 碼。已知母體標準差 σ ＝12。z0.025＝1.96，以上述數值可得到母體平均數的 95% 信賴區間估計值是或 294.3 到 300.9 50 第9章假設檢定 Part A (9.1-9.4) 第343頁

第 9 章

第 9 章

Presentation Transcript