第 12 章

第 12 章 適合度與獨立性的檢定

統計實例 • 大羅徹斯特的聯合基金會(United Way)是一個非營利性的組織。該組織藉由滿足社區居民最重要的生活照顧需求，改善其所服務7個郡居民的生活品質。 • 該基金會決定進行一項調查，以進一步瞭解社區居民對慈善活動的感受。 • 從蒐集到的資料中，可以得到許多描述性的統計，包括次數分配與交叉表格等。 • 本章中，你將學到如何進行如上述的獨立性統計檢定。

第12章適合度與獨立性的檢定 • 12.1 適合度檢定：多項母體 • 12.2 獨立性檢定 • 12.3 適合度檢定：瓦松分配與常態分配

12.1 適合度檢定：多項母體 1. 列出虛無及對立假設。 2. 選取一組隨機樣本，記錄每一類別的觀察次數 fi 3. 假設虚無假設為真，將樣本大小乘以每一類別的機率，求得每一類別的期望次數 ei

適合度檢定：多項母體 4. 計算檢定統計量的值：其中： fi =類別 i 的觀察次數 ei =類別 i的期望次數 k =類別的個數　　注意：此檢定統計量服從自由度為k－1的卡方分配，其中每個類別的期望次數皆須大於或等於5。

拒絕H0若 適合度檢定：多項母體 5. 拒絕法則： p-值法：拒絕H0若p-值≤ a 絕對值法：其中 α 為顯著水準，自由度為 k－1。

適合度檢定：多項母體(實例) • 以Scott Marketing Research 公司進行的一項市場佔有率的研究為例，某個產業在過去一年之間，各廠商的市場佔有率可說十分穩定，其中A、B、C三家公司的佔有率分別為30% 、50% 與20%。 • 但最近C公司發展出一種新的改良性產品，其將取代該公司目前在市場上所推出的產品。該公司請Scott Marketing Research 協助判斷此一新產品是否會使三家廠商的佔有率改變。

適合度檢定：多項母體(實例) • 在本例中，我們所關心的母體就是一個多項母體，其中每個顧客會被歸類為是向A、B或C公司購買。因此，此一多項母體共包含了三種結果，我們使用下列的符號：pA = A公司的市場佔有率pB = B公司的市場佔有率pC = C公司的市場佔有率

適合度檢定：多項母體(實例) • Scott Marketing Research 公司將進行一項抽樣調查，以計算顧客偏愛每家公司產品的比例，並進行一假設檢定以判斷該產品是否已導致市場佔有率的改變。在C公司的新產品不會改變市場佔有率的假設下，虛無及對立假設可表示如下：如果樣本結果導致我們拒絕 H0，該市調公司即有充分證據認為該新產品的推出將會對各公司的佔有率造成影響。

適合度檢定：多項母體(實例) • 假設該市調公司選取200位顧客為一組樣本，請每位顧客指出在A、B公司的既有產品及C公司的新產品三者中，比較偏愛的產品，樣本結果如下所示。 • 在pA＝0.30, pB＝0.50且 pC＝0.20的假設下，計算200位顧客的期望購買偏好，其計算如下。

適合度檢定：多項母體(實例) • 令顯著水準 α＝0.05，利用觀察次數與期望次數計算檢定統計量的值。由於所有的期望次數都大於或等於5，卡方檢定統計量的計算如表12.1所示，即 χ2＝7.34。 • 觀察次數與期望次數的差異夠大時，我們將拒絕虛無假設。此差異愈大會導致檢定統計量的值愈大，因此適合度的檢定為一右尾的檢定，在檢定統計量的右尾區域計算 p值，並據以決定是否拒絕虛無假設。

適合度檢定：多項母體(實例) • 查卡方分配表(附錄B表3)，當自由度為k－1＝3－1＝2時，結果如下：

適合度檢定：多項母體(實例) • 由於檢定統計量 χ2＝7.34，介於5.991與7.378之間，因此其對應的右尾區域的p值會在0.05與0.025之間。因為 p值 ≤ α＝0.05，我們的結論為拒絕 H0，亦即C公司藉由新產品的導入，將會改變目前市場佔有率的結構。 • 運用Minitab或Excel可以算出當 χ2＝7.34時，其p值為0.0255。

適合度檢定：多項母體(實例) • 除了p值的方法外，我們也可以使用臨界值的方法得到相同的結果。當 α ＝ 0.05且自由度為2時，檢定統計量的臨界值為 5.991，右尾的拒絕法則為若 χ2≥ 5.991，則拒絕H0由於7.34＞5.991，因此拒絕H0。p值和臨界值兩種方法都會有一致的檢定結果。

12.2 獨立性檢定 1.列出虛無及對立假設。 2. 選取一組隨機樣本，記錄列聯表中每一方格的觀察次數fij。 3. 計算每一方格的期望次數 eij 。

拒絕 H0若p –值≤a或 獨立性檢定 4. 計算檢定統計量的值 5. 拒絕法則：其中 α 為顯著水準，在 n 列、m 行的情況下自由度為(n－1)(m－1)

獨立性檢定(實例) • 以下以亞利桑那州土桑市的Alber's酒廠所進行的研究，來說明獨立性檢定。該公司主要是製造與配銷三種啤酒：淡啤酒、一般啤酒與黑啤酒。在一項對這三種啤酒市場區隔的分析中，該公司的市場研究小組提出一個問題，即男性與女性的啤酒飲用者對這三種啤酒的偏好是否不同。如果性別與對啤酒的偏好相互獨立，則該公司將對其所有啤酒展開同一種廣告活動；反之，如果對啤酒的偏好與性別有關，該公司將針對不同的目標市場採行不同的促銷活動。

獨立性檢定(實例) • 針對啤酒偏好(淡啤酒、一般啤酒及黑啤酒)是否與啤酒飲用者的性別(男性或女性)相互獨立的問題，進行一項獨立性檢定，其假設為H0：對啤酒的偏好與啤酒飲用者的性別相互獨立Ha：對啤酒的偏好與啤酒飲用者的性別並非相互獨立 • 表12.2可用來描述此一研究的狀況。我們將母體定義為所有的男性與女性啤酒飲用者，從其中取出一組樣本，請每人說出他或她對三種Alber's啤酒的偏好，如此一來，樣本中的每個人都將被歸類到表中的6個方格之一。

獨立性檢定(實例) • 表12.2可稱為列聯表(contingency table)。獨立性檢定即是以列聯表的方式為之，因此其亦稱為列聯表檢定(contingency table test)。

獨立性檢定(實例) • 表12.3中的資料，乃每一個組別或類別的觀察次數。如果可決定在啤酒偏好與性別相互獨立的假設下，每個組別或類別的期望次數，我們即可使用卡方分配來判斷觀察次數與期望次數之間是否有顯著的差異。

獨立性檢定(實例) • 假定啤酒偏好與性別間相互獨立的虛無假設為真，，其次，我們注意到在樣本的150人中，有50位偏愛淡啤酒，70位偏愛一般啤酒，至於偏愛黑啤酒者則有30位。此意指這三種啤酒的偏好比率依序為50/150 ＝ 1/3, 70/150 ＝ 7/15，以及30/150＝1/5。如果獨立性的假設成立，則這些比率不論就男性或女性飲用者而言，均可一體適用。 • 因此，在獨立性的假定之下，我們可以預期在樣本中的80位男性中，有(1/3)80＝26.67位偏好淡啤酒，(7/15)80＝37.33位偏愛一般啤酒，(1/5)80＝16位偏愛黑啤酒。我們同樣可將這些比率用來計算樣本中70位女性的期望次數，如表12.4所示。

獨立性檢定(實例) • 令eij表示列聯表中第 i列與第j行類別的期望次數。例如，e12即代表男性(第1列)且偏愛一般啤酒(第2行)的期望次數，根據前述期望次數的計算方式，可表達為e12＝(7/15)80＝37.33也可表達為其中，80為男性總人數(第1列總和)，70為偏愛一般啤酒的總人數(第2行總和)，而150則是樣本的總人數。因此

獨立性檢定(實例) • 使用此一公式可計算男性、偏愛黑啤酒的期望次數e13＝(80)(30)/150＝16.00，其餘的期望次數如表12.4所示。

獨立性檢定(實例) • 審視表12.4，可看出所有類別的期望次數均大於5，因此，可以進一步計算卡方檢定統計量，從表12.5可計算出檢定統計量 χ2＝6.12。 • 此一卡方分配的自由度，乃將列數減1乘以行數減1。本例中，列數為2，行數為3，自由度為(2－1)(3－1)＝2。 • 如同適合度檢定，當觀察次數與期望次數的差異獲致大的檢定統計量的值時，我們才會拒絕獨立性檢定中的H0。

獨立性檢定(實例) • 獨立性的檢定也是右尾檢定。 • 查卡方分配表(附錄B表3)，當 χ2＝6.12時，右尾區域或p值會介於0.025與0.05之間，運用Excel可以算出p值為0.0468。 • 若令顯著水準為0.05，則p值 ≤ α ＝0.05，因此，我們拒絕獨立性的虛無假設，且下結論為啤酒偏好並非與啤酒飲用者的性別相互獨立。

12.3 適合度檢定：瓦松分配 1. 列出虛無及對立假設。 H0：母體為卜瓦松分配 Ha：母體並非為卜瓦松分配 2. 選取一組隨機樣本，且a.就卜瓦松隨機變數的每個可能值，記錄其觀察次數 fib.計算平均發生次數 3. 就卜瓦松隨機變數的每個可能值，計算其期望次數ei

適合度檢定：瓦松分配 4. 計算檢定統計量的值其中： fi =類別 i 的觀察次數 ei =類別 i的期望次數 k =類別的個數　　

拒絕H0若 適合度檢定：瓦松分配 5. 拒絕法則： p-值法：拒絕H0若p-值≤a 絕對值法：其中 α 為顯著水準，自由度為 k－2。

適合度檢定：瓦松分配(實例) • 考慮位於佛羅里達州塔拉哈西市的Dubek's食品市場，其顧客到達的例子。由於最近的人事問題，該公司的管理者要求當地的一家顧問公司來協助規劃櫃台中店員配置的問題。審視櫃台作業之後，該顧問公司建議了一套店員配置的程序。這套程序係以等候線的數學分析為基礎，其只有在一限定的時間內顧客到達的人數服從卜瓦松分配才適用。因此，在這套程序被付諸實行之前，必須先蒐集顧客到達的資料並進行統計檢定，以決定顧客到達的人數服從卜瓦松分配的假設是否合理。

適合度檢定：瓦松分配(實例) • 我們將到達定義為在5分鐘時段內進入店內的顧客人數。因此，以下的虛無及對立假設對Dubek‘s食品市場的研究而言，應該是適用的。H0：在5分鐘時段內進入店內的顧客人數　　服從卜瓦松分配 Ha：在5分鐘時段內進入店內的顧客人數　　並非服從卜瓦松分配 • 所建議的配置程序；反之，如果樣本結果導致 H0被拒絕，卜瓦松分配的假設不能成立，則該公司將考慮其他的配置程序。如果顧客到達的樣本結果顯示 H0不能被拒絕，該公司將著手實行顧問公司

為了檢定非假日早晨時段顧客到達的人數為卜瓦松分配的假設，店中某位員工在3週之內，於非假日的早晨時段隨機抽取一組大小為128個的5分鐘時段的樣本。在樣本中的每個5分鐘時段內，該員工記錄顧客到達的人數，進而將128個資料彙整成沒有顧客、只有一位顧客、2位顧客……等等的5分鐘時段的人數分類，結果如表12.6所示。為了檢定非假日早晨時段顧客到達的人數為卜瓦松分配的假設，店中某位員工在3週之內，於非假日的早晨時段隨機抽取一組大小為128個的5分鐘時段的樣本。在樣本中的每個5分鐘時段內，該員工記錄顧客到達的人數，進而將128個資料彙整成沒有顧客、只有一位顧客、2位顧客……等等的5分鐘時段的人數分類，結果如表12.6所示。適合度檢定：瓦松分配(實例)

適合度檢定：瓦松分配(實例) • 表12.6中有10個類別的觀察次數，現在我們以適合度檢定來判斷前述128個時段的樣本是否支持卜瓦松分配的假設。欲進行適合度檢定，我們還必須計算當顧客到達人數為卜瓦松分配的假設為真時，這10個類別的期望次數。也就是說，我們必須計算當顧客到達人數為卜瓦松分配時，沒有顧客、只有1位顧客、只有2位顧客……等等的時段之期望個數。

適合度檢定：瓦松分配(實例) • 卜瓦松分配，其機率函數為在此函數中，μ 代表每5分鐘內顧客到達人數的平均數或期望人數，x 為一隨機變數，意指在某一5分鐘時段內顧客到達的人數。最後，f(x)表示在某一5分鐘時段內將到達 x 位顧客的機率。 • Dubek's食品市場的卜瓦松機率函數的估計式如下

適合度檢定：瓦松分配(實例) • 假設該 μ ＝5的卜瓦松分配適合描述Dubek‘s公司顧客到達人數，則可將前述的機率函數代入不同的 x 值而求得每一類到達人數的機率，如表12.7所示，這些機率也可在附錄B的表7查到。 • 例如，在5分鐘內沒有顧客到達的機率是f(0) ＝0.0067，5分鐘內只有1位顧客到達的機率為f(1)＝0.0337等等。如12.1節所述，每個類別的期望次數等於機率乘以樣本大小；例如，沒有顧客到達的期望時段個數為(0.0067)(128)＝0.86，只有1位顧客到達的期望時段個數為(0.0337)(128)＝4.31等等。

適合度檢定：瓦松分配(實例)

適合度檢定：瓦松分配(實例) • 我們將合併0與1為一類，合併9與「10或以上」為一類，而達到每一類別的期望次數至少為5的要求。表12.8為合併後觀察與期望次數的結果。 • 適合度檢定是針對觀察與期望次數之差fi－e來進行。我們可利用表12.8的資料來計算卡方檢定統計量計算卡方檢定統計量的過程列於表12.9，檢定統計量的值 χ2＝10.96。

適合度檢定：瓦松分配(實例)

適合度檢定：瓦松分配(實例) • 一般來說，適合度檢定的卡方分配其自由度為k－p－1，其中k為類別個數，p為從樣本資料中估計的母體參數個數。就本例的卜瓦松分配適合度檢定而言，表12.9中有k＝9個類別；又由於我們使用樣本資料估計了卜瓦松分配的平均數，因此p＝1。所以，自由度為k－p－1＝k－2＝9－2＝7。

適合度檢定：瓦松分配(實例) • 假定我們是以0.05的顯著水準來檢定顧客到達的機率分配為卜瓦松分配的虛無假設。為了檢定這個假設，我們必須藉由自由度為7的卡方分配其右尾區域來算出檢定統計量 χ2＝10.96的p值。查附錄B的表3，當 χ2＝10.96，右尾區域的p值會大於0.10。 • 運用Minitab或Excel，可以算出p值等於0.1403，由於p值大於 α＝0.05，因此不能拒絕H0。也就是說，非假日早晨時段的顧客到達人數服從卜瓦松分配的假設不應被拒絕。所以Dubek's公司的管理者應著手實行由顧問公司所建議的非假日早晨的員工配置方案。

適合度檢定：常態分配 1. 列出虛無與對立假設。 2. 選取一組隨機樣本，且 a.計算樣本平均數與標準差。 b.定義數值的區間，使得每個區間的期望　次數至少為5。使用等機率區間是一個可　行的方法。 c.記錄每個區間的觀察次數 fi。 3. 計算每個區間的期望次數ei。將樣本數乘以常態　隨機變數在該區間的機率。

5. 拒絕法則： p值法：若 p 值 ≤ ，則拒絕H0 絕對值法：若　　　，則拒絕H0 其中 α 為顯著水準，且自由度為k－3。適合度檢定：常態分配 4. 計算檢定統計量的值：

以表12.10 Chemline公司應徵者的測驗資料，來說明常態分配的適合度檢定。適合度檢定：常態分配(實例)

適合度檢定：常態分配(實例) • Chemline 公司每年都為其旗下四家位於美國的工廠僱用400名新進員工，人事主管想瞭解測驗成績的母體是否呈常態分配，因為果真如此的話，公司便能更迅速判定任何特定測驗成績的良窳，例如某份成績名列前20% 、後40% 等。因此，我們要檢定的虛無假設是測驗成績的母體為常態分配。

適合度檢定：常態分配(實例) • 利用表12.10的資料，計算虛無假設中常態分配的平均數與標準差之估計值。我們以樣本平均數與樣本標準差s，作為該常態分配的平均數與標準差的點估計量，其計算如下： • 根據上面的值，提出如下的假設H0：測驗成績的母體呈平均數68.42及標準差10.41　　　　的常態分配 Ha：測驗成績的母體並非呈平均數68.42及標準差10.41的常態分配

適合度檢定：常態分配(實例)

適合度檢定：常態分配(實例) • 現在我們來考慮在常態分配下，定義類別的方法。在檢定離散的卜瓦松分配時，類別被定義為顧客到達的人數，如0, 1, 2等等。但是，在諸如連續常態分配的情況，我們必須以不同的程度，即測驗成績的區間來定義類別。 • 我們在定義測驗成績的類別時，必須使每一區間或類別的期望次數至少為5。由於本例中樣本數為50，為達到前述要求的一種方法，可將常態分配分割為10個有相同機率的區間，如圖12.3所示。因為樣本數為50，每個區間或類別的期望次數均為5。

適合度檢定：常態分配(實例) • 由於我們是將母體假定為常態分配，因此可使用標準常態機率表來決定這些界限。首先考慮後10% 測驗成績的上限。從附錄B的表1可查出此一上限的z值為−1.28，換算成測驗成績為x＝68.42－1.28(10.41)＝55.10。如果算的是後20% 測驗成績的上限，則z＝−0.84，因此x＝68.42－0.84(10.41)＝59.68。根據此種方式，可計算得到下列測驗成績之值。

適合度檢定：常態分配(實例) • 測驗成績的類型或區間已經定義完成，且每個類別的期望次數已知為5，我們可回到表12.10的樣本資料並決定各個類別的觀察次數，其結果如表12.11所示。 • 以表12.11為基礎，我們可進行和以前一樣的適合度檢定；也就是說，我們可藉由計算 χ 值而將觀察與期望次數做一比較。計算卡方檢定統計量的過程列於表12.12，檢定統計量的值 χ2＝7.2。

第 12 章

第 12 章

Presentation Transcript

What is United Way?

United Way of Northern Ozaukee

United Way 2008

United Way of Washington County

United Way of Jamaica

United Way Campaign 101 WELCOME

A United Way Member Agency

United Way Worldwide

United Way Mini-Grants

Student United Way

Middlesex United Way

United Way Business Model

United Way Trivia!

United Way U.S. Network

United Way Reporting

United Way

United Way NWT Coordinator

United Way Speaker’s Training

2009 United Way Rally

2013 United Way Rally

Cornell United Way

United Way Retirees Association Helping United Way Staff Plan for Retirement