560 likes | 870 Views
第 13 章. 實驗設計與變異數分析 Part A (13.1-13.3). 本章內容. 13.1 實驗設計與變異數分析介紹 13.2 變異數分析與完全隨機設計 13.3 多重比較程序 13.4 隨機區集設計 13.5 因子實驗. 第 13 章 實驗設計與變異數分析 第 483-517 頁. 實驗設計與變異數分析. 統計研究可分為實驗型或觀察型兩類。
E N D
第 13 章 實驗設計與變異數分析 Part A (13.1-13.3)
本章內容 13.1 實驗設計與變異數分析介紹 13.2 變異數分析與完全隨機設計 13.3 多重比較程序 13.4 隨機區集設計 13.5 因子實驗 第13章 實驗設計與變異數分析第483-517頁
實驗設計與變異數分析 統計研究可分為實驗型或觀察型兩類。 在實驗型統計研究 (experimental statistical study) 中,我們先界定感興趣之變數,而後控制研究中另一個或更多個其他因素,即可獲得這些因素如何影響欲探討變數之資料。 在觀察型的研究 (observationalstudy) 的研究中,我們不需控制實驗,而是從實地訪查(survey)中取得資料。 在觀察型的研究中,要建立因果關係是有困難的。實驗型研究則較為容易。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第484-485頁
實驗設計介紹 因素(factor)是一個調查研究中可被實驗者選擇的變數。 處理(treatment)是每一因素的對應方式。 實驗單位(experimental units)是實驗中感興趣的主題。 完全隨機設計(completely randomized design)是指處理被隨機指派的一種實驗設計。 當實驗單位的性質相類似時,可以使用完全隨機的設計。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第485頁
實驗設計介紹 (實例) Chemitech 公司發展出一套新的自來水過濾系統。過濾系統之零件必須向數個供應商購買,Chemitech 公司將在位於南卡羅來納州哥倫比亞市的工廠組裝這些零件。工業工程部門須負責決定此套新過濾系統的最佳組裝方法。在考慮很多可行的組裝方法後,工業工程部門選出三種較佳的方法:方法 A、方法 B 及方法 C。這些方法在組裝產品的先後次序上有所差異。Chemitech 公司的經理希望知道何種組裝方法可在一星期內生產最多的過濾系統。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第485頁
實驗設計介紹 (實例) 在 Chemitech 公司的實驗中,組裝方法被視為是一個變數或因素 (factor),因為此因素包含三種組裝方法,我們稱此實驗有三個處理 (treatment),每一個處理對應一種組裝方法。 Chemitech 公司之問題是有關類別因素 (catogorial factor) (組裝方法) 的單因素實驗 (single-factor experiment)的實例。其他實驗可能包含多個因素,其中有些是類別因素,有些則是定量因素。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第485頁
實驗設計介紹 (實例) 這三種組裝方法 (或處理) 定義了此次 Chemitech 實驗中的三個研究母體。第一個母體是使用方法 A 的所有員工、第二個母體為使用方法 B 的所有員工、第三個母體則為使用方法 C 的所有員工。對每一個母體而言,應變數或反應變數(response variable)為每星期組裝的過濾系統數目。而此次實驗的統計目的則是決定三個母體(方法)每星期之平均產量是否相等。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第485頁
實驗設計介紹 (實例) 假設我們從 Chemitech 公司的所有裝配工人中,任意選取 3 名員工組成一組隨機樣本,稱為實驗單位 (experimental units)。 在 Chemitech 公司之問題中,使用的實驗設計稱為完全隨機設計 (completely randomized design)。此種設計方式要求 3 個實驗單位 (即裝配工人) 均被隨機指派一種組裝方法 (或處理)。 例如,第二個工人被指定以方法 A 組裝,第一個工人被指定方法 B,第三個工人則採用方法 C。此例子中的隨機化 (randomization) 概念是所有實驗設計的重要原則。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第485頁
實驗設計介紹 (實例) 值得注意的是,在這個實驗中,一個處理將只含一個測量值 (即組裝的產品數量)。為了獲得更多資料,我們必須重複上述實驗程序。例如,我們不要一次只隨機選取 3 名員工,而改為選取 15 名員工,然後各隨機指派 5 名員工採用某種組裝方式。既然每種組裝方式都有 5 名員工,我們即可說:重複 5 次實驗。這種重複的過程為實驗設計的另一重要原則。 圖 13.1 說明此次 Chemitech 實驗的完全隨機設計。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第485頁
圖13.1 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第486頁 圖13.1
實驗設計介紹 (實例) 在 Chemitech 公司之例子中,我們須先指導員工如何執行所被指派的組裝方法,而後令其使用此種組裝方法開始組裝新的過濾系統。表 13.1 即每名員工在1週內組裝的數量、三種組裝方式所生產的產品數量的樣本平均數、樣本變異數與樣本標準差,其中使用方法A的樣本平均數為62,方法B為66,方法C為52。 就上述資料而言,方法 B 的生產率似乎高於其他兩種方式。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第86頁
表13.1 第13章 實驗設計與變異數分析 Part A (13.1-13.1) 第486頁 表13.1
實驗設計介紹(實例) 真正的問題是,這三個樣本平均數之差異是否大到可以使我們下結論,即三種組裝方式之產量不同。為以統計名詞表達此問題,我們先介紹下列符號。μ1=方法 A 平均每星期產量μ2=方法 B 平均每星期產量μ3=方法 C 平均每星期產量 雖然我們不可能知道 μ1、μ2 及 μ3真正的值,但我們可使用樣本平均數檢定下列的假設。H0:μ1= μ2=μ3Ha:所有母體平均數不全相等 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第486-487頁
變異數分析介紹 變異數分析(ANOVA)能用來分析得自觀察型研究的資料,以檢定三個或三個以上的母體平均數是否相等。 在分析同時包含實驗型及觀察型資料之迴歸分析結果時,ANOVA扮演重要角色。 我們可以使用這些樣本資料的結果進行下列假設檢定: H0: 1=2=3=. . . = k Ha: 所有母體平均不全相等 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第474-475.487頁
變異數分析介紹 H0: 1=2=3=. . . = k Ha: 所有母體平均不全相等 如果拒絕 H0,我們不能下結論說所有的母體平均數 都不相等。 拒絕 H0意指至少有兩個母體平均數不相等。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第487頁
變異數分析的假設 1. 每個母體之反應變數均呈常態分配。 2. 所有母體反應變數的變異數 σ2均相等。 3. 由每個母體抽取之樣本必須互為獨立。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第487頁
圖13.2 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第488頁 圖13.2
圖13.3 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第488頁 圖13.3
變異數分析介紹 每一組樣本之樣本內差異亦將影響變異數分析之結論。當由每個母體中抽取一組隨機樣本時,每一組的樣本變異數均應為共同變異數σ2 的不偏估計值。因此,我們將結合共同變異數σ2 的每個個別估計值,成為一個總樣本估計值。以此方式獲得的母體變異數σ2 的估計值稱為σ2 之混合或處理內估計值 (pooled or within-treatments estimate)。 由於σ2 之處理內估計值乃每組樣本組內變異所計算而得之樣本變異數,故不受母體平均數是否相等之影響。當樣本大小相等時,σ2 之處理內估計值可由計算各個樣本變異數之平均數而得。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第488-489頁
變異數分析介紹(實例) 在 Chemitech公司的例子中,我們可得 σ2 的處理間估計值 (260) 遠大於處理內估計值(28.33),事實上,這兩個估計值之比為 260/28.33=9.18。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第489頁
變異數分析介紹 只有當虛無假設為真時,處理間估計值方為σ2的一個好的估計值;若虛無假設為偽,處理間估計值將高估σ2。但處理內估計值則不論在何種情況下,均為共同母體變異數σ2 的良好估計值。因此,若虛無假設為真,此兩個估計值應極為接近,它們的比也應接近 1;如果虛無假設為偽,處理間估計值應大於處理內估計值,且它們的比應該較大。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第489頁
變異數分析介紹 ANOVA 背後的邏輯乃基於共同母體變異數σ2 的兩種獨立估計方式發展而成。一種σ2 的估計方式係基於各種樣本平均數間之差異計算而得,另一種方式則由每組樣本的組內變異數計算而得。藉由比較上述兩個σ2 的估計值,我們將可決定母體平均數是否相等。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第489頁
變異數分析 變異數分析可以用來檢定 k個母體平均數是否相等。 其假設檢定之一般形式為 H0: 1=2=3=. . . = k Ha: 所有母體平均數不全相等 其中 j= 第 j個母體平均數 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第489頁
變異數分析 樣本資料 = 第 j個處理的第i 個觀察值 = 第 j 個處理的觀察值個數 = 第 j 個處理的樣本平均數 = 第 j 個處理的樣本變異數 = 第 j 個處理的樣本標準差 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第490頁
變異數分析 第 j個處理的樣本平均數公式: 第 j個處理的樣本變異數公式: 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第490頁
變異數分析 總樣本平均數 其中 nT = n1 + n2 +. . . + nk 如果每組樣本數均為 n,則 n= kn 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第490頁
檢定 k個母體平均數是否相等(Chemitech公司實例) 在Chemitech公司的例子中,每個樣本數均為 5。使用表 13.1 的資料,我們可以得到下列結果如果虛無假設為真(1=2=3=),總樣本平均數 60 即為母體平均數 μ的最佳估計值。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第490頁
母體變異數之處理間估計值 處理間平方和 (sum of squares due to treatments),記做SSTR。 處理間均方(mean square due to treatments),記作MSTR。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第491頁
母體變異數之處理間估計值 • 2 的處理間估計值,稱為處理間均方(mean square due to treatments),記作 MSTR,計算 MSTR 的公式如下: 處理間平方和(sum of squares between treatments或sum of squares due to treatments),記作 SSTR k- 1 為SSTR 的自由度 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第491頁
母體變異數之處理間估計值(Chemitech公司實例) 若 H0 為真,則 MSTR 為 σ2 的不偏估計值。 當 k個母體平均數不相等時,MSTR 將不再是 σ2 的不偏估計值。事實上,此時 MSTR 將高估 σ2 。 由表 13.1 Chemitech公司的資料,我們可得到下列的結果。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第491頁
母體變異數之處理內估計值 分母 nT-k為SSTR的自由度 • 誤差平方和 (sum of squares due to error),記作SSE。 • 誤差均方(mean square due to error),記作MSE。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第491頁
母體變異數之處理內估計值(Chemitech 公司實例) MSE 來自於每個處理內的差異,它不會受虛無假設是否為真的影響。因此,MSE 恆為 σ2 的一不偏估計值。 由表 13.1 Chemitech 公司的資料,我們可以得到下列的結果。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第491-492頁
比較變異數之估計值:F檢定 若虛無假設為真且 ANOVA 之假設均成立,MSTR/MSE 的抽樣分配將會服從分子自由度為 k-1,分母自由度為nT-k 的 F分配。換言之,若虛無假設為真,MSTR/MSE 的值會是從此F分配抽樣而得的結果。 若虛無假設為假,則因MSTR高估σ2,MSTR/MSE 的值將提高。 因此,當MSTR/MSE 的值太大,使其不似來自分子自由度為 k-1,分母自由度為nT-k 的 F分配時,我們將拒絕H0。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第492頁
比較變異數之估計值:F檢定 • 假設檢定 H0:1=2=. . . = k Ha: 所有母體平均數不全相等 • 檢定統計量 F = MSTR/MSE 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第493頁
比較變異數之估計值:F檢定 • 拒絕法則 p值法: 若p值 ≤ α,則拒絕H0 絕對值法: 若F ≥ Fα,則拒絕H0 其中F值係由分子自由度k- 1 ,分母自由度nT – k 之F分配查表而得。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第493頁
比較變異數之估計值:F檢定(Chemitech公司實例) 若使用顯著水準 α=0.05來進行假設檢定,則檢定統計量的值其分子自由度為 k-1=3-1=2,分母自由度為 nT-k=15-3=12。由於我們只在檢定統計量的值夠大時,才會拒絕虛無假設,因此 p值為 F分配在檢定統計量 F=9.18 的右尾區域的面積值。 圖13.4為 F=MSTR/MSE 的抽樣分配、檢定統計量的值及此假設檢定右尾區域的 p值。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第492頁
比較變異數之估計值:F檢定(Chemitech公司實例) 查附錄 B 的表 4,分子自由度為 2,分母自由度為 12的 F分配,其右尾區域的範圍如下。 由於 F=9.18 大於 6.93,因此 F=9.18的右尾區域會小於 0.01,亦即 p值小於 0.01。因為 p值 ≤ α=0.05,所以拒絕 H0。 此檢定提供了充分的證據顯示三個母體平均數不相等。換言之,變異數分析支持 Chemitech 公司三家工廠的平均測驗成績不全相等之結論。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第492-493頁
比較變異數之估計值:F檢定(Chemitech公司實例) 我們也可以使用臨界值法進行此假設檢定的程序。假設 α=0.05,在自由度為 2 與 12 的 F分配,其右尾區域的面積為 0.05 處,可找到臨界 F 值,查 F分配表,可得 F0.05=3.89。因此,Chemitech 公司的例子其右尾拒絕法則為 若 F≥ 3.89,則拒絕 H0由於 F=9.18,因此拒絕 H0,結論為三個母體的平均數不全相等。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第493頁
ANOVA表 變異數 平方和 均方 自由度 F p值 SSTR SSE SST k – 1 nT – k nT - 1 處理 誤差 總和 MSTR MSE MSTR/MSE SST 的自由度可分解為 SSTR 的自由度與 SSE 的自由度 SST 可以分解為 SSTR 與 SSE 第13章 實驗設計與變異數分析 Part A (13.1-13.3)
ANOVA表 SST 可分解為兩個平方和:處理間平方和與誤差平方和。SST 之自由度nT-1亦可分解為 SSTR 之自由度 k-1 與 SSE 之自由度 nT-k。 若將所有觀察值視為同一組樣本,則總平方和 SST 之計算公式為 第13章 實驗設計變異數分析與實驗設計 Part A (13.1-13.3) 第494頁
ANOVA表 我們可將變異數分析視為分割(partitioning)總平方和與自由度為兩種不同來源:處理與誤差的一個過程。 將平方和除以相對應之自由度即為變異數之估計值。由此得到的 F值與 p值可用以檢定母體平均數是否相 等之假設。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第494頁
ANOVA表 (Chemitech公司實例) 表 13.3 即為 Chemitech 公司之變異數分析表。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第494頁 表13.3
變異數分析之電腦結果 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第496頁 圖13.5
13.3 多重比較程序 假設變異數分析已提供拒絕母體平均數相等之虛無假設的統計證據。 費雪最低顯著差異 (least significant difference, LSD) 程序可用以決定哪些母體平均數間存在差異。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第500頁
費雪 LSD 程序 假設檢定 檢定統計量 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第500-501頁
費雪 LSD 程序 若p值 ≤ α,則拒絕H0 p值法: 絕對值法: 若t ≤ -tα/2或t ≥ tα/2,則拒絕H0 其中tα/2 值係查自由度為nT – k 之t分配表而得。 拒絕法則 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第501-502頁
費雪 LSD 程序 (實例) 利用費雪 LSD 程序檢定在α=0.05的顯著水準下,母體1 (方法A) 與母體 2 (方法B) 之平均數間是否存在顯著差異。 由表 13.1 得知,方法A之樣本平均數是 62,方法B之樣本平均數為 66。 表 13.3 則顯示母體變異數之估計值,即 MSE,為 28.33,其為 σ2之估計值且對應之自由度為 12。根據 Chemitech 公司的資料,檢定統計量的值為 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第501頁
費雪 LSD 程序 (實例) 查附錄B的表2可知,自由度12的t分配表如下所示: t分配表只有正的 t 值,但 t 分配是左右對稱,我們可以找 t=1.19 右尾的面積,此面積的2倍即是 t=-1.19 對應的 p 值。當 t=1.19,其面積介於 0.20 與 0.10 之間,將之乘以 2,可知 p 值一定介於 0.40 與 0.20 之間。 利用 Minitab 或 Excel 可以算出 p值為0.2571。由於 p 值大於 α=0.05,我們不能拒絕虛無假設,因此,我們不能下結論為方法 A 母體的每週平均產量與方法 B 母體的每週平均產量不相等。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第501頁
以檢定統計量 為基礎之費雪 LSD 程序 若 > LSD,拒絕 H0 其中 檢定統計量 假設檢定 拒絕法則 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第501-502頁
費雪 LSD 程序(實例) 就 Chemitech 公司之例子而言,LSD 之值為當樣本大小均相同時,我們只需計算一個 LSD 值。在此情況下,我們僅需將兩樣本平均數之差異值與 LSD 值進行比較。 第13章 實驗設計與變異數分析 Part A (13.1-13.3) 第502頁