340 likes | 651 Views
統計學. 郭信霖 許淑卿. 第十一章 變異數分析. ■ 11-1 變異數分析的意義、原理 ■ 11-2 一因子 ANOVA ■ 11-3 二因子變異數分析(未重複試驗、無交互作用) ■ 11-4 電腦範例 ■ 11-5 流程圖. 11-1 變異數分析的意義、原理. 一、變異數分析的意義 統計學家 R.A. Fisher ( 1890 ~ 1962 )首創變異數分析( Analysis of Variance , ANOVA ),在相同的顯著水準 下,同時( simultaneously )檢定 k 個母體平均數是否相等的方法,謂之。
E N D
統計學 郭信霖 許淑卿
第十一章 變異數分析 ■ 11-1變異數分析的意義、原理 ■ 11-2一因子ANOVA ■ 11-3二因子變異數分析(未重複試驗、無交互作用) ■ 11-4電腦範例 ■ 11-5流程圖
11-1 變異數分析的意義、原理 一、變異數分析的意義 統計學家R.A. Fisher(1890~1962)首創變異數分析(Analysis of Variance,ANOVA),在相同的顯著水準下,同時(simultaneously)檢定k個母體平均數是否相等的方法,謂之。 一因子ANOVA(one-way ANOVA):以一個解釋變數來解釋反應變數變異來源的一種分析方法。 二因子ANOVA(two-way ANOVA):以兩個解釋變數來解釋反應變數變異來源的一種分析方法。 多因子ANOVA:按兩個以上因子分類分析。
ANOVA的步驟是,將樣本各觀測值之總變異(total of variation)分解為組間變異(between of variation)與組內變異(within of variation)。 ANOVA方法是透過對變異數的分析來同時檢定k個母體之平均數 i,i = 1, 2, …, k是否相等。即檢定,H0:1 = 2 =…= k,H1:至少有二平均數不等。
二、變異數分析之原理 ANOVA基本功能: H0:1 = 2 =…= k v.s. H1:1 , 2 , …, k不全相等 進行ANOVA分析時,必先建立三種假設: (1) 每個母體均為常態母體。 (2) 來自每個母體的隨機樣本均互為獨立。 (3) 每個母體的變異數均相等,即 = =…= = 組內變異:由各組本身資料的分佈情形去觀察資料本身內部的變異; 組間變異:由各組平均數的分佈情形去觀察各組平均數之間的變異。
SST(總變異)= = + = + = SSE (組內變異)+ SSC (組間變異) = 誤差平方和 + 行平均數平方和(處理平方 和) 簡捷公式:先求SST,SSC,再求SSE = SST - SSC。
若n1 = n2 =… = nk= n,則簡捷計算公式為 SST = = SSC = = n = ∴ SSE = SST - SSC = = (n -1)
若ni不全相等,則簡捷計算公式為: SST = = ,N = SSC = = = ∴ SSE = SST - SSC = = 變異數分析方法的建立就是以樣本資料去估計組內和組間這兩種變異數,再配合各自由度,以應用F分配檢定。
11-2 一因子ANOVA 一、一因子ANOVA樣本資料 設從k個母體中,分別抽出大小為ni,i = 1, 2, …, k的隨機樣本,令Yij表來自第i個母體的第j個觀測值,這種試驗過程,稱為完全隨機設計(completely randomized design,CRD),所得到的樣本資料如下表:
設N = ,T = = , = = , = 且 Yij= i+ ij= + i+ ij~N( i, 2 ),i = 1, …, k,j = 1, …, n i, 式中ij = Yij-i表誤差項(error term)或殘差項(residual)。其性質如下: (1)ij為獨立隨機變數。(2) ij ~N(0 , 2) (3)i- = i且= 0 (4) i稱為第i個母體的效果、影響。
二、一因子ANOVA的變異及計算簡式 SST = SSC (組間變異)+ SSE (組內變異) N – 1 = ( k - 1) + (N -k) , N = 總變異自由度 組間自由度 組內自由度(誤差變異自由度)
三、母體變異數2的估計量 母體共同變異數2的獨立估計量有二: 1. 組間變異: = = = MSC(treatment mean square) E(MSC) = 2 + > 2 = E(MSE) 2. 組內變異: = = MSE(error mean square) E(MSE) = 2。
四、一因子ANOVA檢定步驟及表格 一因子ANOVA檢定步驟: (1)假設: H0:1 = 2 =…= k, H1:至少有二平均數不相等或H0:1 = 2 =…= k = 0, H1:至少有一i 0 (2)檢定統計量: F = =
(3)拒絕區域: CR = { F > F(k-1, N-k) } (4)在H0下,計算檢定統計量的值: F0 = (5)結論: 若F0CR,則拒絕H0; 否則,不拒絕H0。
11-3 二因子變異數分析(未重覆試驗、無交互作用) 一、二因子ANOVA樣本資料 將一組樣本觀測值,按A、B兩種標準、因子分類,其中A分類為A1 , A2 ,… , Ar;B分類為B1 , B2 ,… , Bc,在每一個交集項下在完全隨機化集區設計(complete randomized block design,CRBD)將相近的性質歸類於同一個集區Bj,然後在每個集區將r個處理方式隨機指派,而每一個處理方式在同一個集區內恰好出現一次,此種變異數分析,稱為未重覆試驗的二因子ANOVA,其所得到的樣本資料如下表:
設Yij~N(ij , 2),i = 1 ,…, r;j = 1 , … , c且Yij為獨立的隨機變數,表示第i列與第j行的樣本資料, Yij= ij+ ij= +i+ j +ij,i = 1 , … , r,j = 1 , …c, 式中ij = Yij - ij表Yij與 ij之差,稱其為誤差項或殘差項。 其性質如下: (1) ij為獨立隨機變數。 (2) ij~N(0 , 2 ) (3) i表第i列的影響且= 0;j表第i行的影響且= 0。 (4) 設行、列間的影響有可加性,則ij= +i+j 且i. = + i,.j = + j
二、二因子ANOVA的變異及計算簡式 將樣本資料總變異,按變異來源,分解成列變異(列平方和,SSR)、行變異(行平方和,SSC)及剩餘變異(誤差平方和,SSE)等三部份。 SST = = c + r + = SSR + SSC + SSE
二因子ANOVA中平方和計算簡式: 總變異 = SST = = 列變異 = SSR = c = 行變異 = SSC = r = 誤差變異 = SSE = SST - SSR - SSC rc – 1 = ( r - 1) + (c - 1) + (r - 1)(c - 1) 總變異自由度 列變異自由度 行變異自由度 誤差變異自由度
三、母體變異數2的估計量 母體共同變異數2的獨立估計量有三: 1. 列間變異: MSR = E(MSR) = 2 + > 2 = E(MSE)
2.行間變異: MSC = E(MSC) = 2 + > 2 = E(MSE) 3.誤差變異: MSE = E(MSE) = 2
四、二因子ANOVA檢定步驟及表格 二因子ANOVA檢定步驟: 1. 假設: (1) 檢定列間因素的影響 或 (2) 檢定行間因素的影響 或
2. 檢定統計量: • Fr = ; (2) Fc = 3. 拒絕區域: (1) CR1 = { Fr> F( r - 1 , (r -1)(c-1) ) } (2) CR2 = { Fc> F( c - 1 , (r -1)(c-1) ) } 4. 在H0下,計算檢定統計量的值: • Fr0 = ; (2) Fc0 = 5.結論:若Fr0CR1,則拒絕H0;否則,不拒絕H0。 若Fc0CR2,則拒絕;否則,不拒絕。
表11-6 二因子ANOVA表(未重複試驗、無交互作用)
若Fr>F(r - 1 , (r - 1)(c - 1)),則拒絕H0:1 . = …= r.;否則,不拒絕H0。 若Fc>F(c - 1 , (r - 1)(c - 1)),則拒絕:.1 = …= .c;否則,不拒絕。
圖K ANOVA檢定流程圖 11-30