320 likes | 468 Views
Chap 5 因子設計簡介. Factorial Design : 對探討 多個因子效應的研究, 實驗的設計上 安排 所有可能的 因子 水準組合都被測 1 試過,且實驗順序為隨機 ,稱為 因子設計 。 因子設計的試驗結果可分析出二種對反應值的影響: 主效應 及 交互作用 。 主效應 ( Main Effect): 某因子水準的變化對觀察值的影響 因子間的 交互作用 ( Interaction between the factors): 某因子對反應值的影響狀況隨著另一因子水準的變化而有不同的表象,此時稱二因子間有交互作用 。. 交互作用之 例 :.
E N D
Chap 5 因子設計簡介 • Factorial Design : 對探討多個因子效應的研究,實驗的設計上安排所有可能的因子水準組合都被測1試過,且實驗順序為隨機,稱為 因子設計。 • 因子設計的試驗結果可分析出二種對反應值的影響: • 主效應及交互作用。 • 主效應 (Main Effect):某因子水準的變化對觀察值的影響 • 因子間的交互作用 (Interaction between the factors):某因子對反應值的影響狀況隨著另一因子水準的變化而有不同的表象,此時稱二因子間有交互作用 。
交互作用之例: No interaction with interaction 反應均值 反應均值 B- B+ B+ B- A+ A- A- A+
不同型態交互作用之例: 員工生產力 Factorial
交互作用之另一種表示方式: 若二因子皆為數量型因子,且反應值對二因子的關係式可以寫成下列迴歸式,其圖形稱為反應曲面。 主效應由 b1及 b2決定,交互作用效應由 b3決定; 若 b3=0,無交互作用,反應曲面為一平面,等高線圖是一組平行直線;
若 b3≠0,交互作用是明顯的,如圖。所對應之主效應就沒有太多的實質意義,此時討論各別的效應可能無多大意義。 Factorial
因子設計的優勢 : (1) 可同時試驗幾種因子自身的效應,比每次試驗一因子的設計 更為有效。 (2) 可得到因子間相互的效應。 (3) 增加各因子重複次數,減少試驗誤差。 (4) 估計一因子在其它因子不同水準下的效應。 Factorial
5-3 二因子之因子設計 假設二因子為 A 及 B,各有 a 個及 b 個水準,在所有可能的 ab 個組合下,各重複 n 次試驗, n>1 Model Yijk = μ + τi +βj+ (τβ)ij + εijk , i= 1,...,a, j= 1,…,b k=1,…,n εijk ~ N(0, σ2) μ 整體平均數 τi 因子 A 第 i 項水準的影響力 βj 因子 B 第 j 項水準的影響力 (τβ) 交互效應 註:此設計亦為一 Completely Randomized Design
分析 (1) 檢定因子間的interaction (2) 檢定main effect 註 : ANOVA中, SST = SSA + SSB + SSAB + SSE
(3) 檢查模式的適合性 a. 同變異性 (觀察殘差圖) b. 常態性:Normality test & normal prob. Plot (4) 當 ANOVA 的結果是顯著時,進一步分析: Case I、交互作用不顯著 對各因子,分別執行 multiple comparison Case II、交互作用顯著 視情況選擇下列任一分析: 1. 所有因子 A 與 因子 B 的組合間,互作比較。 2. 固定某因子的水準,對另一因子分析。 3. 若二因子皆為數量因子,可尋找觀察值對因子的 關係式
EXAMPLE (3x2 factorial balanced design) IRS 研究表格複雜程度與交表時間對所得稅作業時間的影響 Factors :複雜程度(3 levels),交表時間(2 levels) 對 6 種組合的處理,各取 3 筆資料 ( 3 replicates) Data : (sas報表:Tax_fac, Tax_Normality)
1. ANOVA 二因子間的交互作用不顯著,二因子的主效應是顯著的 2. 各組平均數圖形
3. Tukey’s HSD 對對比較 • Tukey Grouping Mean compx • A 75.000 3 • B 62.500 2 • C 39.000 1 • 由 Tukey HSD法知三種表格的作業時間是完全不同的。 • 4. 模式檢視 • 對殘差的S-W 檢定之p-值 = 0.1167,資料是一常態資料。 • 由殘差圖知資料未違背同變異數的假設。 (見附圖)
5. 總結: (1)資料滿足同變異性及常態性,故可使用 ANOVA。 (2)繳表時間與表格之複雜度對其填表之費時無交互作用。 (3)在不同時間繳交稅表,其填表之費時有顯著不同,提早繳表者其填表之費時較短,均值分別為48.3及67.3。 (4)三種表格之複雜度對其填表之費時皆有顯著不同,愈複雜費時愈多,均值分別為39,62.5及75。 • 平均費時的估計: • 平均費時差異的估計:
(7)提早繳表使用簡單格式者,費時最少,平均費時30(7)提早繳表使用簡單格式者,費時最少,平均費時30 及時繳表使用高度複雜格式者,費時最多,平均費時85 各狀況之平均費時及標準差如下 Factorial
Tests for Normality Test Statistic p Value Shapiro-Wilk W 0.913 Pr < W 0.117 Kolmogorov-Smirnov D 0.12 Pr > D >0.150 Cramer-von Mises W-Sq 0.06 Pr > W-Sq >0.250 Anderson-Darling A-Sq 0.45 Pr > A-Sq 0.243 附圖 Factorial
EXAMPLE 5.1 (3x3 factorial randomize design) 目的 : 1. 研究材質和溫度對電池壽命的影響。 2. 是否有一材質的電池,在任何溫度下,皆保持較長壽命? Factors : 材質--- 3 levels,溫度--- 3 levels 對 9 種組合的處理,各隨機作 4 次實驗 ( 4 replicates) Data :
1. 變異數分析 由 ANOVA table 得到下列結論: 1. 在α=0.05水準下,material types 與 temperatures 之間對壽命影響的交互作用顯著 (p值=0.0186)。 2. 在α=0.01水準下,material type 和 temperature 對電池壽命的主效應是顯著的(p值分別為0.002 及 <0.0001)
Tests for Normality Test Statistic p Value Shapiro-Wilk W 0.976057 Pr < W 0.6117 • 2.模式檢視 • 對殘差的S-W 檢定之p-值=0.6117,常態機率圖接近一直線,由此判定資料未違背常態性假設。 • 由殘差圖來看資料未違背同變異數的假設。 • 所以,此資料適用 ANOVA 的結果 Factorial
殘差圖 Factorial
Average Battery Life for different temperature and material • 交互作用 • 以下是平均數圖 -- (此圖解釋了交互作用現象) ANOVA 的結果顯示溫度、材質各別地對電池壽命都有影響,但是因為交互作用的效應也達到顯著,表示主因素的影響是互相牽制的。對不同材質,溫度對電池壽命的影響是不同的;在不同的溫度下,各材質的影響也不同。由平均值圖形可明顯地看出來,這將引導下一步的 multiple comparison。
4. Multiple Comparisons 由於二因子間的交互作用顯著,分析各因子單獨效應是不具實際意義,可進行所有因子組合的比較,或固定某一因子,比較另一因子的效應。針對本例,我們進行下面分析: • 在固定溫度下,進行不同材質的比較; • 對各材質尋找溫度對壽命的影響。
a)、對一固定溫度,比較不同材質下電池壽命之差異 a)、對一固定溫度,比較不同材質下電池壽命之差異 ( 使用 ANOVA中的 Linear model, 選 material 為 Classification變數, temperature 為 group變數 ) 由Tukey HSD 對對比較法得到: 溫度= 125及15時,在α=0.05下,材質對電池壽命之影響不顯著。 溫度= 70 時,在α=0.05下, type1 之平均壽命最低,與其它二材質有顯著差異, type2 與 type3 則無顯著差異 Factorial
各情況的平均數整理如下表: 註:同一溫度,上標字母不同的二組差異顯著 結論:在常溫(70oF)儲存下,Type2與Type3的電池壽命無顯著差異,且明顯地比Type1長壽, Type1的電池應不是一理想的電池。整體而言,Type3 的電池是較長壽的。 Factorial
b)、針對各材質,研究溫度對電池壽命之影響 (p190) 註: 由平均圖,猜測溫度對電池壽命是一次或二次關係式 (SAS/EG:使用 ANOVA中的 Linear model, ,選 temprt 為 quantitative變數,material 為 group變數,模式的選擇含temprt 之一次及二次) 對各材質,溫度對電池壽命的影響可以下列估計式來表示 : (依據下二頁報表) Type1: y = 132 – 0.702 t ,t:溫度,y:壽命 Type2: y = 176 - 0.966 t Type3: y = 162 - 0.532 t 電池壽命皆隨溫度上升而減少,下降的斜率分別是0.702,0.966與0.532,Type3的電池壽命是比較穩定的。 Factorial
Parameter Parameter Parameter Estimate Estimate Estimate Standard Error Standard Error Standard Error tValue tValue tValue Pr>|t| Pr>|t| Pr>|t| Intercept Intercept Intercept 175.9469697 159.6239669 169.3801653 11.14327180 26.39008857 15.74782536 15.79 6.42 10.14 <.0001 0.0001 <.0001 temprt temprt temprt -0.9659091 -2.5014463 -0.1733471 0.13398751 0.96892047 0.57818640 -7.21 -0.30 -2.58 <.0001 0.7711 0.0296 temprt*temprt temprt*temprt -0.0056612 0.0128512 0.00402760 0.00674942 -1.41 1.90 0.1934 0.0893 Factorial
Parameter Estimate Standard Error tValue Pr>|t| Intercept 132.7623967 18.01817433 7.37 <.0001 temprt 0.9028926 0.66154298 1.36 0.2055 temprt*temprt -0.0102479 0.00460826 -2.22 0.0532 Factorial
Analysis for 2 factorial design NS Interaction A x B Significant 分別檢定 A B 影響力 固定A 討論 B 之差異 對 A B 所有組合 作對對比較 A B 各別的 Multiple comparison 固定B 討論 A 之差異 Factorial
EXAMPLE 教育心理學家想測試學前訓練及父母教育程度這兩個因素對小孩字彙發展的影響,所以在相同文化歷史背景的孩子當中,選出 50 個二年級的女學生,接受圖型的字彙測試,測試成績依照此二因素來分類。結果如下: Data : Factorial
欲檢定學前訓練及父母的教育程度這兩個因素對成績的影響 • 在Model內放 nursery 、 parental 及 nursery*parental • 對應於 nursery*parental的 p-值=0.0425,結論是二因素對成績交互作用顯著 • 對應於 nursery的 p-值=0.0231,對應於 parental的 p-值=0.0011,學前訓練對成績的影響是顯著的,而父母的教育程度對成績影響是顯著。 • 二因素成績平均的圖形可印証交互作用顯著 • 未受學前訓練且父母均未受教育的小孩成績顯著比其它小孩低,其它各組間成績無顯著差異 Factorial
5.3.7 單一觀察值 當每一狀況只有一觀察值時,資料不足以估計誤差,有下列 二種分析法: 1. 假設 model 為 no interaction model. Yij = μ + τi +βj+ εij , i= 1,...,a, j= 1,…,b 2. 假設 interaction term 為一特定型式; (τβ)ij = γτiβj Yij = μ + τi +βj+ γτiβj + εij , i= 1,...,a, j= 1,…,b 分析 : SST = SSA + SSB + SSN + SSE SSN是 nonadditivity 交互作用力的平方和, d.f. = 1
EXAMPLE 5.2 (2-factorial with one observation in each cell) 化學產品的雜質受壓力和溫度二因子所影響 .資料如下表 . Factors : 溫度--- 3 levels, 壓力--- 5 levels 解: 假設 interaction term 為 γτiβj,檢定出壓力和溫度對雜質影響顯著。