1 / 93

變異數分析 ( 一 )

變異數分析 ( 一 ). Analysis of Variance ( 一 ). 變異數分析. 比較多個母體平均數 應用在實驗設計 如何分析. 學習目標. 1. 比較多母體的平均數 ( 檢定 ) 解說變異數分析的原理 3. 變異數分析 analysis of variance (ANOVA) 4. 單因子的實驗設計 完全隨機設計 (completely randomized design) 隨機完全區集設計 (randomized complete block designs) 5. 無母數方法 Kruskal-Wallis rank test.

uriah
Download Presentation

變異數分析 ( 一 )

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 變異數分析(一) Analysis of Variance (一)

  2. 變異數分析 比較多個母體平均數 應用在實驗設計 如何分析

  3. 學習目標 • 1. 比較多母體的平均數(檢定) • 解說變異數分析的原理 • 3. 變異數分析analysis of variance (ANOVA) • 4. 單因子的實驗設計 • 完全隨機設計(completely randomized design) • 隨機完全區集設計(randomized complete block designs) • 5. 無母數方法 Kruskal-Wallis rank test

  4. 例題 • 例一:某一產品以三種不同組合方式(A, B, C)以探討其組合完成時間(分鐘)是否有差異. 以隨機選取員工分派不同組合方式以完成最後產品,得下列實驗結果: • A方式: 15, 18, 19, 21, 23, 26 • B方式: 17, 18, 24, 20 • C方式: 13, 10, 16, 11, 9 • 是否有証據顯示該三種組合方式之完成最後產品之時間不同?

  5. 例題(續) • 例二:將商業區分為4大類後,收集30家商店本月的業績,以了解不同分類的業績是否有差異存在。 • 例三:隨機選取200位一至四年級的學生,記錄其個人學業總平均成績。比較四個年級學生的學業總平均是否有差異存在。

  6. 實驗設計與資料分析 • 實驗設計: 由研究者設定條件後, 執行實驗以觀察結果是否受該條件之影響 • 設定條件稱為「處理」方式(treatments) • 同類型處理方式稱為一個「因子」(factor) • 每因子內之處理方式亦稱為「水準」(levels) • 資料分析:利用變異數分析檢定不同處理對實驗結果產生的差異或效應

  7. 各種實驗設計

  8. 實驗設計專有名詞 • 1. 實驗單位(experimental units/subjects) • 2. 處理(treatments): 實驗中所設定或選取之條件 • 3. 控制因子(factors):由數種處理或水準組成 • 4. 處理效應(effect): 每一種處理對實驗結果產生之影嚮 • 5. 觀測結果(observations)

  9. 實驗設計三原則 • 1. 隨機(randomization)取樣 • 不同實驗模型,設計不同隨機方式取得樣本 • 2. 複製(replications)樣本 • 在相同處理下, 重複實驗以取得的重複樣本 • 3. 區集(blocking)技巧 • 在不同處理下選取同質性高之實驗單位 • 實驗中,僅處理方式不同外,其它因素無法影嚮實驗結果

  10. 完全隨機設計(Completely Randomized Design, CRD) • 1. 一個實驗中,在多個不同處理下取得觀測結果,以比較多個處理效應是否異同 • 一種處理代表「一個母體」﹔實驗結果即為觀測值或樣本值 • 2. 以「完全隨機」方式決定實驗單位的處理方式 • 先決定各處理所需樣本數後, 再以隨機數字表, 決定每次實驗將使用之處理方式

  11. CRD設計方式 • 1. 和比較多個母體平均數之觀念及分析方法皆相同 • 一個母體等於一個處理方式 • 不同母體皆具相同變異情形(homogeneous) • 每一母體下, 重複實驗選取隨機樣本 • 2. 實驗結果之分析方式可稱為單因子(或one-way)ANOVA

  12. 例題: 完全隨機設計 KKK KKK KKK

  13. 完全隨機設計單因子變異數分析CRDOne-Way ANOVA

  14. 比較多個母體統計思考方式 • 1. 比較多個母體之異同 • 2. 比較多個平均數之異同 • 3. 評估多個平均數之間之變異情形 • 4. 若變異量趨近於零,則代表平均數可能相同(Ho:平均數全等) • 5. 若變異量愈大,則代表至少一個平均數可能不相同(Ha:至少一個平均數不等)

  15. CRD統計理論 • 1. 模式(model) ﹕ • yij代表觀測值必須是連續變數 • 任何觀測值 = (特定母體平均值 + 誤差值) • yij = µj + Ij • (樣本數 i=1, …,nj﹔母體樣本數 j=1, …, c) • 或者 yij = (µ + j)+ ij • 模式中有c個參數須要估計

  16. CRD統計理論(續一) • 2. 假設條件(assumptions)﹕ • 各母體的變異數2皆相等(homogeneity) • 誤差項為常態機率分配,期望值為0 ﹔誤差值之間獨立 • ij~ N(0, 2) ,ij independent ij • 2須要估計 • 誤差項以上的假設條件, 必須正式以統計量檢定, 或以殘差分析檢查其是否符合

  17. CRD統計理論(續二) • 3. 目的﹕檢定不同處理對實驗結果的差異或效應 • Ho ﹕ µ1= µ2= … = µc v.s. Ha ﹕ 至少有一個µj不同 • 或者 • Ho ﹕ 1 = 2 = … = c = 0 v.s. Ha ﹕ 至少有一個j不同 • 4. 以變異數分析來檢定Ho (用F-表,又稱F檢定)

  18. CRD統計理論(續三) (No Treatment Effect) The Null Hypothesis is True

  19. CRD統計理論(續四) (Treatment Effect) The Null Hypothesis is NOT True

  20. 變異數分析 (ANOVA)探討 • 1. 變異量(sum of squares, SS)和自由度(degrees of freedom, df) • 藉由樣本變異數 s2 =  ( yij - y )2 / (n-1) = SS / (n-1) 來了解 • 分子項SS代表數據的變異程度, 必為正值(>0), SS愈大表示該組數據之間差異愈大 • 分母項自由度為樣本數減1, df = (n-1) • s2 =SS / df 亦稱均方(mean square, MS)代表平均變異,其意義和SS相似

  21. 變異數分析(ANOVA)探討(續一) • 2. 總變異量(SSTotal) • 先由a個母體皆相同(即是Ho)時來看, 所有樣本(N)觀測值的總變異量SS • (n-1)為總變異量SS的自用度, df=(n-1) • 在單因子ANOVA中, 總變異量由整體隨機樣本(n)的抽樣變異所形成

  22. 變異數分析(ANOVA)探討(續二) • 3. 總變異量的切割 • 總變異量公式 • SSTotal =  ( yij - y )2, df=(n-1) • 總變異量 = 處理間變異量 + 處理內變異量 • 總變異量 = 母體平均數之間變異量 + 誤差項變異量 • 上面式子也可以代數公式表示

  23. 變異數分析(ANOVA)探討(續三) • 4. 處理間變異量(SSBetween) ﹕母體平均數之間變異量,其自由度=(c-1) • SSBetween = SSB = SS(Trt) = SSModel • MS(Trt) = [SS(Trt)] / (c-1)﹔均方(mean of squares) • [SS(Trt )]/ 2 = [(c-1)MS(Trt)]/ 2為卡方分配(df=c-1) • 若母體平均數之間變異愈大,則至少有一個平均數不同

  24. 變異數分析探討(續四) • 5. 處理內變異量(SSWithin, SSW, SSE) ﹕ • 評估屬於每個母體內或誤差項之變異量(SS),其自由度=(n-c) • SSE = [SSE1+SSE2+…+SSEc] / (n-c) • MSE = MSW = SSE / (n-c) • MSE為母體或誤差項變異數(2)之估計值 • SSE / 2為卡方分配(df=n-c)

  25. 變異數分析探討(續五) • 6. F* = MS(trt) / MSE 為 F分配(df1=c-1, df2=n-c) • F* 中分子項MS(trt) 值愈大,F* 愈大(位在F曲線右尾) • 7. F分配之曲線為向右傾斜, F*值愈大發生機率愈小. • RR區域在F曲線右尾 • 8. F*值愈大愈容易落在RR, 則可拒絕Ho

  26. 單因子變異數分析F-檢定One-Way ANOVA F-Test

  27. 單因子ANOVA的不同形式敘述 • 1. 一個觀測值只棣屬於一個母體 • 2. 檢定多個母體的平均數是否均相等 • 或者 • 3. 檢定多個處理的效應是否皆相等 • 4. 一個觀測值只受到一種處理方式的影嚮

  28. 合於使用一因子變異數分析F-檢定的情況 • 1. 常態假設 (normality) • 各母體均為常態分配 • 2. 變異數為同質(homogeneity) • 各母體的變異數皆相等 • 3. 觀測值及誤差項為隨機且獨立的 • 隨機樣本抽選時亦為獨立

  29. 單因子變異數分析之檢定假設 • H0: m1 = m2 = m3 = ... = mc • 所有母體平均數均相等 • 即各處理並無影響(或效應相同) • Ha:母體平均數並不全等 • 至少有一母體平均數有差異 • 處理之間有差異(處理效應不同) • m1=m2= …= mc 是錯的 f(X) X m = m = m 1 2 3 f(X) X m = m m 1 2 3

  30. 看圖了解變異數分析的原理 上下兩組處理間產生不同的變異 但上下兩組各母體內變異相同同 • 上下兩組處理間產生相同的變異 • 但上下兩組各母體內變異不同 A B 0 0 0 0 組間變異不同 組內變異不同 可能得到母體平均數均相等的結論!

  31. 使用變異數分析的原理 • 1. 比較組內變異與組與組間變異的情形以檢定各母體平均數是否相等 • 2. 以兩個變異數的比率值為檢定基礎 • 3. 若是組間變異量相當程度大於> 組內的變異量則得到各母體平均數不可能相等 • 組間變異量與組內變異量可由總變異量分割而得 • 總變異量﹦組間變異量+組內變異量 • (n-1) = (c-1) + (n-c)

  32. Sum of squares error Sum of squares within Within groups variation Sum of squares treatment Sum of squares among Sum of squares between Among groups variation 單因子變異數分析:總變異量的切割 總變異量 因為組間平均數差異產生的變異量 因為組內隨機樣本誤差產生的變異量

  33. 總變異

  34. 總變異量之公式與圖解 反應, X `X 總樣本平均 X11 第一組 第二組 第三組

  35. 組間(處理與處理之間)之變異量 Variation Due to Differences Among Groups

  36. 組間(處理與處理之間)之變異量 反應值(X) `X3 (各組的平均值對總平均產生)的差異平方 `X `X2 `X1 第一組 第二組 第三組

  37. 組內 (隨機誤差、模型後誤差)變異量 Summing the variation within each group and then adding over all groups.

  38. 組內 (隨機誤差、模型後誤差)變異量 反應, X 個別觀察值相較所屬組平均數差異平方和 `X3 `X2 `X1 第一組 第二組 第三組

  39. 組內 (隨機誤差、模型後誤差)變異量 (continued) For c = 2, this is the pooled-variance in the t-Test. • If more than 2 groups, use F Test. • For 2 groups, use t-Test. F Test more limited.

  40. 單因子 ANOVA的 F-檢定統計 • 1. 檢定統計Test statistic • F = MS(Trt) / MSE • MS(Trt) =SS (Trt) / n1組間變異量除以其自由度的平均 • MSE = SSE / n2組內變異量除以其自由度的平均 • 2. 所對應的自由度Degrees of freedom • n1 = c -1 • n2 = n - c • c = 組數;母體個數(處理個數/水準數/群數/組數) • n = 所有的樣本數;總樣本數

  41. 建立ANOVA 表 Source of Degrees Sum of Mean F Variation 來源 Squares 平方和 of Square 均方和 Freedom Treatment 組間;處理 c - 1 SSA MSA = MSA/ SSA/(c - 1) MSE Error 誤差;組內 n -c SSE MSE = SSE/(n - c) Total 總和 n - 1 SS(Total) = SSA+SSE

  42. F-檢定統計量之臨界值 若是各處理母體間平均數差異大, 則F = MST / MSE» 1. Reject H 0 a Do Not Reject H 0 F 0 F a ( p - 1 , n - p ) 總是使用單尾檢定呦Always One-Tail!

  43. 例題一﹕單因子 ANOVA • 你是生產管理經理,欲知道三台機器的產品裝箱平均時間是否有差異。因此你抽選了具相同訓練及經驗的操作員,並隨機指定至此三台機器;每台五人。並測試得到了下列的裝箱時間。 • 以顯著水準.05 ,檢定三台機器的裝箱平均時間是否有差異? Mach1 Mach2Mach3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40

  44. 例題一﹕單因子 ANOVA Machine1Machine2Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 Time in Seconds 27 26 25 24 23 22 21 20 19 • • • • • • • • • • • • • • •

  45. 例題一﹕單因子 ANOVA Machine1Machine2Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40

  46. 例題一﹕建立ANOVA表 Source of Degrees of Sum of Mean F Variation Freedom Squares Square (Variance) Treatment 3 - 1 = 2 47.1640 23.5820 25.60 (Machines) Error 15 - 3 = 12 11.0532 .9211 Total 15 - 1 = 14 58.2172 電腦報表From Computer

  47. 例題一﹕F-檢定平均數相等 • 1. H0: m1 = m2 = m3 • 2. Ha: Not all equal • 3. a = .05 • 4. n1 = 2 n2 = 12 • Critical Value(s): 5. 在Ho下, test statistic: 6. Decision: Conclusion: MSA 23.528 F* = = = 25 . 6 . 9211 MSE 在 a = .05下 拒絕Ho a = .05 有充分證據顯示三台機器裝箱平均時間至少一台不等 F 0 3.89

  48. 利用 EXCEL求解 • Use tools | data analysis | ANOVA: single factor • EXCEL worksheet that performs the one-factor ANOVA of the example

More Related