520 likes | 1.5k Views
變異數分析. Analysis of Variance(ANOVA). F 分配. 單因子變異數分析 (One-way ANOVA). IV : 1 個(與 t 檢定相似)有兩組以上之組別,為獨立樣本 t 檢定之延伸。 例如:教學策略 1 、 2 、 3 對學生成績的影響 Ho :教學策略 1 、 2 、 3 並不會造成學生成績之差異,即. Ho : μi..'s all equal Ha : at least one pair of μi..'s not equal.
E N D
變異數分析 Analysis of Variance(ANOVA)
單因子變異數分析(One-way ANOVA) • IV:1個(與 t 檢定相似)有兩組以上之組別,為獨立樣本 t 檢定之延伸。 • 例如:教學策略1、2、3對學生成績的影響 Ho:教學策略1、2、3並不會造成學生成績之差異,即
Ho:μi..'s all equalHa:at least one pair of μi..'s not equal ANOVA方法是透過對變異數的分析來同時檢定k個母體之平均數 i,i = 1, 2, …, k是否相等。即檢定,H0:1 = 2 =…= k,H1:至少有二平均數不等。
t-test • Treatment(K=3) • Ho:μ1=μ2 Ha:μ1≠μ2 1-α=0.95 • Ho:μ1=μ3 Ha:μ1≠μ3 1-α=0.95 (1-α)3=0.857 • Ho:μ2=μ3 Ha:μ2≠μ3 1-α=0.95 • Type I error:α=1-0.857=0.143 • 三個以上Treatment(K) Type I error:α=1-(0.95)2CK>0.05
變異數分析的意義、原理 變異數分析的意義 統計學家R.A. Fisher(1890~1962)首創變異數分析(Analysis of Variance,ANOVA),在相同的顯著水準下,同時(simultaneously)檢定k個母體平均數是否相等的方法,謂之。 一因子ANOVA(one-way ANOVA):以一個解釋變數來解釋反應變數變異來源的一種分析方法。 二因子ANOVA(two-way ANOVA):以兩個解釋變數來解釋反應變數變異來源的一種分析方法。 多因子ANOVA:按兩個以上因子分類分析。
變異數分析基本觀念 • 變異數分析既然是以變異數為名,自然地它的基本觀念自是源自資料的變異,而其想法是利用全部資料的變異,也就是指所有資料與其平均數差的平方和,然後再考慮個別母體間的變異與個別母體內的變異,再由其間的差異來做比較。 • 因此變異數分析的基本觀念在虛無假設的成立下,亦即假設所有母體的平均數均相等的情況下,將所有樣本資料混合的變異分成兩部分:一部分為各母體內的變異,另一部分為各母體間的變異。然後再去比較這兩個部分的變異比值,是否足以支持虛無假設成立的假說。
變異數分析的基本概念 • 變異數分析的基本假設: • 每個處理水準(即依實驗因子的準分組之各組樣本資料) 的母體,均為常態分配。 • 每個處理水準的母體之變異數相等。 • 抽自各母體的各組隨機樣本互為獨立。 • 實驗結果的變異可區分為實驗因子所造成的變異,加上實驗因子以外的因素所造成的變異。
單因子變異數分析基本觀念 • 總變異(sum of squares due to total,SSt) :混合後資料的變異。 • 處理間變異(sum of square between treatment, SSb ) • 處理內變異 (sum of square due to error,SSE; sum of square within treatment; SSw) • 總變異=處理間變異+處理內變異 SS (sum of square): 平方和
總變異量的概念 • i=組內個數, • j=組別, • k=組數, • n=每組人數
總變異量的概念 SS總變異量Total SS組內Error SS組間Between
MSB SSB = = MSB F - k 1 MSE SSE = MSE - k ( n 1 ) 10-4 完全隨機的變異數分析 • 變異數分析(摘要)表: • 實驗因子有 k 個水準處理,每個處理之實驗單位相同(即分為 k 組,每組樣本大小n 相等): 獨立樣本單因子變異數分析表 ( 樣本大小相同 )
k k å å - - n n 1 k i i = = i i 1 1 MSB SSB = F = MSB - k 1 MSE SSE = MSE k å - n k i = i 1 10-4 完全隨機的變異數分析 • 變異數分析表: • 實驗因子有 k 個水準處理,每個處理之實驗單位不同(即分為k 組,每組樣本大小n 不同): 獨立樣本單因子變異數分析表 (樣本大小不等)
範例一1 • 小華想瞭解三種教學工具(黑板、Power Point、線上)的教學效果。將其12位學生隨機分成三組,對每組採用不同的教工具做實驗,經過一段期間後舉行測驗果下表。試對此問題進行分析。 ANOVA
範例一2 ANOVA
範例一3—ANOVA table ANOVA
二因子變異數分析 • 假設兩因子間無互動關係存在 • 隨機區集設計 • 區集因子無法控制 • 兩因子完全隨機設計 • 可根據實驗單位的地點特性或某些固定因素而將之歸入不同的區集(區集因子可控制) • 兩因子間考慮互動關係 • 互動之二因素變異數分析(重覆二因子變異數分析)
隨機區集設計與兩因子完全隨機設計模型 • Yij=μ+αi+j+εij • 處理變數之假設 • H0(Treatment):α1=α2=…=αm=0 • H1(Treatment):αi不全為0 • 區集因子之假設 • H0(Block):1=2=…=n=0 • H1(Block):j不全為0 • SST=SSTreatment+SSBlock+SSE • SSTreatment=n∑(Ti-Y)2 • SSBlock=m∑(Bj-Y)2 • SSE=SST-SSTreatment-SSBlock
隨機區集設計與兩因子完全隨機設計模型 • αi:第i種處理的效果(影響) • j:第j個區間的效果(影響) • Ti:第i個實驗變數水準的平均數(i=1~m) • Bj:第j個區集變數水準的平均數(j=1~n) • m:實驗變數水準的數目 • n:區集的數目
MSTreatment FTreatment= MSE SSTreatment/(m-1) = SSE/(m-1)(n-1) If FTreatment≦Fα,無法拒絶H0(Treatment) FTreatment>Fα,拒絶H0(Treatment) 隨機區集設計與兩因子完全隨機設計模型
MSBlock FBlock= MSE SSBlock/(n-1) = SSE/(m-1)(n-1) If FBlock≦Fα,無法拒絶H0(Block) FBlock>Fα,拒絶H0(Block) 隨機區集設計與兩因子完全隨機設計模型
二因子變異數分析表: • 實驗因子有 k個水準處理及b個區集設計: 獨立樣本二因子變異數分析表(無重複試驗)
範例二1 • 某位電腦程式教師想了解他所教的電腦語言(因素A)和他所使用的電腦類型(因素B)對學生成績的影響。其進行一項實驗:在四個學期當中,他教了16班,每班在學期終了都舉行一次標準測驗,各班的平均成績如下表,試以α=0.01檢定(1)電腦語言、 (2)電腦類型是否影響學習成效? ANOVA
範例二2 ANOVA
範例二3 ANOVA
範例二4 • 因為FA=1.78<F0.01,3,9=6.99,接受H0(A) ,亦即在1%顯著水準下,電腦語言對學生的電腦分數沒有影響。 • FB=10.25>F0.01,3,9,拒絶H0(B) ,亦即在1%顯著水準下,所用之電腦類型對學生的電腦分數有影響。 ANOVA
互動之二因子變異數分析(重覆二因子變異數分析)互動之二因子變異數分析(重覆二因子變異數分析)
互動之二因子變異數分析(重覆二因子變異數分析)互動之二因子變異數分析(重覆二因子變異數分析) • Yijk=μ+αi+j+(α)ij+εijk • 處理變數之假設 • H0(Treatment):α1=α2=…=αm=0 • H1(Treatment):αi不全為0 • 區集因子之假設 • H0(Block):1=2=…=n=0 • H1(Block):j不全為0 • 交互作用之假設 • H0(no interaction):(α)11=(α)12=…(α)mn=0 • H1(interaction):(α)ij不全為0
互動之二因子變異數分析(重覆二因子變異數分析)互動之二因子變異數分析(重覆二因子變異數分析) • SST=SSTreatment+SSBlock+SSinteraction +SSE • SSTreatment=nr∑(Yi..-Y)2—自由度為m-1 • SSBlock=mr∑(Y.j.-Y)2—自由度為n-1 • SSinteraction=r∑∑(Yij.-Yi..-Y.j.+Y)2—自由度為(n-1)(m-1) • SSE=SST-SSTreatment-SSBlock-SSInteraction • SSE=∑∑∑(Yijk-Yij.)2—自由度為mn(r-1)
二因子變異數分析表: • 實驗因子有 k個水準處理、b個區集設計及n次重複試驗: 獨立樣本二因子變異數分析表(重複試驗)
範例三1 • 一公司為了試驗不同的包裝方式A1、A2、A3對產品銷售量的影響,分別在B1、B2、B3、B4四個試銷點試銷三次,得銷售量如下表。試以α=0.05檢定(1)包裝方式、 (2)試銷點、 (3)交互作用是否影響產品銷售量? ANOVA
範例三2 銷點 包裝 ANOVA
範例三3 銷點 包裝 ANOVA
範例三4 ANOVA
範例三5 • 因為F0.05,2,24=3.4028<9.150,故拒絶H0。表示包裝方式不同可能會影響銷售量。 • 因為F0.05,3,24=3.0088<14.556,故拒絶H0。表示試銷點不同可能會影響銷售量。 • 因為F0.05,6,24=2.5082>1.219,故無法拒絶H0。表示包裝方式與試銷點間可能沒有交互作用。 ANOVA
三因子變異數分析 • Three-way ANOVA, 3 IV, 1 DV
多重比較(事後檢定) • 在ANOVA分析裡,有三組(含)以上之組別接受不同的自變項(IV)的處理,但是ANOVA的結果只能解釋這三組(以上)之間『有無差異』,而無法解釋『兩組間的差異』。 • 事後比較:當變異數分析的F值達到顯著水準後才須尋找到底哪些對平均數之間有顯著差異。
事後檢定 • 因為ANOVA檢定只能知道各組的平均值是否有差異,即只要有任兩組的平均值有差異就會呈現顯著,所以要進行事後檢定,瞭解到底是哪些組(兩兩比較)的平均值有差異 • 最常用Scheffe’s(薛費事後檢定)、Bonferroni、LSD(最小顯著差異法,Least Significant Difference method)三種,前兩者較嚴格 • Scheffe’s: t> • Bonferroni: • LSD: t<
事後多重比較 • ANOVA的結論是拒絕H0: 1= 2=…= k • 平均數不完全相等 • 使用檢定來發現差異性發生在哪些地方 • 兩兩比較的多重t檢定 • 增加第一型錯誤的機率(k=3, =1-(0.95)3=0.143) • Bonferroni修正: • Tukey, Duncan, Scheffe, Dunnett …, etc
c b b a b a a a