470 likes | 593 Views
第九章 两因素的方差分析 ( two-factors analysis of variance ) 或两种方式分组的方 差分析 ( two-way classification analysis of variance ) 一、 模型的类型及交互作用的概念
E N D
第九章 两因素的方差分析(two-factors analysis of variance)或两种方式分组的方 差分析(two-way classification analysis of variance) 一、 模型的类型及交互作用的概念 在实际工作中,经常会遇到两种或两种以上的因素,共同影响实验结果的情况。例如,一组病人同时服用两种药物,每一种药物又有不同的剂量(水平),如A药物有5个水平,B药物有3个水,共有5×3=15个剂量水平。需要15名病人参加实验,每人接受一种水平组合,象这样的分组方式称为交叉(cross)分组。
上面讲过,因素可分作固定因素和随机因素。在两因素实验中:上面讲过,因素可分作固定因素和随机因素。在两因素实验中: • 当两个因素都是固定因素时,称为固定模型(fixed model)。 • 两个因素均为随机因素时,称为随机模型(random model)。 • 一个因素是固定因素,另一个因素是随机因素时,称为混合模型(mixed model)。 这三种模型虽然在计算方法上没有多大不同,但在检验以及对结果解释上却截然不同。尤其是在两因素之间存在交互作用时,不同类型模型的区别就更明显。为了下面叙述方便,介绍主效应与交互作用两个基本概念。
由于因素水平的改变而造成因素效应的改变,称为该因素的主效应(main effect)。例如有下面一组实验,A因素有两个水平,A1和A2;B因素也有两个水平,B1和B2。当A因素从第一个水平变化到第二个水平时,A因素的主效应为A2水平的平均效应减去A1水平的平均效应。
同样,B因素的主效应: 若A、B之间不存在交互作用,则 有时会发现,某一因素在另一因素的不同水平上所产生的效应不同。例如:
A(在B1水平上)=A2B1-A1B1=28-18=10 A(在B2水平上)=A2B2-A1B2=22-30=-8 可以明显看出:A的效应依B的水平而不同。这时我们说:在A和B因素见存在交互作用。交互作用的大小可用 来估计。上例的A、B间的交互作用:AB=18+22―30―28=—18。有时交互作用相当大,因素的主效应相对来说变得相当小。在上面例子中,A因素的主效应:A=(28+22)/2-(18+30)/2=1,与交互作用的绝对值18相比已经相当小,这时可认为不存在主效应。
B2 B1 B1 B2 A1 A1 A2 A2 a. 不存在交互作用 b. 存在交互作用 图2—1 因素间交互作用的图示
两因素实验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab次实验,并设实验重复次数n次,χijk表示A因素的第i水平,B因素第j水平和第k次重复的观察值。数据将以下表的形式出现。两因素实验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab次实验,并设实验重复次数n次,χijk表示A因素的第i水平,B因素第j水平和第k次重复的观察值。数据将以下表的形式出现。 表2-7中A和B可以是固定因素,也可以是随机因素,因而引出三种不同的统计模型。
二、 固定效应模型 1. 有重复实验时 有重复实验时,观察值可以以下线性统计模型描述: 其中,m是总体效应;a i是A因素第i水平的真正效应;bj是B因素第j水平的真正效应;(ab)i j是在ai和bj之间的交互作用的效应;ei j k是随机误差成份。当两因素均为固定因素时,各处理效应是距总平均效应的离差。因此,
交互作用的效应也是固定的, eij是相互独立且服从N(0,s2)的随机变量 (2·24) 因实验共有n次重复,所以实验的总次数为abn次。
交互分组两因素固定效应模型的方差分析的零假设为: 方差分析的基本思想仍然是将总平方和分解。
于是,总平方和可分解为:由于A因素所引起的平方和SSA ,B因素所引起的平方和SSB,A、B交互作用所引起的平方和SSAB及误差平方和SSe。分别是:
从(2·32)式可以看出,为了得到误差平方和,至少要重复两次。有了误差平方和,才能把误差与交互作用分解开。从(2·32)式可以看出,为了得到误差平方和,至少要重复两次。有了误差平方和,才能把误差与交互作用分解开。 与每一平方和所相应的自由度为: A a-1 B b-1 AB交互作用 (a-1)(b-1) 误差 ab(n-1) 总和 abn-1
其中总自由度、A因素自由度和B因素自由度比较简单,分别为abn-1,a-1和b-1。交互作用的自由度,是两个因素全部水平的组合数减1,再减A、B主效应自由度,即(ab-1)―(a―1)―(b―1)=(a―1)(b―1)。误差自由度在每一因素组合内是 n-1,共有ab种组合,故为ab(n-1)。各项的均方分别为:
两因素固定模型方差分析表如下: 表2-8 固定模型方差分析表(因素A、B固定型)
实际计算时,可按下述方式进行。 其中c2···/abn称为校正项,用C表示。
为了得到SSAB需分两步计算。首先,由重复间的平均数,求出次总平方和(subtotal sumof squares)SSST, 这一平方和由三部分构成: 由此可以得出,AB交互作用平方和SSAB, 而
另一种计算交互作用平方和的方法,是通过计算重复间平方和得到误差平方和,另一种计算交互作用平方和的方法,是通过计算重复间平方和得到误差平方和, 再由总平方和减去A因素、B因素及误差平方和,剩余的便是交互作用平方。 例2.3为了从三种不同原料和三种不同发酵温度中,选出最适的条件,设计了一个两因素试验。并得到以下结果(表2-9):
表2-9 用不同原料与不同温度发酵的酒精产量
在这个试验中,温度和原料均为固定因素。每一处理有4次重复。因此可按上面叙述过的方法分析。将表中的每一数字均减去30,列成表2-10.1,由表2-10.1中,可以计算出 及
利用χij·列列成表2-10.2。 表2-10.2 发酵实验方差分析表
表2-11 发酵实验方差分析表 列成方差分析表: ** a=0.01 * a=0.05 原料和温度在α=0.01水平上拒绝H0;交互作用在α=0.05水平上拒绝H0。因此酒精的产量不仅与原料与温度有关,而且与两者的交互作用也有关。
三、 随机效应模型 如果因素A和因素B都是随机因素,则构成随机效应模型。例如,将同一种作物种在不同地块上,并施以不同数量的农家肥,考查不同地块和不同施肥量对作物产量的影响。不同地块是随机选出来的,属随机因素。农家肥的肥力水平,是很难人为控制的,即使施用相同的数量,其效应值也不会完全相同。因此,肥料也书随机因素。 随机效应模型的每一观察值,可用以下线性统计模型描述:
零假设分别是: 方差分析的方法与固定模型的分析一样,分别计算出SST、SSA、SSB和SSe。 对H03:s2a b=0的检验统计量应当是(具(a-1) (b-1),ab(n-1)自由度):
与F(a-1) (b―1), ab ( n―1), a 做比较,当F<Fa时,接受H03:s2a b=0的假设;若F>Fa ,拒绝H03:s2a b=0的假设。 对H01:s2a=0的假设,使用统计量(具(a-1),(a-1) (b-1)自由度) 与F(a-1), (a―1) (b―1), a 做比较,当F<Fa时,接受H01:s2a=0的假设;若F>Fa ,拒绝H01:s2a =0的假设。
对H02:s2b=0的假设,使用统计量(具(b-1),(a-1) (b-1)自由度) 与F(b-1), (a―1) (b―1), a 做比较,当F<Fa时,接受H02:s2b=0的假设;若F>Fa ,拒绝H02:s2b =0的假设。
随机效应模型的方差分析表如下: 表2-14 随机效应模型方差分析表(因素A、B随机型)
例 2.6为了研究不同地块中施用不同数量农家肥对作物产量的影响,设计了一个两因素试验。试验结果列在下表中。 解 前面已经说过,这是一随机模型。随机模型的各项平方和的计算与固定模型是一样的。将上表中的cijk每一个均减去9.5列成下表:
表2-15.2 作物产量方差分析计算表 利用χijk列,列成下表: 由表2-15.1 计算出
列成方差分析表: ** a=0.01 从以上方差分析表中,可以看出所选择的不同地块对产量没有显著影响。但不同施肥两对产量的影响极为显著。
四、 混合模型 在两因素交叉分组实验中,若一个因素(如A因素)是固定型,另一个因素(如B因素)是随机型,则称为混合模型。在混合模型中,每一观察值 χijk的线性统计模型为: 其中ai是固定效应,bj是随机效应,交互作用(αb)ij,被认定随机效应。因为固定因素的全部交互作用效应之和为0,所以在固定因素的某个水平上,交互作用的成分不是独立的。
对于H01:αi=0的检验的统计量为(具a―1,(a―1)(b―1)自由度): 对于H02:sb2=0的检验的统计量为(具b―1,ab(n―1)自由度):
对于H03:σ2αβ=0的检验的统计量为(具(a-1)(b―1),ab(n―1)自由度): 混合模型方差分析表如下: 表2-16 混合模型方差分析表(A固定,B随机)
例2·7表2-17 所列出的数据是四个受试者在四种速度下工作,即正常速度的60%、80%、100%、120%所得到的能量消耗的比值,试验共有16种处理,每一处理重复观察2次,共做32次观察。 表2-17 四个受试者在四种速度下工作的能量消耗
解 首先,看因素的类型。因素A是从60~120%这个范围内,人为地选出的四个水平,这四个水平是可以严格控制的,所以因素A为固定型;因素B的四个水平,是从受试者人群中随机抽取的,所以因素B为随机型。本试验属于混合效应模型。具体计算过程不再重复,下面给出方差分析表 表 2-18 能量消耗实验方差分析表
首先,检验假设 因为F>F9,16,0.05,所以A、B之间存在交互作用。检验 F<F3,16,0.05,所以实验对象个体之间的差异不显著。
最后,检验 F<F3,16,0.01,接受H01。因素A是不显著的。在这四种速度下,工作的能量消耗没有显著不同。要提醒大家的是,在混合模型的方差分析时,正确区分因素的类型,正确地使用检验的统计量是非常重要的。
五、两个以上因素的方差分析 六、缺失数据的估计 弥补缺失数据的原则:使补上缺失的数据之后,所得到的误差平方和最小。 七、数据变换 对数变换、平方根变换、反正弦变换等等。