460 likes | 666 Views
第九章 方差分析 第一节 方差分析的意义 当试验的处理数目 K≥3 时,不能直接应用两两测验方法进行平均数假设测验的原因有三: 1. 当有 K 个处理平均数时,将有 [k(k-1)]/2 个差数,要对这诸多差数逐一进行比较测验,程序实为繁琐 。 2. 试验误差估计的精确度要受到损失。 3. 两两测验的方法会随着 K 的增加而大大增加犯 α 错误的概率。. ?. 。. 方差分析的基本特点是:. 将全部变量看成一个整体,进行观察值的 变异原因分析 ,求出各变异原因方差的估计值 →. 进行 F 测验. ,以判断各处理平均数间的差异状况.
E N D
第九章 方差分析 第一节 方差分析的意义 当试验的处理数目K≥3时,不能直接应用两两测验方法进行平均数假设测验的原因有三: 1. 当有K个处理平均数时,将有[k(k-1)]/2 个差数,要对这诸多差数逐一进行比较测验,程序实为繁琐。 2. 试验误差估计的精确度要受到损失。 3. 两两测验的方法会随着K的增加而大大增加犯α错误的概率。 ? 。
方差分析的基本特点是: 将全部变量看成一个整体,进行观察值的变异原因分析,求出各变异原因方差的估计值 → 进行F测验 ,以判断各处理平均数间的差异状况 → 在此基础上,进行平均数的多重比较,以明确两两处理之间的差异状况。
表 1 kn个观察值的单向分组资料的模式 注:i = 1,2,3, ……k ; j = 1,2,3, ……n
重点呦! 第二节 方差分析的基本步骤 一、平方和与自由度的分解 分析目的:获得各项变异来源方差的估计值。 观察值总变异 处理间变异 处理内变异 (误差)
SST = SSt+ SSe dfT= dft+ dfe
二、F测验 F = F测验分析的目的是判断各个处理平均数之间是否存在显著差异,即可测验: Ho: HA: 不相等
三、多重比较 如果F测验的结果为各处理间的差异不显著,则分析结束,否则将进行多重比较。多重比较分析的目的是进一步判断两两处理平均数之间的差异显著性。
(一)保护性最小显著差数法(protected least significant difference),即 PLSD法。 步骤:1. 根据 dfe 查出 tα。 2. 计算平均数差数标准误: 3. 计算显著尺度PLSDα值: PLSDα = tα × =
4. 将处理平均数由大到小排序,并依次求出各处理平均数之间的差值,将各均数差值均与PLSDα相比较,作出平均数间差异显著性判断: 差异为显著; 差异为极显著; 差异为不显著。
(二)最小显著极差法(least significant ranges) ,即LSR法。 主要介绍SSR法。SSR法即邓肯氏新复极差法。 步骤:1.根据平均数秩次距k和dfe查出SSRα值。秩次距是指相比较的两个平均数之间(含这两个平均数)包含的平均数个数。 2.计算平均数标准误: =
3.计算各秩次距下的显著尺度LSRα或Rα值: LSRα或Rα= 4.将处理平均数由大到小排序,并依次求出各处理平均数之间的差值,将各均数差值与相应秩次距下的显著尺度进行比较,作出差异显著性判断。同样有:
(1)相应秩次距的 R0.01 > 平均数差值 ≥ 相应秩次距的R0.05,则两处理平均数间差异为显著; (2)平均数差值 ≥相应秩次距的 R0.01 ,则两处理平均数间差异为极显著; (3)相应秩次距的R0.05 > 平均数差值 ,则两处理平均数间差异为不显著。
多重比较结果的字母表达: (1)以小写英文字母表示α=0.05水平下的比较结果;以大写英文字母表示α=0.01水平下的比较结果。 (2)以相同字母表示差异不显著的比较结果,不同字母表示差异显著。
若各处理的重复次数不相等,其分析过程 与上述方法仅有以下三点区别,其余步骤完全相同。 1. 矫正数 C = 2. 处理平方和 3.以n0代替n进行平均数差数标准误和平均数标准误的计算:n0 =
第三节 方差分析的数学模型 一、线性可加模型 线性可加模型是指每一个观察值可以划分成若干个线性组成部分。它是分解平方和与自由度的理论依据,不同类型资料的线性可加模型是各不相同的。前述资料观察值的数学模型为: = μ + τi + εij
(二)期望均方(EMS) Se2的EMS是σe2; St2的EMS是 ∴ F = F测验有效性的保证条件之一是分子均方 的EMS仅比分母均方 的EMS多一个分量(线性组成部分)。
(三)固定模型和随机模型 固定模型是指试验的各处理都抽自其特定的处理总体,这些总体遵循N(μi, σe2),因而处理效应τi =(μi - μ)是固定的。我们分析的目的就在于研究τi ,如果重复做试验,处理不变,而所要测验的假设则是:H0:τi =0或 H0:μi=μ对HA: 不等。故我们的推断也仅限于供试处理范围之内。
随机模型是试验的各处理皆是随机抽自 的一组随机样本,因而处理效应 是随机的,随试验的不同而不同。若重复做试验,必然是从总体 中随机抽取一组新的样本。其分析的目的不在于研究处理效应,而是在于研究 的变异度,故推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。所以方差分析要测验的假设是 对
第四节 常用试验设计资料的方差分析 一、完全随机设计资料的方差分析(见前述) 二、巢式设计资料的方差分析 处理间变异(组间变异) 观察值总变异 亚组间变异 误差
(一)平方和与自由度分解 按照上述变异原因分解进行各项平方和与自由度的计算。 (二)F测验 巢式设计的资料属于系统分组资料,应注意在进行处理间(即组间)差异的F测验时,分母应为亚组间方差;而进行亚组间差异的F测验时,分母应为误差方差。当亚组间的差异未达到显著时,则应将亚组间变异与误差进行合并,求出新的误差量,再对组间差异进行F测验
(三)、多重比较 =
三、随机区组设计资料的方差分析 (一)单因素资料的方差分析 此资料为两向分组资料(交叉分组资料),其行为处理,列为区组,为 k 行 r 列的两向表,即可看作是试验因素具有 k 个水平和区组因素具有 r 个水平的两因素试验。 注意:这样的模式要求行与列间不存在交互作用,即处理效应不因区组不同而显著不同,否则,F 测验将
丧失有效性,需采用二因素随机区组试验。一般的随机区组试验,往往假定处理效应是固定的,而区组效应是随机的,一般是不存在交互作用的。 处理间变异 观察值总变异 区组间变异 误 差 ε
2.F测验 一般来说,区组只是局部控制的手段,而不是研究的目的,所以通常仅需将它从误差中分离出来,并不一定要作 F 测验,更无多重比较的必要。 F=
3.多重比较 此资料多重比较方法见前述,此处不赘述。 (二)复因素随机区组资料的方差分析 先了解几个概念: 简单效应:指在单因素试验中不同水平的差异。 主效应: 指复因素试验中不同条件下同一简单效应的平 均效应。 交互作用:指试验因素间相互促进或抑制而产生的效应。 分正交互作用、负交互作用及零交互作用。
无交互作用时,因素彼此独立,简单效应等于主效应。故各因素最佳水平就组成最佳组合。有交互作用时,因素彼此相依,简单效应不等于主效应,故由简单效应推论最佳组合一定有偏,甚至错误。 区组间变异 A因素间变异 观察值总变异 B因素间变异 处理间变异 A、B因素间互作 (A×B) 误 差
+ 1.平方和与自由度的分解 注意用计算器进行各项平方和计算的简便方法。
F测验 • 进行F测验时,应注意两个因素的模型。如果两个因 • 素均为固定模型,则测验A因素、B因素以及A、B因素互 • 作的效应是否显著时,分母均以误差方差为被比量。 3. 多重比较 不同类型平均数的多重比较需要注意标准误计算上的区别(见表)。若互作效应未达显著,可用相加式法选取试验优劣组合。但在互作效应显著或极显著时,采取相加式法推断结果可能有误,需对处理组合平均数进行多重比较以确定试验优劣组合。
四、拉丁方设计资料的方差分析 行区组间变异 区组间变异 观察值总变异 列区组间变异 处理间变异 误 差
F测验 3. 多重比较 • 单个拉丁方资料的F测验和多重比较相对简单,基本 • 同前述单因素随机区组资料的分析,此不再赘述。 五、裂区设计资料的方差分析 区组间变异 主区部分 主处理间(A因素) 观察值总变异 主区误差 副处理间(B因素) A×B 副区部分 副区误差
2.F测验 计算F值时,主处理的F值用主处理均方与主区误差均方比,副处理和主、副处理交互作用用各自均方与副区误差比。F测验时误差自由度的使用是:主区部分用主区误差自由度,副处理和主、副处理交互作用,用副区误差自由度。
多重比较 • 不同类型平均数的多重比较要注意标准误计算上的区别 。 六、正交试验结果分析 (一)直观分析 1.计算各个处理组合的总和数; 2.计算出各因素各水平的总和数 ; 3.计算出各因素各水平的平均数 ;
4.计算各因素各水平平均数的极差; 5.根据各因素的极差值来分析其对所研究性状的影响 程度。 (二)方差分析 1、无重复试验的方差分析 此类分析是通过空列进行误差估计的,但从试验设计来讲,应该设置重复才能正确估计误差,因此在进行试验设计时,应尽可能地采用设置重复的正交试验。
2、有重复的正交试验结果分析 因为正交试验中选出的部分处理组合是按照随机区组设计方法进行试验的,因此其资料的分析基本同复因素随机区组资料的分析,只是不进行互作项的分析。但根据正交试验设计的情况,虽然没有研究互作,但正交试验的一个重要目的就是要找出最优组合,因此仍需要进行处理组合平均数间的多重比较。
第五节 方差分析的基本假定和数据转换 一、方差分析的基本假定 (一)可加性:处理效应与环境效应(误差)是 可加的。是进行平方和与自由度分解的依据。 (二)正态性:试验误差是独立的随机变量, 并遵从正态分布。这是F测验的前提条件。 (三)同质性:所有试验处理的误差方差都是 同质的。方差分析是以各个处理的合并均方值作 为测验处理间显著性共用的误差均方
为使所获得的试验资料满足方差分析的基本假定,在进行方差分析之前,可采取以下措施:为使所获得的试验资料满足方差分析的基本假定,在进行方差分析之前,可采取以下措施: 1、“剔除”某些表现“特殊”的观察值、处理或重复。 2、将总的试验误差的方差分裂为几个较为同质的试验误差的方差。 3、采用几个观察值的平均数作方差分析。 4、采用适当的数据转换,然后用转换后的数据作方差分析。
二 、数据转换的方法 (一)、反正弦转换法 适用于两项百分数资料,不遵从二项分布的百分数资料不能作反正弦转换。如果资料的p值都在0.3-0.7之间, 可省略转换,直接进行方差分析;但如果p只要有大于0.7或小于0.3的,则宜将全部p值都转换成尺度,再作方差分析。分解结果的表达时应将变数转换为原尺度。
(二)、平方根转换 平方根转换的主要作用是减少极端大变量对于均方的影响。适用于处理平均数 与其均方成比例的资料。 (三)、对数转换 若变量的均方是和处理平均数的平方成比例,或者已知处理效应是和处理水平的变化成比例而不是可加的,则宜作对数转换。一般说,对数转换对于削弱大变量的作用,要比平方根转换更强。
第六节 缺区(值)估计 一、概念 在试验中,由于某种意外或疏忽而缺失的观察值叫缺值。 二 、缺值估计的原理 缺值的最可能值仅需满足 , 即使被估计值的误差等于零。 三、估计的方法 随机区组设计的误差:
拉丁方试验的误差 : 裂区副区误差:
缺值估计后的资料在进行方差分析时应注意: 1.一个试验若有m个缺值,则误差项和总变异的自由度都要比常规的(未发生缺值的)少m个。 2.由于误差项自由度减少,F测验的灵敏度降低,所以多重比较时一般用PLSD法。 3. 多重比较时,平均数差数标准误的计算需要进行矫正。 本章结束