870 likes | 1.05k Views
第五章 方 差 分 析. 5.1.1 自由度和平方和的分解. 5.1.2 F 分布与 F 测验. 5.1 方差分析的基本原理. 上章介绍了一个或两个样本平均数的假设测验方法。本章将介绍 k ( k ≥3) 个样本平均数的假设测验方法,即 方差分析 (analysis of variance) 。这种方法的基本特点是: 将所有 k 个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自由度和平方和分解为不同变异来源的自由度和平方和,进而获得不同变异来源的总体方差估计值。.
E N D
第五章 方 差 分 析 西南科技大学生命科学与工程学院周海廷制作
5.1.1 自由度和平方和的分解 5.1.2 F分布与F测验 5.1方差分析的基本原理 西南科技大学生命科学与工程学院周海廷制作
上章介绍了一个或两个样本平均数的假设测验方法。本章将介绍k(k≥3)个样本平均数的假设测验方法,即方差分析(analysis of variance)。这种方法的基本特点是:将所有k个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自由度和平方和分解为不同变异来源的自由度和平方和,进而获得不同变异来源的总体方差估计值。 西南科技大学生命科学与工程学院周海廷制作
其中,扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据。其中,扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据。 西南科技大学生命科学与工程学院周海廷制作
5.1.1 自由度和平方和的分解 • 方差是平方和除以自由度的商。要将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将总自由度和总平方和分解为各个变异来源的相应部分。因此,自由度和平方和的分解是方差分析的第一步。 • 下面我们首先用一个例子来说明这一问题。 西南科技大学生命科学与工程学院周海廷制作
[例5.1]以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试分解其自由度和平方和。[例5.1]以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试分解其自由度和平方和。 西南科技大学生命科学与工程学院周海廷制作
1、总变异 • 把表中的全部观察值作为一个组看待[即把4个处理(4组、每组有4个观察值)合并成一组,共有24个观察值],根据前面讲过的计算平方和的公式 ,可以计算出总变异的平方和和自由度 西南科技大学生命科学与工程学院周海廷制作
其中: 称为矫正数,用C表示。 • 自由度DFT=nk-1=4×4-1=15。 • 表中的每一个观察值,即包括有处理的效应(不同药剂对苗高的影响)又受到误差的影响。 西南科技大学生命科学与工程学院周海廷制作
2、误差效应 • 表中处理内(组内)各观察值之间,若不存在误差,则各观察值应该相等,由于误差是客观存在的,因而处理内(组内)各观察值之间必然是有差异的,因此,可以用组内(处理内)的差异度量误差效应: 西南科技大学生命科学与工程学院周海廷制作
药剂A内: 药剂B内: 药剂C内: 药剂D内: 西南科技大学生命科学与工程学院周海廷制作
从理论上讲,这4个误差平方和除以相应的自由度得的误差均方都可以作为总体误差方差的无偏估计值。但是,用它们的加权平均值来估计总体误差方差,则效果更佳。所以:从理论上讲,这4个误差平方和除以相应的自由度得的误差均方都可以作为总体误差方差的无偏估计值。但是,用它们的加权平均值来估计总体误差方差,则效果更佳。所以: 每个组内(处理内)的自由度为:n -1=4-1=3, 西南科技大学生命科学与工程学院周海廷制作
从理论上讲均应该相等, 因此可以用 所以误差的自由度为:DFe=k(n-1)=4(4-1)=12 3、处理效应 如果没有处理效应,表中各个处理(组)平均数 来度量处理效应。 西南科技大学生命科学与工程学院周海廷制作
需要注意的是, 系样本平均数的方差, 是 的估值,而 则是 的估值。 。因而,处理(组间)平方和 计同一参数 为了进行正确的F 测验,必须使它们都是估 应为: 西南科技大学生命科学与工程学院周海廷制作
本例中 平方和: 602=504+98 • 自由度: 15=3+12 • 因此误差平方和可以采用简单的办法计算 • SSe=SST-SSt=602-504=98。 • 进而可得均方: 西南科技大学生命科学与工程学院周海廷制作
将上述例子推广到一般,设有k组数据,每组皆具n个观察值,则资料共有nk个观察值,其数据分组如表6.1(P99)。将上述例子推广到一般,设有k组数据,每组皆具n个观察值,则资料共有nk个观察值,其数据分组如表6.1(P99)。 • 平方和与自由度的分解归纳为下表 西南科技大学生命科学与工程学院周海廷制作
和 ,将 的比值定义为F: 和 其均方 5.1.2 F分布与F测验 • 一、F 分布 • 在一个平均数为μ、方差为σ2的正态总体中随机抽取两个独立样本,分别求得 西南科技大学生命科学与工程学院周海廷制作
按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个F分布。它是具平均数μF=1和取值区间为[0, ∞]的一组曲线; 而某一特定曲线的形状仅决定于参数ν1和ν2。 F分布下一定区间的概率可从已制成的统计表中查出。附表5给出了各种ν1和ν2下右尾概率α=0.05和α=0.01 西南科技大学生命科学与工程学院周海廷制作
时的临界F 值。其值是专供测验 的总体方 是否显著大于 的总体方差 差 而设计的(H0 : 对HA: > )。 ≤ • 二、F 测验 • 在方差分析的体系中,F测验可用于检测某项变异因素的效应或方差是否存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异(如误差项)作分母。 西南科技大学生命科学与工程学院周海廷制作
和 彼此独立。 (2) [例6.3] 在例6.1中算得药剂间均方 =168.00,药剂内均方 =8.17,具有自由度ν1=3,ν2=12。试测验药剂间变异 对HA: 假设H0: F测验需具备的条件:(1)变数y遵循N(μ,σ2); 是否显著大于药剂内变异? α=0.05 西南科技大学生命科学与工程学院周海廷制作
测验计算: 查附表5在ν1=3,ν2=12时 F0.05=3.49, F0.01=5.95 实得F> F0.01 P<0.01 西南科技大学生命科学与工程学院周海廷制作
推断:否定H0: ,接受HA: • 将例6.1和例6.3的分析结果归纳在一起,列出方差分析表如下: 水稻药剂处理苗高方差分析表 西南科技大学生命科学与工程学院周海廷制作
5.2.1 最小显著差数法 5.2.2 q 法 5.2.3 新复极差法 5.2.4 多重比较方法的选择 5.2多重比较 西南科技大学生命科学与工程学院周海廷制作
5.2.1 最小显著差数法 • 最小显著差数法(least significant differrence,简称LSD法) 西南科技大学生命科学与工程学院周海廷制作
[例6.4] 试以LSD法测验各种药剂处理的苗高平均数之间的差异显著性。 由附表4,ν=12时,t0.05=2.179,t0.01=3.055 故 LSD0.05=2.179×2.02=4.40(cm) LSD0.01=3.055×2.02=6.17(cm) 西南科技大学生命科学与工程学院周海廷制作
不同药剂处理水稻苗高平均数比较(LSD法) A a b A B c B C C c 西南科技大学生命科学与工程学院周海廷制作
5.2.2 q 法 • q 测验方法是将k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的。 西南科技大学生命科学与工程学院周海廷制作
[例6.5] 试以q法测验各种药剂处理的苗高平均数之间的差异显著性。 查附表7,得到当DF=12时,p=2,3,4的qα值 西南科技大学生命科学与工程学院周海廷制作
LSRα值 不同药剂处理水稻苗高平均数比较(q法) 西南科技大学生命科学与工程学院周海廷制作
5.2.3 新复极差法 • 新复极差法,又称最短显著极差法(shortest significant range),与q法相似。计算LSRα值查的是SSRα值(附表8)而不是q表。 LSRα值 西南科技大学生命科学与工程学院周海廷制作
5.2.4 多重比较方法的选择 • 1、试验事先确定比较的标准,凡是与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法; • 2、根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。 西南科技大学生命科学与工程学院周海廷制作
方差分析的基本步骤: (1)分解平方和与自由度; (2)F测验; (3)平均数的多重比较。 西南科技大学生命科学与工程学院周海廷制作
5.3.1 方差分析的线性数学模型 5.3.2 期望均方 5.3方差分析的线性模型与期望均方 西南科技大学生命科学与工程学院周海廷制作
5.3.1 方差分析的线性数学模型 • 方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模型是指总体每一个变量可按其变异的原因分解成若干个线性组成部分,它是方差分析的基础。 西南科技大学生命科学与工程学院周海廷制作
表6.1数据的线性模型可表示为: 式中,μ为总体平均数,τi为试验处理效应,εij为随机误差具有N(0,σ2)。 西南科技大学生命科学与工程学院周海廷制作
是μ的无偏估计值, • 在以样本符号表示时,样本的线性组成为: 西南科技大学生命科学与工程学院周海廷制作
5.3.2 期望均方 • 在线性可加模型中,由于对τi有不同解释产生了固定模型(I)和随机模型(II)。 • 一、固定模型(fixed model) • 指试验的各处理都抽自特定的处理总体,其处理效应τi=(μi-μ )是一个固定的常量,我们的目的就在于研究τi,所测验的假设是H0:τi=0或H0:μi= μ。 西南科技大学生命科学与工程学院周海廷制作
一般的栽培和饲养试验,如肥料试验、药效试验、密度试验、饲料试验、品种试验等均属于固定模型。一般的栽培和饲养试验,如肥料试验、药效试验、密度试验、饲料试验、品种试验等均属于固定模型。 [例6.8]以5个水稻品种作大区比较试验,每品种作3次取样,测定其产量,所得数据为单向分组资料。本试验需明确各品种的效应,故为固定模型,方差分析和期望均方的参数列入下表: 西南科技大学生命科学与工程学院周海廷制作
5个水稻品种产量的方差分析与期望均方表 固定模型的处理效应(本例为品种效应) τi属于固定效应,固定效应的方差用 表示。 固定模型的F测验 西南科技大学生命科学与工程学院周海廷制作
二、随机模型(random model) • 指试验中的各处理皆是抽自N(0, )的一组随机样本,因而处理效应τi是随机的,它会因试验的不同而不同;故我们的目的不在于研究τi而在于研究τi的变异度。 • 随机模型在遗传、育种和生态的研究试验方面有较广泛的用处。 西南科技大学生命科学与工程学院周海廷制作
[例6.9]研究籼粳杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。其方差分析的结果如下:[例6.9]研究籼粳杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。其方差分析的结果如下: 西南科技大学生命科学与工程学院周海廷制作
;系统间MS 因而 本例中系统内 MS 估计了σ2,因而 估计了 • 随机模型的F 测验 西南科技大学生命科学与工程学院周海廷制作
这是测验处理效应的变异度,而不是测验处理效应本身。这是测验处理效应的变异度,而不是测验处理效应本身。 本例F=72.79/17.77=4.09>F0.05,说明单株干草重存在遗传变异。 西南科技大学生命科学与工程学院周海廷制作
5.4.1 组内观察值数目相等的单向分组资料的方差分析 5.4.2组内又分亚组的单向分组资料的方差分析 5.4单向分组资料的方差分析 西南科技大学生命科学与工程学院周海廷制作
5.4.1 组内观察值数目相等的单向分组资料的方差分析 • 每组具n个观察值的k组数据的符号表 西南科技大学生命科学与工程学院周海廷制作
组内观察值数目相等的单向分组资料的方差分析组内观察值数目相等的单向分组资料的方差分析 西南科技大学生命科学与工程学院周海廷制作
5.4.2组内又分亚组的单向分组资料的方差分析 西南科技大学生命科学与工程学院周海廷制作
设一系统分组资料共有l组,每组内有m个亚组,每一亚组内有n个观察值,则该资料共有lmn个观察值。其观察值的线性模型为:设一系统分组资料共有l组,每组内有m个亚组,每一亚组内有n个观察值,则该资料共有lmn个观察值。其观察值的线性模型为: 将该线性模型变型得: 西南科技大学生命科学与工程学院周海廷制作
等式的左边是总效应,它是由右边的(1)组间变异;(2)同一组内亚组间变异;(3)同一亚组内各重复观察值间的变异所构成。其自由度和平方和的估计如下:等式的左边是总效应,它是由右边的(1)组间变异;(2)同一组内亚组间变异;(3)同一亚组内各重复观察值间的变异所构成。其自由度和平方和的估计如下: 1、总变异 自由度DFT=lmn-1 西南科技大学生命科学与工程学院周海廷制作