1.05k likes | 1.31k Views
第 9 讲 方差分析. 第一节 引言. K 个样本. 样本数超过 2 个后,利用 t 检验的缺点 烦琐, k ( k – 1)/2 次 t 检验 每对检验的标准误不同, I 类错误增大 没有考虑平均数的秩次, I 类错误增大 如 3 个样本, P (Type I error)=1 – (1 – a ) k P(Type I error)=1 – (0.95) 3 = 1 – 0.86 =0.14 结论:不能利用 t 检验. 概念. 方差分析 (Analysis of variance) 把 k 个总体当作一个整体看待
E N D
K个样本 • 样本数超过2个后,利用 t检验的缺点 • 烦琐,k(k – 1)/2次 t检验 • 每对检验的标准误不同,I 类错误增大 • 没有考虑平均数的秩次,I 类错误增大 • 如3个样本, P(Type I error)=1 – (1 – a)k P(Type I error)=1 – (0.95)3= 1 – 0.86 =0.14 • 结论:不能利用 t检验
概念 • 方差分析(Analysis of variance) • 把k个总体当作一个整体看待 • 把观察值的总变异的平方和及自由度分解为不同来源的平方和及自由度 • 计算不同方差估计值的比值 • 检验各样本所属的平均数是否相等 • 实际上是观察值变异原因的数量分析
概念 • 试验指标(Experimental index):试验测定的项目或者性状。 • 日增重、产仔数、瘦肉率 • 试验因素(Experimental factor):影响试验指标的因素。 • 温度、营养水平 • 单因素试验:只有一个因素的试验 • 多因素试验:有多个因素
概念 • 因素水平(Level of factor):试验因素所处的特定状态或者数量等级。简称水平 • 如日粮中粗蛋白质含量 • 试验处理(Treatment):实施在试验单位上的具体项目。简称处理。 • 单因素:试验因素的一个水平 • 多因素:试验因素的一个水平组合
概念 • 试验单位(Experimental unit):试验载体 • 1只家禽、1只鱼 • 几只家禽、几只鱼 • 观测数据的单位 • 重复(Repetition) • 一个处理实施在两个或者两个以上的试验单位上,称为处理有重复。 • 试验单位数称为处理的重复数
第二节 基本原理 单因素分类资料的方差分析
一、各水平 样本含量相等
例1 某水产研究所比较四种饲料对鱼的饲喂效果
数学模型: yij= 第i组第j个鱼的观察值; = 平均值; i= 第i种日粮的效应值;eij= 误差效应 • 单因素试验 的 线 性 模 型(linear model)亦称数学模型 • 模型假定: • e ~ N(0, 2),方差同质性homogeneity • 数据正态分布normality • 效应可加additivity
假设 H0:1 = 2 = … = n HA: 至少有一对 不相等
平均数 总体平均数 grand mean
总平方和 sum of squares • 总平方和 • 总平方和(Total sum of squares, SSTotal) • 观察值同总体平均数的离差可以剖分成与处理平均与总体平均的差和观察值与处理平均的差
N – 1 = ( k – 1 ) + ( N – k ) Total Treat Error 0 总平方和及自由度的剖分 SSTRTSSRES
F检验 • SSTRT/2~2(k– 1) • SSRES/2~2(n–k) • MSTRT = SSTRT/(k– 1) • MSRES = SSRES/(n–k) • F = MSTRT/MSRES ~ F(k– 1, n–k)
期望均方 请注意无效假设如果成立,则处理均方等于误差均方
F检验 • F检验:利用F值出现概率的大小推断两个总体方差是否相等的方法 • 目的:推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零 • 在计算F 值时总是以被检验因素的均方作分子,以误差均方作分母 • 分子、分母的选择是由模型和各项变异原因的期望均方决定的 • ANOVA分析中的F检验总是单尾检验,而且为右尾检验
如何理解 • 如果H0是正确的,那么MSTRT与MSRES都是总体误差2的估计值,理论上讲F值等于1;如果H0是不正确的,那么 ,理论上讲 F 值就必大于1。但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。 • 只有F值大于1达到一定程度时,才有理由否定H0
平方和的计算公式 校正数
例:ANOVA表 如果接受H0,则分析结束。否则,进行下一步分析。
多重比较 • 多重比较 • F检验否定H0, 不表明任意两个平均数间都存在显著差异 • 功能:发现哪两个平均数间存在显著差异 • Mean separation technique or multiple comparisons • 常用方法 • 最小显著差数法LSD(lest significant difference) • 最小显著极差法LSR(lest significant ranges):q法和DUNCAN
LSD法 • LSD法的基本原理:
例 临界值:t0.05(16)=2.12, t0.01(16)= 2.921 LSD0.05(16)=2.120*1.462=3.099 LSD0.01(16)=2.921*1.462=4.271
LSD • 说明 • 实质上是 t检验,但统一了标准误 • 简单、灵敏(降低了检验标准、夸大了差异的显著性) • I 类错误概率增大, 控制单次比较的I类错误(comparisonwise error rate)时应用 • 无法控制所有比较的总体 I 类错误(experimentwise error rate)
LSR • 把平均数的差异看成是平均数的极差(range) • 根据极差范围内所包括的处理数(称为秩次距)k的不同,而采用不同的检验尺度叫做 最小显著极差LSR • 说明 • I类错误下降、工作量加大 • 把每个处理的样本数看成相同,如果不同,则需要校正
q检验法 • 此法是以统计量q的概率分布为基础的。q值由下式求得
q检验步骤 • 列出平均数多重比较表; • 由自由度dfRES、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k; • 将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k, LSR0.01,k比较,作出统计推断
q检验法 q值及LSR
多重比较:q检验法 秩次距
新复极差法 • 英语名称 • New multiple range method • Shortest significant ranges, SSR • Duncan’s multiple range test, DMRT • 新复极差法与q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附表6)而不是查q值表 • 公式
新复极差法 SSR与LSR值 以后步骤与q法相同
总结 • 方差分析假定不同处理的方差相等 • 若不相等,则结果的可靠性下降 • 数据不是正态分布要经过转换;或者利用非参数方法
总结 • 多重比较有多种方法,不同方法用途不同、比较的结果不同 • 尺度大小:LSD法≤新复极差法≤检验法 • 当秩次距k=2时,取等号; 秩次距 k ≥3时,取小于号。 • 对试验要求严格时,用q检验法较为妥当 • 生物试验中,由于试验误差较大,常采用新复极差法 • 应该注明利用的是何种多重比较方法 • LSR的目的是控制单次多重比较的I类错误
二、各处理重复数 不等的方差分析
第三节 两因素方差分析
前言 • 两因素试验资料的方差分析是指对试验指标同时受到两个试验因素作用的试验资料的方差分析 • 两因素试验按水平组合的方式不同,分为交叉分组和系统分组两类 • 对试验资料的方差分析方法也分为交叉分组方差分析和系统分组方差分析两种
前言 • 设试验考察A、B两个因素,A因素分a个水平,B因素分b个水平 。 • 所谓交叉分组是指A因素每个水平与B因素的每个水平都要碰到 ,两者交叉搭配形成ab个水平组合即处理 ,试验因素A 、B在试验中处于平等地位 。 试验单位分 成 ab 个组,每组随机接受一种处理 ,因而试验数据也按两因素两方向分组。这种试验以各处理是单独观测值还是有重复观测值又分为两种类型
二、随机化完全区组设计 Randomized Complete Block Design ANOVA
前言 • 概念 • 为配对 t试验设计的推广 • 这时每个试验单位的处理多于两个 • 试验动物随机选择,处理随机安排 • 如: • 对于A、B两个试验因素的全部ab个水平组合,每个水平组合只有一个观测值, 全试验共有ab个观测值