720 likes | 832 Views
第十五章. 试验设计方法. 本章主要讨论几种常用的试验设计方法及相应的数据处理方法. 第一节 完全随机设计. 一、方法 从一个大群体中 随机 抽取符合试验要求的动物个体、或独立供试单位、或试验材料,数量与试验要求相符,或略多一些,组成样本 将抽取到的样本 随机 分成若干个组或组合,使每一组和组合内的重复数相等,或基本相等,并作适当的调整 每一组和组合 随机 接受一种处理. 二、特点 1 、 随机抽样、随机分组、随机配置 2 、 优点:方法简单 限制条件少 抽样比较自由
E N D
第十五章 试验设计方法
本章主要讨论几种常用的试验设计方法及相应的数据处理方法本章主要讨论几种常用的试验设计方法及相应的数据处理方法
一、方法 从一个大群体中随机抽取符合试验要求的动物个体、或独立供试单位、或试验材料,数量与试验要求相符,或略多一些,组成样本 将抽取到的样本随机分成若干个组或组合,使每一组和组合内的重复数相等,或基本相等,并作适当的调整 每一组和组合随机接受一种处理
二、特点 1、随机抽样、随机分组、随机配置 2、优点:方法简单 限制条件少 抽样比较自由 在试验材料不明了的情况下也能使用这种方法 统计方法明确 3、缺点:精确度较低
三、统计分析方法 2 个样本组时可采用 t-test 法进行显著性检验 多个样本组时可采用单因子方差分析法 同时考虑 2 个因子或多个因子时可采用两因子或多因子方差分析法 质量性状的资料可采用卡方检验法
四、采用完全随机设计方法时应注意的事项 1、对照的设置 不管使用什么样的试验设计,都应当设置对照组,但完全随机设计尤应注意这一点 对照组的设置应与处理组同等对待,在动物学科试验中,应当是先分组,然后在其中任取一组作为对照,而不应当先设置对照或最后设置对照 即在整个试验中,对照的设置应当也是随机的
2、随机化 一定要遵守完全随机化的原则,不应当作任何人为的干预
3、群饲的处理 以群为供试单位时,应注意不能以群内个体间的差异作为误差来源,而应当以群间的差异作为误差来源 比较理想的设计方法是:同一处理内设置多个小群体(即独立供试单位),以每一小群体的平均值作为原始数据进行统计分析 特别是个体间易相互干扰的试验: 或者是每一试验动物一个单独的圈舍,或者是几个试验动物一个圈舍但仅作为一个独立单位来对待
一、方法 当试验规模达到一定程度后,完全随机设计就不容易做到试验条件完全一致 因此可以将整个试验分成若干个相对独立、比较均匀的单元(局部)、每一单元内设置一整套完整的试验,这一个单元就称为区组 一个区组可以是一个独立的空间,如:一个地区、一个试验区、一个畜牧场、一栋畜舍、一个养殖单元、一个家系;或是一个独立的时间段,等 可以用作区组的条件(或因素)有很多
A1 A2 . . . . . Aa A1 A2 . . . . . Aa A1 A2 . . . . . Aa 区组设置: 区组1 区组2 … 区组b
A1 A2 A1 A2 A1 A2 配对设计:
对区组的要求是: 区组内的供试单位(或供试动物)其各项条件应当基本一致,而区组之间应有适度的间距或差异 每一区组应能容纳一整套试验 同一区组内如何安排试验单位,应随机化 如果一个区组内仅安排一个处理、一个对照,这样的区组就是配对试验设计 因此区组试验设计可以看作是配对试验设计的扩展 配对试验设计:对子内的两个动物应尽可能一致 区组试验设计:区组内的一套动物应尽可能一致
配对试验设计:对子内的供试动物何者为处理、何者为对照应当是随机的配对试验设计:对子内的供试动物何者为处理、何者为对照应当是随机的 区组试验设计:同一区组内的供试动物哪一个为对照亦应当是随机的 配对试验设计:同一对子内的两个动物其非试验条件应当是一致的 区组试验设计:同一区组内的一套供试动物其非试验条件亦应当是一致的
二、随机区组设计的特点 随机区组设计的精确度要高于完全随机设计 其原因是:由于设计了区组,误差被分成了两部分 一部分误差是区组内的,由于区组内的条件基本一致,这部分误差就完全是随机性的 另一部分误差是区组间的,这部分误差由于设置了区组,而可以在方差分析中作为因子 B 而从总变异中析出,从而使得区组内误差(即随机误差)变得较为单纯
即随机区组设计所进行的方差分析,所得到的误差(用误差项均方进行估计)是真正的随机误差即随机区组设计所进行的方差分析,所得到的误差(用误差项均方进行估计)是真正的随机误差
三、随机区组设计试验的统计分析 配对试验设计仅有两个区组,因此所得到的数据可以用 t-test 进行分析 随机区组设计有多个区组,因此所得到的数据应当用组合内无重复的两因子方差分析 例:在 5 个鸡场试验 4 种中草药添加剂配方的增重效果 每一鸡场内选择 4 组条件基本一致的同品种鸡,每一组鸡随机地饲喂一种中草药添加剂 这里中草药添加剂是 A 因子,有 4 个水平;鸡场为 B因子,有 5 个水平
试验结束后,得如下数据: 鸡 中草药添加剂配方 场 A1 A2 A3 A4 B1 1.33 1.02 1.82 1.84 B2 1.42 1.46 1.99 2.19 B3 1.59 1.38 1.36 1.28 B4 1.04 0.92 1.25 1.79 B5 1.20 1.56 1.60 1.82 请回答:这一数据表的结构属于哪种类型? 数据的数学模型是什么? 表中的数据应使用哪种统计方法进行分析?
当考察两个因素时,同样可以设置区组,即设置 r 个区组,每一个区组内设置一套两因素的完整试验,一个区组内的整套两因素试验既可以是无重复的,也可以是有重复的 统计分析时,可以将总变异剖分成 A 因子、B 因子、A×B 互作、区组 C、误差 e 五部分
四、随机区组设计的注意事项 1、因子内各水平的相似性 被考察的因子(A)各水平在不同的区组内应有相似的反应 即一个水平在某一区组内表现得较好,那么在其他区组内亦应普遍较好;另一个水平在某一区组内较差,那么在其他区组内亦应普遍较差 否则,就会出现互作
2、A 因子的水平数和区组数 A 因子的每一水平都应当在所有区组内出现;每一区组应包含 A 因子所有的水平(完全随机区组) 3、自由度与误差的关系 设置区组的目的是希望试验误差变小,从而提高试验分析的精确性,但如果区组的设置不能起到降低误差的作用,就应当将区组并入误差项,如区组的F<1或≈1时,就应当将区组项的自由度、平方和与误差项的自由度、平方和合并,形成一个新的误差项均方,用以检验A因子均方
4、区组设置方法 用作区组的条件或因素可以很多,如:场、舍、家系、田块、时间、等,但需要注意这些作为区组的因素应当确保与被考察的主因素A之间没有互作存在
5、随机区组设计的优缺点 优点: 试验处理数与区组数之间无严格的限制 精确性高 统计分析比较简单 缺点: 同一区组内条件相似的供试动物不容易配齐 有时不一定能确信试验因子与区组之间是否存在互作
交叉设计又称为反转设计 这一设计方法在医学试验和动物学试验中用得比较多 这是将条件配对设计和自身配对设计结合起来以弥补两者不足的一种设计方法 条件配对的不足之处:处于同一条件下能配成一对的供试动物不容易找到 自身配对的不足之处:试验规模小,而试验单元间差异大引起系统误差 交叉设计是一种特殊的自身配对设计方法,它充分利用了上述两者的优点,克服了两者的缺点
一、设计方法 同一试验中,同一供试单位在不同时期接受 2 次或2 次以上不同的处理,各处理组间保持平衡的这样一种试验设计方法 交叉设计有很多种模式 这里主要介绍最主要、也是最简单的 2×2、2×3 法
2×2 法:将供试动物随机分为数量相等的两组 B1、B2,设立 2个试验期 C1和 C2,在第一试验期 C1,随机一组 B1接受 A1处理,另一组 B2 则接受 A2处理 第二试验期C2,原来接受 A1处理的 B1 组接受 A2处理,而原来接受 A2处理的 B2 组则接受 A1处理 组 试 验 期 别 C1C2 B1 A1 A2 B2 A2 A1
2×3 法:设立 3 个试验期 C1、C2、C3,供试动物随机分为数量相等的两组 B1、B2 在第一试验期 C1:B1组动物接受 A1处理,B2组动物接受 A2处理 在第二试验期 C2:B1组动物接受 A2处理,B2组动物接受 A1处理 在第三试验期 C3:B1组动物再次接受 A1处理,B2组动物再次接受 A2处理 组 试 验 期 别 C1 C2 C3 B1 A1 A2 A1 B2 A2 A1 A2
二、数据分析方法 交叉设计所得到的数据资料可以采用无互作的三因子方差分析法进行分析,但一般常用差值分析法进行分析 下面我们结合实际例子来了解交叉设计的方法和数据分析方法
2×2 法: 试验某种药物对血液内血糖含量变化的影响,设 A1为常规药物,A2为研制的新药 抽取 6头条件比较一致的奶牛,随机分为两组 B1、B2,每组 3头奶牛,设置了两个试验期 C1和C2,进行交叉设计试验,C1期 B1组用A1常规药物,B2组用 A2新药,C2期 B1组用 A2新药,B2组用 A1常规药物,两试验期间保留足够的缓冲期,得数据如下,试分析该新药对血糖的作用
试验期C1 C2 C1-C2 药 物A1 A2 d1j d2j B1 B11 10.2 19.6 -9.4 B12 13.7 20.0 -6.3 组B13 18.4 9.4 9.0 药 物A2 A1 B2 B21 19.5 5.9 13.6 B22 8.7 2.7 6.0 组B23 18.4 3.7 14.7 和 -6.7 34.3
同一头奶牛得到一个差值 d,即 C1 - C2 例如,B11牛的差值为 d11 = C1 - C2 = 10.2 - 19.6 = -9.4 余类推 将每头牛的差值列于表右,并计算每一组差的和: 按单因子方差分析法对差 dij进行分析
求校正值和各平方和、自由度: 这表示在该次试验中,这一新药对血糖含量的影响并不比常规药物来得显著
2×3 法: 试验者心犹不甘,认为对该新药的试制从新药的设计,到原料的选配,到投产,应当没有问题,希望得到一个理想的结果,因此在 2×2法的基础上试验者继续将试验进行下去,即将其扩展成 2×3 法(即在 2×2法后并不结束试验,而是继续进行):设立 C3期,在C3期 B1组仍然使用A1药物,B2组使用 A2药物,得如下数据,并进行统计分析
试验期C1 C2 C3 C1 -2C2+C3 药 物A1 A2 A1 d1j d2j B1 B11 10.2 19.6 10.1 -18.9 B12 13.7 20.0 15.3 -11.0 组B13 18.4 9.4 5.9 5.5 药 物A2 A1 A1 B2 B21 19.5 5.9 14.2 21.9 B22 8.7 2.7 7.1 10.4 组B23 18.4 3.7 9.6 20.6 -24.4 52.9
同一头奶牛得一个差值 d,即 C1 - 2C2 + C3 例如,B11牛的差值为: d11 = C1 - 2C2 + C3 = 10.2-2×19.6+10.1 = -18.9 余类推 将每头牛的差值列于表右,并计算每一组差的和: 按单因子方差分析法对差 dij进行分析
求校正值和各平方和、自由度: 即:试验结果达到显著程度
关于差值 d的讨论: 在单因子方差分析中,我们是以原始数据 xijk来进行分析的,但交叉设计中,我们却是以每一独立供试单位的差值来进行统计分析的 在交叉设计中,我们有 3 个因子:A(处理)、B(组别)和 C(试验期),其中B和 C 都是区组,分析的重点是 A 在统计分析过程中,我们发现:在求每一供试动物的差值时,个体效应被消除了,因而组别效应也被消除了
在求处理效应时,试验期的效应也被消除了,因而整个统计分析仅剩下了处理效应在求处理效应时,试验期的效应也被消除了,因而整个统计分析仅剩下了处理效应 因而交叉设计的最后结果是消除了个体-组别效应、试验期效应 剩下了处理间效应,因此,交叉设计可以很高的精确度来检验处理间的差异 但同时,我们也看到,个体-组别、试验期两个差异的信息被丢失了
三、交叉设计的注意事项和特点 注意事项 1、在进行交叉设计时,必须注意处理 A、供试单位B、试验期 C 三者之间不能存在互作(有些具体的试验其处理条件与个体、试验期可能发生互作),而一旦存在互作,则这种互作将混杂在误差项中分析不出来,结果是增大了误差,降低了试验的精确性,因此当怀疑试验可能存在上述三者间的互作时,此法不能采用
2、处理的残效是否能在试验期作变换时被有效地消除干净,因此在每两个试验期之间设置足够的缓冲期是非常有必要的,且至关重要2、处理的残效是否能在试验期作变换时被有效地消除干净,因此在每两个试验期之间设置足够的缓冲期是非常有必要的,且至关重要 但缓冲期太长又拉长了整个试验期,因此缓冲期的长短应事先心中有数 3、破坏性试验不能使用交叉设计 4、两个组的供试动物应当相等 5、上例中的 Bij 既可以是真正的一头试验动物,也可以是一个试验动物组
优缺点 交叉设计有“得”有“失” 所谓“得”:是指用很少的试验动物就可以得到很高的精确度 所谓“失”:是指统计分析中无法分析试验个体、试验期的效应,因此如果希望在获得因子 A的信息的同时,还希望知道供试单位间的差异、试验期的差异的话,就不宜使用此法 因此交叉设计最大的优点是:可以用很少的动物数、较少的资金、人力,即可获得较高的精确度,且无需剔除系统误差
交叉设计包括试验期、缓冲期,需要很长的试验时间,因此在安排交叉设计时必须通盘考虑动物的生长周期和生产周期交叉设计包括试验期、缓冲期,需要很长的试验时间,因此在安排交叉设计时必须通盘考虑动物的生长周期和生产周期 交叉设计所需要的供试动物必须处在相似的生理条件下 交叉设计还可以设置 4 个、5 个 … 试验期 交叉设计在处理水平数 a>2时,仍可使用,但设计会变得复杂一些、资料分析也会复杂一些
在设计区组设计中,我们以区组来消除系统误差,但如果系统误差来自两个方面,如一个来自空间,一个来自时间,则我们就应当设置两个方向的区组来消除这种系统误差在设计区组设计中,我们以区组来消除系统误差,但如果系统误差来自两个方面,如一个来自空间,一个来自时间,则我们就应当设置两个方向的区组来消除这种系统误差 拉丁方(Latin Square)就是可以消除上述两个方向上的系统误差的一种有用的设计方法 例如,要考察某些药物在饲料中的残留量、考察药物在动物体内的代谢速率、某些添加剂对猪生长的影响,等等,都可以用拉丁方设计进行试验 拉丁方设计除需要考察的因素 A 外,需设置供试单位 B、动物生活期 C,共三个因素
假设主因素 A 设置三个水平:A1、A2、A3;供试动物 B 有三组:B1、B2、B3;供试动物的连续生长期 C 也有三个:C1、C2、C3 如果考虑全部组合,从 A1B1C1 直至 A3B3C3 就应当有 33 = 27 个组合 能否仅完成部分组合的试验就可取得本来要全部试验才能获取的信息量呢? 答案是肯定的: 首先我们将两个区组 B 与 C 搭配起来,从 B1C1 到B3C3 共有 3×3 = 9 个组合
这 9 个组合中,B 因素的每一水平与 C 因素的所有水平均搭配一次,也仅搭配一次 反之,C 因素的每一水平也与B因素的所有水平搭配一次,也仅搭配一次,我们将这种搭配称为正交 即 B 因素与 C 因素的搭配是均衡的,即正交的 现在我们将 A 因素的各个水平搭配进去,要使得 A因素与 B 因素、A 因素与 C 因素也正交 即 A 因素的每一水平与 B 因素的所有水平搭配一次,也仅搭配一次
同样,A 因素的每一水平与 C 因素的所有水平也要搭配一次,也仅搭配一次 这样,因素 A、因素 B、因素 C 两两正交 从下面的三因素搭配图,我们可以看出,A 因素的每一水平包含了 B 因素的所有水平,也包含了 C因素的所有水平 同样,B 因素的每一水平包含了 A 因素的所有水平,也包含了 C 因素的所有水平 C 因素的每一水平包含了 A 因素的所有水平,也包含了 B 因素的所有水平
这种搭配就是两两正交(orthogonal) B1 B2 B3 C1 A1 A2 A3 C2 A2 A3 A1 C3 A3 A1 A2