750 likes | 918 Views
第九章 方差分析. 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析 多个样本均数间的多重比较. 基本思想及应用条件. 1 、基本思想:根据资料设计的类型及研究目的,可将 总变异 分解为 两个或多个部分 ,每个部分的 变异 可由 某因素 的作用来 解释 。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。. 基本思想及应用条件. 2 、应用条件: 1 )各样本是相互独立的 随机样本 2 )各样本来自 正态总体
E N D
第九章 方差分析 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析 多个样本均数间的多重比较
基本思想及应用条件 1、基本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。
基本思想及应用条件 2、应用条件: 1)各样本是相互独立的随机样本 2)各样本来自正态总体 3)各处理组总体方差相等,即方差齐
完全随机设计资料的方差分析 一、完全随机设计 完全随机设计:(completely random design)是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。
完全随机设计资料的方差分析 例1 某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表9-1所示。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?
完全随机设计资料的方差分析 • 分组方法:先将60名糖尿病患者从1开始到60编号;从随机数字表(附表15)中的任一行任一列开始,依次读取三位数作为一个随机数录于编号下;然后将全部随机数从小到大编序号(数据相同的按先后顺序编序号),将每个随机数对应的序号记录;规定序号1-21为甲组,序号22-40为乙组,序号41-60为丙组。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 二、变异分类与表达
完全随机设计资料的方差分析 • 完全随机设计资料在进行统计分析时,需根据数据的分布特征选择方法,对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-way ANOVA)或成组资料的t检验(g=2);对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 记总均数为 , • 各处理组均数为 , • 总例数为N=nl+n2+…+ng, g为处理组数。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 1. 总变异 60名2型糖尿病患者的餐后2小时血糖Xij大小各不相同,与它们的总均数(overall mean)也不相同,这种变异称为总变异(total variation)。该变异既包含了随机误差(即2型糖尿病患者的个体差异和测量误差),又包含了三组用药即处理的不同,其大小用所有数据(N=60)的方差即均方MS(mean square)来表示。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 1.总变异全部测量值大小不同,这种变异称为总变异。 • 总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。 • 总变异SS总反映了所有测量值之间总的变异程度
完全随机设计资料的方差分析 完全随机设计资料的方差分析
完全随机设计资料的方差分析 完全随机设计资料的方差分析 2.组内变异在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,各组内2型糖尿病患者的餐后2小时血糖Xij大小各不相同,与本组的样本均数也不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内, 表示随机误差(含个体差异和测量误差)的影响。又称误差变异
完全随机设计资料的方差分析 完全随机设计资料的方差分析
完全随机设计资料的方差分析 完全随机设计资料的方差分析 3.组间变异各处理组由于接受处理的水平不同,各组的样本均数(i=1,2,…,g)也大小不等,三组2型糖尿病患者餐后2小时血糖的样本均数各不相同,它与总均数也不相同,这种变异称为组间变异。 其大小可用各组均数与总均数的离均差平方和表示,记为SS组间,它反映了三组用药不同的影响(如处理确实有作用),同时也包括了随机误差
完全随机设计资料的方差分析 完全随机设计资料的方差分析
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 各组均数之间相差越悬殊,它们与总均数的差值越大,SS组间就越大,反之SS组间越小。SS组间反映了各间的变异程度。 • 存在组间变异的原因有: ①随机误差(包括个体变异和测量误差) ②处理的不同水平可能对试验结果的影响。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 基本思想:
完全随机设计资料的方差分析 完全随机设计资料的方差分析 变异程度除与离均差平方和的大小有关外,还与其自由度有关,将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(mean square,MS)。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 如果各组样本的总体均数相等(H0:…),即各处理组的样本来自相同总体,无处理因素的作用(处理效应),则组间变异同组内变异一样,只反映随机误差作用的大小。组间均方与组内均方的比值称为F统计量
完全随机设计资料的方差分析 完全随机设计资料的方差分析
完全随机设计资料的方差分析 完全随机设计资料的方差分析 F值(Fisher)接近于l,就没有理由拒绝H0;反之,F值越大,拒绝H0的理由越充分。数理统计的理论证明,当H0成立时,F统计量服从F分布。F分布有两个自由度, 分子自由度为1,分母自由度为2,记为F~。
完全随机设计资料的方差分析 完全随机设计资料的方差分析
完全随机设计资料的方差分析 完全随机设计资料的方差分析 通过上述变异的分解,可以看出,方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 应用条件: 1)各样本是相互独立的随机样本 2)各样本来自正态总体 3)各处理组总体方差相等,即方差齐
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 分析步骤 (1)建立检验假设,确定检验水准 H0:三个总体均数全相等,即μ1=μ2=μ3 H1:三个总体均数不全相等,亦即至少有两个总体均数不等。 即μ1≠μ2≠μ3或μ1=μ2≠μ3或μ1=μ3≠μ2或μ2=μ3≠μ1 α=0.05
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • (2)计算检验统计量 可根据下表的公式和前面表9-1下半部分数据来计算。也可用统计软件包如SAS或SPSS等进行计算,直接获得表9-4的方差分析表。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 本例的资料是按完全随机设计方法获得的试验结果, 可将总变异分解成组间变异和组内变异, 并列方差分析表.
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 按表中的公式计算各离均差平方和SS、自由度、均方MS和F值。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 (3)确定P值,作出推断结论 以求F值时分子的自由度ν1=ν组间、分母的自由度ν2=ν组内查附表3的F界值表得P值。若F≥Fα(ν1, ν2),则P≤α,按α水准,拒绝H0,接受H1,有统计学意义。 • 本例:ν1=3−1=2,ν2=60−3=57。因附表3中ν2无57,故取最接近者ν2=60,得P<0.01。按α=0.05水准,拒绝H0,接受H1,有统计学意义。可以认为2型糖尿病患者经药物(新药和标准药物)治疗4周,其餐后2小时血糖的总体平均水平不全相同,即三个总体均数中至少有两个不同。
完全随机设计资料的方差分析 完全随机设计资料的方差分析 • 注意:方差分析的结果若拒绝H0,接受H1,不能说明各组总体均数两两间都有差别。如果要分析哪些两组间有差别,要进行多个均数间的多重比较(见本章第六节)。当g=2时,方差分析的结果与两样本均数比较的t检验等价,有 。
随机区组设计资料的方差分析 随机区组设计 • 随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。
随机区组设计资料的方差分析 随机区组设计资料的方差分析 • 与完全随机设计相比,随机区组设计的特点是随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内平方和(误差平方和),提高了统计检验效率。若将区组作为另一处理因素的不同水平,随机区组设计等同于无重复观察的两因素设计。
随机区组设计资料的方差分析 例9-2 为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,即在松止血带前分别给予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表9-6所示,问A、B两方案分别与C方案的处理效果是否不同?
随机区组设计资料的方差分析 随机区组设计资料的方差分析 • 方法:先将小白鼠的体重从轻到重编号,体重相近的3只小白鼠配成一个区组,共10个区组。在随机数字表(附表15)中任选一行一列开始的2位数作为1个随机数;在每个区组内将随机数按大小排序;各区组中内序号为1 的接受A方案、序号为2的接受B方案、序号为3的接受C方案.
随机区组设计资料的方差分析 随机区组设计资料的方差分析 • 符合随机区组设计的资料在进行数据统计分析时也需根据数据的分布特征选择方法,对于正态分布且方差齐同的资料,应采用两因素方差分析(two-way ANOVA)或配对t检验(g=2)。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的Friedman M检验。
随机区组设计资料的方差分析 随机区组设计资料的方差分析 变异分解 为说明随机区组设计方差分析的变异分解和计算分析过程,将按随机区组设计的试验结果用符号表示整理成表。将第j (j=1,2,…,n)区组的受试对象随机分配接受处理因素第i(i=1,2,…,g)水平的处理,试验结果用Xij表示,整理成表4-7形式。
随机区组设计资料的方差分析 随机区组设计资料的方差分析
随机区组设计资料的方差分析 随机区组设计资料的方差分析 (1) 总变异SS总:反映所有观察值之间的变异,计算见公式(4-1)。 (2) 处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理,计算见公式(4-2)。 (3) 区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组,计算公式为
随机区组设计资料的方差分析 随机区组设计资料的方差分析 (4) 误差变异:完全由随机误差产生的变异,记为SS误差。
随机区组设计资料的方差分析 随机区组设计资料的方差分析
随机区组设计资料的方差分析 随机区组设计资料的方差分析 分析步骤 (1)建立检验假设,确定检验水准 • 对于处理组, H0:三个总体均数全相等,即A、B、C三种方案的效果相同 H1:三个总体均数不全相等,即A、B、C三种方案的效果不全相同 • 对于区组, H0:十个总体均数全相等 H1:十个总体均数不全相等 均取α=0.05
随机区组设计资料的方差分析 随机区组设计资料的方差分析 (2)计算检验统计量
随机区组设计资料的方差分析 随机区组设计资料的方差分析 • 按 水准,1=2、2=18查附表3的F界值表,得F0.05(2,18)=3.55,F0.01(9,18)= 3.60,F=32.64>F0.01(2,18),P<0.01。按a水准,拒绝H0,认为三种方案的处理效果不全相等,还不能认为十个区组的总体均数不全相同。
随机区组设计资料的方差分析 随机区组设计资料的方差分析 • 注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较(见本章第六节)。当g=2时,随机区组设计方差分析与配对设计资料的t检验等价,有 。
随机区组设计资料的方差分析 随机区组设计资料的方差分析 • 随机区组设计确定区组因素应是对试验结果有影响的非处理因素。区组内各试验对象应均衡,区组之间试验对象具有较大的差异为好,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。因此,当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,试验效率得以提高。
重复测量资料的方差分析 • 例9-4 为研究减肥新药盐酸西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同,以及肥胖患者服药后不同时间的体重随时间的变化情况。采用双盲双模拟随机对照试验,将体重指数BMI27的肥胖患者40名随机等分成两组,一组给予盐酸西布曲明片+模拟盐酸西布曲明胶囊,另一组给予盐酸西布曲明胶囊+模拟盐酸西布曲明片。所有患者每天坚持服药,共服药6个月(24周),受试期间禁用任何影响体重的药物,而且受试对象行为、饮食及运动与服药前的平衡期均保持一致。分别于平衡期(0周)、服药后的8周、16周、24周测定肥胖患者的体重(kg)得表9-13的资料。