570 likes | 752 Views
实例分析. 某医生为研究一种四类降糖新药的疗效,以统一的标准选择 60 名 2 型糖尿病患者,按完全随机设计方案将患者分为三组进行试验。表 9-1 是治疗 4 周后的血糖下降 值。 检验三组受试对象血糖下降值差别有无统计学意义?. 表 9-2 从已知正态总体 N (10,5 2 ) 随机抽取 10 个样本( n i =20 )的结果. 表 9-3 45 次比较中 5 次有统计学意义的结果. 方差分析 An alysis o f va riance(ANOVA). 一个或多个处理因素,多个水平样本均数的比较. 主要内容. 方差分析基本思想
E N D
实例分析 • 某医生为研究一种四类降糖新药的疗效,以统一的标准选择60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行试验。表9-1是治疗4周后的血糖下降值。 检验三组受试对象血糖下降值差别有无统计学意义?
表9-2 从已知正态总体N(10,52)随机抽取10个样本(ni=20)的结果
方差分析Analysis of variance(ANOVA) 一个或多个处理因素,多个水平样本均数的比较
主要内容 • 方差分析基本思想 • 完全随机设计资料的方差分析 • 随机区组设计资料的方差分析 • 析因设计资料的方差分析 • 多个样本均数间的两两比较
有关方差分析的几个符号 • 离均差 • 离均差平方和SS • 方差(2 S2);均方(MS) • 自由度: • 关系: MS= SS/
一、方差分析的基本思想 就是把全部观察值间的变异——总变异按 设计和需要分解成两个或多个组成部分, 再作分析。变异的大小用方差来衡量,只 不过将方差的分子离均差平方和及分母自 由度分开,分别考虑。
分析: 该资料有三个不同的组别,称为3个处理组,目的是检验三组样本均数( )所代表的总体均数(μ1, μ2,μ3)之差异有无统计学意义。
全部资料中存在哪些变异?用什么指标反映资料的变异?全部资料中存在哪些变异?用什么指标反映资料的变异? -------离均差平方和之均数为方差。 -------离均差平方和SS反映各类变异。
(一)变异的分解 1.总变异(total variation) 三个处理组中,各个观察值之间及各观察值与总体均数之间不完全相同,存在变异,称为总变异。 ν总=N-1
2.组间变异(variation between groups) 各处理组间的样本均数 ( ) 各不相等,与总均数也不同,它们之间的离散程度称为组间变异。
MS组间=SS组间/ ν组间 组间均方反映的是处理因素的作用,同时 也包括了随机误差。
3.组内变异(variation within groups) 每一个处理组内各数据大小各不相同,此变异 异称为组内变异。 ν组内=(n1-1)+ (n2-1)+ (n3-1)+….+ (nk-1) =N-k
MS组内=SS组内/ν组内 组内变异反映了观察值的随机误差,包括个体变异和随机测量误差。
4.三种变异的关系 • SS总=SS组间+SS组内 • ν总=ν组间+ν组内
分析:若各样本所代表的未知总体相同,即处理因素不起作用,那么组间变异和组内变异均由抽样误差所致,则 MS组间/MS组内≈1。
若处理因素起作用,则组间变异应较大, 那么: MS组间/MS组内将明显大于1。 当F= MS组间/MS组内大于一定的界值时,可以下结论认为处理因素起作用。
此检验就是方差分析,也称F检验,检验统计量为F值服从自由度ν组间=k-1,ν组内=N-k的F分布。此检验就是方差分析,也称F检验,检验统计量为F值服从自由度ν组间=k-1,ν组内=N-k的F分布。
ANOVA 由英国统计学家R.A.Fisher创立,为纪念Fisher,以F命名,故方差分析又称 F 检验 (F test)。用于推断多个总体均数有无差异 。
(二)统计量F 的计算及其意义 F=MS组间/MS组内 自由度: 组间= 组数 - 1 组内= N - 组数 通过公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。
根据检验水准α,查F界值表: • 当F≥Fα(ν1, ν2) ,P≤ α,拒绝H0,接受H1,认为总体均数间有差别。 • F<F α(ν1, ν2), P> α,没有理由拒绝,还不能认为各组总体均数的差别有统计学意义。 • 注意:方差分析是单侧检验。
方差分析表 变异来源 SS ν MSFP 组间 k-1SS组间/ ν组间 组内 SS总-SS组间 N-kSS组内/ ν组内 总 N-1
方差分析的基本思想 将总变异分解成至少2部分 比较不同变异的均方 F分布,统计学检验 总自由度分解成与总变异相同数量的部分
方差分析的基本思想: 根据资料的设计类型,即变异的不同来源将全部 观察值总的离均差平方和和自由度分解为两个 或多个部分,除随机误差外,其余每个部分的变 异可由某个因素的作用加以解释,如各组均数间 的变异SS组间可由处理因素的作用加以解释,通 过比较不同变异来源的均方,借助F分布做出统 计推断,从而了解该因素对观测指标有无影响。
(三)方差分析的应用条件 • 各观察值相互独立 • 各组观察值X均服从正态分布 • 各总体方差相等(齐性)
二、 完全随机设计资料的方差分析 只有1个研究因素,但该因素至少有2个以 上的水平。根据随机化原则将受试对象随 机分配到一个研究因素的多个水平中去, 然后观察效应,比较各水平组的效应是否 不同。
检验步骤: 1.建立假设,确定检验水准 H0:三个总体均数全相等,即μ1=μ2=μ3 H1:三个总体均数不全相等。 α=0.05 2.计算检验统计量 ∑X2ij=3914.33,∑Xij=411.9,C= 2827.6935
3.确定P值,做出推断结论。 F0.05(2,60) =3.15,F> F0.05(2,60), P<0.05。按α水准 拒绝H0,接受H1,差别有统计学意义。可认 为2型糖尿病患者治疗4周,其餐后2小时血糖 的总体平均水平不全相同。
三、随机区组设计资料的方差分析 例9-2 为探索丹参对肢体缺血再灌注损的影 响,将30只纯种新西兰实验用大白兔,按窝 别相同、体重相近划分为10个区组。每个区 组3只大白兔随机采用A、B、C三种处理方 案,结果如表9-6所示,问A、B两种方案分 别与C方案的处理效果是否不同。
(一)离均差平方和与自由度的分解 SS处理 处理 SS区组 区组 SS总 总 SS误差 误差
变异之间的关系: SS总=SS处理+ SS区组+ SS误差 总= 处理+区组+ 误差
(二)方差分析的基本步骤 1.建立检验假设,确定检验水准 对于处理组: H0:三个总体均数相等, H1:三个总体均数不全相等。 对于区组: H0:十个总体均数相等, H1:十个总体均数不全相等。 α=0.05
3.确定P值,做出推断结论。 对处理,按α=0.05水准,拒绝H0 ,接受H1, 有统计学意义。可以认为A、B、C三种方案 的处理效果不全相同,即三个总体均数不全相 同。对区组,按α=0.05水准,不拒绝H0 ,无 统计学意义。还不能认为十个区组的总体均数 不全相同。
存在的问题 方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。 解决方案:多个样本均数间的两两比较。
四、多个样本均数间的两两比较 • 若要说明多个总体均数中哪些总体均数不等,需进一步作两两比较。
(一)SNK法 属多重极差检验,其检验统计量为q, 故又称q检验。 例9-5 对例9-1资料中治疗4周后,血糖下 降值的三组均数进行两两比较。
1.建立检验假设,确定检验水准 H0:μA=μB,任两个对比组的总体均数相等 H1: μA≠μB,任两个对比组的总体均数不等 α=0.05 2.计算检验统计量:首先将三个样本均数由大到 小排列,并编组次。
3.确定P值,做出推断结论:由表可以看出,按α=0.05水准,1与3及1与2对比组拒绝H0,接受H1,有统计学意义。2与3对比组不拒绝H0,无统计学意义。因此,可以认为血糖下降值的总体平均水平在高剂量组与对照组、高剂量组与低剂量组不同。3.确定P值,做出推断结论:由表可以看出,按α=0.05水准,1与3及1与2对比组拒绝H0,接受H1,有统计学意义。2与3对比组不拒绝H0,无统计学意义。因此,可以认为血糖下降值的总体平均水平在高剂量组与对照组、高剂量组与低剂量组不同。
(二) Dunnett法 Dunnett法检验统计量为t,故称Dunnett -t检验。适用于k-1个实验组与对照组均数的比较。 例9-6 对例9-2资料,问A方案、B方案分别与C方案的总体均数是否不同?
1.建立检验假设,确定检验水准 H0:μT=μC,任一实验组与对照组的总体均数相等 H1: μT≠μC,任一实验组与对照组的总体均数不等 α=0.05 2.计算检验统计量
表9-19 例9-2的Dunnett-t检验表 3.确定P值,做出推断结论:ν误差=18,a=2(实验组数), α=0.05,查Dunnett-t界值表, tD=2.40。按α水准,A与C、B与C拒绝H0,接受H1,有统计学意义。可以认为A方案与C方案、B方案与C方案血中白蛋白的减少量不同。
(三)Bonfferoni法 例9-7 对例9-1资料中治疗4周后,血糖下降值的三组均数进行两两比较。 1.建立检验假设,确定检验水准 H0:μA=μB,任两个对比组的总体均数相等 H1: μA≠μB,任两个对比组的总体均数不等 α′= α/m=2α/k(k-1)= 0.0167 2.计算检验统计量