340 likes | 1.06k Views
2012 年硕士研究生 《 医学统计学 》. 多个样本均数比较的 方差分析. analysis of variance, ANOVA. 第一节. 方差分析的基本思想及应用条件. 一、方差分析的基本思想. 合计 X ij N S X ij : 第 i 个处理组第 j 个观察对象的测量结果. 总均数. 各处理组均数. 总例数. N = n l + n 2 +…+ n g. 问题:推 断 g 个处理组总体均数有无差别. (一)测量数据的变异
E N D
2012年硕士研究生《医学统计学》 多个样本均数比较的 方差分析 analysis of variance, ANOVA
第一节 方差分析的基本思想及应用条件
一、方差分析的基本思想 合计Xij N S Xij:第i个处理组第j个观察对象的测量结果
总均数 各处理组均数 总例数 N=nl+n2+…+ng 问题:推断g个处理组总体均数有无差别
(一)测量数据的变异 离均差平方和(sum of squares of deviations from mean,SS) :
2. 组间变异:各组均数与总均数的离均差平方和,反映 间的变异程度。
存在组间变异的原因: • 随机误差(个体变异和测量误差) • 不同处理(处理的不同水平)效果的差异
3. 组内变异:同一组内各测量值Xij与其所在组均数的差值的平方和,反映组内个体的变异程度。
存在组间变异的原因: • 随机误差(个体变异和测量误差) • 不同处理的不同效果 存在组内变异的原因: • 随机误差
均方差:在SS基础上考虑自由度 均方(mean square,MS)
(二)方差分析的检验统计量:F • 组间变异:随机误差和处理的效应 • 组内变异:随机误差 • F值越接近于l,越没有理由拒绝H0;反之,F值越大,拒绝H0的理由越充分。
当H0成立时,F统计量服从F分布。 • 根据分子自由度1和分母自由度2,查出特定显著性水准 下F分布的界值,作为判断统计量F值大小的标准。 • 根据计算的统计量F值与F界值的相对大小,决定H0成立的可能性。
方差分析的基本思想 将总变异分解为两个(如组间变异和组内变异)或多个部分,除随机误差外,各个部分的变异可由某个因素的作用加以解释。通过比较不同来源的变异(均方),借助F分布做出统计推断。若F值大于某个临界值,表示处理组间的效应不同;若F值接近甚至小于某个临界值,表示处理组间效应相同(差异仅仅反映随机误差)。
不同设计类型方差分析的基本思想相同:将处理间平均变异与误差平均变异比较。不同设计类型方差分析的基本思想相同:将处理间平均变异与误差平均变异比较。 • 不同设计类型方差分析的变异分解项目不同,应结合实际选择具体的方差分析方法。
二、方差分析的应用条件 • 各样本是相互独立的随机样本,均服从正态分布; • 相互比较的各样本的总体方差相等,即具有方差齐性(homogeneity of variance)。
第二节 完全随机设计资料的方差分析
一、完全随机设计 采用完全随机化分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,实验结束后比较各组均数之间的差别有无统计学意义,推论g个处理因素的效应是否相同。
例4-2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,分别使用安慰剂和三个剂量的降血脂新药。例4-2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,分别使用安慰剂和三个剂量的降血脂新药。
完全随机化分组方法: 1. 实验单位编号 2. 取随机数 3. 随机数排序 4. 按随机数的序号决定组别
完全随机设计:统计方法选择 1. 正态分布且方差齐同:完全随机设计的单因素方差分析(one-way ANOVA)或两独立样本均数比较的 t 检验(g=2) 2. 非正态分布或方差不齐:数据变换或采用Wilcoxon秩和检验(非参数方法)
例4-1 完全随机化分组方法 1. 120名患者编号 2. 为每个编号的患者取随机数 3. 120个随机数排序 4. 按患者随机数的序号决定组别
二、方差分析的变异分解 例4-2 120名高血脂患者,完全随机等分为4组,分别使用安慰剂和三个剂量的降血脂新药。试验6周后测得低密度脂蛋白。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?
变异 总变异 处理组间变异(随机误差和处理效应) 组内变异(随机误差)
三、分析步骤 1. 建立假设 H0: 即4个试验组总体均数相等 H1:4个试验组总体均数不全相等 检验水准
3. 列方差分析表 例4-2的方差分析表
4 .下结论 按 ,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相同,即不同剂量药物对血脂ldl-c水平的影响存在统计学意义上的差别。
方差分析的结果若拒绝H0,不能说明各组总体均数两两间都有差别。如果要分析哪两组间有差别,需要进行均数间的多重比较。 当g=2时,方差分析的结果与两独立样本均数比较的t 检验等价,且有 。