410 likes | 687 Views
方差分析(一) ANOVA. ANALYSIS OF VARIANCE. 请大家用学过的统计学方法进行解决. 四组不同摄入方式病人的血浆游离吗啡水平. 主要内容. 第一节 方差分析的基本概念 第二节 完全随机设计的单因素方差分析 第三节 随机区组设计的两因素方差分析 第四节 多个样本均数间的多重比较. 第一节 方差分析的基本概念. 一、方差分析的几个名词. 什么是 方差 ? 离均差 离均差平方和 SS 方差( 2 S 2 )均方( MS ) 标准差: S 自由度: 关系: MS= SS/ . 二、方差分析的含义.
E N D
方差分析(一) ANOVA ANALYSIS OF VARIANCE
请大家用学过的统计学方法进行解决 • 四组不同摄入方式病人的血浆游离吗啡水平
主要内容 • 第一节 方差分析的基本概念 • 第二节 完全随机设计的单因素方差分析 • 第三节 随机区组设计的两因素方差分析 • 第四节 多个样本均数间的多重比较
第一节 方差分析的基本概念 一、方差分析的几个名词 • 什么是方差? • 离均差 • 离均差平方和SS • 方差(2 S2)均方(MS) • 标准差:S • 自由度: • 关系: MS= SS/
二、方差分析的含义 • 方差是描述变异的一种指标,方差分析是一种假设检验的方法。方差分析也就是对变异的分析。 • 是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。
三、方差分析的基本思想 • 根据变异的来源,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某些特定因素的作用加以解释。 • 通过比较不同来源变异的方差(也叫均方MS),借助F分布做出统计推断,从而判断某因素对观察指标有无影响。
第二节 成组设计的多个样本均数比较 (单因素方差分析) 某社区随机抽取糖尿病患者、IGT异常和正常人共30人进行载蛋白测定,结果如下,问3种人的载蛋白有无差别?
各种符号的意义: • Xij第i 个组的第j 个观察值 • I=1,2,…k • J=1,2,…ni ni第i 个处理组的例数 • ∑ni=N • Xi = • X=
列举存在的变异及意义 • 1、全部的30个实验数据之间大小不等,存在变异(总变异)。 • 2、各个组间存在变异(组间变异):反映处理因素之间的作用,以及随机误差。 • 3、各个组内个体间数据不同:反映了观察值的随机误差(组内变异)。
各种变异的表示方法 • SS组内 • 组内 • MS组内 • SS组间 • 组间 • MS组间 • SS总 • 总 • MS总 • 三者之间的关系: • SS总= SS组内+ SS组间 • 总= 组内+ 组间
四、方差分析的步骤 1.建立假设 H0:1 = 2 =3 =…. H1:??总体均数不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F(见下张) 4.求概率值P: 5.做出推论:统计学结论和专业结论。
计算统计量F F=MS组间/MS组内 公式是在H0成立的条件下进行的,即MS组间与MS组内差别应该很小, F值应该接近于1。那么要接近到什么程度呢?(Fisher计算出了F的分布规律,即标准的F値) 通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。
完整书写方差检验的过程 1.建立假设 H0:3种载脂蛋白的总体均数相等 1 = 2 =3 H1:3种载脂蛋白的总体均数不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F:F=MS组间/MS组内=5.854 组间=组数-1 =3-1=2 组内=N-组数=30-3=27 4.计算概率值P: F0.05(2,27) =3.35 F=5.854, P是F所对应的概率値。 P与的大小进行比较,?? 5.做出推论:统计学结论?? 专业结论??
应用条件 各样本是相互独立的随机样本 各样本来自正态分布 各样本方差相等,即方差齐。
给小白鼠喂A、B、C三种不同的营养素,了解不同营养素的增重效果。现将体重基本相同的24只小白鼠随机分为3组,每组8只。3周后测量增重结果,结果如下表,给小白鼠喂A、B、C三种不同的营养素,了解不同营养素的增重效果。现将体重基本相同的24只小白鼠随机分为3组,每组8只。3周后测量增重结果,结果如下表, • 问3种不同营养素喂养后,体重增加有无差别?
第三节 随机区组设计的两因素方差分析(Randomized block design Two-way ANOVA) 将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。 (复习配对资料)是配对资料的扩充。
例 题 • 给小白鼠分别喂A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表, • 问3种不同营养素喂养后所增体重有无差别?
分析变异 总变异:24只小白鼠的增重不等,与均数之间存在差别。 处理间变异:喂不同营养素的小白鼠增重不同。 区组间变异:不同窝别的小白鼠增重不同 误差:各组内小白鼠增重不同
变异间的关系 • SS区组 • 区组 • MS区组 • SS处理 • 处理 • MS处理 • SS总 • 总 • SS误差 • 误差 • MS误差 • 变异之间的关系: • SS总= SS处理+ SS区组+ SS误差 • 总= 处理+ 区组+误差
统计量F 的计算 F1=MS处理/MS误差 F2=MS区组/MS误差 自由度: 处理=组数-1=3-1=2 区组=区数-1=8-1=7 误差=(组数-1)(区数-1)=14
完整书写方差分析的过程 1.建立假设: H0:3种营养素喂养的小白鼠体重增量相等 1 = 2 =3 H1: 3种营养素喂养的小白鼠体重增量不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F:F=MS处理/MS误差 4.求概率值P: 5.做出推论:
完整书写方差分析的过程 1.建立假设: H0:8窝小白鼠体重增量相等 1 = 2 =3。。。 H1: 8窝小白鼠体重增量不全相等 2.确定显著性水平,常取0.05。 3.计算统计量F:F2=MS区组/MS误差 4.求概率值P: 5.做出推论:
存在问题 • 方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。 • 为了得到这方面的信息,可进行多个样本间的两两比较。
第四节 多个样本均数间的多重比较(Multiple comparison) • 能否用t检验或µ检验? • 每次犯第一类错误的概率0.05,10次都犯的概率不是0.05,而是:?? 远大于0.05,不是小概率事件,会把本来无差别的两个总体均数判断为有差别。
一、最小有意义t(LSD- t)检验 • 意义:检验K组中某一对或几对在专业上有特殊意义的均数(dAB =XA-XB)的总体水平是否为0。 • 公式: 自由度:用误差的自由度
例题: 1.建立假设: H0:糖尿病患者与IGT的载脂蛋白相等1 = 2 H1:糖尿病患者与IGT的载脂蛋白不等1 2 2.确定显著性水平,用 表示,取0.05。 3.计算统计量t:105.45,102.39,203.62 ,11,9 4.求概率值P: 5.做出推论: 对前面例题中,用糖尿病患者、正常人的载蛋白与IGT异常者进行比较。
二、 SNK-q检验 • 也叫Student-Newman-Keuls(SNK-q)检验 • 用于多个样本均数间每两个均数的比较。 • 计算统计量q的公式:
计算q值 1.将各组样本均数从大到小排列 组次 1 2 3 均数 122.8 105.45 102.39 组别 正常人 糖尿病 IGT异常 2.根据公式计算q值,查q界值表(a, ) 3.计算组间跨度a:中间涵盖的均数个数 4.误差自由度
变量变换 • 目的:将原始资料变换成适用于检验方法的资料 • 方法:对数变换、平方根变换、倒数变换等。