1 / 41

方差分析(一) ANOVA

方差分析(一) ANOVA. ANALYSIS OF VARIANCE. 请大家用学过的统计学方法进行解决. 四组不同摄入方式病人的血浆游离吗啡水平. 主要内容. 第一节 方差分析的基本概念 第二节 完全随机设计的单因素方差分析 第三节 随机区组设计的两因素方差分析 第四节 多个样本均数间的多重比较. 第一节 方差分析的基本概念. 一、方差分析的几个名词. 什么是 方差 ? 离均差 离均差平方和 SS 方差( 2 S 2 )均方( MS ) 标准差: S 自由度:  关系: MS= SS/ . 二、方差分析的含义.

brock
Download Presentation

方差分析(一) ANOVA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 方差分析(一) ANOVA ANALYSIS OF VARIANCE

  2. 请大家用学过的统计学方法进行解决 • 四组不同摄入方式病人的血浆游离吗啡水平

  3. 主要内容 • 第一节 方差分析的基本概念 • 第二节 完全随机设计的单因素方差分析 • 第三节 随机区组设计的两因素方差分析 • 第四节 多个样本均数间的多重比较

  4. 第一节 方差分析的基本概念 一、方差分析的几个名词 • 什么是方差? • 离均差 • 离均差平方和SS • 方差(2 S2)均方(MS) • 标准差:S • 自由度:  • 关系: MS= SS/ 

  5. 二、方差分析的含义 • 方差是描述变异的一种指标,方差分析是一种假设检验的方法。方差分析也就是对变异的分析。 • 是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。

  6. 三、方差分析的基本思想 • 根据变异的来源,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某些特定因素的作用加以解释。 • 通过比较不同来源变异的方差(也叫均方MS),借助F分布做出统计推断,从而判断某因素对观察指标有无影响。

  7. 第二节 成组设计的多个样本均数比较 (单因素方差分析) 某社区随机抽取糖尿病患者、IGT异常和正常人共30人进行载蛋白测定,结果如下,问3种人的载蛋白有无差别?

  8. 各种符号的意义: • Xij第i 个组的第j 个观察值 • I=1,2,…k • J=1,2,…ni ni第i 个处理组的例数 • ∑ni=N • Xi = • X=

  9. 列举存在的变异及意义 • 1、全部的30个实验数据之间大小不等,存在变异(总变异)。 • 2、各个组间存在变异(组间变异):反映处理因素之间的作用,以及随机误差。 • 3、各个组内个体间数据不同:反映了观察值的随机误差(组内变异)。

  10. 各种变异的表示方法 • SS组内 • 组内 • MS组内 • SS组间 • 组间 • MS组间 • SS总 • 总 • MS总 • 三者之间的关系: • SS总= SS组内+ SS组间 • 总= 组内+ 组间

  11. 计算:

  12. 四、方差分析的步骤 1.建立假设 H0:1 = 2 =3 =…. H1:??总体均数不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F(见下张) 4.求概率值P: 5.做出推论:统计学结论和专业结论。

  13. 计算统计量F F=MS组间/MS组内 公式是在H0成立的条件下进行的,即MS组间与MS组内差别应该很小, F值应该接近于1。那么要接近到什么程度呢?(Fisher计算出了F的分布规律,即标准的F値) 通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。

  14. 完整书写方差检验的过程 1.建立假设 H0:3种载脂蛋白的总体均数相等 1 = 2 =3 H1:3种载脂蛋白的总体均数不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F:F=MS组间/MS组内=5.854 组间=组数-1 =3-1=2 组内=N-组数=30-3=27 4.计算概率值P: F0.05(2,27) =3.35 F=5.854, P是F所对应的概率値。 P与的大小进行比较,?? 5.做出推论:统计学结论?? 专业结论??

  15. 应用条件 各样本是相互独立的随机样本 各样本来自正态分布 各样本方差相等,即方差齐。

  16. 方差分析(二)

  17. 给小白鼠喂A、B、C三种不同的营养素,了解不同营养素的增重效果。现将体重基本相同的24只小白鼠随机分为3组,每组8只。3周后测量增重结果,结果如下表,给小白鼠喂A、B、C三种不同的营养素,了解不同营养素的增重效果。现将体重基本相同的24只小白鼠随机分为3组,每组8只。3周后测量增重结果,结果如下表, • 问3种不同营养素喂养后,体重增加有无差别?

  18. 第三节 随机区组设计的两因素方差分析(Randomized block design Two-way ANOVA) 将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。 (复习配对资料)是配对资料的扩充。

  19. 例 题 • 给小白鼠分别喂A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表, • 问3种不同营养素喂养后所增体重有无差别?

  20. 分析变异 总变异:24只小白鼠的增重不等,与均数之间存在差别。 处理间变异:喂不同营养素的小白鼠增重不同。 区组间变异:不同窝别的小白鼠增重不同 误差:各组内小白鼠增重不同

  21. 变异间的关系 • SS区组 • 区组 • MS区组 • SS处理 • 处理 • MS处理 • SS总 • 总 • SS误差 • 误差 • MS误差 • 变异之间的关系: • SS总= SS处理+ SS区组+ SS误差 • 总= 处理+ 区组+误差

  22. 统计量F 的计算 F1=MS处理/MS误差 F2=MS区组/MS误差 自由度: 处理=组数-1=3-1=2 区组=区数-1=8-1=7 误差=(组数-1)(区数-1)=14

  23. 方差分析结果

  24. 完整书写方差分析的过程 1.建立假设: H0:3种营养素喂养的小白鼠体重增量相等 1 = 2 =3 H1: 3种营养素喂养的小白鼠体重增量不全相等 2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F:F=MS处理/MS误差 4.求概率值P: 5.做出推论:

  25. 完整书写方差分析的过程 1.建立假设: H0:8窝小白鼠体重增量相等 1 = 2 =3。。。 H1: 8窝小白鼠体重增量不全相等 2.确定显著性水平,常取0.05。 3.计算统计量F:F2=MS区组/MS误差 4.求概率值P: 5.做出推论:

  26. 存在问题 • 方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。 • 为了得到这方面的信息,可进行多个样本间的两两比较。

  27. 第四节 多个样本均数间的多重比较(Multiple comparison) • 能否用t检验或µ检验? • 每次犯第一类错误的概率0.05,10次都犯的概率不是0.05,而是:?? 远大于0.05,不是小概率事件,会把本来无差别的两个总体均数判断为有差别。

  28. 一、最小有意义t(LSD- t)检验 • 意义:检验K组中某一对或几对在专业上有特殊意义的均数(dAB =XA-XB)的总体水平是否为0。 • 公式: 自由度:用误差的自由度

  29. 例题: 1.建立假设: H0:糖尿病患者与IGT的载脂蛋白相等1 = 2 H1:糖尿病患者与IGT的载脂蛋白不等1  2 2.确定显著性水平,用 表示,取0.05。 3.计算统计量t:105.45,102.39,203.62 ,11,9 4.求概率值P: 5.做出推论: 对前面例题中,用糖尿病患者、正常人的载蛋白与IGT异常者进行比较。

  30. 二、 SNK-q检验 • 也叫Student-Newman-Keuls(SNK-q)检验 • 用于多个样本均数间每两个均数的比较。 • 计算统计量q的公式:

  31. 计算q值 1.将各组样本均数从大到小排列 组次 1 2 3 均数 122.8 105.45 102.39 组别 正常人 糖尿病 IGT异常 2.根据公式计算q值,查q界值表(a, ) 3.计算组间跨度a:中间涵盖的均数个数 4.误差自由度

  32. 变量变换 • 目的:将原始资料变换成适用于检验方法的资料 • 方法:对数变换、平方根变换、倒数变换等。

  33. 小 结

More Related