610 likes | 786 Views
第十三章. 直线相关与直线回归. 119.6. 121.9. 125.1. 117.0. 115.4. 124.7. 120.1. 123.0. 122.8. 117.3. 120.6. 121.5. 125.0. 125.9. 123.2. 126.6. 122.0. 127.6. 125.1. 120.1. 119.5. 126.1. 126.4. 125.6. 118.9. 130.4. 124.9. 125.8. 126.1. 1. 20.9. 116.1. 124.0. 124.6. 118.7.
E N D
第十三章 直线相关与直线回归
119.6 121.9 125.1 117.0 115.4 124.7 120.1 123.0 122.8 117.3 120.6 121.5 125.0 125.9 123.2 126.6 122.0 127.6 125.1 120.1 119.5 126.1 126.4 125.6 118.9 130.4 124.9 125.8 126.1 1 20.9 116.1 124.0 124.6 118.7 119.1 121.9 118.0 117.0 114.6 123.9 116.0 125.3 123.6 123.6 126.4 115.5 119.2 114.0 123.4 126.6 117.3 113.6 127.6 120.5 113.6 130.2 128.3 118.2 124.7 122.4 118.8 123.1 122.7 126.6 127.8 125.9 110.5 124.8 115.2 119.4 128.0 116.7 132.4 129.3 121.7 115.0 120.4 122.1 127.0 135.3 125.7 111.2 124.3 124.2 124.7 121.7 121.3 124.1 119.9 121.7 113.8 116.7 129.9 128.5 126.5 122.8 120.1 118.2 122.5 127.7 124.9 123.3 120.3 125.7 某市1995年104名男童身高(cm)资料如下
表1 不同饲料组大鼠肝中维生素A含量(IU/g) 大鼠对号 正常饲料组 维生素 E 缺乏组 ( 1 ) ( 2 ) ( 3 ) 1 3550 2450 2 2000 2400 3 3000 1 800 4 3950 3200 5 3800 3250 6 3750 2700 7 3450 2500 8 3050 1750 26550 20050 合计
第一节 直线相关(linear correlation) 直线相关分析:描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法 条件:两变量(x,y)都是来自正态分布的随机变量
负相关 正相关 -1< r <0 0< r <1 非线性相关r = 0 零相关r = 0 完全正相关 r =1 零相关r = 0 零相关r = 0 完全负相关 r = -1 直线相关示意图 一、直线相关的概念
二、相关系数的意义与计算 直线相关系数:又称积差相关系数,是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 r
二、相关系数的意义与计算 范围: 大小: 符号:
例13.1(P212) 在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液在临床上有时又不容易采集到。某医生欲了解急性脑血管病病人血清IL-6(pg/ml)与脑脊液IL-6 (pg/ml)水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6和脑脊液IL-6数据如表2,问SAH患者血清IL-6和脑脊液IL-6间是否有直线相关关系存在?
直线相关分析步骤 2、计算: lxx=6104.664 lyy=16242.101 lxy=7201.698 r=0.7232 1、绘制散点图:
三、相关系数的假设检验 1、tr检验 =n-2
例13.1 SAH患者血清IL-6和脑脊液IL-6间相关系数的假设检验步骤: H0 :=0 即SAH患者血清IL-6和脑脊液IL-6间无直线相关关系 H1 :≠0即SAH患者血清IL-6和脑脊液IL-6间有直线相关关系 =0.05
r=0.7232, n=10, 代入公式 计算得 t=…=2.962 根据=10-2=8查t界值表得0.01< P < 0.02,按=0.05的检验水准,拒绝H0,接受H1,可认为SAH患者血清IL-6和脑脊液IL-6间有直线相关关系
三、相关系数的假设检验 2、查表法 根据r值及=n-2查附表13-1(P222) 相关系数r界值表
相关分析应用中应注意的问题 1.相关分析一定要有实际意义 2.进行相关分析前要先绘制散点图 3.分析相关的密切程度时样本含量要足够大
第 二 节 直线回归 Linear Regression
编号 (1) 尿雌三醇 mg/24h(2 产儿体重 kg(3) 编号 (1) 尿雌三醇mg/24h(2) 产儿体重 kg(3) 1 7 2.5 17 17 3.2 2 9 2.5 18 25 3.2 3 9 2.5 19 27 3.4 4 12 2.7 20 15 3.4 5 14 2.7 21 15 3.4 6 16 2.7 22 15 3.5 7 16 2.4 23 16 3.5 8 14 3.0 24 19 3.4 9 16 3.0 25 18 3.5 10 16 3.1 26 17 3.6 11 17 3.0 27 18 3.7 12 19 3.1 28 20 3.8 13 21 3.0 29 22 4.0 14 24 2.8 30 25 3.9 15 15 3.2 31 24 4.3 16 16 3.2 表2 孕妇尿中雌三醇含量与产儿的体重
编号 体重 ( kg ) 肺活量 ( L ) 1 42 2.55 2 42 2.2 3 46 2.75 4 46 2.4 5 46 2.8 6 50 2.81 7 50 3.41 8 50 3.1 9 52 3.46 10 52 2.85 11 58 3.5 12 58 3 表3 12名一年级女大学生体重与肺活量
回归的由来 英国统计学家Pearson K(1857~1936)1903年搜集了1078个家庭人员的身高、前臂长等指标的记录,发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线形关系: = 33.73+0.516 X
回归的由来 即高个子父亲儿子的平均身高虽然比矮个子父亲儿子的平均身高要高一些,但稍矮于其父亲的平均身高;而矮个子父亲儿子的平均身高虽然比高个子父亲儿子的平均身高要矮一些,但稍高于其父亲的平均身高。英国人类学家Galton F(1822~1911)将这种趋向于种族稳定的现象称之为“回归”。
在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为直线回归。在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为直线回归。 直线回归仍用直线方程来描述两变量间的回归关系,但称为直线回归方程. 直线回归的概念
医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等
二、直线回归方程 直线回归方程: b:回归系数 b0:截距
y x
表2 SAH患者血清和脑脊液IL-6(pg/ml)检测结果 例13.2 对例13.1进行回归分析
2、求回归系数b和截距b0: 1、绘制散点图:
计算x、y、lxx、lyy、lxy x=59.26 y=142.87 lxx=6104.664 lyy=16242.101 lxy=7201.698
例:某地一年级12名女大学生的体重与肺活量数据如下,试分析肺活量与体重关系例:某地一年级12名女大学生的体重与肺活量数据如下,试分析肺活量与体重关系 表3 12名一年级女大学生体重与肺活量 编号 体重 ( kg ) 肺活量 ( L ) 1 42 2.55 2 42 2.2 3 46 2.75 4 46 2.4 5 46 2.8 6 50 2.81 7 50 3.41 8 50 3.1 9 52 3.46 10 52 2.85 11 58 3.5 12 58 3
2、求回归系数b和截距b0: 1、绘制散点图:
计算x、y、lxx、lyy、lxy x=49.33 y=2.9025 lxx=306.6667 lyy=1.8892 lxy=18.04
直线回归方程的图示 在自变量X的实测范围内任取相距较远且易读数的两X值代入回归方程求得两点坐标、连线即得其回归直线
(一)总体回归系数的估计与假设检验 1、总体回归系数的区间估计 bt/2,sb 三、直线回归的统计推断
方差分析 t检验 2、回归系数的假设检验
回归系数的假设检验:方差分析法 方差分析的基本思想: 把总的离均差平方和(即总变异)分解为至少两个部分,其中有一部分表示处理因素的效应,有一部分表示抽样误差的影响,然后比较两者的均方,计算F值,若F值远大于1,可认为处理有效应,否则认为处理无效应。
Q Y X 应变量Y的离均差平方和的分解
应变量Y的离均差平方和的分解 SS总 = SS回 + SS剩
回归系数的方差分析 SS总 = SS回 + SS剩 总= n – 1 回= 1 剩= n - 2 SS总 =lYY SS回 =blXY =lXY2/lXX SS剩= SS总-SS回= lYY -lXY2/lXY
例13.3:对例13.2建立的回归方程的回归系数进行假设检验例13.3:对例13.2建立的回归方程的回归系数进行假设检验 • H0:β=0 H1:β≠0 α=0.05 • 计算统计量F,求得概率值P • 做出推断:
回归系数的假设检验:t检验法 = n - 2 其中Sy.x表示去除X影响后Y的变异大小