560 likes | 851 Views
www.empowerstats.com. Mark.chen@empowerstats.com Changzhong_chen@dfci.harvard.edu. 医学科研数据 统计分析 思路. 哈佛大学医学院: 陈常中 2012 年 10 月. 希望达到的效果:. 分析工具:学会使用易尔统计软件. 分析思路:学会设计一个路线图. 统计方法:学会设计与解读回归方程. 假设. 现有 数据. 数据 分析. 课题 设计. 假设. 资料 提取. 资料 收集. 分析思路.
E N D
www.empowerstats.com Mark.chen@empowerstats.com Changzhong_chen@dfci.harvard.edu
医学科研数据 统计分析思路 哈佛大学医学院: 陈常中 2012年10月
希望达到的效果: 分析工具:学会使用易尔统计软件 分析思路:学会设计一个路线图 统计方法:学会设计与解读回归方程
假设 现有 数据 数据 分析 课题 设计 假设 资料 提取 资料 收集
分析思路 http://www.empowerstats.com/manuals/empowerRCH/manual/page0/t_auto.htm
科研假设 肥胖 高血压
比较下面这些结论 胖子与瘦子两组相比,收缩压无差别,P>0.05 在控制了其它因素下,体重指数每增加1kg/m2,收缩压增加1mmHg,95%可信区间:0.7-1.3mmHg 体重指数与收缩压不相关,P>0.05 体重指数与收缩压非常显著相关,P<0.0001 体重指数每增加1kg/m2,收缩压增加0.01mmHg,95%可信区间:0.007-0.0013mmHg,P<0.00001
广义线性回归方程 f(Y) = β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ …… Y:收缩压值? f(y)=Y Y: 是否高血压?f(y)=logit(y)
实例 • regdd.xls
回归方程 与 t检验 / 方差分析 /卡方检验 原来你也能做我的工作,不会抢我的饭碗吧?哈哈!
Yi=β0+β1*Xi+ei β0 ei X = 0 β1 X = 1 ei ?β1= 0 β0+β1
X=0,1 X=1, Y=β0+β1*X • X=0, • Y=β0 • Y=β0+β1
X=0,1,2 Y=β0+β1*X • X=0, Y=β0 X=2, Y=β0+β2 • X=1, Y=β0+β1 • X=2, Y=β0+β1*2 Y=β0+β1*(X=1) +β2*(X=2) • X=0, Y=β0 • X=1, Y=β0+β1
Y5 = β0 + β1*(X6=1) + β2*(X6=2) Y5 = β0 + β1*X6
分析流程 研究人群描述
分析流程 人群描述 • 单因素分析: • 曲线拟合,线性模型,分段模型
与 有没有关系? 哪些因素与危险因素 有关系? 哪些因素与结果变量 有关系?
阈值效应与饱和效应 我今天前3小时工作,后1小时机器坏了休息,还按4小时计算我每小时产出。也好,以后我每干3小时都可以休息1小时!哈哈…! X对Y的作用有没有分段效应呢?
分析流程 人群描述 单因素分析:曲线拟合,线性模型,分段模型 • 分层分析: • 混杂、交互作用分析
交互作用 让我跟F小姐搭档,比跟M先生搭档,我的产出要高出一倍,这个糊涂的领导怎么就看不出来呢? 哪些因素会影响所分析的X对Y的作用呢?
交互作用的 P值 0.093
ACEI与叶酸联用降低心脑血管事件19% JAMA. 2008 May 7;299(17):2027-36 hcy.cnkme.com
混杂 找个“替罪羊”还不容易,就栽赃给“他”吧?没人能查出来! 哪个才是真正的危险因素?
? 单因素分析结果: X 对 Y 无作用, 还要不要分层分析 X与Y 的关系呢?
例:被动吸烟与痛经关系 被动吸烟---〉是否痛经 跟踪387妇女,1492个月经周期 论文发表在: Environmental Health Perspectives 2000 108 (11) P1019-1022
被动吸烟 与 痛经 你如何下结论? 下一步怎么做?
没有痛经史妇女中:被动吸烟与痛经 趋势检验: OR=1.4, P<=0.03
分析流程 人群描述 多个多元模型: 模型比较,危险因素作用大小的确定 • 单因素分析: • 曲线拟合,线性模型,分段模型 • 分层分析: • 混杂、交互作用分析
β(95%CI ) p 值 Y1= β0+0.49*X1 Y1= β0’+5.39*X5 Y1= β0+0.16*X1+5.21*X5 多元回归模型能控制混杂
调整与控制 Y= β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ …… 既然你做的不计了,那就把你的加到我身上吧,这样我的业绩就更高了,嘿嘿! 可不能把你干的坏事算到我的头上!哈哈! X对Y的作用有没有包含其它因素的作用在内呢?
多因素回归方程的比较 方程三 方程一 方程二
Y2 = β04 + 0.41 * X3 Y2 = β05 + 3.32 * X4 Y1 = β01 + 0.49 * X1 Y1 = β02 + 5.39 * X5 Y1 = β03 + 0.16 * X1 + 5.21 * X5 Y2 = β06 + 0.28 * X3 + 2.28 * X4
分析X对Y的作用,要调整C吗 ? C 的P 值 ? Y = β0+β1C 基本模型中引进C Y=β0+β1X Y=β0+β1X+β2 C β1的变化 ? 完整模型中剔除C Y=β0+β1X +β2 C +β3 A2 +…… Y=β0+β1X +β2 C+β3 A2+…… β1的变化 ?
要分析X3对Y2的作用,要不要调整X4呢? 看易尔统计软件如何检查X4的混杂作用 Y2 = β0+β1*X4 Y2 =β0+0.276*X3+βc*X4+β3*X2+β4*X5 Y2 = β0+0.407*X3 Y2 = β0+0.360*X3+β2*X2+β3*X5 Y2 = β0+0.337*X3+βc*X4 基本模型 0.236 0.407 0.337 17.1 0.004 0.027 完整模型 0.122 0.276 0.360 30.4 0.046 0.005