1 / 56

empowerstats

www.empowerstats.com. Mark.chen@empowerstats.com Changzhong_chen@dfci.harvard.edu. 医学科研数据 统计分析 思路. 哈佛大学医学院: 陈常中 2012 年 10 月. 希望达到的效果:. 分析工具:学会使用易尔统计软件. 分析思路:学会设计一个路线图. 统计方法:学会设计与解读回归方程. 假设. 现有 数据. 数据 分析. 课题 设计. 假设. 资料 提取. 资料 收集. 分析思路.

jake
Download Presentation

empowerstats

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. www.empowerstats.com Mark.chen@empowerstats.com Changzhong_chen@dfci.harvard.edu

  2. 医学科研数据 统计分析思路 哈佛大学医学院: 陈常中 2012年10月

  3. 希望达到的效果: 分析工具:学会使用易尔统计软件 分析思路:学会设计一个路线图 统计方法:学会设计与解读回归方程

  4. 假设 现有 数据 数据 分析 课题 设计 假设 资料 提取 资料 收集

  5. 分析思路 http://www.empowerstats.com/manuals/empowerRCH/manual/page0/t_auto.htm

  6. 科研假设 肥胖 高血压

  7. 比较下面这些结论 胖子与瘦子两组相比,收缩压无差别,P>0.05 在控制了其它因素下,体重指数每增加1kg/m2,收缩压增加1mmHg,95%可信区间:0.7-1.3mmHg 体重指数与收缩压不相关,P>0.05 体重指数与收缩压非常显著相关,P<0.0001 体重指数每增加1kg/m2,收缩压增加0.01mmHg,95%可信区间:0.007-0.0013mmHg,P<0.00001

  8. 广义线性回归方程 f(Y) = β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ …… Y:收缩压值? f(y)=Y Y: 是否高血压?f(y)=logit(y)

  9. 实例 • regdd.xls

  10. 回归方程 与 t检验 / 方差分析 /卡方检验 原来你也能做我的工作,不会抢我的饭碗吧?哈哈!

  11. Yi=β0+β1*Xi+ei β0 ei X = 0 β1 X = 1 ei ?β1= 0 β0+β1

  12. X=0,1 X=1, Y=β0+β1*X • X=0, • Y=β0 • Y=β0+β1

  13. X=0,1,2 Y=β0+β1*X • X=0, Y=β0 X=2, Y=β0+β2 • X=1, Y=β0+β1 • X=2, Y=β0+β1*2 Y=β0+β1*(X=1) +β2*(X=2) • X=0, Y=β0 • X=1, Y=β0+β1

  14. Y5 = β0 + β1*(X6=1) + β2*(X6=2) Y5 = β0 + β1*X6

  15. 分析流程 研究人群描述

  16. 分析流程 人群描述 • 单因素分析: • 曲线拟合,线性模型,分段模型

  17. 有没有关系? 哪些因素与危险因素 有关系? 哪些因素与结果变量 有关系?

  18. 阈值效应与饱和效应 我今天前3小时工作,后1小时机器坏了休息,还按4小时计算我每小时产出。也好,以后我每干3小时都可以休息1小时!哈哈…! X对Y的作用有没有分段效应呢?

  19. 阈值效应与饱和效应分析

  20. Mn and NBNA 上海新华医院:余晓丹

  21. 分析流程 人群描述 单因素分析:曲线拟合,线性模型,分段模型 • 分层分析: • 混杂、交互作用分析

  22. 分层分析

  23. 哪些因素影响

  24. 交互作用 让我跟F小姐搭档,比跟M先生搭档,我的产出要高出一倍,这个糊涂的领导怎么就看不出来呢? 哪些因素会影响所分析的X对Y的作用呢?

  25. 交互作用的 P值 0.093

  26. ACEI与叶酸联用降低心脑血管事件19% JAMA. 2008 May 7;299(17):2027-36 hcy.cnkme.com

  27. 混杂 找个“替罪羊”还不容易,就栽赃给“他”吧?没人能查出来! 哪个才是真正的危险因素?

  28. X5=0

  29. X5=1

  30. 单因素分析结果: X 对 Y 无作用, 还要不要分层分析 X与Y 的关系呢?

  31. 例:被动吸烟与痛经关系 被动吸烟---〉是否痛经 跟踪387妇女,1492个月经周期 论文发表在: Environmental Health Perspectives 2000 108 (11) P1019-1022

  32. 被动吸烟 与 痛经 你如何下结论? 下一步怎么做?

  33. 没有痛经史妇女中:被动吸烟与痛经 趋势检验: OR=1.4, P<=0.03

  34. 分析流程 人群描述 多个多元模型: 模型比较,危险因素作用大小的确定 • 单因素分析: • 曲线拟合,线性模型,分段模型 • 分层分析: • 混杂、交互作用分析

  35. β(95%CI ) p 值 Y1= β0+0.49*X1 Y1= β0’+5.39*X5 Y1= β0+0.16*X1+5.21*X5 多元回归模型能控制混杂

  36. 调整与控制 Y= β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ …… 既然你做的不计了,那就把你的加到我身上吧,这样我的业绩就更高了,嘿嘿! 可不能把你干的坏事算到我的头上!哈哈! X对Y的作用有没有包含其它因素的作用在内呢?

  37. 结局变量: Y2β(95%CI ) p 值

  38. 多因素回归方程的比较 方程三 方程一 方程二

  39. Y2 = β04 + 0.41 * X3 Y2 = β05 + 3.32 * X4 Y1 = β01 + 0.49 * X1 Y1 = β02 + 5.39 * X5 Y1 = β03 + 0.16 * X1 + 5.21 * X5 Y2 = β06 + 0.28 * X3 + 2.28 * X4

  40. 分析X对Y的作用,要调整C吗 ? C 的P 值 ? Y = β0+β1C 基本模型中引进C Y=β0+β1X Y=β0+β1X+β2 C β1的变化 ? 完整模型中剔除C Y=β0+β1X +β2 C +β3 A2 +…… Y=β0+β1X +β2 C+β3 A2+…… β1的变化 ?

  41. 要分析X3对Y2的作用,要不要调整X4呢? 看易尔统计软件如何检查X4的混杂作用 Y2 = β0+β1*X4 Y2 =β0+0.276*X3+βc*X4+β3*X2+β4*X5 Y2 = β0+0.407*X3 Y2 = β0+0.360*X3+β2*X2+β3*X5 Y2 = β0+0.337*X3+βc*X4 基本模型 0.236 0.407 0.337 17.1 0.004 0.027 完整模型 0.122 0.276 0.360 30.4 0.046 0.005

More Related