910 likes | 1.74k Views
第八章. 系统综述和 Meta 分析. Systematic review and Meta-analysis. 第一节 概 述 第二节 步骤和方法 第三节 Meta 分析常用统计方法 第四节 偏倚及其检查. 目 录. 第一节 概 述. 简 史 基本概念 进行系统综述和 Meta 分析的意义 目前发表的系统综述和 Meta 分析存在问题. 案例一: 1989 年的一项震惊整个医学界的研究 —— 在产科经常使用的 226 种方法中,临床试验或系统评价证明: 20% 有效或疗效大于副作用 30% 是有害或疗效可疑 50% 缺乏随机试验证据
E N D
第八章 系统综述和Meta分析 Systematic review and Meta-analysis
第一节 概 述 第二节 步骤和方法 第三节 Meta分析常用统计方法 第四节 偏倚及其检查 目 录
第一节 概 述 • 简 史 • 基本概念 • 进行系统综述和Meta分析的意义 • 目前发表的系统综述和Meta分析存在问题
案例一: 1989年的一项震惊整个医学界的研究—— • 在产科经常使用的226种方法中,临床试验或系统评价证明: • 20%有效或疗效大于副作用 • 30%是有害或疗效可疑 • 50%缺乏随机试验证据 Iain Chalmers et al. Effective Care in Pregnancy and Childbirth. Oxford: Oxford University Press, 1989
案例二: 从1950s起,医学教科书推荐利多卡因为心肌梗塞后各类室性心律失常的首选药。 从1960s-1990s的9项8745人的随机对照试验研究结果证明,该治疗无效甚至可能是有害的。
启 示: ·经验是不可靠的; ·医学干预都应接受严格的科学评估; ·应停止使用无效的干预措施,预防新的无效措施引入医学实践。
The buzzword in medicine in the 21st century: Where is the evidence?二十一世纪医学界最流行的一句话: 证据在哪里?
第一节 概 述 FROM STUDING INFETIOUS DISEASE TO EBM流行病学: 从研究传染病到后现代流行病学 Started from studying communicable diseases 起源于传染病研究的方法 Studying chronic disease 用于慢性非传染病研究: 疾病分布学 Modern epidemiology: Studying causes of disease 现代流行病学: 病因研究 Clinical epidemiology 临床流行病学 (病因、诊断、治疗、预后等) Post-modern epidemiology后现代流行病学
WORLD COCHRANE COLLABORATION世界考可兰协作中心 In 1992, the very first Cochrane centre was established in Oxford.1992世界第一个考可兰中心在英国牛津成立. Mission: Collecting, summarizing and disseminating evidence from organized research.世界考可兰协作的宗旨是收集总结和传播临床研究的证据. Chinese national Cochrane/EBM Centre四川成都中国国家考可兰及循证医学中心.
Evidence Based Medicine EBM 遵循科学依据的医学 循证医学是有意识地、明确地、审慎地利用现有最好的证据制定病人的诊治方案。实施循证医学意味着医生要参照最好的研究证据、临床经验和病人的意见。 ——David L. Sackett
中国Cochrane中心于1999年3月成立,中心位于四川成都华西医科大学第一附属医院。中国Cochrane中心于1999年3月成立,中心位于四川成都华西医科大学第一附属医院。
地 址: 北京市海淀区学院路38号北京大学医学部 北京大学公共卫生学院518室 北京大学循证医学中心邮 编: 100083电 话: 86-10-8280 5162传 真: 86-10-8280 5162E-mail: siyan-zhan@bjmu.edu.cn Website: http://pkuebm.bjmu.edu.cn
第一节 概 述 循证医学典范 1987年,Cochrane根据对妊娠和分娩后随访的大样本随机对照试验结果进行系统评价研究,获得了令人信服的证据。 过去有关氢化可的松治疗可能早产的孕妇的试验结果不一致,而根据单个的临床试验结果难以确定该疗法是否利大于弊。 Cochrane的系统评价明确肯定:氢化可的松可以降低新生儿死于早产并发症的危险,使早产儿死亡率下降30%~50%。 由于此前没有进行相关的系统评价分析和报道,多数产科医师并未认识到该项治疗措施的效果,不仅导致成千上万早产儿可能因其母亲未接受相应治疗而死亡,还耗费更多不必要的治疗费用。推广这一科学结论将挽救千分之十早产婴儿的生命 。
系统综述(systematic review) 被公认为客观地评价和综合针对某一特定问题的研究证据的最佳手段。 Meta分析(Meta-analysis) 作为系统综述中使用的一种统计方法,过去20年间在医学研究领域也得到了广泛的应用。 第一节 定义
第一节 概 述 • 系统综述 • 针对某个主题进行的二次研究 • 在复习、分析、整理和综合针对该主题的全部原始文献的基础上进行 • 综述过程依照一定的标准化方法 • 是循证决策的良好依据
叙述性综述 系统综述 研究问题:涉及范围较广 常集中于某一问题 文献来源:不全面 明确,常为多渠道 检索方法:常未说明 有明确检索策略 文献选择:有潜在偏倚 有明确选择标准 文献评价:方法不统一 有严格评价方法 结果合成:定性研究 定量研究 结论推断:有时遵循研究依据 大多遵循研究依据 结果更新:不定期更新 依据新试验定期更新 与传统文献综述的区别
系统评价的意义与作用: • 增大样本含量,得出更为可靠的结论 • 解决寻找证据难的问题(收集零散的有关研究) • 对证据的质量进行了严格评价 • 结论简单明了,方便一线临床医生的应用 • 目前发达国家已越来越多地使用SR结果作为制定临床指南和政府决策的依据 • 卫生技术评估(HTA)及药物评价均采用系统评价原则
临床实践指南(Clinical Practice Guideline) 以系统评价等为依据,由各级政府、医药卫生管理部门、专业学会、学术团体或专家组等制定的有关公共卫生、预防、诊疗等方针政策或标准。 如:HIV/AIDS诊断标准及处理原则(中华人民共和国国家标准) Preventive-Care Knowledge and Practices Among Persons with Diabetes Mellitus(糖尿病人预防护理知识与实践指南)
可靠性 分级 证据来源 评价 LevelⅠ 按照特定病种的特定疗法收集所有质量可靠的随机对照试验后所作的系统评价或Meta分析 可靠性最高,可作为金标准 LevelⅡ 单个大样本随机对照试验结果 有较高的可靠性,建议采用 LevelⅢ 设有对照组但未用随机方法分组的研究 有一定的可靠性,可以采用 LevelⅣ 无对照的系列病例观察 可靠性较差,可供参考 LevelⅤ 个案报道和专家意见(非前瞻性、非随机、无对照) 可靠性最差,仅供参考 循证医学证据可靠性分级(治疗性证据)
什么是Cochrane 系统综述? 是Cochrane协作网协作者在Cochrane统一工作手册指导下完成的系统评价,其结果发表在Cochrane图书馆(The Cochrane Library 因特网)上。
Cochrane系统综述的特点 特点 Cochrane系统综述 一般系统综述 资料收集 较全面 不一定全面 质量控制措施 较完善 不一定完善 方法学 较规范 不一定规范 不断更新 是 否 反馈意见及修正 及时 不一定及时
第一节 概 述 Meta分析 Meta(after, more comprehensive, secondary)希腊词 • 是在系统性综述时为了合并多个独立的研究结果,所使用的统计方法。 • 可以将针对同一问题的,多个独立的研究结果进行定量分析。 • 目前,国外文献常常将系统综述与Meta-分析交叉使用。 • 狭义:只是一种定量合成的统计处理方法。
系统综述并非必须对纳入研究进行统计学合并(Meta分析)系统综述并非必须对纳入研究进行统计学合并(Meta分析) 是否做Meta分析需要视纳入研究是否有足够的相似性 Meta分析也并非一定要做系统综述,因为其本质是一种统计学方法 包含有对具同质性的多个研究进行Meta分析的系统评价称为定量系统综述 如果纳入研究不具有同质性,则不进行Meta分析,而仅进行描述性的系统综述,此类系统评价称为定性系统评价 系统综述与Meta分析的关系
综述 系统综述 Meta-分析
在用样本信息推断总体参数时存在抽样误差,并且抽样误差的大小与样本量的大小有关。 统计学用抽样分布的理论来描述样本统计量的变化规律。 Meta analysis原理和基本思想
进行 meta-分析的步骤 1.) 提出问题 2.) 根据入选标准选定相应的文献 3.) 选用统计的模型 (fixed effects versus random effects) 4.) 计算综合的效果 5.) 解析结果
选择统计的模型 假如有C个研究,c代表每一个研究(c=1,2..C) • 把这些C研究看作是一个总体(固定效果模型); • 把这些研究看成是总体中的C个样本(随机效果模型): 假设包括在meta-分析中的研究是所有类似研究中(总体)的一个随机样本
理想状态 我们把不同作者对相同问题进行的研究可以看作从同一总体中进行抽样得到的一个随机样本,如果他们都是按照相同的设计得到的研究结果,并且我们可以找到每一项研究的结果,这样就可以根据上面的原理得到一个更为可靠的结果。
实际情况 不同作者: 所使用的设计方案会有一定的差别, 选择的实验对象有所不同, 研究结果不一定都能发表到专业杂志上。 因此实际能够得到的资料可能是不完整的,甚至是有偏性的,如阳性结果的文章,以及和目前大家普遍能够接受的观点一致的文章可能更容易发表在专业杂志上。 重复发表。 认为修改数据。
系统综述和Meta分析的功能 定量综合 提供系统的、可重复的、客观的综合方法 通过对同一主题多个小样本研究结果的综合,提高原结果的统计效能,解决研究结果的不一致性,改善效应估计值 回答原各研究未提出的问题
引 言 四.目前发表的系统综述和Meta分析存在问题 1 没用纳入全部的相关研究 2不能提取全部相关数据 3发表偏性(Publication bias) only studies with positive findings published / accepted 4用于合并统计的临床终点定义不明确
注意: • Meta-分析只是一个统计工具。它不可能将那些本身有问题的研究结果,合成一个好的结果 • Meta-分析仅仅是系统综述中一个部分
第二节 步骤和方法 • 拟定研究计划 • 收集资料 • 根据入选标准选择合格的研究 • 复习每个研究并进行质量评估 • 提取信息,填写过录表,建立数据库 • 计算各独立研究的效应大小 • 异质性检验 • 敏感性分析 • 总结报告
明确研究目的 提出检验假设 特殊注意的亚组 确定和选择研究的方法和标准 提取和分析资料的方法和标准 第二节 步骤和方法 一、拟定研究计划
原则 多途径、多渠道、最大限度 途径 利用多途径广泛收集资料 多种电子资源数据库 参考文献的追溯 注意 未正式发表“灰色文献”(grey literature)——这些文献中可能包含阴性研究结果 会议专题论文 未发表的学位论文 第二节 步骤和方法 二、收集资料 • 临床试验注册登记系统 • 手工检索 • 专著内的章节 • 制药工业的报告
检索大量的文献 根据入选和排除标准进行仔细的筛选 挑出合格的研究进行系统综述和Meta分析 第二节 步骤和方法 三、根据入选标准选择合格的研究
方法学质量 研究设计和实施过程中避免或减小偏倚的程度方法学质量 研究设计和实施过程中避免或减小偏倚的程度 精确度(随机误差的程度) 一般用可信限的宽度来表示 外部真实性 研究结果外推的程度 第二节 步骤和方法 四、复习每个研究并进行质量评估
随机对照试验(RCT)的方法学质量考察: 受试者分组是否真正随机 随机方案是否隐藏 是否详细说明入选标准 组间基线是否可比 研究过程中是否使用了盲法 对失访、退出及不良反应病例是否进行了详细录,是否报告失访原因 是否采用意向分析法(intention-to-treat,ITT)分析结果 患者的依从性(compliance)如何 第二节 步骤和方法
记分为1~5分(1或2分:低质量,3~5分:高质量):记分为1~5分(1或2分:低质量,3~5分:高质量): 随机化方法 恰当 如计算机产生的随机数字或类似的方法(2分) 不清楚 试验描述为随机试验,但没有告知随机分配产生的方法(1分) 不恰当 如采用交替分配或类似方法的半随机化(0分) 第二节 步骤和方法 RCT质量评价的Jadad量表
盲法: 恰当 使用完全一致的安慰剂或类似的方法(2分) 不详 试验称为双盲法,但未交代具体的方法(1分) 非盲法 未采用双盲法或盲的方法不恰当(0分)
失访与退出: 具体描述了撤除与退出的数量和理由(1分) 未报告撤除或退出的数目或理由(0分)
第二节 步骤和方法 五、提取信息,填写过录表,建立数据库 • 按事先制定的资料摘录表内容提取相应变量并填表 • 用meta分析软件MetaView或SPSS、SAS、EXCEL等建立数据库 • 注意对计量资料必须注明单位 • 比较的两组有 x和S;计数资料要使用相同的率来表示 • 双重录入
通用统计软件中有Meta-analysis的程序: STATA SAS WinBUGS NCSS
通常两组间比较时 连续变量 平均差值(Difference between means, DBM) 率差(rate difference) 二分变量 比值比(OR) 相对危险度(RR) 第二节 步骤和方法 六、计算各独立研究的效应大小
恰当分配各研究的权重 将较多的权重分配给能使我们获得较多信息的研究,这些研究具有: • 较多的研究对象 • 较多的临床事件 • 较低的变异 根据研究的样本量大小、研究质量等因素进行加权