临床科研中常见偏倚及其预防

临床科研中常见偏倚及其预防 陈世耀复旦大学临床流行病学中心

？高血压与急性心梗预后研究 • 设计：队列研究； • 病例：1985－1998年急性心梗住院病人543例； • 分组：按有无高血压分两组； • 结果测量：两组病人住院病死率； • 结果：高血压组病死率高于无高血压组； • 结论：高血压是影响急性心梗预后的重要因素。

临床研究中的一些基本概念 • 总体：同质个体所构成的全体； • 样本：从总体中取出的部分个体； • 目的：从样本估计总体 • 目标人群：又称靶人群，是样本人群来源的总体，也是样本人群研究结果用以说明或推广应用的总体人群；

抽样及其抽样误差 • 抽样：从总体中取出部分个体(进行研究)的过程。原因： • 我们不可能获得总体的全部资料； • 我们没有足够的人力、物力研究总体； • 抽样误差：样本与总体之间由于抽样过程引起的差异，在统计学上称为抽样误差。

偏倚的定义 • 偏倚是从样本研究中所得结果不能如实反映目标人群真实结果的一种系统误差； • 临床研究比基础研究更容易产生偏倚： • 两组可比性、心里因素、中途退出研究等； • 偏倚的控制： • 科研的设计和实施阶段； • 统计学方法纠正。

机遇与偏倚(1) • 机遇：是观察结果的精确性及可重复性受到影响；机遇是一种随机误差。 • 任何观察所固有，只能设法缩小，不能避免。 • 偏倚：观察结果系统地、向一个方向(或大、或小)发生偏差而不能反映真实情况。 • 在科研设计、实施和分析阶段避免或校正。

机遇与偏倚(2) • 机遇与偏倚反映了一项研究或测量结果的两方面：精确性(随机误差)和真实度(系统误差) 真实度高真实度低精确度高精确度低

机遇对研究结果的影响 • 假阳性：如实际上两种方法治疗疗效相同，如少数病人的抽样研究发现甲、乙两方法疗效不同，这是由于机遇的影响而发生的假阳性错误，统计上称一类错误，用α表示。 • 假阴性：如实际两种治疗一种比另一种好，但由于抽样研究中机遇的影响，两者疗效十分相近而作出假阴性的错误判断；统计上称二类错误，用β表示。

可信区间 • 直接估计机遇在临床研究中的作用大小； • 表明机遇所致的围绕真实值变动的范围，通常用95％或99％可信区间表示； • 变动范围越窄，真实值越稳定。

真实性 • 指一项研究或观察所作推论的正确及可靠程度，即结果反映观测对象的真实情况； • 内部真实性：为正确反映研究人群或靶人群真实状况的研究结果的外延部分； • 外部真实性：内部真实性的结果推广到靶人群以外的其他人群仍然有效。

内部真实性和外部真实性 病人总体 (包括其他设施中的人群) 样本内部真实性样本偏倚机遇研究结论外部真实性：外推到样本所属总体或其他人群

偏倚的特性 • 偏倚是一种系统误差，具有一定的方向性； • 偏倚的分类： • 选择偏倚：发生在设计阶段； • 测量偏倚：发生在观察、研究、测量等实施阶段； • 混杂偏倚：又称外来因素的影响，发生在设计阶段，可通过统计方法加以纠正。

选择性偏倚 • 产生环节：设计阶段； • 产生原因：被选入对象同落选对象间在与研究有关的特征方面有系统差别，同时在比较组间除研究因素外，其他一些有关因素也分布不均，导致结果偏离真实情况。

入院率偏倚(Berkson bias) • 研究某危险因素是否与A病有关，A病来源于住院病人，对照为同期住院的其他病人(B病)； • A病与B病由于各种因素在该医院入院率不同； • 危险因素具有一定独立性，与疾病无关的入院率。 • A病：糖尿病；B病：肿瘤；危险因素：高血压

人群A、B两病及C因素分布 • 病种有C因素无C因素总人数 • A病 750 4250 5000 • B病 750 4250 5000 • OR＝(750×4250)/(4250×750)＝1

假设：A病入院率60％，B病25％，危险因素C的入院率40％假设：A病入院率60％，B病25％，危险因素C的入院率40％ • 病种有C因素无C因素总人数 • A病 750×60％ 4250×60％ 3120 • 750×40％×40％ • ＝570＝2550 • B病 750 750×25％ 4250×25％ 1476 • 750×75％×40％ • ＝413＝1063 • OR＝(570×1063)/(2550×413)＝0.575

检出征候偏倚 • 口服雌激素与子宫内膜癌病例对照研究； • 病例组：子宫内膜癌患者，对照：无子宫内膜癌患者； • 结果：子宫内膜癌患者口腹雌激素比例高； • 结论：口服雌激素是子宫内膜癌的危险因素。 • 偏倚：无症状早期子宫内膜癌病人服雌激素后易致出血就诊。即病例入选受暴露因子影响，具有该暴露因子的病例会早期出现临床症状，入选病例与未入选病例之间存在系统差别。

奈曼偏倚(存活偏倚或患病率发病率偏倚) • 病例对照研究大量饮用咖啡与心梗； • 病例组：医院心梗病人，对照组：医院非心梗病人； • 结果：大量饮用咖啡与心梗无关； • 偏倚：调查对象为存活者，只是一般饮用咖啡或减少饮用量，入院前死亡病人多是大量饮用咖啡者。

无应答偏倚 • 调查吸烟在男女人群中的比例； • 人群调查表返回： • 男性回答率90％以上；女性回答率50％，且多数为女性吸烟者未回答。 • 结果：低估女性吸烟率。

志愿者偏倚 • 体锻与冠心病队列研究： • 研究组为志愿者，对照组为非志愿者 • 结论：体锻减少冠心病发生 • 偏倚：志愿参加研究者更关心自己的健康：注意饮食及营养，禁烟酒、坚持体锻。

失访偏倚 • 失访是一种无应答，只是发生在队列及干预的前瞻性研究中； • 包括：失访或退出； • 主动失访常常与暴露因素或结果有关。 • 应减少到最小程度； • 研究中应了解退出的原因； • 处理时可做“最坏打算”校正或评价

健康工人偏倚 • 化学物质接触与白血病发生的队列研究； • 研究组：接触苯的工人，对照组：普通工人； • 结果：两组发生白血病比例相似； • 结论：接触苯与白血病发生无关 • 偏倚：进入研究组的工人是留下来不易患白血病人群，患病工人早已转出；又归为易感性偏倚。

转组偏倚 • 研究运动与冠心病关系； • 设计：码头工人，根据劳动强度分组，然后观察22年冠心病发生率； • 结论：运动(劳动强度)与冠心病发生无关。 • 偏倚：劳动强度的变化。

非同期对照偏倚 • 研究监护室建立在心梗中作用； • 研究组：1999－2000年监护室建立后死亡率15％，对照组：1997－1998年监护室建立前死亡率25％； • 结果：建立监护室减少心梗死亡率。 • 偏倚：没有考虑心梗诊断和治疗改进的作用

异地对照偏倚 • 抗凝药治疗心梗； • 治疗组与对照组分别来自两家医院； • 结果：抗凝药减少或不能减少死亡率。 • 偏倚：两家医院死亡率差别？

易感性偏倚 • 溃疡病病因病例对照研究： • 病例组：溃疡病人，调查发现：面食多； • 对照组：非溃疡病人，面食少； • 结论：多面食与溃疡发生有关。 • 偏倚：溃疡发生在先，面食在后。

时间效应偏倚 • 某饮食与急性肝炎的病例对照研究。 • 病例组：急肝病人；对照组：同单位其他人。 • 结果：该饮食与急性肝炎发生无关。 • 许多慢性病，自接触有效暴露到出现临床症状，其间经过漫长过程。在此期间，他们实际是有暴露史但未出现症状，也未能用现有手段发现异常的病人。这类病人常被归入健康对照内。在遗传病中同样(疾病发生的外显年龄)。 • 研究结果的过低估计。

领先时间偏倚 • 研究肿瘤等慢性病，自症状出现，临床处理，平均存活12月； • 筛检诊断，临床处理，平均存活15月； • 结论：筛检措施能延长生存时间。 • 偏倚：延长3月时间系提早发现及诊断时间。

测量偏倚 • 又称观察性偏倚、信息偏倚； • 发生在研究的实施阶段； • 原因：资料的观察、测量、收集方法不当，诊断试验的灵敏度、特异度以及患者提供有关信息的准确性不足，并且这种不足在比较组之间存在差别。

诊断怀疑偏倚 • 病例对照研究：DMII病人中口服降糖药与心血管并发症死亡 • 口服药物组对照组(胰岛素治疗组) • 尸体解剖不作尸体解剖 • 寻找心血管并发症死因归于其他死因

暴露怀疑偏倚 • 研究者在收集并确定病例组的暴露比例时所具认真、细致、深入的程度同对照组相比有重大差别；如医生知道某因素与疾病的关系，不同收集者差别。

回忆偏倚 • 发生于病因与危险因素的病例对照研究中，询问的发病因素与结果或研究时间隔时间较长； • 如家族史、用药史等。

归类错误偏倚 • 每项诊断试验的灵敏度和特异度不可能达到100％，就会产生假阳性和假阴性，即误诊和漏诊－在研究中将病人分入对照组，而将非病人分入病例组。 • 错分有均衡与非均衡之分；均衡错分使偏倚趋向无效，而非均衡错分对结果判断有影响。

混杂性偏倚 • 研究危险因素与疾病之间的关系时，如果存在第三因子，且第三因子与研究因素及疾病之间均有联系，研究因素与第三因子的效应混在一起，便产生混杂偏倚，从而掩盖或夸大研究因素与疾病之间的联系。 • 如研究饮酒与肺癌关系，发现饮酒是肺癌的危险因素－吸烟的混杂偏倚。

混杂偏倚与其他偏倚的异同 • 选择偏倚与测量偏倚：选取样本不当或者在观察过程中、测量过程中产生； • 混杂偏倚： • 也是一种系统误差，不能通过增大样本量来控制，可发生在临床科研设计阶段，但不易识别，难于控制，但可以通过统计学方法消除。 • 第三因子在在目标人群中同所研究的结果变量存在固有联系，如也为一危险因子。 • 第三因子同所研究的暴露因素存在固有联系，如吸烟与饮酒

产生混杂的条件 • 第三因子在在目标人群中同所研究的结果变量存在固有联系，如也为一危险因子； • 第三因子同所研究的暴露因素存在固有联系，如吸烟与饮酒； • 否定或排除条件：若第三因子为暴露与疾病因果联系中的一中间环节，那么该第三因子不可能为一混杂因子。

评价诊断试验的指标 诊断试验的四格表黄金标准病例组非病例组诊断阳性 (真阳性)a b(假阳性) a+b 试验阴性 (假阴性)c d(真阴性) c+d a+cb+d a+b+c+d 灵敏度=a/a+c 阳性预测值=a/a+b 特异度=d/b+d 阴性预测值=d/c+d 准确度=a+d/a+b+c+d 患病率=a+c/a+b+c+d

诊断试验研究中的偏倚(1) • 选择样本误差： • 由常规试验引起的误差：阳性结果的病人通常被选择用标准方法进行鉴别，在1990－1993年，38％的研究有此现象。 • 由不明确结果引起的误差：带有不明确或中间检查结果的病人往往被排除出分析之外。在1990－1993年，62％的研究有此现象。

参考试验偏差 • 参考试验： • 灵敏度90％，特异度90％， • 新的诊断试验： • 真敏感度90％，真特异度90％，

问题1：若患病率为10％，结果如何？ 疾病+ 疾病－参考试验＋ 90 90 － 10 810 100 900 1000 研究结果(低流行率) 参考试验+ 参考试验－新试验＋ 90(81+9) 90(9+81) － 90(9+81) 730(1+729) 总数 180(90+90) 820(10+810) 灵敏度＝90/180=50%；特异度＝730/820=89%

问题2：若患病率为90％，结果如何？ 疾病+ 疾病－参考试验＋ 810 10 － 90 90 900 100 1000 研究结果(高流行率) 参考试验+ 参考试验－新试验＋ 730(729+1) 90(9+81) － 90(81+9) 90(81+9) 总数 820(810+10) 180(90+90) 灵敏度＝730/820=89%；特异度＝90/180=50%

参考试验影响 • 在评价一个新的诊断试验时，如果误差是独立的话，不完满的参考试验会产生假的灵敏度以及特异度。 • 在高流行情况下，对灵敏度的误差将小些，在低流行情况下，对特异度的误差将会小些。

试验结果中不明确部分的影响 • 病例： • 15岁女性，临床怀疑是患阑尾炎，外科医师估计其概率是90％，外科医师认为只要其概率(可能性)大于50％就应做手术，然而，下腹超声波做了，如果超声波结果是阴性的话，患有阑尾炎的可能性是多大呢？这位病人应送去外科吗？

方法1 • 文献资料：金标准(剖腹探查) ＋－超声波＋ 16(80%) 4 － 4 36(90%) 20 40 • 验前比＝9/1 • 验后比＝(9/1)*(20%/90%)=2 • 验后概率＝2/3=66.7% OK?

方法2 • 文献资料剖腹探查结果阑尾炎无阑尾炎超声结果＋ 16 4 － 4 36 ？ 36 4 合计 56 44 • 验前比＝9/1 • 验后比＝9*(4/56)/(36/44)=0.8 • 验后概率＝0.8/1.8<50% Not Surgery!

诊断试验研究中的偏倚(2) • 测量误差： • 审阅误差：评价标准的人已事前知道结果，在1990－1993年，53％的研究有此现象。

观察者偏倚 • 调查者在解释参考实验结果时，不应该事前知道试验的结果，而在解释试验结果时，亦不应该事前知道参考试验的结果。

诊断试验研究中的偏倚(3) • 随机误差： • 试验进行得不准确，并不知道或没有重复试验的结果；对试验观察者，试验仪器及时间的变化无进行评价。 • 试验特征的不准确：样本不足，而且没有关于敏感度，特异度，或似然比的可信区间域的描述。在1990－1993年，76％的研究有此问题

诊断试验研究中的偏倚(4) • 推广性(外部正确性) • 没有对病人的特征进行描述：对疾病的情况，其它临床及病人特征没有足够的描述； • 忽视了可能的相互作用因素或效果修正因素：没有对重要的临床或人群分组的特征进行评价，亦没有对测定患病率对试验特征的影响进行评价。

预后研究中的关键问题 • 队列研究的起始点：必须有明确的标准； • 研究对象的来源和分组： • 研究人群与目标人群一致 • 分组具有可比性 • 随访和失访

临床科研中常见偏倚及其预防

临床科研中常见偏倚及其预防

Presentation Transcript