960 likes | 1.26k Views
流行病学中常见的 偏倚及其控制. Biases and Their Control 吴库生 汕头大学医学院预防医学教研室. 误差 ( error ). 对事物某一特征的测量值偏离真实值的部分。 随机误差 ( random error ) 系统误差 ( systematic error ). 随机误差 . 指随机抽样所得的均值与总体参数的差异,也称抽样误差。只能减少,不能避免。 可以是测量方法本身的 随机 变异,也可以是被测定的生物现象的 随机 变异。 利用统计学技术可估计随机误差的大小,但随机误差无法消除。.
E N D
流行病学中常见的偏倚及其控制 Biases and Their Control 吴库生 汕头大学医学院预防医学教研室
误差 (error) 对事物某一特征的测量值偏离真实值的部分。 随机误差 (random error) 系统误差 (systematic error)
随机误差 • 指随机抽样所得的均值与总体参数的差异,也称抽样误差。只能减少,不能避免。 • 可以是测量方法本身的随机变异,也可以是被测定的生物现象的随机变异。 • 利用统计学技术可估计随机误差的大小,但随机误差无法消除。
随机误差的两个特点 • 样本的观察值都在平均值上下分布,从许多无偏倚样本中得到的观察值均数,假如数量较大,总是趋向于接近总体值; • 随机误差的范围可以用可信区间估计,当保持随机方法而加大样本时,样本均值逐渐向总体均值接近。
描述性结果的样本变异性 样本A 样本B 样本C 图8-1
在图8-1中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。在图8-1中,群体高胆固醇率为25%,样本A为40%,样本B为20%,样本C为0%。 增大样本含量,样本的变异性会减少,样本的高胆固醇率对群体的代表性会增大。
分析性结果的样本变异性 膳食改良组 降低胆固醇药物组 膳食改良组 降低胆固醇药物组
如图8-2,研究A和B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。如图8-2,研究A和B中膳食改良组五年内发生心机梗死的风险为9%,而降胆固醇药物组为6%。 研究A样本较小(200人),两组效应指标(心肌梗死风险)的95%可信限较大,发生重叠,无显著性差异。 研究B样本较大(2000人),两组效应指标(心肌梗死风险)的95%CI较小,未发生重叠,有显著性差异。
样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。样本越大,效应估计值的抽样误差越小(95%可信限越小),统计检验能发现的两组间效应差值越小。 样本非常大,两组间差异很小的效应值也会有统计学显著差异,但这很少有生物学或临床意义。
系统误差 当对群体的某一特征做一次测量或对某一个体的某一特征做多次测量时,所得均值与总体间的真实性也会产生误差,如果误差向量的方向一致或基本一致时,这种误差称为系统误差。
系统误差不是由随机抽样所引起的,而是由某些不能准确定量但较为恒定的因素所引起,其结果导致测量值系统地偏离总体的真实值。系统误差不是由随机抽样所引起的,而是由某些不能准确定量但较为恒定的因素所引起,其结果导致测量值系统地偏离总体的真实值。
举例:用动脉血压计测量某人血压(实际值为80mmHg),各次读数的均值为100mmHg,系统误差和随机误差可用以下图示举例:用动脉血压计测量某人血压(实际值为80mmHg),各次读数的均值为100mmHg,系统误差和随机误差可用以下图示 发生频次 系统误差 随机误差 舒张压(mmHg) 80 100 血压计法测量舒张压值的分布
随机误差和系统误差的区别 • 假设一项研究可以将样本量增至无穷大,如果研究样本无穷大能使误差减小到零,则此误差为随机误差。系统误差不受样本量增加的影响,因此在研究样本无穷大时仍然存在的误差是系统误差; • 适当的重复试验或增加样本含量可以减少随机误差,但不能减少系统误差。
偏倚(bias) 指在流行病学研究中样本人群所测得的某变量系统地偏离了目标人群中该变量的真实值,使得研究结果或推论的结果与真实情况之间出现偏差,这是由系统误差造成的。
偏倚的方向 (一)正偏倚和负偏倚: 凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为θ,而测得值为θ’。 θ=1.0为零效应; θ>1为危险效应; θ<1为保护效应。
1.θ>1时: (1) θ’>θ>1时,夸大危险效应,为正偏倚。 (2)θ>θ’>1时,缩小危险效应,为负偏倚。 2.θ<1时: (1) θ’<θ<1时,夸大 保护效应,为正偏倚。 (2)θ<θ’<1时,缩小保护效应,为负偏倚。
(二)趋向无效值偏倚、远离无效值偏倚或颠倒偏倚:无效值指产生零效应的值。例如,对于RR或OR等于1时即无效值。就RR或OR而言:(二)趋向无效值偏倚、远离无效值偏倚或颠倒偏倚:无效值指产生零效应的值。例如,对于RR或OR等于1时即无效值。就RR或OR而言: 当θ>1时,若θ’>θ>1,则为远离无效值偏倚。 若θ>θ’>1,则为趋向无效值偏倚。 当θ<1时,若θ’<θ<1,则为远离无效值偏倚。 若θ<θ’<1,则为趋向无效值偏倚。 (三)无论θ>1或θ<1,若θ和θ’在1的两侧,则为颠倒偏倚。
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值正偏倚。 (2)RR=0.6 RR’=0.8时,为趋向无效值负偏倚。 (3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
1946年,Berkson做最著名的偏倚研究并给予证实,又称为Berkson偏倚。 1976年,Miettinen详细讨论了偏倚的定义,并给出分类框架,分三类 选择偏倚 信息偏倚 混杂偏倚
选择偏倚(selection bias) 指被选入到研究中的研究对象与没有被选入者特征上的差异所造成的系统误差。主要产生于研究的设计阶段,在各类流行病学研究中均可能发生,以在病例对照研究与现况研究中为常见。 例如研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。
描述性研究的选择偏倚 主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群体(志愿者、因特网利用者等)造成的外部效度(外推)受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等
分析性研究的选择偏倚 主要体现 研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联,由此增大或减少暴露与疾病、处理与效应的关联,导致效应估计的偏倚。 控制方法 选取具体环节或已选取人群的具体特征 分析研究对象的选取是否同暴露或处理因素有关
常见的选择偏倚 1、入院率偏倚(admission rate bias) 亦称伯克森偏倚(Berkson’s bias),是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同或就诊机会的不同而导致的偏倚。
不同疾病在不同医院的就诊或住院率各异,其原因是多方面的,如不同医院的技术专长,患者所患疾病的严重程度,患者的经济状况,以及就诊方便与否等。因此,若在医院内选择研究对象进行流行病学研究时,应注意到可能会出现这种偏倚。不同疾病在不同医院的就诊或住院率各异,其原因是多方面的,如不同医院的技术专长,患者所患疾病的严重程度,患者的经济状况,以及就诊方便与否等。因此,若在医院内选择研究对象进行流行病学研究时,应注意到可能会出现这种偏倚。
用住院病例进行研究时可能没有包括: • 抢救不及时死亡的病例 • 距离医院远的病例 • 无钱住院的病例 • 病情轻的病例
2、现患-新发病例偏倚(Prevalence-incidence bias) 又称奈曼偏倚(Neyman bias),凡因现患病例与新病例的构成不同,只调查典型病例或现患病例的暴露状况,致使调查结果出现的系统误差都属于本类偏倚。
在美国弗明汉地区对心血管系统疾病的研究中发现:男性居民在队列研究中,具有高胆固醇水平者,患冠心病的OR 值为2.4,而在病例对照研究中,病例组和对照组却无明显差异(OR =1.16)。 原因:病例对照研究中的现患病例已改变了他们高胆固醇的饮食习惯。
3、无应答偏倚(non-respondent bias) 无应答者指调查对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作的无应答者可能在某些重要特征或暴露上与应答者有所区别。如果无应答者超过一定比例,就会使研究结果产生偏倚,即无应答偏倚。
安阳县食管癌普查,普查率仅20%左右,不能代表总体。安阳县食管癌普查,普查率仅20%左右,不能代表总体。 造成无应答的主要原因: 研究对象不了解研究目的;调查内容不当,过于繁琐,涉及隐私;对象不能正理解调查内容(文化低、高龄等);对象病重、外出。
研究人员调查美国西北部铁路职工冠心病分布情况。虽然采取各种措施鼓励和要求全体职工参加此项工作,但一般职工只有73.6%,扳道工只有58%自愿参加。初步分析结果表明,一般职工冠心病现患率为43‰,扳道工为24 ‰,两者差异有显著性。
失访偏倚:是一种无应答,主要发生在前瞻性队列研究和实验研究中。失访偏倚:是一种无应答,主要发生在前瞻性队列研究和实验研究中。 (1)随访过程中因种种原因拒绝继续留在观察组中。 (2)观察对象在出现预期的结果之前死于其他疾病或事故。 如果暴露组与对照组观察对象均有500人,随访过程中均失访100人,其结果是否可靠???
4、志愿者偏倚(volunteer bias ) 志愿者与非志愿者在关心健康、注意饮食卫生及营养食疗、戒烟戒酒、体育锻炼等方面有系统差别。如选择志愿者为对象,而非志愿者常落选,可能会产生偏倚。 例如:观察体育锻炼预防冠心病的效果 实验组为志愿者,非志愿者为对照组。
美国疾病控制中心调查参加过内华达州原子武器实验部队中继发白血病的发病情况时,追踪随访了76%的人,其中82%是调查员追踪到的,但有18%是由于宣传的影响而主动与调查员接触的。18%主动报告的研究对象中有4例白血病,而82%调查员随访的对象也只有4例。美国疾病控制中心调查参加过内华达州原子武器实验部队中继发白血病的发病情况时,追踪随访了76%的人,其中82%是调查员追踪到的,但有18%是由于宣传的影响而主动与调查员接触的。18%主动报告的研究对象中有4例白血病,而82%调查员随访的对象也只有4例。
5、检出征候偏倚(detection signal bias) 亦称为揭露伪装偏倚(unmasking bias),指某因素与某疾病在病因学上虽无关联,担由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该病相关联的错误结论。
有人以病例对照研究发现,子宫内膜癌患者的雌激素比例显著高于对照组,认为子宫内膜癌与服用雌激素密切相关。有人以病例对照研究发现,子宫内膜癌患者的雌激素比例显著高于对照组,认为子宫内膜癌与服用雌激素密切相关。
1978年,Horwitz和Feinstein:口服雌激素与子宫内膜癌的高度关联是虚假的,是一种检出偏倚。 (1)人群中有一定量无症状的子宫内膜癌早期病人。 (2)无症状的子宫内膜癌早期病人如服用雌激素易发生子宫出血而就诊,由此被发现而选入病例组。 (3)对照组为一般住院病人。 结果:雌激素服用率高于对照组。
6、易感性偏倚(susceptibility bias) 有些因素可能直接或间接影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此产生的偏倚称为易感性偏倚。 如:当研究某种有毒物质对工人的健康危害时,常发现暴露于有毒物质的工人的死亡率比一般人群还低,这主要是接触该有毒物质的工人,其初始的健康水平要比一般人群要高,其易感性低。
健康工人效应 有人开展了一项历史性队列研究,来评价接触木尘对呼吸系统疾病死亡率的影响。研究者选择了家具制造厂的工人作为暴露组,以全体人群作为非暴露组,结果发现家具制造厂工人的呼吸系统疾病的死亡率低于全人群。
7、排除偏倚(exclusive bias) 在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。
在一项关于阿司匹林与心肌梗塞关系的病例对照研究中,病例组与对照组均不应包括患慢性关节炎者,亦不应包括慢性胃溃疡病人,因前者倾向于服用此药,而后者倾向于不服用此药。在一项关于阿司匹林与心肌梗塞关系的病例对照研究中,病例组与对照组均不应包括患慢性关节炎者,亦不应包括慢性胃溃疡病人,因前者倾向于服用此药,而后者倾向于不服用此药。
研究利血平与乳腺癌关系时,若病例组(患乳腺癌妇女)含有高血压患者,而对照组没有,即使利血平与乳腺癌无任何关联,结果也可能会显示两者之间在统计学上的联系,因为高血压患者增加了利血平的暴露率。研究利血平与乳腺癌关系时,若病例组(患乳腺癌妇女)含有高血压患者,而对照组没有,即使利血平与乳腺癌无任何关联,结果也可能会显示两者之间在统计学上的联系,因为高血压患者增加了利血平的暴露率。
选择偏倚的控制 • 研究者应充分了解该项研究工作中各种可能的选择偏倚来源,并在研究设计过程中尽量避免; • 严格掌握研究对象的纳入与排除标准,使研究对象能较好地代表其所出自的总体; • 为了避免存活因素的影响,在进行病例对照研究时,如果病例组选择新诊断的病人,则对照组不应由慢性病病人组成;如果对照所患的慢性病严重地影响暴露,则更不应作为对照;
为了避免由于拒绝参加研究而引入选择偏倚,应尽可能地降低拒绝参加人员的比例。有人主张对拒绝参加者做出各种假设分开分析;为了避免由于拒绝参加研究而引入选择偏倚,应尽可能地降低拒绝参加人员的比例。有人主张对拒绝参加者做出各种假设分开分析; • 在队列研究中随访全部研究对象,或获得尽可能高的应答率,可能预防或减小偏倚。
信息偏倚(information bias) 又称观察偏倚(observational bias),指研究中有关研究对象的或来自研究对象的信息是错误的,会产生系统误差。信息偏倚的表现是使研究对象的某种特征被错误分类如暴露者与某因素被错误地认为是非暴露者,某病的患者被认为是非患者。
常见的信息偏倚 1、回忆偏倚(recall bias) 指在回忆过去的暴露史或既往史时,因研究对象的记忆失真或回忆不完整,使其准确性或完整性与真实情况间存在的系统误差。
小儿白血病←→母亲怀孕时接受x线的回忆 死于白血病的小儿的母亲增加了暴露于x线的回忆。 病例 医院 对照 社区 认真回忆暴露史 暴露经历易遗忘或不重视
回忆偏倚产生的原因 • 由于调查的因素或事件发生的频率低,未给研究对象留下深刻的印象而被遗忘; • 调查事件是很久以前发生的事情,研究对象记忆不清或已经遗忘; • 研究对象对调查的内容或事件关心程度不同,因而回忆的认真程度有异,回答问题的多少及准确性也有所不同。