890 likes | 1.19k Views
病例对照研究 郑全庆 流行病与卫生统计学教研室. 分析性研究 ( analytical epidemiology ). 病例对照研究 (case-control study) 和队列研究 (cohort study) 均属于分析性的研究 。. 病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾性研究方式。. 分析性流行病学常使用的术语 暴露 (exposure) 是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。这些因素、特征或状态即为暴露因素。暴露因素也叫研究变量 (variable) 。
E N D
病例对照研究郑全庆流行病与卫生统计学教研室病例对照研究郑全庆流行病与卫生统计学教研室
分析性研究(analytical epidemiology ) 病例对照研究(case-control study)和队列研究(cohort study)均属于分析性的研究 。
病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾性研究方式。病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾性研究方式。
分析性流行病学常使用的术语 暴露(exposure)是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。这些因素、特征或状态即为暴露因素。暴露因素也叫研究变量(variable)。 暴露因素可以是机体的特征,也可以是体外的;可以是先天的、人体固有的,也可以是后天获得的。它可以是有害的,也可以是有益的。
分析性流行病学常使用的术语 • 危险因素:是指当此因素存在时能造成人群发病率上升的内外环境因素。 • 保护因素:是指当此因素存在时能造成人群发病率下降的内外环境因素。
病例对照研究的定义: 比较患某病的人与未患该病的对照者暴露于某个可能的危险因素的差异,从而确定这种因素与该病之间是否存在联系及联系程度的研究。
病例对照研究基本原理 病例对照研究是以一组患有某种疾病的人(病例)和一组或几组未患这种疾病的人(对照)作为研究对象,调查他们过去对某个或某些可以病因的暴露情况(有无或暴露剂量),通过对病例组和对照组有关暴露情况的比较,推断研究因素(暴露)作为病因的可能性。
特定疾病病人 评估偏倚 可比 病因推断 不患有该病 基本原理 特定疾病的病人 未患该病的人 统计学检验 源人群 探索和检验病因假说 统计学关联 收集数据 病例和对照的选择
特 点 • 是一种回顾性研究 • 是一种从“果”到“因”的研究 • 设有对照组
调查方向 暴露 病例(有病者) 非暴露 某人群 暴露 对照(无病者) 非暴露 时间 病例对照研究设计
病例对照研究资料整理表 OR:(a/c)/(b/d)=ad/bc
病例对照研究的用途 1.广泛地探索疾病的可疑危险因素。 2.深入检验某个或某几个病因假说。 3.为前瞻性队列研究提供明确的病因线索
实例 ( 年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系) 研究背景 研究步骤 研究结果
研究背景 美国波士顿Vincent纪念医院妇产科医生Herbst发现,1966~1969年收治7例阴道腺癌患者,均为15岁~22岁女青年。通常阴道癌仅占女性生殖系统癌的2%,阴道腺癌仅占阴道癌的5%~10%,非常罕见,而这7例全是腺癌;过去年龄均大于25岁,而这7例全在15岁~22岁之间
研究步骤 • Herbst对阴道腺癌危险因素进行探索 • 7例病人加上另一个医院的1例阴道腺癌患者作为病例组 • 每个病人配4个对照,共32个对照 • 用标准调查表对病例、对照与她们的母亲进行了调查研究,经统计学处理后的主要结果见表
研究结果 表 阴道腺癌病例与对照的母亲主要暴露因素的比较
研究结果 • 在比较的因素中,只有三个因素有显著差别 • 母亲怀孕期间使用过己烯雌酚激素治疗 (P<0.00001) • 母亲以前流产史(P<0.01) • 此次怀孕阴道出血史(P<0.05) • 因有后两个因素存在才使用己烯雌酚治疗 • 做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加
病例对照研究的类型 (一)病例与对照不匹配 (二)病例与对照匹配
(一)病例与对照不匹配 又称成组比较法,按与病例组可比的原则,选择一定数量的对照。
1、什么是匹配 匹配(matching)或称配比:要求对照在某些因素或特征上与病例保持一致。 匹配:是一种常用的选择对照的方法。
2、为什么匹配 • 提高研究效率, 表现为每个研究对象提供的信息量增加。 • 控制混杂因素的作用,当然分层分析也可以控制混杂因素
3、怎样匹配 • 频数匹配(frequency matching):匹配的因素在对照组和病例组所占的比例一致,即是匹配因素的分布相同。它是整体的匹配。比如某项研究中按性别匹配,病例组男女各半,则对照组也应如此。 • 个体匹配(pair matching):以病例和对照的个体为单位进行匹配。有1:1,1:2,1:3,……1:R匹配。 • 两者的区别主要是匹配的单位不同。
关于何时运用频数匹配和个体匹配,应主要根据研究目的,所需样本量,匹配因素的性质,研究现场实际情况综合考虑。关于何时运用频数匹配和个体匹配,应主要根据研究目的,所需样本量,匹配因素的性质,研究现场实际情况综合考虑。 • 研究罕见病,病例少,多用个体匹配。 • 按照年龄,匹配,多考虑用频数匹配。 • 按照特定混杂因素多用个体匹配。 注意以上只是惯常的思维,并不绝对。具体情况具体分析。
匹配因素必须选择那些明确(clearly)能引起混杂作用的因子。匹配因素必须选择那些明确(clearly)能引起混杂作用的因子。 • 年龄,性别,常被用于匹配。
4、匹配中的问题 匹配过头 把不必要的项目列入匹配会造成匹配过头。 • 增加了选择对照的难度,降低了研究效率。 • 使病例与对照尽量一致,就可能徒然丢失信息。
病例对照研究的步骤 一、提出假设 二、拟订研究计划 1、选择适宜的对照形式 2、病例与对照的来源与选择 3、样本含量的估计 4、研究因素 三、实施研究计划 四、分析、写出研究报告
提出假设 根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设
明确研究目的,选择适宜的对照形式 原则 • 广泛探索病因,采用不匹配或频数匹配 • 罕见病采用个体匹配 • 1:R的匹配法,R值不宜超过4 形式 • 成组比较法 • 匹配法
病例与对照的选择 进行病例对照研究时,病例组与对照组的正确选择是该研究成败的关键。 基本原则 • 代表性 病例能代表总体的病例 对照能代表产生病例的总体人群或源人群 • 可比性 两组主要特征方面无明显差异
病例的选择 要求 • 诊断可靠,尽量使用金标准 • 病例内外部特征的限制内部━━患病部位、病理类型。 外部━━年龄、性别、种族。 • 病例类型的选择新发、现患、死亡。
病例的选择 来源 • 总体人群中的全部病例或者随机样本人群中的全部病例 • 医院住院或门诊的病例
对照的选择 要求 • 候选对象必须来自产生病例的总体,即来自同一人群; • 未患此病的人(可以是其它疾病);对照一旦发生所研究的疾病便成为病例组的研究对象 • 不能有共同危险因素的疾病病人; • 除研究因素外其它条件一致; 来源 • 研究的总体人群或抽样人群中具有代表性的 非病例 • 医院中患有其他疾病的病人 • 亲属、邻居、同事、同学等
样本大小的估计 1、有关的影响因素: (1)、研究因素在对照组中的暴露率;(2)、估计该因素引起相对危险度;(3)、希望达到的精确度; (4)、希望达到的检验把握度; (5)、是单侧还是双侧检验; 2、估计的方法: 样本只是一个估计值,过大、过小都不好。
(一)有关参数 • 病例组的暴露率(P1)和对照组暴露(P0) • 优势比(odds ratio, OR) • α值 • 把握度1-β
Zα与 Zβ 分别为与α及β值对应的标准正态分布分位数,p0与p1分别为对照组及病例组估计的某因素暴露史的比例。 计算应用下列公式: 非匹配设计的样本量计算
正态分布的分位数表 ─────────────────────────────── Zα(单侧检验) Zα(双侧检验) α或β Zβ(单侧和双侧) ─────────────────────────────── 0.001 3.090 3.290 0.002 2.878 3.090 0.005 2.576 2.807 0.010 2.326 2.576 0.020 2.058 2.326 0.025 1.960 2.242 0.050 1.645 1.960 0.100 1.282 1.645 0.200 0.842 1.282 ───────────────────────────────
例如在一次吸烟与肺癌关系的研究中,估计对照组有20%吸烟史,OR值约为2,要求α=0.05,β=0.1,求样本大小N?例如在一次吸烟与肺癌关系的研究中,估计对照组有20%吸烟史,OR值约为2,要求α=0.05,β=0.1,求样本大小N? 用公式求: p1=(2×0.2)/(1-0.2+2×0.2)=0.333 q0=1-0.2=0.8 q1=1-0.3333=0.6667 p =(0.2+0.3333)/2=0.2667 q =1-0.2667=0.7333 Zα=1.96,Zβ=1.282 代入公式 (1.96 2×0.2667×0.733+1.282 0.2×0.8+0.3333×0.6667)2 N = ────────────────────────── (0.3333 - 0.2)2 = 228.9 即每组约需230人。
1︰1配对设计的样本量计算m为病例与对照暴露情况不一致的对子数M总对子数1︰1配对设计的样本量计算m为病例与对照暴露情况不一致的对子数M总对子数
研究口服避孕药与先天性心脏病的关系 设α=0.05;β=0.1, 对照组暴露比例为p0=0.3, 估计的OR=2;则p=2/3、m=90; p1=0.46; p0=0.3 M=186
研究因素的选择 (一)变量(暴露因素)的选定:一项病例对照研究可用来研究多个暴露因素与疾病之间联系。但是,研究的暴露因素也不是愈多愈好,所以要精心选择、仔细设计暴露因素。与研究目的有关的变量决不可少,且应当将变量尽量分解、分细。如:吸烟 (二)变量的规定:每项变量要有明确的定义,尽可能地采用国际或国内统一的标准,以便交流和比较。 如:吸烟的定义 (三)变量的测量:1.定量指标;2.定性指标。尽可能定量。此外,变量的测量尽可能采用客观的手段。如询问疾病史时还要查阅病历、档案等。
资料来源与收集 1、资料来源 2、调查的含义及实施时遵循的原则 3、调查表
1 资料来源 • 医院病案记录,疾病登记报告等摘录 • 检测病人的标本或病人的环境获得 • 对病例或对照的询问调查中取得
2、调查的含义及实施时遵循的原则 含义 是信息传达、接受和反映的过程,是属于行为科学的范畴 ,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题 原则 • 调查表的设计需要各专家参加讨论 • 调查员要经过严格的培训 • 调查员手册 • 监督与审查
3、调查表 • 定义 也称“调查问卷”,通过把拟收集的数据项目用 恰当的措词构成一系列问题的答卷,是资料收集的最主要工具 • 内容 • 调查表的名称、编号 • 一般项目:姓名、性别、民族等 • 研究项目:研究变量,疾病史、吸烟史等 • 结尾部分:调查员签名、调查日期等
数据资料的整理和分析 (一)资料的整理 1.原始资料的再核查,目的是纠正错误或补救不足,保证资料完整性。 2.资料的分组、归纳、编码、输入计算机。 (二)资料的分析 1.描述性统计: (1)描述研究对象的一般特征(年龄、性别、疾病类型等) (2)均衡性检验:比较病例组和对照组在研究因素以外其它主要特征有否可比性。两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关。 2.推断性统计 (1)病例组与对照组的暴露率有无统计学差异。 (2)暴露与疾病的关联强度。
描述性分析 1、描述研究对象的一般特征:研究对象人数及各种特征的构成、如性别、年龄、职业、疾病类型的分布等. 2、均衡性检验:比较两组某些基本特征是否相似或齐同. 目的是检验病例组与对照组是否有可比性。
(1)显著性检验χ2检验检验研究因素与疾病之间有否统计学联系? 可用传统的四格表公式 也可用Mantel-Haenszel (M-H)方法(2)计算联系强度OR值及可信区间估计研究因素与疾病之间联系强度
(1)显著性检验 • 判断暴露与疾病是否有统计学联系,一般采用χ2检验 • P<0.05,说明两组暴露率差异有统计学意义。