470 likes | 549 Views
唯统计论. “请给个铜币吧,”一个乞丐在议会广场拦住财政部的统计专家说,“我已经三天没有吃东西了。” “啊,”统计专家亲切地问,“和去年同期相比怎样?” 有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着: “擦眼泪 11 次;系鞋带 15 次;给每个孩子吹玩具气球各 5 次;每个气球的平均寿命 10 秒钟;警告孩子不要横穿马路 26 次;孩子坚持要穿马路 26 次;我还要再过这样的星期六 0 次。”. 统计学是现代医学大厦的一个重要支柱
E N D
唯统计论 “请给个铜币吧,”一个乞丐在议会广场拦住财政部的统计专家说,“我已经三天没有吃东西了。” “啊,”统计专家亲切地问,“和去年同期相比怎样?” 有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着: “擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿马路26次;我还要再过这样的星期六0次。”
统计学是现代医学大厦的一个重要支柱 ——美国医学会杂志(JAMA)主编 统计学是挖掘数据背后的真理 —— MedSci.cn
医学论文中的统计学问题 • 60年代到80年代,国外医学杂志调查结果:有统计 • 错误的论文20%~72%。 • 1996年对4586篇论文统计(中华医学会系列杂志 • 占6.9%),数据分析方法误用达55.7%。 • 2001年《中华预防医学杂志》:中华医学会系列杂 • 志误用约54%(1995篇)。 如果广大医师没有一定的统计学知识,没有独立分析和判决的能力,将会把出现在上述70%以上文献中的部分或完全不可靠的结论作为正确的而接受下来。
一、统计方法的选择应从科研设计开始 • 实验设计包括统计分析方法 • - 无科学设计、设计不严谨,数据量不够、统计结果与专业结论自相矛盾、无法得出期望的统计结果,“亡羊补牢”。 • 严谨完善的科研设计是正确运用统计方法的前提。 • -Fancy statistical methods cannot rescue garbage data • - Fancy statistical methods can help you gain insight into your data, over and above what seems obvious on its face • - You should always worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.
二、统计方法的选择要遵循基本原则 • 研究目的 • 设计类型 • 结局变量的类型 • 适用条件
计量资料 计数资料 等级资料 研究目的转换成数据资料 • 研究目的 拟分析指标 结局变量 某市高血压患病率 某市人群 变量:血压,性别,年龄,家族史,高盐饮食… … 收缩压:130mmHg, 110mmHg… …(计量) 高血压:有或无(计数) 高血压程度:轻,中,重(等级) 1000名 随机抽样 - 只能由高级向低级转化:连续型-有序-分类-二值
完全随机设计 配对设计 交叉设计 随机区组设计 析因设计 描述性研究:现况研究 病例对照研究 分析性研究 队列研究 医学科学研究 实验研究 实地观察研究 • 医学科学研究 文献研究-review, systemic review,Meta分析 调查研究 • 适用条件: • -资料分布特征:正态分布,二项分布,Poission分布 • - 样本量大小,理论频数,方差齐性
分析的目的 资料的类型 资料的分布 设计方案 样本含量大小 二、统计方法的选择要遵循基本原则
三、统计分析要有明确的思路 • 先统计描述后统计学推断 • 先单因素分析后多因素分析 • 先计量资料,后计数和等级资料
常用的统计分析方法 资料类型 研究目的 计数资料 计量资料 等级资料 统计推断 统计描述 统计推断 统计推断 统计描述 no 条件 离散程度 集中趋势 统计图表 卡方检验 秩和检验 t 检 验 方差分析 相对比 构成比 率
五、医学论文中常出现的统计学错误 • 按分析思路分为: • 资料的表达和描述错误 • 统计推断方法错误 • 结果表达错误 • 按性质分为: • 表达方式欠妥 • 科学性不够严谨 • 原则性错误
(一)资料的表达和描述 • 统计表和统计图 • 描述平均水平和离散趋势 • 描述相对数
统计图 • 恰当的选用图形,标题,图例,坐标,美观 • 论文中除非表示趋势,一般不建议用图。
计量资料描述:平均水平和离散趋势 • 使用正态分布方法表达呈偏态分布的资料( × ) • 应选用中位数(M),描述其离散趋势应选用四分位数间距(QR)
计数资料描述:相对数(率,构成比) • 不能以构成比代替率:率-某一确定人群中某事件发生的频率 - 2003年,有人撰文并在网上报道如下:第一阶段医护人员感染率为33%,并解释说:在感染“非典”的100人中,有33人是医护人员。 -《600例小儿烧伤休克期治疗分析》:600例烧伤患儿,210例早期有休克症状,其中3岁以下者110例,占52%,3岁以上者100例,占48%,年龄越小,休克发生率越高。 • 错用患病率和发病率: - 某日新闻联播 - 我国高血压现状不容乐观,发病率已高达约10%。 - 发病率(incidence rate): - 患病率(prevalence rate):
表5资料是假设的某地1955年和1956年疟疾发病人数资料,已知该地人口在两年中没有什么变动。表5资料是假设的某地1955年和1956年疟疾发病人数资料,已知该地人口在两年中没有什么变动。 表5 各种疟疾的构成情况 从表中可以看到,1956年间日疟疾和三日疟的百分比都上升了,但由此得出间日疟和三日疟增多的结论 ,是否正确? 计数资料描述:相对数(率,构成比)
计数资料描述:相对数(率,构成比) • 计算相对数的分母过小( × ) • 一般要求观察单位数不小于 30
计数资料描述:相对数(率,构成比) • 用实际频数来描述
表3 两种方法治愈率的比较 计数资料描述:相对数(率,构成比) • 两组研究对象构成不一致,需要进行标准化 • 两个样本率比较时应该进行假设检验。 • 比较相对数时应注意可比性。
二、统计方法的选择要遵循基本原则 • 研究目的 • 设计类型 • 结局变量的类型 • 适用条件
(二)统计学推断常见错误 – 计量资料 • 误将计量资料判为计数资料 • 忽视t检验和方差分析的前提条件 • 单因素分析中实验设计类型判断错误 • 多因素分析中实验设计类型判断错误
忽视t检验和方差分析的前提条件 • 医学论文中t检验的流行 • 不考虑t检验的应用前提,对两组的比较一律用t检验 • 将各种实验设计类型一律视为多个单因素两水平设计, • 多次用t检 验进行均值之间的两两比较 ( × ) • 根据设计类型: • - 单因素两水平:t检验,秩和检验 • 条件:正态分布,方差齐性 • 设计:单组、配对、成组设计 • - 单因素多水平(≥3):方差检验,秩和检验 • - 多因素单水平或多水平:方差检验,秩和检验 ( √ )
误将定量资料判为定性资料 实例:小儿皮肤血管瘤雌、孕激素受体的研究-采用免疫组化对皮肤组织的ER,PR受体进行检测。对标本进行免疫组化染色,高倍镜下对肿瘤区内计数500个细胞,计数ER, PR 阳性细胞百分率。 • 原作者:X2检验 ( × ) • 需要专业和统计知识相结合 • 研究目的是样本的ER,RR检测率
误用成组设计资料的t检验分析配对设计计量资料误用成组设计资料的t检验分析配对设计计量资料 实例:用改良的Seldinger’s插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后测血hCG。 • 原作者:两组独立样本t检验( × ) • 对对数的差值进行正态性检验 • 偏态分布:Wilcoxon秩和检验
计量资料单因素多组比较分析 实例:研究血清 CEA,CA19-9,CA72-4 和CA242 4项肿瘤标志在患者手术前,手术后及转移复发方面差异有无显著意义。 • 原作者:t检验 ( × ) • 经过正态性和方差齐性检验:取对数或平方根变换 • 正态分布:ANOVA,Dunett-t检验;偏态分布:Kruskal-Wallis
析因设计资料 实例:为探讨发育期营养不良伴发癫痫持续状态对海马神经发生的影响,将28只新生Wistar大鼠建模为4组,分别为营养良好组,营养不良组,营养良好+惊厥组,营养不良+惊厥组,每组7只,测量各组齿状回Brdu阳性细胞数。 • 原作者:配对设计资料的t检验( × )
析因设计资料 • 正态分布:析因设计资料的方差检验 • 单独效应,主效应和交互效应
(二)统计学推断常见错误 – 计数资料 • 资料整理过失及误差和对资料类型判断错误导致 • 盲目套用χ2检验 • 误用χ2检验回答相关性问题 • 实验设计类型判断错误
列联表资料的11种形式 来自横断面研究设计 来自队列研究设计 来自病例对照研究设计 来自配对研究设计 四格表 双向无序 结果变量为有序变量的单向有序 双向有序且属性不同 双向有序且属性相同 R×C列联表 结果变量为二值变量 结果变量为多值有序变量 结果变量为多值名义变量 高维列联表
若消毒后的20根螺纹管就是消毒前的那20根螺纹管若消毒后的20根螺纹管就是消毒前的那20根螺纹管 • McNemar χ2检验公式
一般四格表资料 表18 不同分娩方式与重症肝炎孕妇的结局 • 原作者:一般的χ2检验 ( × ) 实际频数太小,根据总体样本量和理论频数来判断公式 n≥40,理论频数T大于5:一般四格表χ2公式 n≥40,但有理论频数满足1≤T<5:校正公式 n<40或有理论频数小于1时Fisher精确检验
配对四格表资料 实例:研究者分别用两种方法检验120份标本,PCR法检测得到28份标本为阳性结果,ELISA法检测得到23份标本为阳性结果。 表19 PCR法与ELISA法检测结果 • 原作者:一般的χ2检验 ( × ) • 配对设计下卡方检验:McNemar 检验 • b+c<40, 应用矫正公式
表19 (b)以PCR法为“金标准”推算ELISA法测定结果 • 要看是否有评判检测结果正确与否的“金标准” • 要看能否以其中一种检测方法为基法。
单向有序R×C列联表资料 • 原作者:R×C χ2检验 ( × ) • 排除性别、病程等非实验因素影响 • 单项有序R×C列联表:秩和检验,Ridit分析
双向有序属性不同R×C列联表资料 • 原作者:R×C χ2检验 ( × ) • 双向有序且属性不同 • 不同分化程度下P16各等级的频数分布有无差别-秩和检验 • 希望研究“分化程度”与“P16取值的等级”之间是否存在相关, • 可选用Spearman等级相关、典型相关分析。
双向有序属性相同R×C列联表资料 实例:中老年职工最大呼气流量与工作能力的关系-采用工作能力指数(WAI)法和75%肺活量位最大呼气流量(V75)法评价285名中老年职工的工作能力,并分为差,中,好三个等级 • 原作者:R×C χ2检验 ( × ) • 双向有序且属性相同,目的是分析两种方法的结果之间是否具有一致性, • 做一致性检验,即Kappa检验。
常见: 资料未经过任何统计处理 未交代选用的是何种统计分析方法,仅给出P值 但未给出统计量的具体值 (三)统计检验结果表达 ( × ) • 完善的表达方式: • 所选用的统计分析方法; • 统计量的具体取值及其自由度; • 假设检验的具体P值; • 有关总体参数的95%可信区间; ( √ )
正确解读统计学意义和实际意义 统计的结论必须和专业结论有机的相结合 统计显著性 ≠ 临床“显著性”? • 某大型降压类药物RCT临床试验,发现A组药物平均收缩压下降较B组多2 mmHg,统计学显示P<0.001,表明两组有统计学显著性差异,但是否有临床疗效显著差异? • 某研究组采用基因治疗6例血友病患儿,取得极其满意疗效,但例数太少,也无对照组。无法进行统计,这种研究有临床意义吗?
案例1:因为 2 mmHg本身就在血压测量误差范围,没有任何临床意义案例2:发表在NEJM,2011;365:2357上 统计意义与临床意义只有携手,做统计意义的主人,才是“真意义”
正确解读“P<0.01”与“P<0.05”的真正含义 ( × ) • 根据P值是“<0.05”还是“<0.01”作出肯定程度不同的专业结论。 • 例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P<0.001”,则认为甲药极显著地优于乙药;若得到“P<0.01”,则认为甲药非常显著地优于乙药;若得到“P<0.05”,则认为甲药显著地优于乙药 。 ( √ ) 统计学上根据假设检验原理推算出来的P 值,表示拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的大小不反映对比的两者之间差别的程度大小。
注视小概率事件 • 1949年,西方某国家曾有过一个真实的故事。丈夫到法院要求离婚,唯一的理由是他去海外服兵役50个星期后,回家发现妻子在家分娩。(无亲子鉴定技术出现) • 法官如何判案?你认为呢? • 一例因因急性髓性白血病,合并HIV感染患者。因为大剂量化疗,会加重HIV感染,因此,难以决策该用何种方案? • 通过骨髓移植,发现一例合适配型中,携带CCR5⊿32突变,移植后,患者两个病同时被治愈了
Meta分析发现“小概率事件”中的问题 靶向抗癌药物的致命性不良反应事件 • 背景: 传统化疗药物致命性不良反应事件,很清晰. 但是靶向制剂,虽然也有不良反应,但是温和得多,而且多是小样本事件(因为价格高昂,研究样本量不会太大,因此不良事件观察也较少),这是Meta分析基础。 • Meta分析必要性:通过Meta分析获得更大的样本,从而得出更可靠的结论。发现一些潜在问题。 • Schutz FA,Richards CJ,Je Y,et al. Meta-Analysis of Randomized Controlled Trials for the Incidence and Risk of Treatment-Related Mortality in Patients With Cancer Treated With Vascular Endothelial Growth Factor Tyrosine Kinase Inhibitors. J Clin Oncol. 2012 Feb 6.
“统计笑话” • 一位统计学家得到信息:“每一百万乘坐飞机人中只有一个人会携带炸弹”。 于是他每次坐飞机要携带一个炸弹。 被机场管理员发现后,他解释原因说: 一架飞机上有一个人携带炸弹的几率是百万分之一,同时有两个人携带炸弹的几率是万亿分之一,所以不可能发生。
Thank you very much for your attention! http://www.medsci.cn 电话 400-640-8988 021-64087586/64088675/64085339 传真 021-64085875 Email: editing@medsci.cn