370 likes | 497 Views
华西口腔医学杂志 讲座. 在口腔医学论文统计分析中常见的缺陷 与 问题. 四川大学华西公共卫生学院卫生统计学教研室博士生 第四军医大学口腔医学院口腔预防医学教研室副教授 Mar-k@21cn.com 028-85583347. 医学统计学作为一种认识医学现象数量特征的重要工具,在口腔医学研究的过程中起着非常重大的作用。 任何科研设计、实验研究都离不开统计方法,而统计方法的正确与否直接影响到论文的质量。. 统计分析. 统计分析由统计描述和统计推断两大部分组成,是医学统计学的核心。 统计描述包括统计表、统计图和统计指标。 统计推断包括参数估计和假设检验。.
E N D
华西口腔医学杂志 讲座 在口腔医学论文统计分析中常见的缺陷与问题 • 四川大学华西公共卫生学院卫生统计学教研室博士生 • 第四军医大学口腔医学院口腔预防医学教研室副教授 • Mar-k@21cn.com 028-85583347
医学统计学作为一种认识医学现象数量特征的重要工具,在口腔医学研究的过程中起着非常重大的作用。医学统计学作为一种认识医学现象数量特征的重要工具,在口腔医学研究的过程中起着非常重大的作用。 • 任何科研设计、实验研究都离不开统计方法,而统计方法的正确与否直接影响到论文的质量。
统计分析 • 统计分析由统计描述和统计推断两大部分组成,是医学统计学的核心。 • 统计描述包括统计表、统计图和统计指标。 • 统计推断包括参数估计和假设检验。
70年代初,国际著名生物统计学家Feinstein (Feinstein AR. Clinical biostatistics. XXV. Survey of statistical procedures in general medical journals. Clin Pharmacol Ther, 1974,15:97-107.)对美国、英国、加拿大五种权威医学期刊中统计方法的应用状况进行了调查,引起了医学教育界和学术界人士的极大兴趣。
Rosenfeld(1Rosenfeld RM, Rockette HE. Biostatistics in Otolaryngology Journals. Arch Otolaryngol Head Neck Surg, 1991, 117:1172-1176.)等[1]和Juzych(2Juzych MS, Shin DH, Seyedsadr M, et al. Statistical techniques in Ophthalmic Journals. Arch Ophthalmol, 1992, 110:1225-1229.)等[2]的调查比较了不同年代的期刊论文,发现90年代的期刊论文中用复杂的统计分析方法比70、80年代有显著增多。
国际医学界普遍认为,临床论著中统计方法的应用及缺陷状况,既是衡量一个国家、一个时期或一种专业杂志科研论文质量的重要标志,也是医学院校课程改革和继续教育的指南。
我们的调查也有类似的发现,在口腔医学期刊论文中t检验和联列表分析(主要为卡方检验)所占的比例更大。复杂些的统计方法甚至包括方差分析都用的较少。我们的调查也有类似的发现,在口腔医学期刊论文中t检验和联列表分析(主要为卡方检验)所占的比例更大。复杂些的统计方法甚至包括方差分析都用的较少。 • 随着科研设计方法的完善,一些特定统计分析方法应被更广泛地应用于科研报告中,如生存分析中的COX回归分析、多元回归分析、与流行病研究相关的危险度分析、诊断试验评价中的ROC曲线等,但在提倡和推广使用这些较复杂的统计分析时,应注意强调医学科研人员与统计专业人员之间的合作。
二、统计指标选择的缺陷与问题 • 常出现率与构成比,发病率与患病率,死亡率与病死率等的混淆。
把构成比当率 • 构成比是说明事物或现象内部各构成部分的比重,率为表示某种现象发生的频率或强度。它们都是相对数指标,用百分数表示。
发病率与患病率 • 发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比,强调在观察期内的新发病例数。 • 患病率则指观察时点的某病的现患病例数与该时点人口数之比,强调的是该观察时点上某病的现患(新、旧病例)情况。
有人调查男性7674人,龋病患者6235人,发病率为81.25%;女性调查2896人,龋病患者2225人,发病率为76.83%。这显然是错误的,应该是患病率。有人调查男性7674人,龋病患者6235人,发病率为81.25%;女性调查2896人,龋病患者2225人,发病率为76.83%。这显然是错误的,应该是患病率。
死亡率与病死率 • 这也是两个容易混淆的指标。某病死亡率是观察人群中某病的死亡频率,一般以10万分率表示;某病病死率是某病患者中因该病而死亡的频率,一般以百分率表示。前者反映人群因该病而死亡的频率,后者反映疾病的预后。部分作者常将某病住院病死率误为某病死亡率。
华西口腔医学杂志对来稿中资料的表达与描述的有关要求:用±s表达近似服从正态分布的定量资料、用M(QR)表达呈偏态分布的定量资料;用相对数时,分母不宜小于20,要注意区分百分率与百分比。
三、统计方法选择与使用的缺陷与问题 • 选用统计方法之前应首先确定是计数资料还是计量资料。
计数资料是先将观察单位按性质或类别进行分组,然后清点各观察单位的个数所得的资料,如根据治疗结果计算出的治愈率、有效率、病死率、阳性率等。 • 计量资料是对每个观察单位用定量方法测定某项指标数值大小所得的资料,如身高、体重、脉搏、血压、浓度、白细胞总数等。
计数资料最常用的统计方法为χ2检验或U检验。计数资料最常用的统计方法为χ2检验或U检验。 • 计量资料最常用的统计方法为t检验(或F检验)。
应用t检验的条件是:当样本含量较小时,要求样本符合或近似正态分布;当两样本均数比较时,两样本方差相等;应用t检验的条件是:当样本含量较小时,要求样本符合或近似正态分布;当两样本均数比较时,两样本方差相等; • 当样本不符合正态分布时,应采用t’检验代替t检验; • 当两样本方差不等时,应采用秩和检验或t’检验。
(1)在需要进行统计学分析时没有进行统计学分析。 • 使用了统计学分析,但未说明是什么方法,也是较常见的问题。 • 表现为论文中只有P值,但看不出使用的是哪种检验方法和统计量的大小。 • 在这种情况下,读者无法对统计学方法的正确性进行评价。 • 由于大部分文章的数据分布无法从文章中得知,不符合检验假设的比例可能更高。
(2)标准误代替标准差。 • 研究数据一般综合表示为均数±标准差,标准差表示这些研究数据相对于均数的离散程度,而标准误的含义则完全不同,所以用标准误代替标准差是错误的。但更多的情况是作者没有说明应用的是标准差还是标准误,应该在文章中说明。
(3)应用的统计学方法所要求的前提条件不具备 • 对计量资料的统计数据经常用t检验或F检验。 • 经常出现把非参数计量资料的数据用参数统计方法进行处理。 • 如t检验要求资料呈正态分布,但许多明显偏态分布的资料作者也使用t检验。 • 如微量元素(血铅、血锌、尿汞)等数据经常出现偏态分布。当数据呈偏态分布时小样本(n<50)不能用参数统计方法(t检验或F检验),而应该用非参数统计方法(参比差值法或秩和检验)或进行数据转换(倒数或对数)后用参数统计方法。
用t检验代替方差分析进行多组间两两比较,这种错误非常常见,应该用方差分析对三组间的各种指标进行比较而不是用t检验进行各组间两两比较。用t检验代替方差分析进行多组间两两比较,这种错误非常常见,应该用方差分析对三组间的各种指标进行比较而不是用t检验进行各组间两两比较。 • 用成组t检验代替配对t检验,对配对资料的分析忽视了配对特性。 • 卡方检验代替精确概率法。 • 将同一受试者的多次重复测量结果作为独立资料进行分析。
(5)在使用多元回归分析的文章中 • 存在所用分析方法的名称不详(如是Logistic回归,还是多元线性回归)、变量定义不明、自变量选择不恰当(如变量间存在自相关或不恰当的因果关系)、在结果变量为二分变量时使用多元线性回归等问题。 • 有的文章在结果中仅列出多元回归分析的P值而无回归分析的结果或有关的重要参数。
华西口腔医学杂志对来稿中统计分析方法的选择的有关要求华西口腔医学杂志对来稿中统计分析方法的选择的有关要求 • 对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因素方差分析。 • 对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用χ2检验。
华西口腔医学杂志对来稿中统计分析方法的选择的有关要求华西口腔医学杂志对来稿中统计分析方法的选择的有关要求 • 对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资料,不应简单化处理。 • 对于多因素、多指标资料,要在一元分析的基础上,尽可能运用多元统计分析方法,以便对因素之间的交互作用和多指标之间的内在联系作出全面、合理的解释和评价。
四、统计表图不规范 • 使用统计表图以阐说疾病发生发展的客观规律,评价防治措施的效果。 • 正确的统计表应该是简单、明了,能够说明各统计量之间关系和差异的三线式统计表。 • 现在论文中常见的统计图有直条图、构成图、普通线图、半对数线图和直方图等,各种统计图有各自的绘制方法。
统计表常见的问题是标题过于简略或繁琐,且时间、地点和内容交待不清;或标目过多,文字欠简明,层次不清;线条过多,填写阿拉伯数字没有对位,保留小数的位数不一致等。统计表常见的问题是标题过于简略或繁琐,且时间、地点和内容交待不清;或标目过多,文字欠简明,层次不清;线条过多,填写阿拉伯数字没有对位,保留小数的位数不一致等。 • 统计图常见的问题是选择不合适,如有的纵、横座标比例不当,有的标题本应放在图下,而放在图的上方或侧面等。
华西口腔医学杂志对来稿中统计表和图的有关要求华西口腔医学杂志对来稿中统计表和图的有关要求 • 用统计表时,要合理安排纵横标目,并将数据的含义表达清楚。 • 用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则。
五、统计结果解释的缺陷与问题 • 主要表现在对P值的含义理解错误。 • 另一个问题为结论依据不足。
华西口腔医学杂志对来稿中统计分析结论的表述要求华西口腔医学杂志对来稿中统计分析结论的表述要求 • 应写出描述性统计量(如样本均数、率、相关系数、相对危险度等)及其可信区间,检验统计量(如χ2、t、u、F值),P值,然后根据P值大小作出统计学推断,并作出相应的医学专业结论。
P值的含义 • 数理统计的基础是概率论,对统计分析的资料下结论的依据是小概率事件在一次试验中是不可能发生的。 • 一般统计上习惯把概率P≤0.05或P≤0.01认为是小概率事件。 • 当通过假设检验(显著性检验)获得P>0.05时,认为是大概率事件,说明在这一次试验中很可能发生,因此接受假设,认为差异无显著意义(差异不显著)。 • 反之,若P≤0.05,则认为差异有显著意义,P≤0.01差异有非常显著意义,也就是说P越小,就越有理由认为被比较的均数或率之间有差异。
至于两者差异有多大,这要由它们之间实际相差有多大再结合专业知识来确定。不是由P≤0.05,还是P≤0.01来决定。一般统计上说的“差异显著”(P≤0.05),“差异非常显著”( P≤0.01)是统计学的术语,它不同于一般意义上的“显著”概念。
再有通过统计分析被比较的均数或率是否被认为有差别,决定于被研究事物有无本质差异和抽样误差的大小(又决定于个体差异的程度和样本例数的多少),以及选用检验水准α的高低,而检验水准的高低是根据分析要求确定的。 • 在实际应用中有一定的灵活性,即使取同一检验水准,其样本差异虽无显著意义,当增加样本例数,由于减少了抽样误差,可能差异有显著意义。因此,P接近显著水准α时,下结论要慎重。
有的人只凭少量的统计资料就作出“有差异”、“无差异”的判断,并对所调查的数据下结论,是不科学的。有的人只凭少量的统计资料就作出“有差异”、“无差异”的判断,并对所调查的数据下结论,是不科学的。 • 还有的作者将统计学显著性差异的大小与组间差异的大小相混淆,错误地认为P值越小,组间差异越大。
评价一项研究结果是否有价值,要看其是否有临床意义和统计学意义两个方面,当然最理想的是两个方面都有意义。如果差异本身没有临床意义,可以不必进行统计学检验,因为如果样本足够大,均会取得统计学上有显著意义的结果。评价一项研究结果是否有价值,要看其是否有临床意义和统计学意义两个方面,当然最理想的是两个方面都有意义。如果差异本身没有临床意义,可以不必进行统计学检验,因为如果样本足够大,均会取得统计学上有显著意义的结果。 • 医学论文中,常发现作者仅根据统计学检验有显著性就断定研究结果有意义,而不管研究结果是否有临床意义。相反,如果统计学检验结果没有显著性意义,尽管研究结果本身有重要的临床意义,也会作出没有效果的结论。下结论时,不仅根据统计学的结论,还要根据专业知识来判断。
在结果解释方面常见的另一个问题为结论依据不足。在结果解释方面常见的另一个问题为结论依据不足。 • 有些科研设计因为本身的局限性,不可能得出肯定的结果,但可以为以后的研究提供有价值的线索。 • 有些作者往往忽视自身科研设计的缺陷,贸然得出肯定结论。
华西口腔医学杂志对来稿中统计结果的解释和表达的有关要求华西口腔医学杂志对来稿中统计结果的解释和表达的有关要求 当P<0.05(或P<0.01)时,应说对比组之间的差别具有显著性(或非常显著性)的意义,而不应说对比组之间具有显著性(或非常显著性)的差别。 应写明所用统计分析方法的具体名称(如:成组设计资料的t检验、两因素析因设计资料的方差分析、多个均数之间两两比较的q检验等),统计量的具体值(如:t=3.45,χ2=4.68,F=6.79等),应尽可能给出具体的P值(如:P=0.0238); 当涉及到总体参数(如总体均数、总体率等)时,在给出显著性检验结果的同时,再给出95%置信区间。