580 likes | 748 Views
等级资料常用检验方法. 临床流行病学应用研究室 周罗晶. 等级资料定义:. 在医学资料中,特别是临床医学资料中,常常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、症状严重程度的临床分级、中医诊断的一些临床症状等, 对这些指标常采用分成若干等级然后分类计数的办法来解决它的量化问题 ,这样的资料我们在统计学上称为有序变量( ordered variable )或半定量资料,也称为等级资料( ranked data )。. 特点: 观察结果具有等级差别。. 等级资料划分的两种情况:.
E N D
等级资料常用检验方法 临床流行病学应用研究室 周罗晶
等级资料定义: 在医学资料中,特别是临床医学资料中,常常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、症状严重程度的临床分级、中医诊断的一些临床症状等,对这些指标常采用分成若干等级然后分类计数的办法来解决它的量化问题,这样的资料我们在统计学上称为有序变量(ordered variable)或半定量资料,也称为等级资料(ranked data)。
特点:观察结果具有等级差别。 等级资料划分的两种情况: • 按性质划分:如药物疗效分为痊愈、显效、好转、无效;麻醉效果分为Ⅰ、Ⅱ、Ⅲ、Ⅳ级等。 • 按数量分组:数据两端不能确切测定的计量资料。如抗体滴度分为>1:20,1:20,1:40,1:80,<1:80;年龄分为<10,10~, 20~,40~,≥60等。
? 等级资料的分析方法是否和 一般计数资料的检验方法相同呢? 等级资料的分析应该选用什么方法?
实例1考察硝苯地平治疗老年性支气管炎的疗效,治疗组60人,用硝苯地平治疗,对照组58人,常规治疗,两组患者的性别、年龄、病程无显著性差异,治疗结果见表1。实例1考察硝苯地平治疗老年性支气管炎的疗效,治疗组60人,用硝苯地平治疗,对照组58人,常规治疗,两组患者的性别、年龄、病程无显著性差异,治疗结果见表1。
1、建立数据库 • 在变量窗口“variable view”中设定变量 • 在数据窗口“data view”中录入数据 • 使用“Weight Cases”过程权重记录 • SPSS软件默认一行就是一条记录,而我们是以频数格式录入数据,即相同的观测值只录入一次,另加一个频数变量(count)用于记录该数值共出现的次数。因此我们使用此过程:
2、卡方检验 分析结果:
结论: 两组疗效的构成百分比差异无统计学意义。 两组的疗效无差别。 (×)
注意: 一般的χ2检验不适用于有序分类资料——“等级”、“程度”、“优劣”的比较分析。因为检验只利用了两组构成比提供的信息,损失了有序指标包含的“等级”信息。
例如,假定两组的显效例数和有效例数互换,见表2。例如,假定两组的显效例数和有效例数互换,见表2。 显然,两组反映的信息是不同的,但由于两组的结构百分比无变化(仅仅是位置不同),不改变检验结果。(χ2=5.224,P>0.05)
等级资料正确的统计分析方法: • 非参数统计的秩和检验 • Kendall 、spearman等级相关 • CMH卡方检验 • Ridit分析 • 线性趋势卡方检验 • 有序变量的Logistic回归分析
一、非参秩和检验 由于非参数检验法不考虑数据的分布规律,检验不涉及总体参数,检验统计量多是人们在总结经验的基础上创造出来的,所以这类检验方法的特点是针对性强。但是不同设计、不同目的所用的非参数检验法是不同的。
v单向有序行列表 在表的两个方向上的分类中,一个方向(横向)无顺序和等级概念,另一个方向(纵向)是有顺序的分类,称为单向有序行列表。
两组独立样本等级资料比较的Mann- Whitney秩和检验 以表1为例。将无效、有效、显效三个疗效等级数量化,数值用平均秩号,然后比较各组平均秩号的大小。
计算两组秩号并进行秩和检验 两组的平均秩号分别为: 治疗组:R1= (6×10.5+19×40+35×89)/60 =65.6 对照组:R2=(14×10.5+20×40+24×89)/58=53.1 经秩和检验,u=2.169,P<0.05,两组疗效差异有统计学意义,因为治疗组平均秩号大于对照组,所以治疗组疗效好。
SPSS窗口操作过程: • Analyze —— • Nonparametric Tests —— • 2 independent Samples —— Test variable List :result —— Grouping variable :group —— Define groups:group1:1;group2:2 ,—— Test Type :Mann-Whitney —— • OK
μ=-2.169,P<0.05 结论:两组疗效差异有统计学意义,且治疗组效果好于对照组。
同样方法,对表2数据进行秩和检验,结果如下:同样方法,对表2数据进行秩和检验,结果如下:
μ=0.731,P>0.05 结论:两组疗效差异没有统计学意义。
两组配对样本等级资料比较的Wilcoxon秩和检验 • 多组等级资料比较的Kruskal-Wallis秩和检验 该方法对K (K>2)组独立样本进行K个总体分布函数相同假设的检验,是在Wilcoxon秩和检验基础上扩展的方法,称为K-W检验。
例2对54例牙病患者的64颗患牙的根端形态不同分为3种,X线片显示喇叭口状为A型,管壁平行状为B型,管壁由聚状为C型例2对54例牙病患者的64颗患牙的根端形态不同分为3种,X线片显示喇叭口状为A型,管壁平行状为B型,管壁由聚状为C型 比较不同根端形态患牙的疗效有否差别。
SPSS软件操作步骤: 1、建立数据库 1.1定义变量 group: 1 A型 2 B型 3 C型 result: 1成功 2进步 3失败 count: 例数 1.2录入数据 1.3权重频数
2、分析: • Analyze —— • Nonparametric Tests —— • K independent Samples —— Test variable List :result —— Grouping variable :group —— Define range:minimum:1;maximum:3—— Continue —— Test Type :Kruskal-WallisH—— • OK
H =6.528,P =0.038 结论:按α=0.05的检验水平,三组间差异有统计学意义。
注意: 计算结果中显示的χ2值并不是χ2检验,只是Kruskal-Wallis Test的检验统计量H,此时近似χ2分布,所以按χ2分布的近似值来确定概率,它的自由度υ = 组数-1。
双向有序资料行列表——Kendall等级相关法和Spearman等级相关分析法双向有序资料行列表——Kendall等级相关法和Spearman等级相关分析法 例3 某病病情与疗效的关系
两表的区别仅在于病情“极重”组和“中”组的数据进行了互换。两表的区别仅在于病情“极重”组和“中”组的数据进行了互换。
分别对上面两个表格数据进行χ2检验和多组等级资料比较的Kruskal-Wallis秩和检验。分别对上面两个表格数据进行χ2检验和多组等级资料比较的Kruskal-Wallis秩和检验。 对于表4: χ2=40.000,P=0.000 H=24.896 ,P=0.000 对于表5: χ2=40.000,P=0.000 H=24.896 ,P=0.000 两种检验都无法表达表4和表5的差别,直观地看,表4的资料显示病情越轻者疗效越好,表5却未显示这种趋势来。
此时我们选用Kendall和Spearman等级相关分析法分别计算相关系数t和rs。此时我们选用Kendall和Spearman等级相关分析法分别计算相关系数t和rs。 计算公式: n:总例数 m:最长对角线上的格子数 S:专用统计量 t = Kendall等级相关意义:当一个变量的等级为标准时,另一个变量的等级与它不一致的情况(可分析两个以及多个变量间的等级相关性)。
Spearman等级相关公式: n:总例数 d:每一对值的等级差 rs = 1- Spearman等级相关意义:两个变量之间的等级相关性。 (只适用于分析两个变量关系)
SPSS操作演示: 1.建立数据库 2.录入数据 3.权重频数 4.界面操作(以表4为例): Analyze —— Correlate —— Bivariate ——Row(s):疗效—— Column(s) :病情 —— Statistics —— Kendall’s tau-b ,Spearman—— OK
重复测量等级资料时间趋势检验 ——CMH卡方检验 实例4 在某药治疗闭塞性动脉炎的临床试验中,治疗26例下肢溃疡的病人溃疡改善情况见表6,评价该药有无促进溃疡愈合的作用。
本例特点:1.个体的重复测量 2.溃疡随时间的变化趋势 CMH卡方检验, Cochran-Mantel-Hansel检验简称 ,包括非零相关、行平分差和一般联系3种检验方法。对于这种重复测量的等级变量,行列变量均为等级变量,应该作非零相关检验。本方法仅限于检验线性趋势。
计算公式: Qcs = 结果:χ2 = 4.7424,P = 0.0294 结论:溃疡改善程度随着治疗时间延长有变好的趋势。
多组等级资料的两两比较——Ridit分析 Ridit是“Relative to an identified distribution integral transformation”的首个字母缩写,意指对于一个确认的分布作积分变换。 Ridit分析是一种关于等级资料进行对比组与标准组比较的假设检验方法,其基本思想是先确定一个标准组作为特定总体,求得各等级的Ridit值,标准组平均Ridit值理论上可以证明等于0.5,其他各组与标准组比较,看其可信区间是否与0.5重叠,来判断组间的统计学显著性,最后得出专业解释。
Ridit分析适用范围: 1.两组或两组以上等级资料的比较和分析 2.两端数据不确切的计量资料分组转换成计数资料的分析,如血清滴度等。 特点:简便、直观、适用性广。
Ridit分析关键步骤: 一、确定标准组: 1.利用已知的标准分布(传统方法)作为标准组。如某药物大规模的观察研究结果,计算不同疗效的R值。 2.以例数最多的一组作为标准组。 3.各组的例数都差不多时,可把各组观察结果合并起来作为标准组。
Ridit分析关键步骤: 二、计算标准组的Ridit值: 三、利用对照组计算各组的平均R值 四、置信区间判断 五、统计检验:u检验、t检验、χ2检验
Ridit分析(实例5 ): 表7 三种方剂对某妇科病患者治疗效果比较
PEM3.1操作过程: 1.建立数据库 1.1 定义变量名 1.2 录入数据 2.界面操作: 其他统计分析—— Ridit分析—— 分析目的:多个样本比较—— 分组变量:分组—— 类别变量:类别—— 频数变量:例数—— 确定
主要结果: 检验水准: α=0.05 选用同一参照组 (各样本合计为参照组) 样本数 k=3 等 级 数: 4
各样本平均R───────────────────样本名 频数合计 平均R ───────────────────第1组 361 0.4819第2组 58 0.6287第3组 77 0.4881─────────────────── 主要结果:
主要结果: 卡方检验: 卡方值 = 13.0887 自由度 v= 3 概 率 P= 0.0044 结论:三种药物对妇科病的疗效差异有统计 学意义。
三者之间究竟有何种差异呢? 1.标准组平均R值 := 248.00/496 =0.5 2.标准组方差、标准差的计算:
标准组方差、标准差的计算 方差 = [160.16 – 248^2/496]/(496-1)= 0.0730 标准差 = 0.2702