220 likes | 347 Views
第九节 秩和检验. 秩和检验 基本概念 两样本配对比较 两样本成组比较 多个样本比较 随机区组设计资料秩和检验. 基本概念. (一) 非参数统计 : 不依赖于总体分布形式,应用时可以不考虑被研究对象为何种分布及分布是否已知,其并非是参数间的比较,而是用于分布之间的比较。 (二) 参数统计 : 依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较。. 两类统计方法的优缺点. 参数统计 :检验效率较高,但使用条件较严格; 非参数统计:由于对资料无特殊要求,因此适用范围广,
E N D
第九节 秩和检验 • 秩和检验 • 基本概念 • 两样本配对比较 • 两样本成组比较 • 多个样本比较 • 随机区组设计资料秩和检验
基本概念 (一)非参数统计: 不依赖于总体分布形式,应用时可以不考虑被研究对象为何种分布及分布是否已知,其并非是参数间的比较,而是用于分布之间的比较。 (二)参数统计: 依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较。
两类统计方法的优缺点 参数统计:检验效率较高,但使用条件较严格; 非参数统计:由于对资料无特殊要求,因此适用范围广, 但统计效率较低,即不够精确,犯第二类错 误的可能性大于参数检验。 其中最常用的是χ2检验、秩和检验,及等级 相关分析. 使用选择: 首先考虑参数检验,当条件不符,才选择非参数统计方法。
计量资料的非参数检验 秩和检验
非参数统计适用情况 (1)偏态分布资料; (2)总体分布不明资料; (3)数据一端或两端有未确定值; (4)等级资料; (5)方差不齐资料。
一、配对资料差值的符号秩和检验。(Wilcoxon配对法)一、配对资料差值的符号秩和检验。(Wilcoxon配对法) 用于计量配对比较的资料
1、建立假设及确定检验水准 H0:差值总体水平为0。 H1:差值总体水平不为0。 α=0.05 2、计算T值 (1)求差:算出每对差值 (2)编秩:按差值绝对值大小从小到大编秩,并冠以原差值的正负号。 A 若差值为0,可删去不计,不编秩。 B 若差值的绝对值相等,符号相反,则以平均秩次作为每一个差值的秩次,保留原差值符号。 C 若差值完全相等,则按原秩号,不必平均。 (3)求秩和:将正负秩次分别相加,以秩和绝对值小则为T。本例T=8。
3、确定P值,判断结果。 (1)查表法:当n 50 时 得: T0.05, 11 = 10~56,( T0.01, 11 = 5~61) 若 T+或 T-: 落在范围内,则P>0.05; 落在范围外, 则P<0.05; 等于界值, 则P=0.05。 现T=8或58,故 0.01 < P<0.05
基本思想 注意:配对的对子数不能少于6。 本法的基本思想:若H0成立,则样本的正负秩和应较接近于T值的均数n(n+1)/4,T值不会很小。若正负秩和相差悬殊,则T值特别小,则在H0成立的情况下,由于抽样误差所至的可能性很小,当P<α时,拒绝H0。 随着n增大,T的分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的正态分布。N>50时,可用u-T代替秩和检验。
二、成组设计两样本比较的秩和检验(Wilcoxon法)二、成组设计两样本比较的秩和检验(Wilcoxon法) 两组小白鼠发癌后生存日数 试验组 对照组 生存日数 秩次 生存日数 秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上 22 11 11 12 12.5 1314 N1=10 T1=170 N2=12 T2=83
假设: • H0:两种人的血铁蛋白总体分布相同 • H1: 两种人的血铁蛋白总体分布不同 • = 0.05 • 编秩: • 两组数据混合后按大小顺序编秩; • 如遇相等数值,取平均秩次; • 计算各组秩和,以例数较少组秩和为检验统计量T; • 若两组例数相等,两组秩和均可为检验统计量。
(1)查表法: 本例 T = 170 查表得: T0.05, (10,2)= 84~146 T0.01, (10,2)= 79~151 所以 P < 0.01 (2)正态近似法: 当超过附表的范围时(n1>10, n2 - n1 >10) u检验公式为:
三、成组设计多个样本比较的秩和检验(Kruskal-Wallis法三、成组设计多个样本比较的秩和检验(Kruskal-Wallis法 1、普通成组设计多个样本比较的秩和检验 该方法的编秩过程与前者相同,但其统计量的名称和计算方法不同。 统计量 12 Ri2 H = ————(∑——)—3(N+1) N(N+1) ni
例题 不同时间空气中CO2含量(mg/m3) 课前 课中 课后 含量 秩次 含量 秩次 含量 秩次 0.48 1 4.45 12.5 2.95 7 0.53 2 4.73 14 3.07 8 0.55 3 4.77 15 3.18 9 0.55 4 4.82 16 3.20 10 0.58 5 4.89 17 3.30 11 0.62 6 5.00 18 4.45 12.5 Ri 21 92.5 57.5 ni 6 6 6 12 212+92.52+57.52 本例 H = —— ( )— 3(18+1) 18 6 = 14.95
续 确定P值: 若组数k=3,ni≤5,可查H界值表。 若最小样本例数大于 5,则H近似服从v=k—1的χ2分布,可查χ 2界值表。 如本例,n=6,v=3—1=2,查χ2表得P<0.005。按α=0.05水准,拒绝H0,接受H1,故可认为三个不同时间空气中CO2含量有差别。
2、等级资料成组设计多个样本比较的秩和检验2、等级资料成组设计多个样本比较的秩和检验 在χ2检验中曾经讲过,若单项有序列表中等级数大于3 时,用秩和检验更合适。 三种病人肺切除术的针麻效果比较 针麻效果 肺癌 肺化脓症 肺结核 合计 秩次范围 平均秩次 Ⅰ 10 24 48 82 1-82 41.5 Ⅱ 17 41 65 123 82-205 143.5 Ⅲ 19 33 36 88 206-293 249.5 Ⅳ 4 7 8 19 294-312 303.0 Ri 8807 17234 22725.5 ni 50 105 157 312 平均Ri 176.14 164.13 144.75 注意:当各样本相同秩次较多时(超过25%),则要进行校正。不同的秩和检验矫正的方法不同。
续 由于每个等级的频数(即相同秩次的个数)较多,故用矫正公式: H C= H / C = 3.8 , C=1-(tJ3-tJ)/(N3-N) 由于k=3,n均大于5,故按v=3—1查χ2界值表, 0.25<p<0.10,按α=0.05水准,不拒绝H0,故可认为三种病人肺切除术的针麻效果无差别。
四、多个样本两两比较的秩和检验(Nemenyi法)四、多个样本两两比较的秩和检验(Nemenyi法) 当经过多个样本比较的秩和检验认为各总体分布不同或不全相同时,需要进一步作两两比较的秩和检验,以推断哪两个总体分布存在区别。 1、各样本例数相同 以“不同时间空气中CO2含量”为例 H0:三个时间任两组的空气中CO2含量相同 H1 :三个时间任两组的空气中CO2含量不同α=0.05 求秩和的差值:D= 1 RA—RB 1 查D界值表,比较Dα(n,k)与实际D,若D ≥Dα(n,k),则P<α。本例n=6,k=3,得界值D0.05(6,3)=43.3,D 0.01(6,3)=53.9 。 D1=92.7 -- 21=71.5 >D0.01(6,3),P<0.01 D2=92.5 – 57.5=35 <D0.05(6,3),P>0.05 D3=57.5 -- 21=36.5 <D0.05(6,3),P>0.05 故课前与课中相比,空气中CO2含量有差异,而课中与课后、课前与课后相比差别均无统计学意义。
2、各组样本例数不等 比较各对比组平均秩和之差,该差值与相应的界值比较。 三种病人肺切除术的针麻效果两两比较 对比组 样本含量 平均秩和 √C χ2a, v〔 N(N+1)/12 〕 〔 1/nA+1/nB〕 P A和B nA nB 之差0.05 0.01 一和二 50 105 12.01 35.99 44.63 >0.05 一和三 50 157 31.39 34.01 42.18 >0.05 二和三 105 157 19.38 20.41 32.74 >0.05 本例C=0.9,v=2,N=312, χ20.05,2=5.99, χ20.01,2=9.21。通过两两比较,同样说明三种病人的针麻效果没有差别。
练习 1、以下检验方法除外,均属非参数检验。 A t检验B H 检验C T检验D Χ2检验 2、两小样本比较的假设检验,首先考虑 A t检验 B 秩和检验 C t检验、秩和检验均可 D 资料符合t检验还是秩和检验的条件 3、符合t 检验条件的计量资料如果采用秩和检验,则: A第一类错误增大 B第二类错误增大 C第一类错误减小 D第二类错误减小