770 likes | 1.1k Views
第 12 章 非参数检验. 说明:非参数检验这章,请看下面吴喜之教授的讲义,更为具体的可参看 《 统计分析与 SPSS 的应用 》 薛薇 编著 人大出版社, 2002.7 第二次印刷. 非参数检验的概念. 是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。. 非参数检验的过程. 1. Chi-Square test 卡方检验
E N D
第12章 非参数检验 说明:非参数检验这章,请看下面吴喜之教授的讲义,更为具体的可参看《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念 • 是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。 • 这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。
非参数检验的过程 • 1. Chi-Square test 卡方检验 • 2. Binomial test二项分布检验 • 3. Runs test 游程检验 • 4. 1-Sample Kolmogorov-Smirnov test 一个样本柯尔莫哥洛夫-斯米诺夫检验 • 5. 2 independent Samples Test 两个独立样本检验 • 6. K independent Samples Test K个独立样本检验 • 7. 2 related Samples Test 两个相关样本检验 • 8 . K related Samples Test 两个相关样本检验
12.1 卡方检验 Chi-Square test • 这里介绍的卡方检验可以检验列联表中某一个变量的各个水平是否有同样比例或者等于你所想象的比例(如5:4:1) • 实例1:掷骰子300次,变量LMT,1、2、3、4、5、6分别代表六面的六个点,试问这骰子是否均匀。数据data12-01(300个cases)。 • Analyze-> Nonparametric Tests->Chi Square • Test Variable: lmt 想要检验的变量 • 由于这是一个均匀分布检测,使用默认选择(Expected Values:All categories equal作为零假设); • 比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均匀。 • 实例1的数据可以组织成:两个变量(side面和number次数),6个cases。但在卡方检验前要求用number加权。结果同。
补充:卡方检验实例 • 实例:心脏病人猝死人数与日期的关系,收集168个观测数据。其中用1、2、3、4、5、6、7表示是星期几死的。而人数分别为55、23、18、11、26、20、15。推断心脏病人猝死人数与日期的关系是否为2.8:1:1:1:1:1:1。(变量2个:死亡日期和死亡人数,Cases 7个) • 加权:Data->Weight Cases:死亡人数 • Analyze-> Nonparametric Tests->Chi Square • Test Variable:死亡日期 • Expected Values: 2.8:1:1:1:1:1:1 • 比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 。
12.2 二项分布检验 Binomial test • 二项分布:在现实生活中有很多的取值是两类的,如人群的男和女、产品的合格和不合格、学生的三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是P,则另一类出现的概率就是1-P。这种分布称为二项分布。 • 实例1:掷一枚比赛用的挑边器31次,变量tbh,1为出现A面、2为出现A面,试问这挑边器是否均匀。数据data12-03(31个cases)。 • Analyze-> Nonparametric Tests-> Binomial • Test Variable: tbh • 由于这是一个均匀分布检测,使用默认选择(Test Proportion:0.5); • 比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假设,认为挑边器是均匀。 • 实例1的数据可以组织成:两个变量(side面和number次数),2个cases。但在二项分布检验前要求用number加权。结果同。
补充:二项分布检验实例 • 实例:为验证某批产品的一等品率是否达到90%,现从该批产品中随机抽取23个样品进行检测,结果有19个一等品(1-一等品,0-非一等品)。(变量2个:一等品和个数,Cases 2个:1 19 和0 4) • 加权:Data->Weight Cases:个数 • Analyze-> Nonparametric Tests-> Binomial • Test Variable:一等品 • Test Proportion:0.9 • 比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假设,认为该批产品的一等品率达到了90% 。
12.3 游程检验Runs test • 单样本变量随机性检验是对某变量值出现是否随机进行检验。 • 实例1(同二项分布检验):掷一枚比赛用的挑边器31次,变量tbh,1为出现A面、2为出现A面,试问这挑边器出现AB面是否随机。数据data12-03(31个cases)。 • Analyze-> Nonparametric Tests-> Runs • Test Variable: tbh • Cut Point:Custom:2 • 比较有用的结果: 总case数(31)、 游程Run数(21)、 sig=.142>0.5, 不能拒绝零假设, 认为挑边器出现AB面是随机的。
12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验1-Sample Kolmogorov-Smirnov test • 单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,适用于探索连续型随机变量的分布形态(判断定距变量的分布情况):Normal正态分布、Uniform均匀分布、Poisson泊松分布、Exponential指数分布。 • 实例:卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒的时间间隔里到达某个计数器的由某块放射物资放出的alfa粒子质点数,共观察了2608次。数据data12-05(1个变量zd, 2608个cases,按0-10排序)。试问这种分布规律是否服从泊松分布 • Analyze-> Nonparametric Tests->1-Sample K-S • Test Variable: zd • Test Distribution: Poisson • 比较有用的结果: 均值(3.8673)、 sig=.850>0.5, 不能拒绝零假设, 认为服从泊松分布。
12.5 两个独立样本检验2 independent Samples Test • 通过分析两个样本数据,推断它们的分布是否存在显著性差异。方法有四种: • Mann-Whitney U:是通过对平均秩的研究来实现推断的 • K-S Z:是通过对分布的研究来实现推断的 • Moses extreme reactions:一个作为控制样本,另一个作为实验样本 • Wald Wolfwitz Runs:是通过对游程的研究来实现推断的 • 实例:甲乙两种安眠药服用后的效果。数据data12-06(2个变量: 组别zb和延长时间ycss, 20个cases)。试问这两种药物的疗效是否有显著性差异。 • Analyze-> Nonparametric Tests-> 2 independent Samples • Test Variable: ycss • Grouping: zb(1,2) • Test type:四种均选 • 比较有用的结果:比较四个sig值,有三个sig>.5,不能拒绝零假设认为疗效无显著性差异。
12.6 多个独立样本检验K independent Samples Test • 通过分析多个样本数据,推断它们的分布是否存在显著性差异。方法有三种: • Median:是通过对中位数的研究来实现推断的 • K-W:是通过对推广的平均秩的研究来实现推断的 • J-T:与两个独立样本检验的Mann-Whitney U类似 • 实例:某车间用四种不同的操作方法检测产品优等品率的实验数据。数据data12-07(2个变量: 方法ff和优等品率ydpl, 21个cases)。试问这四种不同的操作方法对产品优等品率是否有显著性差异。 • Analyze-> Nonparametric Tests-> K independent Samples • Test Variable: ydpl • Grouping: ff(1,4) • Test type:三种均选 • 比较有用的结果:比较三个sig值,K-W方法的sig=.009<.05, 拒绝零假设,认为这四种不同的操作方法对产品优等品率是有显著性差异。其他二个方法的sig>.5,但不用,原因是观测量太少。
12.7 两个相关样本检验2 related Samples Test • 同一个被测试者,前后测两次,彼此相关。方法有四种。 • 实例:某校15名男生的长跑锻炼后晨脉变化数据。数据data12-08(2个变量: 锻炼前dlq和锻炼后dlh优, 21个cases)。试问锻炼前后的晨脉有无显著性差异。 • Analyze-> Nonparametric Tests-> 2 related Samples • Test Pairs: dlq-dlh • Test type:选一种或多种 • 比较有用的结果:看sig值,sig<.05, 拒绝零假设,认为锻炼前后的晨脉有显著性的差异。
12.8 多个相关样本检验K related Samples Test • 对多个被测试者,多个打分,看打分是否有显著性差异。方法有三种: • Cochran Q:要求样本数据为二值的(1-满意 0-不满意) • Friedman:利用秩实现 • Kendall协同系数检验:H0:协同系数为0(评分标准不相关的或者是随机的) • 实例:9个顾客对三种款式衬衫的喜爱程度(1-最喜爱 2-其次 3-不喜爱)。数据data12-09(3个变量: 款式A,款式B,款式C, 27个cases)。试问顾客对三种款式衬衫的喜爱程度是否相同。 • Analyze-> Nonparametric Tests-> k related Samples • Test Variables: a b c • Test type:选一种或多种 • 比较有用的结果:看sig值,sig<.05, 拒绝零假设,认为顾客对三种款式衬衫的喜爱程度是不相同的。
补充:非参数检验 • 以下的讲义是吴喜之教授有关非参数检验的讲义,我觉得比书上讲得清楚。
为什么用非参数方法? • 经典统计的多数检验都假定了总体的背景分布。 • 但也有些没有假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行检验。 • 这都称为非参数检验。
为什么用非参数方法? • 这些非参数检验在总体分布未知时有很大的优越性。这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。 • 非参数检验总是比传统检验安全。 • 但是在总体分布形式已知时,非参数检验就不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 • 但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。
非参数方法 • 这里介绍一些非参数检验。 • 关于非参数方法的确切定义并不很明确。我们就其最广泛的意义来理解。 • 在计算中,诸如列联表分析中的许多问题都有精确方法,Monte Carlo抽样方法和用于大样本的渐近方法等选择。精确方法比较费时间,后两种要粗糙一些,但要快些。
Xi 15 9 18 3 17 8 5 13 7 19 Ri 7 5 9 1 8 4 2 6 3 10 秩(rank) • 非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升序排列之后,每个观测值的位置。例如我们有下面数据 这下面一行(记为Ri)就是上面一行数据Xi的秩。
秩(rank) • 利用秩的大小进行推断就避免了不知道背景分布的困难。这也是大多数非参数检验的优点。 • 多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。
列联表问题 • 我们讲过列联表的c2检验问题(第七章)。 • 这里介绍的检验可以检验列联表中某一个变量的各个水平是否有同样比例或者等于你所想象的比例。 • 每个检验都可以选择使用精确方法,Monte Carlo抽样方法或用于大样本的渐近方法。 • 利用数据table7.sav,假定你想知道收入的比例是否是5比4比1(零假设)。而且选择精确检验,你可以得到各种检验结果如下:
列联表问题 • 利用数据table7.sav,假定你想知道收入的比例是否是5比4比1(零假设)。而且选择精确检验,你可以得到各种检验结果如下:
列联表问题 • 该结果除了给出了精确检验的p值,表明无论还给出渐近检验的p值;两个都是0.000;这表明零假设的比例欠妥。输出还给出了Pearson统计量中的Oi和Ei(分别为下表中的Observed N和Expected N):
列联表问题 • 如果要检验变量的各水平是否都相等,从SPSS可以得到对这三个变量的检验(对每个变量的零假设是各水平影响相同)结果: SPSS还分别给出对每个变量的Pearson统计量中的Oi和Ei。
SPSS软件使用说明 • 用table7.sav数据。假定已经加权了(number:权) • Analyze-Nonparametric Tests-Chi Square。然后选择想要检验的变量(如income), • 如要检验其水平是否相等,则在Expected Values选All categories equal作为零假设(默认选择); • 如要检验其水平是否为某比例,则在下面Values输入你的比例(我们是5比4比1,逐个输入)作为零假设。 • 点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。 • 如果选入的变量多于一个,则检验的都是水平相等的零假设。最后OK即可。
单样本Kolmogorov-Smirnov检验 • 单样本的Kolmogorov-Smirnov检验(K-S检验)是用来检验一个数据的观测累积分布是否是已知的理论分布。 • 这些作为零假设的理论分布在SPSS的选项中有正态分布(Normal),泊松分布(Poisson) ,均匀分布(Uniform)和指数分布(Exponential)。在SPSS软件中对于是否是正态分布或均匀分布的检验统计量为
数据ksdata.sav的K-S检验 • 我们检验它是否是正态分布、均匀分布和指数分布。输出结果分别显示在下面三个表中: • 由于sig=.074>.05,不能拒绝正态分布(Normal)零假设。
由于sig=.664>.05,不能拒绝指数分布(Exponential)零假设由于sig=.664>.05,不能拒绝指数分布(Exponential)零假设 比较三种分布检验,认为是该数据服从指数分布
SPSS软件使用说明 • 使用我们的ksdata.sav数据。 • 选项为Analyze-Nonparametric Tests-1 Sample K-S。 • 然后把变量(这里是x)选入Variable List。再在下面Test Distribution选中零假设的分布(Normal、Poisson、Uniform和Exponential)作为零假设。 • 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。
关于随机性的游程检验(run test) • 游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由0和1组成的一个这种变量的样本(数据run1.sav): • 0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0 • 其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。 • 这个数据中有4个0组成的游程和3个1组成的游程。一共是R=7个游程。其中0的个数为m=15,而1的个数为n=10。
关于随机性的游程检验(run test) • 出现0和1的的这样一个过程可以看成是参数为某未知p的Bernoulli试验。但在给定了m和n之后,在0和1的出现是随机的零假设之下,R的条件分布就和这个参数无关了。根据初等概率论,R的分布可以写成(令N=m+n)
关于随机性的游程检验(run test) • 于是就可以算出在零假设下有关R的概率,以及进行有关的检验了。利用上面公式可进行精确检验;也可以利用大样本的渐近分布和利用Monte Carlo方法进行检验。利用上面数据的结果是:
关于随机性的游程检验(run test) • 当然,游程检验并不仅仅用于只取两个值的变量,它还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于0和1的个数)是否随机的问题。看下面例子。 • 例 (run2.sav): 从某装瓶机出来的30盒化妆品的重量如下(单位克) • 71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9 • 为了看该装瓶机是否工作正常,首先需要验证是否大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。
关于随机性的游程检验(run test) • 如果把小于中位数的记为0,否则记为1,上面数据变成下面的0-1序列 • 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 • 这就归为上面的问题。当然这里进行这种变换只是为了易于理解。实际计算时,用不着这种变换,计算机会自动处理这个问题的。 • 直接利用这个数据,通过SPSS,得到下面游程检验结果的输出。
SPSS软件使用说明 • 用run2.sav数据。 • 选项为Analyze-Nonparametric Tests-Runs。 • 然后把变量(这里是length)选入Variable List。再在下面Cut Point选中位数(Median)。当然,也可以选其他值,如均值(Mean),众数(Mode)或任何你愿意的数目(放在Custom)。注意在对前面的由0和1组成的序列(run1.sav进行随机性检验时,要选均值(为什么?)。 • 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。
Wilcoxon (Mann-Whitney)秩和检验 • 这里介绍常用的Wilcoxon (或称Mann-Whitney)秩和检验。它的原理很简单, • 假定第一个样本有m个观测值,第二个有n个观测值。把两个样本混合之后把这m+n个观测值升幂排序, • 记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。这两个值可以互相推算,称为Wilcoxon统计量。 • 该统计量的分布和两个总体分布无关。由此分布可以得到p-值。 • 直观上看,如果WX与WY之中有一个显著地大,则可以选择拒绝零假设。 • 该检验需要的唯一假定就是两个总体的分布有类似的形状(不一定对称)。
Wilcoxon (Mann-Whitney)秩和检验 • 下面数据(GDP.sav)是地区1的十个城市和地区2的15个城市的人均GDP(元)。现在要想以此作为两个样本来检验两个地区的人均GDP的中位数m1和m2是否一样,即双尾检验H0: m1=m2对Ha: m1≠m2。由于地区2的人均GDP的中位数大于地区1的中位数,因此也可以做单尾检验H0: m1=m2对Ha: m1<m2。 • 地区1:3223 4526 3836 2781 5982 3216 4710 5628 2303 4618 • 地区2:5391 3983 4076 5941 4748 4600 6325 4534 5526 5699 7008 5403 6678 5537 5257 • 由SPSS的输出可以得到下面结果:
Wilcoxon (Mann-Whitney)秩和检验 • 该结果头两行显示了Mann-Whitney和Wilcoxon统计量的值。另外和我们需要结果的相关部分为:对于双尾检验H0: m1=m2对Ha: m1≠m2,p-值为0.016(见“Exact Sig. (2-tailed)”);而对于单尾检验H0: m1=m2对Ha: m1<m2(见“Exact Sig. (1-tailed)”),p-值为0.008。这两个结果是精确计算的。通常在样本量大的时候利用近似方法得到渐近分布的p-值(见“Asymp. Sig. (2-tailed)”),它只给了双尾检验的近似p-值0.017,和精确值差别不大。注意单尾检验的p-值是双尾检验的p-值的一半。这个例子的结果表明,可以拒绝原假设,即有理由认为地区2的人均GDP的中位数要高一些。
SPSS软件使用说明 • 使用GDP.sav数据。 • 选项为Analyze-Nonparametric Tests-2 Independent Samples。 • 把变量(gdp)选入Test VariableList;再把用1和2分类的变量area输入进Grouping Variable,在Define Groups输入1和2。 • 在Test Type选中Mann-Whitney。 • 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可
两样本分布的Kolmogorov-Smirnov检验 • 假定有分别来自两个独立总体的两个样本。要想检验它们背后的总体分布相同的零假设,可以进行两独立样本的Kolmogorov-Smirnov检验。原理完全和单样本情况一样。只不过把检验统计量中零假设的分布换成另一个样本的经验分布即可。假定两个样本的样本量分别为n1和n2,用S1 (X)和S2 (X)分别表示两个样本的累积经验分布函数。再记Dj=S1 (Xj)-S2 (Xj)。近似正态分布的检验统计量为
计算结果 • twonp.sav:两种破坏性试验的持续时间。根据这个数据,n1=30,n2=25。由SPSS输出,得到
SPSS软件使用说明 • 使用twonp.sav数据。 • 选项为Analyze-Nonparametric Tests-2 Independent Samples。 • 把变量(duration)选入Test Variable List;再把用1和2分类的变量type输入到Grouping Variable,在Define Groups输入1和2。 • 在Test Type选中Kolmogorov-Smirnov Z。 • 在点Exact时打开的对话框中可以选择精确方法(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可
两样本Wald-Wolfowitz游程检验 • Wald-Wolfowitz游程检验(Wald-Wolfowitz runs test)和Kolmogorov-Smirnov检验都是看两个样本所代表的总体是否分布类似。但是所采取的方法不一样。Wald-Wolfowitz游程检验把两个样本混合之后,按照大小次序排列,一个样本的观测值在一起的为一个游程。和单样本的游程问题类似。可以由游程个数R看出两个样本在排序中是否随机出现。由twonp.sav数据,可以得到下面SPSS关于Wald-Wolfowitz游程检验的输出:
软件使用:数据和前面一样,只在Test Type选Wald-Wolfowitz runs。
Kruskal-Wallis关于多个样本的秩和检验 • 这个检验的目的是看多个总体的位置参数是否一样。 • 方法和Wilcoxon-Mann-Whitney检验的思想类似。 • 假定有k个总体。先把从这个k个总体来的样本混合起来排序,记各个总体观测值的秩之和为Ri,i=1,…,k。显然如果这些Ri很不相同,就可以认为它们位置参数相同的零假设不妥(备选假设为各个位置参数不全相等)。
Kruskal-Wallis关于多个样本的秩和检验 • 注意这里所说的位置参数是在下面意义上的qi;由于它在分布函数Fi(x)中可以和变元x相加成为F(x+qi)的样子,所以称qi为位置参数。 • 形式上,假定这些样本有连续分布F1,…,Fk,零假设为H0:F1=…=Fk,备选假设为Ha:Fi(x)=F(x+qi),i=1,…,k,这里F为某连续分布函数,而且这些参数qi并不相等。Kruskal-Wallis检验统计量为
Kruskal-Wallis关于多个样本的秩和检验 • 公式中ni为第i个样本量,而N为各个样本量之和(总样本量)。 • 如果观测值中有大小一样的数值,这个公式会有稍微的变化。 • 这个统计量在位置参数相同的零假设下有渐近的自由度为k-1的c2分布。Kruskal-Wallis检验仅仅要求各个总体变量有相似形状的连续分布。