360 likes | 652 Views
t 检验. 假设检验的基本思想 : 小概率反证法,即原假设成立时,若在一次抽样中就发生了小概率事件,则应推翻原假设。 假设检验的两类错误 : Ⅰ 类错误(弃真)、 Ⅱ 类错误(存伪). t 检验. 单样本. 单样本 t 检验. 两样本. 成组设计两样本均数比较的 t 检验 配对设计样本均数比较的 t 检验. 单样本 t 检验. 样本均数与总体均数的比较即单样本的 t 检验通过 One-Sample T Test 过程实现。 建立假设: H 0 : μ = μ 0 ,样本均数与总体均数的差异完全是
E N D
假设检验的基本思想: 小概率反证法,即原假设成立时,若在一次抽样中就发生了小概率事件,则应推翻原假设。 假设检验的两类错误: Ⅰ类错误(弃真)、Ⅱ类错误(存伪)
t 检验 • 单样本 • 单样本t 检验 • 两样本 • 成组设计两样本均数比较的t 检验 • 配对设计样本均数比较的t 检验
单样本t 检验 • 样本均数与总体均数的比较即单样本的 t检验通过 • One-Sample T Test 过程实现。 • 建立假设: • H0:μ= μ0,样本均数与总体均数的差异完全是 • 抽样误差造成。 • H1:μμ0,样本均数与总体均数的差异除了由 • 抽样误差造成外,也反映了两个总体均数确 • 实存在的差异。 • =0.05
单样本t 检验 例1为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了20名健康成年男子,求得其脉搏的均数为74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏数均数为72次/分,能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏数?数据见pulse.sav: 75、74、72、74、79、78、76、69、77、76、70、73、76、71、78、77、76、74、79、77。
单样本t 检验 要检验的变量: pulse 总体均数
单样本t 检验 分析结果 (1) 单样本统计量 • 共有20个测量值,质量均值为75.05次/分,标准差为2.892次/分,标准误为0.647次/分。
差值的均值为3.050,95%可信区间为1.70~4.40。 单样本t 检验 分析结果 (2) 单样本检验 • t值为4.716,自由度为19,双侧检验p值小于0.001,则按所取检验水准0.05,则拒绝H0,接受H1,即表明可认为样本该山区健康成年男子脉搏的均数高于一般健康成年男子。
单样本t 检验 • 1. 总体均数置信区间与t检验的一致性 • 上述分析结果同时给出了均数的置信区间和 t 检验的结果,两者的结论实际上是完全一致的。 • 置信区间可用于回答假设检验的问题,同时这两者又是互为补充的关系:置信区间回答“量”的问题,即总体均数的范围在哪里,而假设检验是回答“质”的问题,即总体均数之间是否存在差异,以及在统计上确认这种差异的把握有多大。 • 置信区间在回答有无统计学意义的同时,还可进一步回答这种差异有无实际意义。
单样本t 检验 • 2. 单样本 t 检验的应用条件 • 当样本例数较小时,一般要求样本取自正态总体。 • 由中心极限定理可知,如果原始数据不服从正态分布,只要样本量足够大,其样本均数的抽样分布仍然是正态的。也就是说只要数据分布不是强烈的偏态,一般而言单样本 t 检验都是适用的。 • 总的来说,单样本 t 检验非常稳健,只要没有明显的极端值,其分析结果都是非常稳定的。
成组设计t 检验 • 两样本均数的比较即两样本 t 检验通过Independent- • Samples T Test过程实现。 • 建立假设: • H0:μ1= μ2,两个样本均数的差异完全是抽样误 • 差造成,两个总体均数相同。 • H1:μ1μ2,两个样本均数的差异除了由抽样误 • 差造成外,两个总体均数确实存在差异。 • =0.05
成组设计t 检验 例2现希望评价两位老师的教学质量,试比较其分别任教的甲、乙两班(设甲、乙两班原成绩相近,不存在差别)考试后的成绩是否存在差异? 见score.sav 甲班:85 73 86 77 94 68 82 83 90 88 76 85 87 74 85 80 82 88 90 93 乙班:75 90 62 98 73 75 75 76 83 66 65 78 80 68 87 74 64 68 72 80
成组设计t 检验 要检验的变量:Score 分组变量
成组设计t 检验 • 定义组别具体数值
成组设计t 检验 分析结果 (1) 各组统计量 • 给出两个班级的各种统计量,包括样本含量、均数、 • 标准差、标准误
成组设计t 检验 分析结果 (2) 两样本检验 方差齐性检验,结果p=0.397表明方差齐。 • 若方差齐,参考Equal variances assumed一行统计量 • 若方差不齐,参考Equal variances not assumed一行统计量
成组设计t 检验 • 应用条件 独立性(independence) 各观察值之间相互独立,不能相互影响 正态性(normality) 各个样本均来自正态总体 方差齐性(homoscedascity) 各个样本所在总体的方差相等
独立性 独立性:在实际应用中,独立性对结果的影响较大,但检验数据独立性的方法比较复杂,一般都是根据资料的性质来加以判断。例如遗传性疾病、传染病的数据可能就存在非独立的问题。如果从专业背景上可以肯定数据不存在这些问题,则一般独立性总是能够满足的。
正态性 • 正态性:在SPSS中,正态分布的考察方法有:偏度系数、峰度系数;直方图、P-P图;也可进行各种假设检验。而最常用的对于正态分布的检验就是K-S单样本检验。 • t检验对资料的正态性有一定的耐受能力,如果资料只是少许偏离正态,则结果仍然很稳健。若偏离正态很远,则最好考虑变量变换,或用非参数方法加以分析。 • 以例2(score.sav)为例,用K-S单样本检验考察数据的正态性。 • 注意:应分组考察正态性,而不是合并进行
正态性 • 为分组进行正态性检验,首先对数据进行拆分
正态性 • 数据拆分后,右下角显示Split File On,表示 • 正处于数据已拆分状态
正态性 正态分布 均匀分布 泊松分布 指数分布
正态性 正态性检验结果 P=0.779,表明数据服从正态分布 P=0.908,表明数据服从正态分布
方差齐性 在上述两样本 t 检验的结果中已经提供了Levene’s检验的结果,在SPSS的Explore过程中提供了更为详细的Levene’s方差齐性检验。
方差齐性 Levene’s方差齐性检验
方差齐性 • Based on Mean:基于均数 • Based on Median:基于中位数 • Based on Median and with adjusted df: • 基于调整自由度的中位数 • Based on trimmed mean:基于截尾均数
配对设计t 检验 • 常用的配对设计有4种情况: • 同一受试对象处理前后的数据 • 同一受试对象两个部位的数据 • 同一样品用两种方法(仪器等)检验的结果 • 配对两个受试对象分别接受两种处理后的数据 • 配对设计均数的比较即配对t检验通过Paired-Samples • T Test 过程实现。 • 建立假设: • H0:µd=0,两种处理没有差别 • H1:µd0,两种处理存在差别 • =0.05
配对设计t 检验 例3用某药治疗10名高血压病人,对每人治疗前、后舒张压(mmHg)进行测量,数据见pair.sav,问该药有无降压作用? 治疗前后的舒张压测量结果
配对设计t 检验 选入配对变量
配对设计t 检验 分析结果 (1) 配对样本统计量 (2) 配对变量相关性分析
配对设计t 检验 分析结果 (2) 配对 t检验 配对差值的统计描述 差值的检验结果 上表的结果可知:t=2.645,p=0.027,按所取检验水准0.05,则拒绝H0,接受H1。治疗前后的差异具有统计学意义,即认为某药对高血压病人有影响。