870 likes | 1.09k Views
SPSS 16 实用教程. 第 6 章 相关分析. 6.1. 6.2. 相关分析的基本概念. 二元定距变量的相关分析. 6.3. 二元定序变量的相关分析. 6.4. 6.5. 偏相关分析. 距离相关分析. 描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相关分析。可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。本章介绍常用的相关分析方法:二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析。. 6.1 相关分析的基本概念.
E N D
SPSS 16实用教程 第6章 相关分析
6.1 6.2 相关分析的基本概念 二元定距变量的相关分析 6.3 二元定序变量的相关分析 6.4 6.5 偏相关分析 距离相关分析
6.1 相关分析的基本概念 任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。
相关系数的取值范围在−1和+1之间,即−1≤r≤+1。其中:相关系数的取值范围在−1和+1之间,即−1≤r≤+1。其中: 若0<r≤1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同; 若−1≤r<0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;
为了判断r对ρ的代表性大小,需要对相关系数进行假设检验。为了判断r对ρ的代表性大小,需要对相关系数进行假设检验。 (1)首先假设总体相关性为零,即H0为两总体无显著的线性相关关系。 (2)其次,计算相应的统计量,并得到对应的相伴概率值。如果相伴概率值小于或等于指定的显著性水平,则拒绝H0,认为两总体存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝H0,认为两总体不存在显著的线性相关关系。
在实际中,因为研究目的不同,变量的类型不同,采用的相关分析方法也不同。比较常用的相关分析是二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离分析。在实际中,因为研究目的不同,变量的类型不同,采用的相关分析方法也不同。比较常用的相关分析是二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离分析。
6.2 二元定距变量的相关分析 二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相关分析和二元定序变量的相关分析。
在二元变量的相关分析过程中比较常用的几个相关系数是Pearson简单相关系数、Spearman和Kendall's tua-b等级相关系数。
6.2.1 统计学上的定义和计算公式 定义:二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行分析。 定距变量又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量、“收入”变量、“成绩”变量等都是典型的定距变量。
Pearson简单相关系数用来衡量定距变量间的线性关系。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。
计算公式如下。 Pearson简单相关系数计算公式为
对Pearson简单相关系数的统计检验是计算t统计量,公式为对Pearson简单相关系数的统计检验是计算t统计量,公式为 t统计量服从n−2个自由度的t分布。
6.2.2 SPSS中实现过程 研究问题 某班级学生数学和化学的期末考试成绩如表6-1所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。
实现步骤 图6-1 在菜单中选择“Bivariate”命令
6.2.4 绘制相关散点图 如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。
实现步骤 图6-4 在菜单中选择“Scatter/Dot”命令
结果和讨论 图6-7 散点图
6.3 二元定序变量的相关分析 6.3.1 统计学上的定义和计算公式 定义:定序变量又称为有序(ordinal)变量、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如,“最高学历”变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学本科、6—研究生以上。由小到大的取值能够代表学历由低到高。
Spearman和Kendall's tua-b等级相关系数用以衡量定序变量间的线性相关关系,它们利用的是非参数检验的方法。 计算公式如下。 Spearman等级相关系数为
对Spearman等级相关系数的统计检验,一般如果个案数n≤30,将直接利用Spearman等级相关统计量表,SPSS将自动根据该表给出对应的相伴概率值。对Spearman等级相关系数的统计检验,一般如果个案数n≤30,将直接利用Spearman等级相关统计量表,SPSS将自动根据该表给出对应的相伴概率值。
对Kendall's tua-b等级相关系数的统计检验,一般如果个案数n≤30,将直接利用Kendall's tua-b等级相关统计量表,SPSS将自动根据该表给出对应的相伴概率值。
6.3.2 SPSS中实现过程 研究问题 某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量“作文1”和“作文2”,数据如表6-2所示。问两次评分的等级相关有多大,是否达到显著水平?
实现步骤 图6-8 “Bivariate Correlations”对话框(二)
6.4 偏相关分析 二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。
6.4.1 统计学上的定义和计算公式 定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。 偏相关分析的工具是计算偏相关系数r12,3。
6.4.2 SPSS中实现过程 研究问题 某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表6-3所示。现求降雨量对产量的偏相关。
实现步骤 图6-9 在菜单中选择“Partial”命令