100 likes | 208 Views
第三章 SPSS 数据文件的基本加工和处理 § 3.1 数据文件的整理 一 . 个案排序 概念:排序变量,单值排序,多重排序、主排序变量、第二排序变量。。。 排序步骤:(演示) Data - >Sort Cases 注意: 1) 在多重排序中,排序变量名的次序很关键; 2) 注意保存排序前的数据 二 . 个案选取(演示) 注意: 1 )个案选取后,以后所有的 SPSS 分析操作仅对选中的个案进行,直到再次个案选取。
E N D
第三章 SPSS数据文件的基本加工和处理 §3.1 数据文件的整理 一. 个案排序 概念:排序变量,单值排序,多重排序、主排序变量、第二排序变量。。。 排序步骤:(演示)Data->Sort Cases 注意: 1)在多重排序中,排序变量名的次序很关键; 2)注意保存排序前的数据 二. 个案选取(演示) 注意: 1)个案选取后,以后所有的SPSS分析操作仅对选中的个案进行,直到再次个案选取。 2)采用前三种方式选取个案后,数据编辑窗口自动生成一个名为filter_$的新变量。
职工号 职工号 职工号 工资收入 工资收入 工资收入 职称 职称 职称 020 001 001 1014 879 1014 高级工程师 高级工程师 高级工程师 021 002 002 984 984 879 高级工程师 工程师 工程师 003 003 003 1044 1044 1044 高级工程师 高级工程师 高级工程师 020 879 高级工程师 021 879 高级工程师 003 1044 高级工程师 三. 数据文件的合并 1.纵向合并(Add Cases) 将数据编辑窗口中的数据与另一个SPSS数据文件中的数据首尾对接。 即把另一个文件的内容追加到源文件的下方。 如: 应遵循的条件: (1)两合并文件的内容要有意义; (2)两文件中数据含义相同的变量,最好起相同的变量名。
职工号 职工号 职工号 工资收入 工资收入 奖金 职称 职称 年龄 奖金 年龄 001 001 001 1014 100 1014 高级工程师 36 高级工程师 100 36 002 002 002 984 984 250 工程师 50 工程师 250 50 003 004 003 1044 1044 150 高级工程师 42 高级工程师 004 150 42 2.横向合并(Add Variable) 将另一个SPSS数据文件的若干个变量加到当前数据编辑窗口的数据中。 即把另一个文件的内容加到源文件的右方。 如: . . . . 应遵循的条件:(1)两文件必须至少有一个变量名相同的公共变量; (2)两文件都必须已经排序; (3)数据含义不同的变量,最好不要取相同的变量名;
职工号 职工号 性别 001 年龄 002 收入 003 004 001 性别 男 男 48 男 1014 女 女 002 年龄 男 48 49 49 54 984 41 收入 003 女 1014 984 54 1044 1044 866 004 女 41 866 四. 数据文件的转置 将数据编辑窗口中的数据的行列互换. 如: 注意:字符变量不能进行行列转置。如果强行转置,则变量值将会变成为系统缺失值。
§3.2 数据加工 一. 变量转换 在原有SPSS数据文件的基础之上,根据用户给出的SPSS算数表达式以及函数,对所有个案或满足SPSS条件表达式的个案,计算产生出一系列结果,并将结果存到一个用化指定的SPSS变量中。 1. SPSS算术表达式 由常量、SPSS变量名、SPSS算术运算符、圆括号等组成的式子。 其中: 1)字符型常量应用单引号引起来 2)SPSS变量名是指已经存在于数据编辑窗口中的现有变量名。 3)算术运算符: + 、- 、× 、/ 注意: 1)算数表达式中常量和变量的类型应一致; 2)算数表达式的计算是针对每个个案进行的; 3)存放结果的变量的类型应与计算结果的类型一致。
2. SPSS函数 SPSS函数是由程序员事先编好并存储在SPSS软件中的一段计算机程序。 注意: 1)算数表达式的计算是针对每个个案进行的; 2)存放结果的变量的类型应与计算结果的类型一致。 八大类函数: 1)算数函数 2)统计函数 3)分布函数 4)逻辑函数 5)字符串函数 6)日期时间函数 7)缺失值函数 8)其他函数
3. 条件表达式 • 可用SPSS条件表达式指定对某些个案进行计算。 • 1) 简单条件表达式 • 如 数学>80 • 2)复杂条件表达式 • 如 (数学>80)and (英语>90) • 变量转换的步骤 • 产生计数变量 • 对所有个案或满足一定条件的个案,计算若干个变量中有几个变量的值落在指定的区间内,并将结果存入到一个新变量中.
职工号 职称 工资 工资_1(平均工资) 职称 高级工程师 1024.00 001 1014.00 高级工程师 011 1014.00 高级工程师 工程师 908.29 003 1044.00 高级工程师 助理工程师 827.00 009 859.00 工程师 018 879.00 工程师 020 879.00 工程师 010 827.00 助理工程师 022 827.00 助理工程师 029 827.00 助理工程师 021 879.00 工程师 014 889.00 工程师 002 984.00 工程师 012 989.00 工程师 三. 数据文件的分类汇总 注意:可进行多重分类汇总 步骤: 第一步,指出分类变量和汇总变量; 第二步,根据分类变量把个案分成若干类,并对每类个案分别计算汇总变量的描述统计量; 第三步,将分类汇总的计算结果保存到一个SPSS数据文件中。
个案号 分组变量(年龄) 标志变量 标志变量值标签 1 20 2 20 2 18 1 18 3 35 3 35 4 20 2 20 5 89 4 89 6 35 3 35 §3.3 数据分组(数据重新编码) 将个案数据概括成若干个组,是对原始数据的进一步概括和总结。 通常是把定距数据转化为顺序水准数据或名义水准数据。 数据分组的主要步骤: 首先,指定分组变量; 其次,定义分组变量的分组区间; 最后,指定标志变量,存放分组结果。 一. 数据自动分组 依照分组变量值得大小,将个案分成若干组。 需要指定分组变量和标志变量。
二. 数据手工分组 需要指定分组变量、分组区间和标志变量。 个案号 分组变量(年龄) 标志变量 1 35 1 2 40 2 3 20 1 4 45 2 5 50 2 6 30 1 7 55 3 8 60 3 注意: 对字符型分组变量,分组区间是指特定的值。 特征 对数值型分组变量,分组区间不要交叉重叠。 1. 分组结果存入原变量 2. 分组结果存入新变量。