1 / 36

数据的选取与操作

数据的选取与操作. 庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw. 课程大纲. 数据选取与操作的意涵 选择观察值 ( Select) 分割 档案 ( Split files) 变量的重新编码 ( Recode) 计算 ( Compute) 计数 ( Count). 数据选取与操作的意涵. 研究者在进行数据分析时,有时可能需要 对数据的结构做某些改变 或 创造新的变数 , 以符合研究的 需求 , 尤其是研究者所使用的原始资料文件是他人基于不同研究目的而搜集的资料 , 例如 ICPSR 数据库、中研院学术调查数据库 。

kylynn-wall
Download Presentation

数据的选取与操作

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 数据的选取与操作 庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw SPSS之应用(庄文忠副教授)

  2. 课程大纲 • 数据选取与操作的意涵 • 选择观察值(Select) • 分割档案(Split files) • 变量的重新编码(Recode) • 计算(Compute) • 计数(Count) SPSS之应用(庄文忠副教授)

  3. 数据选取与操作的意涵 • 研究者在进行数据分析时,有时可能需要对数据的结构做某些改变或创造新的变数,以符合研究的需求,尤其是研究者所使用的原始资料文件是他人基于不同研究目的而搜集的资料,例如ICPSR数据库、中研院学术调查数据库。 • 即使是研究者自己所搜集的资料,为了进行某些较为特殊的分析,也有可能需要对数据的格式或变量的属性作某些改变,例如政治世代的比较;甚至有些「根本」的改变可能在资料搜集之初,就已经有所预期或规划,例如指数(index)或量表(scale)的建构。 SPSS之应用(庄文忠副教授)

  4. 数据选取与操作的意涵 • 在数据操作过程中,个案的个数保持不变,变量的数目也不会减少(事实上,变量的数目反而会增加)。数据操作涉及到现有变量的处理,例如: 1.利用某种方式变更变数的原始数值/编码; 2.利用某种方式结合2个或2个以上变数的数值/编码的逻辑条件陈述来建立一个新的变量。 SPSS之应用(庄文忠副教授)

  5. 选择观察值(Select) • 研究者有时会发现在进行某项研究或特定分析时,并不见得需要使用数据文件中所包含的全部信息,分析时必须选择某些值得分析的个案或变量。 • 操作的步骤: 1.设定筛选的标准; 2.选取所需要的观察值; 3.暂时或永久的删除未选择的观察值。 • 在完成特定的分析之后,记得恢复选择「全部观察值」。 SPSS之应用(庄文忠副教授)

  6. 选择观察值 SPSS之应用(庄文忠副教授)

  7. 「有」工作(v27=1)且学历为「专科以上」(degree >=4) SPSS之应用(庄文忠副教授)

  8. SPSS之应用(庄文忠副教授)

  9. 全部观察值 选择观察值:V27=1 & degree>=4 SPSS之应用(庄文忠副教授)

  10. 分割档案(split files) • 有时利用类别变量的组别来切割一个档案是非常有帮助的,如此一来,计算机就会自动地分别对每一层别的数据进行分析。 • 最多可以设定8个分组变数。 • 两种分割档案方式: (1)比较群组 (2)依群组组织输出 • 在完成特定的分析之后,记得恢复选择「分析所有观察值,勿建立群组」。 SPSS之应用(庄文忠副教授)

  11. (1)比较群组 SPSS之应用(庄文忠副教授)

  12. SPSS之应用(庄文忠副教授)

  13. (2)依群组组织输出 SPSS之应用(庄文忠副教授)

  14. SPSS之应用(庄文忠副教授)

  15. 变量的重新编码(Recode) • 利用改变实际的单一编码数值或将一群编码合并成较大之集合体的方式,来变更变量的单一编码或一组编码,这是数据操作的基本形式之一。 • 重新编码的类型: 1.重新编码成同一变数(不建议) 2.重新编码成不同变数 3.自动重新编码 SPSS之应用(庄文忠副教授)

  16. 例:年龄重新编码 SPSS之应用(庄文忠副教授)

  17. 重新编码成同一变数(不建议) SPSS之应用(庄文忠副教授)

  18. SPSS之应用(庄文忠副教授)

  19. 重新编码成不同变量—数字变量 SPSS之应用(庄文忠副教授)

  20. 重新编码成不同变量—数字变量 SPSS之应用(庄文忠副教授)

  21. 原始数值 重新编码后 SPSS之应用(庄文忠副教授)

  22. 重新编码成不同变量—类别变量 SPSS之应用(庄文忠副教授)

  23. 重新编码成不同变量—类别变量 SPSS之应用(庄文忠副教授)

  24. 原始分类 重新编码后 SPSS之应用(庄文忠副教授)

  25. 自动重新编码 SPSS之应用(庄文忠副教授)

  26. SPSS之应用(庄文忠副教授)

  27. 计算(Compute) • 如果一个或多个变量的数字编码是代表真实的数量而非只是类别的标记,那么,这些编码就可以成为算术运算的标的。 • 计算是产生新变量的方法之一,也可以提供更有意义的变量,例如以身高和体重的比值换算成「身体质量指数」(BMI)。 BMI=(体重)/(身高)2 • 如果有些个案是遗漏值,在计算时便会被排除,成为「系统遗漏值」。 SPSS之应用(庄文忠副教授)

  28. 简单的计算-周工作时数转换为年工作时数 SPSS之应用(庄文忠副教授)

  29. 利用计算建立量表-工作成就感 SPSS之应用(庄文忠副教授)

  30. 年工作时数 • 工作成就感 SPSS之应用(庄文忠副教授)

  31. 计数(Count) • 在许多不同的变量之中,有时可能会想要知道某一个编码或某一范围内的编码发生的次数。 • 计数的结果也可用以建立新的量表。例如:各种参与政治的行为(投票、投书、联署、call-in),可结合成政治参与量表 SPSS之应用(庄文忠副教授)

  32. 计数 SPSS之应用(庄文忠副教授)

  33. SPSS之应用(庄文忠副教授)

  34. 操作练习&提问时间 SPSS之应用(庄文忠副教授)

  35. 作业: • 利用「观察值摘要」、「选择观察值」和「分割档案」的作法,比较男性和女性的教育程度(degree)和接受教育年数(educyrs)有何不同? • 找一组题目,利用「计算」的指令建立一个量表,并说明此一量表的意义。 • 找一组题目,利用「计数」的指令建立一个量表,并说明此一量表的意义。 SPSS之应用(庄文忠副教授)

  36. 作业:将变数v66重新编码成新变量whyjobend SPSS之应用(庄文忠副教授)

More Related