310 likes | 478 Views
SPSS 统计分析基础教程. 联系方式:. e-Mail: xsc060@126.com 办公室:科技楼 -915 课下问题解决方式: 邮件联系 办公室联系 个人博客: http://blog.sina.com.cn/scxiong. 课程目的. 应用统计学 理解统计数据分析主要方法的基本理论 掌握基本统计方法在实践中的应用 能熟练运用 SPSS 软件实现数据分析 建立起独立运用统计方法解决实际问题的能力. 参考书目:. 1 、 《 多元统计分析 》 ,傅德印著,中国统计出版社, 2007 。
E N D
联系方式: • e-Mail: xsc060@126.com • 办公室:科技楼-915 • 课下问题解决方式: • 邮件联系 • 办公室联系 • 个人博客: • http://blog.sina.com.cn/scxiong
课程目的 • 应用统计学 • 理解统计数据分析主要方法的基本理论 • 掌握基本统计方法在实践中的应用 • 能熟练运用SPSS软件实现数据分析 • 建立起独立运用统计方法解决实际问题的能力
参考书目: • 1、《多元统计分析 》,傅德印著,中国统计出版社,2007。 • 2、《统计分析方法与SPSS的应用(第二版) 》,薛薇编著,中国人民大学出版社,2008。 • 3、《应用多元统计分析 》,高惠璇等主编,北京大学出版社 ,2005 。 • 4、《SPSS统计应用实务 》,吴明隆主编,科学出版社 ,2003。
在线教辅 • http://agec.ruc.edu.cn/personalweb/pengchao/ • http://www.ats.ucla.edu/stat/spss/default.htm • http://www.pinggu.org/bbs/index.asp?boardid=65
一. 关于统计 1.统计的含义(三种) 统计工作:对总体数量方面进行搜集、整 理和分析的实践活动。 { 统计 统计资料:统计活动过程所取得的各种资料。 统计学:研究现象总体的数量表现和规律 性的方法论科学。 为谁统计(统计目的) { ★统计活动的基本问题 由谁统计(统计主体) 统计什么(统计客体) 如何统计(统计方法)
按计量方法:计点与计量资料 { ★统计资料的类别 按资料是否直接取得:原始与次级资料 按统计资料的时间属性:静态与动态资料 按统计资料所涵盖的范围:全面与抽样资料 按发展阶段和侧重点的不同:描述与推 断统计学 { ★统计学 的分科 按理论与实践应用关系:理论与应用统 计学
统计学几乎可以应用于所有的领域: 精算,农业,动物学,人类学,考古学,审计学,晶体学,人口统计学,牙医学,生态学,经济计量学,教育学,选举预测和策划,工程,流行病学,金融,水产渔业研究,遗传学,地理学,地质学,历史研究,人类遗传学,水文学,工业,法律,语言学,文学,劳动力计划,管理科学,市场营销学,医学诊断,气象学,军事科学,核材料安全管理,眼科学,制药学,物理学,政治学,心理学,心理物理学,质量控制,宗教研究,社会学,调查抽样,分类学,气象改善,博彩等。
可以想象出的统计应用例子 • 如何对电视节目排名次 • 什么因素影响一个节目的收视率 • 如何按照各种不同环境估计某商店的顾客人数 • 如何按照各种指标评价雇员 • 如何把地区(市县镇等)按照各种指标分类 • 如何确定红楼梦第几回不是曹雪芹所写 • 如何确定一个产品的可靠性 • 如何进行偏差较少的民意调查 • 如何根据一些财务数据发现漏税的嫌疑单位?
2.统计工作与统计学、统计资料的关系 ★统计资料是统计工作的最终产品和成果,是表明客观现象整体数量特征和规律性的统计数据、统计图表、统计年鉴、统计摘要、统计数据库、统计报告的总称。 ★统计学又称统计理论和方法,是统计实践活动发展到一定阶段的产物,是统计实践活动经验的科学总结、理论概括的创新发展。 统计工作与统计资料的关系:统计活动与统计成果。 统计工作与统计学的关系:统计实践与统计理论。
3.统计的研究方法 大量观察法 、统计分组法 、综合指标法、 统计模型法 、归纳推断法 4.统计研究过程 统计设计 、统计调查 、统计整理、统计分析
计算机的重要性 • 由于统计和数据打交道,没有计算机 的发展统计就没有前途. • 计算机和统计的发展相辅相成
统计软件的作用 • 统计分析软件是数据分析的主要工具 • 统计设计完成后,完整的数据分析过程包括 • 数据的收集 • 数据的整理 • 数据的分析 • 统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段
统计软件 • SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。对于非统计工作者是很好的选择。 • SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。对于基本统计课程则不那么方便。
STATA:这是众多统计软件的后起之秀;它操作灵活、简单、易学易用,同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点。占用计算机系统资源少,绘图漂亮,对有简单编程基础者来讲十分容易上手,有专门出版的专业刊物。STATA:这是众多统计软件的后起之秀;它操作灵活、简单、易学易用,同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点。占用计算机系统资源少,绘图漂亮,对有简单编程基础者来讲十分容易上手,有专门出版的专业刊物。 • 以上三种软件并称为新的国际三大权威统计软件
Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。
S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。 • R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断加入的各个方向统计学家编写的统计软件包。同时从网上可以不断更新和增加有关的软件包和程序。这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。
Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。 • Statistica:也是功能强大而齐全的“傻瓜化”的软件,在我国用的也不如SAS与SPSS那么普遍。 • Eviews:这是一个主要处理回归和时间序列的软件。 • GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。
FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有一定的统计软件包。计算速度比这里介绍的都快得多。但需要编程和编译。操作不那么容易。FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有一定的统计软件包。计算速度比这里介绍的都快得多。但需要编程和编译。操作不那么容易。 • MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。
二. SPSS软件介绍 • 软件名称 • Statistical Package for Social Science • Statistical Product and Service Solutions • 软件发展 • 60年代:美国斯坦福大学三位研究生研制 • 70年代:SPSS总部成立于芝加哥,推出 SPSS中小型机版—SPSSX • 80年代:微机版(V1.0-4.0)SPSS/PC+ (DOS版) • 90年代: Windows版(v6.0-10.0) • 本世纪: Windows版11.0-15.0版,中文版
SPSS的基本特点 • 优势 • 操作界面极为友好 • 精心设计的图形操作界面,美观的结果输出 • 强大的辅助教学功能 • 中文兼容问题已完全解决,也已推出中文版 • 劣势 • 计算速度相对较慢 • 在统计模型的纳入上速度较慢 • SPSS够用吗?
SPSS的安装 1. SPSS Server的安装(见教材第6页) 2. SPSS Client的安装 Step1:将SPSS Client安装光盘放入计算机光驱后,选 中“Istall SPSS”即进入安装向导; Step2:接受License协议,并选择安装目录,随后键入 名称、公司和SPSS公司提供的序列号 Step3:当要求输入License时,键入SPSS 公司提供的 License,即出现该License允许安装的模块,单 击Next开始安装,最后单击Finish完成安装
SPSS窗口简介 1.数据编辑窗口(SPSS Data Editor) • 类似于Excel窗口的标准的电子表格 • 菜单,快捷工具栏,状态栏 • 数据视图:主要操作界面 一行代表一个观测个体(Record),一列代表一个属性(Variable) • 变量视图:用于定义变量(详见第2章) • 打开以“sav”为扩展名的SPSS数据文件
2.结果管理窗口(SPSS Output Viewer) • 又称结果视图,用于存放分析结果 • 打开以“spo”为扩展名的SPSS结果文件 3.草稿结果窗口(SPSS Draft Viewer) • 是结果的简化文本格式 • 是Word所兼容的rtf超文本格式,可在没有安装SPSS的PC机上用文字编辑软件打开 • 打开以“rtf”为扩展名的SPSS草稿结果文件
4.语法编辑窗口(SPSS Syntax Editor) • 适用于高级分析人员 • 打开以“sps”为扩展名的SPSS语法文件 5.脚本编辑窗口(SPSS Script Editor) • Script菜单:提供了基本的开发功能 • Debug菜单:提供程序调试的常用功能 • 高级用户进行SPSS二次平台开发时使用
SPSS的四种运行方式 1.菜单对话框方式 • 最常用,最好记,效率最低 2.程序方式 • 适合于批量数据分析(建议了解基本知识) • 3.Include命令方式 • 适合于较大规模的分析项目 • 4.SPSS Production Facility方式 • 适合于分布式环境中在服务器上执行分析
SPSS的四种结果输出 • 增强的多维立体表格,拥有动态展示功能 1.表格格式 2.文本格式 • 标准的rtf文本 3.标准图与交互图 • 标准图具有动态展示功能,交互图编辑功能更 强,但目前标准图已基本够用 4.结果的保存与导出 • 除可存为“.spo”格式外,还可存为HTML、Word、Excel和Text格式。
三. 数据分析的7个阶段 1. 计划阶段 确定研究问题、建立项目预算、确定研究总体与个体、确定样本抽取方法、分析评估所需样本量、确定数据收集方式、确定该收集个体的哪些数据、确定研究问题的分析方法与分析工具。 2. 数据收集阶段 数据收集方式有多种:电话式访问、面谈式收集等。 3. 数据获取阶段(第2章) 将分散的、原始的数据读入分析工具中,使分析工具可对数据进行分析。
4. 数据准备阶段(第3章) 清理数据以保证数据的准确性;对数据进行必要的转换、合并、汇总;填充缺失数据。 5. 数据分析阶段(第4-15章) 预分析(概括性统计描述:使用统计图和统计表对数据更好地理解;探索性统计描述:尝试对数据进行分析),可用单因素与多因素分析方法进行分析 精确分析(尝试拟合最佳统计模型) 6. 结果报告阶段 7. 模型发布阶段