980 likes | 1.38k Views
SAS 基础培训课程. SAS Institute (Shanghai) Co., Ltd. SAS 系统. SAS 系统是用于数据分析与决策支持的大 型集成式模块化软件包。 ( 其早期的名称为 S tatistical A nalysis S ystem ). SAS 系统是用于决策支持 的大型集成信息系统. SAS 系统主要完成以数据为中心的四大任务 : 数据访问 数据管理 数据呈现 数据分析 . SAS 系统介绍. The SAS System. 数据访问. 数据管理. 分 布 式
E N D
SAS 基础培训课程 SAS Institute (Shanghai) Co., Ltd.
SAS系统 • SAS系统是用于数据分析与决策支持的大型集成式模块化软件包。 • (其早期的名称为 • Statistical Analysis System )
SAS系统是用于决策支持的大型集成信息系统 • SAS系统主要完成以数据为中心的四大任务: • 数据访问 • 数据管理 • 数据呈现 • 数据分析
SAS 系统介绍 The SAS System 数据访问 数据管理 分 布 式 计 算 环 境 Base SAS GRAPH, GIS, CALC, INSIGHT, SPECTRAVIEW, ASSIST Base SAS,STAT,ETS, OR,QC,IML,INSIGHT, NNA,LAB, SPECTRAVIEW 开 发 工 具 AF EIS FSP CONNECT SHARE IntrNET DATA Base SAS ACCESS MDDB Server ODBC Base SAS FSP SHARE CONNECT ASSIST Warehouse Admin. MDDB Server 数据分析 数据呈现
SAS系统的构成 • SAS系统是一个可由几个到二、三十个工具模块及面向行业的子系统组成的可伸缩系统。其模块按功能大体有四类: • 数据库及其管理 • 面向对象的4GL开发平台 • 各类堪称行业标准的分析工具 • 方便用户的外层技术(多平台支持,开 放环境,网络计算及分布处理)
SAS 系统软件由模块构成 • 数据库部分:BASE SAS, FSP, ACCESS,.. • 分析核心:STAT, ETS, QC, OR, IML, . . . • 开发呈现工具:AF, EIS, GRAPH, . . . • 分布处理与数据仓库:CONNECT, WA, ..
数据 进入 组织 利用 提交信息(Information Delivery):SAS的核心业务 信息 知识 输出 管理
SAS系统简介 • 要 求 • 进入SAS系统 • 发常用命令,切换窗口 • 进Assist和Desktop窗口
启动SAS:在Windows桌面系统下双击SAS图标 SAS系统简介§1 SAS 提供的基本运行环境 或运行SAS系统目录下(例C:\SAS)的可 执行程序sas.exe 常用的是交互运行方式。也可用提交批作业 方式运行的
SAS系统简介§1 SAS 提供的基本运行环境 • SAS 为交互方式运行提供的环境 • 显示管理系统下拉菜单(弹出菜单) • 命令框、工具栏 • 三个基本窗口 • PROGRAM EDITOR 窗口 • LOG 窗口,OUTPUT 窗口 工作界面介绍
访问和编辑已有的SAS程序 编写新的SAS程序 递交SAS程序 将SAS程序存为文件 是一个基本的敞口,缺省地打开 依次记录程序输出的结果 有结果输出时自动转到前台 是一个基本的窗口,缺省地打开 依次记录SAS进程中各程序运行的信息 可用命令清空 SAS系统简介§1 SAS提供的基本运行环境--三个基本窗口
SAS系统简介§1 SAS 提供的基本运行环境 • SAS常用的交互式运行方式: 用SAS编程实现各种任务 用SAS提供的菜单系统实现各种任务 用SAS/ASSIST 用SAS桌面系统
SAS系统简介§1 SAS 提供的基本运行环境 • 在交互式操作中用命令指挥显示管理系统、切换窗口和完成各种特定的功能 • 发布命令有四种方式: • 在命令框直接键入命令; • 使用下拉菜单; • 使用工具栏。 • 按功能键; 发命令
SAS系统简介§1 SAS 提供的基本运行环境 • 常用的其它窗口: • KEYS 查看及改变功能键的设置 • LIBNAME 查看已存在的SAS数据库 • DIR 查看某个SAS数据库的内容 • VAR 查看SAS数据集的有关信息 • OPTIONS 查看及改变SAS的系统设置
SAS系统简介§1 SAS 提供的基本运行环境 • 进入SAS/ASSIST • 使用工具栏图标 • 发命令ASSIST • 下拉菜单选 GlobalsASSIST 进入SAS桌面系统 发命令DESKTOP 下拉菜单选 Globals Desktop 进菜单系统
SAS系统简介 § 2 运行一个简单的SAS程序 • 运行一个简单的 SAS 程序:在 PROGRAM EDITOR窗口中键入程序: • 提交程序(SUBMIT) • 查看 LOG窗口的信息 • 调出提交的程序(RECALL)并修改,再次提交 • 在 OUTPUT窗口查看运行结果 • 存储程序 P005
SAS系统对数据的管理 • 要 求 • 设定、浏览SAS数据库 • 打开SAS数据集及其变量窗口
SAS系统对数据的管理 • SAS对数据的分析与呈现都是面对SAS数据集进行的 • SAS数据集是一种SAS文件 • SAS文件是由SAS系统创建和管理的有特殊结构的文件。包括 SAS数据集和SAS目录册(CATALOG)等
SAS系统对数据的管理 数据直接输入 流行的数据库 其它文件格式 SAS数据集 SAS应用程序
SAS系统对数据的管理§1 SAS 数据库 • SAS数据集存储在SAS数据库中SAS数据库还存储其它SAS专用文件 • SAS数据库文件用两级命名方式定名:libname.SAS-filename • (库标记.文件名) SAS数据库 SAS数据集
SAS系统对数据的管理§1 SAS 数据库 • SAS数据库有永久库和临时库两种 • 临时库:名为WORK,系统自动指定 • 永久库:系统自动指定名为SASUSER,(SASHELP等). 其它可由用户指定
SAS系统对数据的管理§1 SAS 数据库 • 用工具栏中的图标进入库管理对话窗或键入命令 Dlglib 或 Global Access Display Liberary可进入库管理窗口浏览库内容和库文件 • 或用LIBNAME命令进入Libname窗口用DIR 命令进入Dir窗口用VAR 命令进入Var窗口 操作:看库
SAS系统对数据的管理§1 SAS 数据库 • 不同的主操作系统下SAS数据库文件以不同方式与主操作系统下的文件组织相联系 • 在Windows下每个SAS数据库置于某个子目录之中 • 例:SASUSER: C:\SAS\SASUSERWORK: C:\SAS\SASWORKCOURSE: C:\USERS\ZDW
SAS系统对数据的管理§1 SAS 数据库 设定 • 用工具栏中的图标进入库管理对话窗,按下New Library按键 • 使用LIBNAME语句可以指定SAS库标:LIBNAME 库名 SAS数据库挘 • 在Windows环境下:LIBNAME 库名 目录名挘LIBNAME course ‘c:\course’; 连库 Libname 库名 ('目录1' '目录2')
SAS系统对数据的管理§2 SAS 数据集 • 两种类型的数据对象: • SAS数据集(Data sets):包含描述部分和数据部分 • SAS数据视窗(Data View):只含描述部分 • (变量名,属性,长度,标题 格式,创建与修改日期)
SAS系统对数据的管理§2 SAS 数据集: 描述部分 • Global Access Display Liberary . . . • Desktop SAS Explore File Pop menu Contents • Ass D.Manag. Utilities Contents.. B & E Dst Attr. Proc contentsdata=SAS数据集 <position>; run;
SAS系统对数据的管理§2 SAS 数据集: 数据部分 SAS数据集的数据部分是由数据构成的矩形表 变 量(字段、列) 记录 或行 缺失值(Missing Value)。 字符型变量的缺失值用空格符表示 数值型变量的缺失值用句号“ . ”表示
SAS系统对数据的管理§2 SAS 数据集看数据集 • 用工具栏中的图标进入库管理对话窗 选中数据集 在弹出菜单选 Open table view • 发命令:VT(或FSV)数据集名 • 提交程序: proc print data=数据集名; run;
浏览和编辑SAS数据集 • 要 求 • 使用ViewTable浏览、编辑和新建SAS数据集 • 使用Proc Print输出SAS 数据集 在SAS系统中浏览和编辑SAS数据集必须先设定SAS数据库,将要浏览和编辑的数据集存放在已设定的SAS数据库中
浏览和编辑SAS数据集§1 使用Viewtable 浏览与编辑 • Viewtable 提供一个显示数据集的窗口。它具有对数据集的浏览、编辑和创建的功能 • Viewtable 提供两种显示数据集的方式: • Table View以矩阵表格形式显示数据,一次可显示多条记录 • Form View一次只显示一条记录
浏览和编辑SAS数据集§1 使用Viewtable 浏览与编辑 • 如何进入Viewtable窗: • 在SAS浏览器或数据库对话窗中双击数据集图标 • 键入命令:VT 数据集名
浏览和编辑SAS数据集§1 使用Viewtable 浏览与编辑 • 除了Viewtable窗口外,FSV等也提供了字符型界面的数据集的浏览和编辑的窗口,它打开数据集的速度更快。 • Insight和Analyst Application也提供了对数据集浏览和编辑的窗口,他们在生成新变量方面有更强的功能
用VIEWTABLE FSEDIT FSVIEW 编程:用DATA步 用Import菜单 用SAS/ACCESS 浏览和编辑SAS数据集§2 用Viewtable新建数据集 建立SAS数据集的各种途径 数据存于纸上 需直接键入 数据存于文本文件 数据存于流行 数据库文件中
浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 为了新建一个SAS数据集,一般应该先规定输入变量的属性(变量名,标题名,类型,长度,输入输出格式)。 • 对格式和其它属性无特殊要求的也可先输入数据,而后设定各个变量的属性。 • 命令:VT。选中变量名在弹出菜单选Column Attributes 先输入数据举例.另法:File=>Add Item=>Table
浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 数据集变量的属性描述: • 变量名(Name):字母或下划线开始且不超过8个字符或数字构成 • 类型(Type):数值型、字符型 • 长度(Length):缺省8字节( 200) • 标题名(Label): 缺省40字节 • 输入格式(Informat):$输入格式名w.d • 输出格式(Format): $输出格式名w.d 必须 可选
NAME SEX POSITION AGE SALARY Alex M A 35 1500 Linda F 28 1400 Simon M C 45 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 在数据集的一条记录的某个变量无数据时,称为缺失值(Missing Value)。 • 字符型变量的缺失值用空格符表示 • 数值型变量的缺失值用句号“ . ”表示
浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 输入、输出格式例: 输入格式 输入数据 8.2 comma8.2 dollar8.2 12234.1234 12,234.1234 $12,234.1234 实际存储 数据值 12234.12 输出格式 输出数据 8.2 comma8.2 dollar8.2 12234.12 12,234.12 $12,234.12
输出格式 输出数据 20OCT1997 102097 97-10-20 date9. mmddyy6. yymmdd8. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 日期输入、输出格式例: 1960,1,10 1960,1,21 1960,2,131 1961,1,1366 输入格式 输入数据 DATE7. DDMMYY8. yymmdd10. 20OCT97 20/10/97 1997/10/20 实际存储 数据值 13807 转换:data _null_; x=put(today(), date7.);put x;run; datetry
浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 几种常用的输入、输出格式: w.d $w. COMMAw.d DOLLARw.d DATEw. MMDDYYw. 标准的数字型格式 标准的字符型格式 数字中嵌入逗号 数字中嵌入逗号,前加$ 日期格式 日期格式
浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 利用HELP查找SAS系统提供的输入、出格式 SAS System Help下拉菜单 目录: SAS Language 索 引: SAS Informats and Formats -- Contents SAS Formats and Informats 从函数名找 从分类功能找
SAS编程基本概念 • 用户提交的 SAS 程序由许多程序步构成。 数据步常用于创建数据集 原始 数据 过程步 Proc Step 报告 数据步 Data Step SAS表 SAS表 过程步常用于处理数据集(生成 报表、图形和实现数据分析功能)
SAS编程基本概念 • SAS的程序由两种程序步(Step)构成: • 数据步(DATA STEP):以(DATA)语句开始,创建和处理SAS数据集 • 过程步(PROC STEP): 以(PROC)语句开始,用于处理SAS数据
SAS编程基本概念 • SAS的每个程序步都由语句构成。 • 每个语句常以开始的关键词称呼,用分号表示语句的结束。 • SAS语句书写的格式较为任意 • 语句可以在任一列开始和结束 • 词间可任意加入空格和换行 • 一个语句可跨多行,多个语句可写在一行 • 良好的书写格式便于程序的阅读 看例e029, e029_2
浏览和编辑SAS数据集§3 打印数据集 • 基于数据集的报表从其内容来看大体有两类: • 一类是提供数据集的详细数据为主,在SAS 中是采用Report窗口或用过程print或report • 另一类是只含各种分类的汇总信息,在SAS 中是采用过程 tabulate 或与此联系的菜单窗口
编程: PROC PRINT DATA=SAS-data-set; RUN; 浏览和编辑SAS数据集§3 打印数据集
浏览和编辑SAS数据集§3 打印数据集 • PROC PRINT DATA=SAS-data-set <NOOBS>; • ID variable; • VAR variables; • WHERE where-expression; • SUM variables; • BY by-variables; • PAGEBY by- variables; • RUN;
浏览和编辑SAS数据集§3 打印数据集Format的使用 • 若数据集形成时已为变量规定format,则在打印输出时自动运用这一format。 • 在打印程序中使用format语句,可为变量临时设定使用的format。 format语句的形式为 FORMAT variables format; 例 format date yymmdd10.;
浏览和编辑SAS数据集§3 打印数据集Format的使用 • FORMAT语句: FORMAT variables format; 定义用户格式: PROC FORMAT; VALUE format-name range1=label range2=label . . . . . ;
浏览和编辑SAS数据集§3 打印数据集Label的使用 • LABEL variable1=label • variable2=label • . . . . . . . . . .; Label语句: Print 选项: SPLIT=符号