740 likes | 939 Views
SPSS 的应用. (基本统计方法). 宋 花 玲 ( 预防医学教研室) 51322155 99shl@163.com. 资料的类型: 计量资料 (连续性变量资料) 计数资料 (无序分类变量资料) 等级资料 (有序分类变量资料) 常见实验设计类型: 完全随机设计 配对设计 、 配伍(随机区组)设计 拉丁方设计 交叉设计 析因设计 正交设计. 主要内容: 一、 SPSS 简介: 1.SPSS 软件概述 2. 基本操作
E N D
SPSS的应用 (基本统计方法) 宋 花 玲 ( 预防医学教研室) 51322155 99shl@163.com
资料的类型: 计量资料(连续性变量资料) 计数资料(无序分类变量资料) 等级资料(有序分类变量资料) 常见实验设计类型: 完全随机设计 配对设计、配伍(随机区组)设计 拉丁方设计 交叉设计 析因设计 正交设计
主要内容: 一、SPSS简介: 1.SPSS软件概述 2.基本操作 二、计量资料的分析: 1.统计描述 2.单样本t检验 3.配对t检验 4.两样本t检验 5.单因素方差分析 6.多因素方差分析 (正态性检验 方差齐性检验)
三、计数资料的分析 2检验 四、非参数检验(计量资料、等级资料) 1.配对设计的符号秩检验 2.Wilcoxon秩和检验 3.H检验 4.M检验 五、直线回归与相关分析 六、统计图的绘制(SPSS Excel)
一、SPSS简介: 1.SPSS软件概述 Statistical Package for Social Science Statistical Product and Service Solutions 下拉式菜单和对话框操作方式 易于掌握和操作 非统计专业人员最爱
下拉式菜单:点击后选择子菜单 工具条: 快速简便的执行命令 数据编辑窗口 数据视图:编辑及显示 数据 变量视图:点击后编辑及显示变量的详细情况
结果输出窗口 标题窗 内容窗
SPSS的主要窗口: 数据编辑窗口:建立、编辑和显示数据文件 结果输出窗口:显示、编辑分析结果 程序编辑窗口: 脚本编辑窗口 草稿结果窗口
2.基本操作: 数据文件的建立、导入、导出 数据文件的整理 数据转换
数据文件的建立、导入、导出: 建立新文件: 资料输入原则: 每行表示一条记录(一个研究对象的所有信息) 每列表示一个变量(特殊情况:频数加权、重复测量资料…) 定义变量→变量设置→录入数据→保存
例1:某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择60名高血脂患者,采用完全随机设计方法将患者等分为2组2,进行双盲试验。6周后测得低密度脂蛋白作为试验结果如下。问2个处理组患者的低密度脂蛋白含量总体均数有无差别?例1:某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择60名高血脂患者,采用完全随机设计方法将患者等分为2组2,进行双盲试验。6周后测得低密度脂蛋白作为试验结果如下。问2个处理组患者的低密度脂蛋白含量总体均数有无差别?
定义变量和变量设置: 变量名:需要定义 变量类型 变量宽度 (一般默认) 小数位数:需要定义 变量标签:需要定义 值标签:需要定义 缺失值 列宽 对齐方式 测量尺度 (一般默认 )
导入各种类型的文件:Excel、dBase、SAS… File→open→data: (文件类型:选择已存在文件的类型)双击要打开的文件即可。 注:要导入的文件,其格式也需遵循资料输入的基本原则 例:Excel文件 →SPSS文件
导出为其他类型的文件:Excel、dBase、SAS… File→save as: (保存类型:选择需要的文件类型) →保存 例:SPSS文件 → Excel文件
数据文件的整理(data): 观察值排序:sort cases 拆分文件: split files 选择观察单位: select cases … 变量加权: weight cases
数据转换(transform): 计算产生变量: compute 重新赋值: recode 观察单位排秩: rank cases … 随机数生成器: random number generators
二、计量资料的分析 1.统计描述: Analyze → descriptive statistics → descriptives → variables: 分析变量→ok 例:(分组进行描述--split file:group)
descriptive statistics: frequencies(频数分布分析) Descriptives (描述性统计分析) Explore(探索性分析) Crosstabs (列联表资料分析) …
Analyze → descriptive statistics → descriptives → variables: 分析变量→ok 例数 最小值 最大值 均数 标准差
2.t检验:样本均数与总体均数的比较 analyze→compare means →one-sample t test →test variable:分析变量 →test value:总体均数的值 →ok 例:(低密度脂蛋白的资料)假设正常人的低密度脂蛋白总体均数为2.9mmol/L,新药组用药后的低密度脂蛋白是否回复正常。
统计量t值 自由度 P值 差值的均数 差值的95%CI
3.t检验:配对t检验 analyze→compare means →paried-samples t test →paried variables:配对的两个变量 →ok
例2为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-5第(1)~(3)栏。问两法测定结果是否不同?例2为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-5第(1)~(3)栏。问两法测定结果是否不同? 表2 两种方法对乳酸饮料中脂肪含量的测定结果(%)
analyze→compare means →paried-samples t test →paried variables:配对的两个变量 →ok 差值的均数、标准差、标准误、可信区间、t值、自由度、P值
4.t检验:两样本均数的比较 analyze→compare means →independent-samples t test →test variable:分析变量 →grouping variable:分组变量 →define groups:分组变量的值 (group:1 group:2) →ok
方差齐性检验:P=0.45说明方差齐 第一行是方差齐的结果 第二行是方差不齐的结果 两组t检验的t值、自由度、P值, 差值的均数、标准误、可信区间
例3 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见例4-1),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别? 表3 4个处理组低密度脂蛋白测量值(mmol/L) 5.单因素方差分析(完全随机设计资料):
5.单因素方差分析(完全随机设计资料): analyze→compare means →one-way anova →dependent list:分析变量 →factor:分组变量 →post hoc…:选择多重比较的方法 →ok
两两比较的结果 比较的组别 P值
6. 随机区组设计资料: 例4 某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物,以肉瘤的重量为指标,试验结果见下表。问三种不同的药物的抑瘤效果有无差别? 表 不同药物作用后小白鼠肉瘤重量(g)
6.多因素方差分析(随机区组设计资料): analyze→general linear model →univariate →dependent variable:分析变量 →fixed factor:分组变量 →random factor:区组变量 →model → custorm:分组变量、区组变量 →continue → ok (拉丁方设计、两阶段交叉设计资料的分析方法基本相同)
处理因素效应 区组因素效应
两两比较的结果 比较的组别 P值
正态性检验: Analyze → nonparametric tests → 1-sample K-S →test variable:分析变量 → ok ( “Paste”按钮的使用)
三、计数资料的分析 2检验 (Fisher确切概率法)
计数资料的分析 --2检验 例5:某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别? 表 两组降低颅内压有效率的比较
例:数据输入的格式: 组别:分组变量 1-试验组 2-对照组 疗效: 1-有效 0-无效 F:表示频数
四格表资料的2检验: 表明f变量是频数变量 Data →weight cases → weight cases by: frequency variable:f →ok analyze →descriptive statistics →crosstabs … : row: 组别(行变量) column:疗效 (列变量) statistics →选择chi-square →continue → ok
Pearsonχ2 连续性校正χ2 似然比χ2 Fisher确切概率 线性χ2 P值
行×列表资料的2检验: (同四个表) 例 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别? 表 三种疗法有效率的比较
χ2值、自由度、P值 没有理论数小于5
配对四格表资料: 例6 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别? 表 两种方法的检测结果
配对四格表资料的2检验: Data →weight cases → weight cases by: frequency variable:f →ok analyze →descriptive statistics →crosstabs … : row: 药物 column:疗效 statistics →选择McNemar →continue → ok
四、非参数检验 配对设计的符号秩检验: Analyze → nonparametric tests →2 related samples →test pair list:原法-新法 test type: wilcoxon →ok 49
例: 对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见下表的第(2)、(3)栏。问两法所得结果有无差别? 表 12份血清用原法和新法测血清谷-丙转氨酶(nmol· S-1/L)的比较