270 likes | 381 Views
调查设计与分析. 陈景武. 几个基本概念. 1. 总体与样本 2. 参数与统计量 3. 抽样研究与抽样误差 4. 概率 5. 小概率事件及小概率事件的原理 6. 参数估计 7. 假设检验. 第一节 调查研究类型. 1 、 横断面研究: 是对某人群当前特定状况的调查,因此又称现况调查。 2 、 追踪研究(队列研究): 是对不同暴露水平的对象进行追踪观察,从而分析暴露因素与疾病发生之间的因果关系、是由因寻果的调查研究。
E N D
调查设计与分析 陈景武
几个基本概念 1. 总体与样本 2. 参数与统计量 3. 抽样研究与抽样误差 4. 概率 5. 小概率事件及小概率事件的原理 6. 参数估计 7. 假设检验
第一节 调查研究类型 1、横断面研究:是对某人群当前特定状况的调查,因此又称现况调查。 2、追踪研究(队列研究):是对不同暴露水平的对象进行追踪观察,从而分析暴露因素与疾病发生之间的因果关系、是由因寻果的调查研究。 3、回顾性研究(病例对照研究):是对某病的一组患者和另一组非患者进行观察,比较两组某些因素的暴露情况,从而分析该疾病与这些因素的关系。是由果推因的研究。
第二节 横断面研究的设计与分析 一、调查方法 (一)普查(全面调查)是对研究总体的所有观察单位都进行调查。目的是了解总体某一特定时点的情况。 (二)抽样调查是从总体中抽取一定数量的观察单位组成样本,根据对样本的调查信息来推论或推断总体特征。 (三)典型调查(案例调查)是选择有代表性的观察单位进行调查。用于对总体特征进行深入的研究、推论。
二、抽样方法类型 (一)非概率抽样 在抽样中各个观察单位(个体)被抽中的概率是未知的。 1、“滚雪球”抽样 2、偶遇抽样 3、典型抽样 非概率抽样可用于推论总体情况而不能推断总体参数。
(二)概率抽样抽样中总体各个观察单位被抽中的概率是已知的。(二)概率抽样抽样中总体各个观察单位被抽中的概率是已知的。 (三)样本的代表性 样本对总体的代表性越好,对总体的估计越精确。样本中的个体在总体中分布越均匀,对总体的代表性越好。
三、两类总体 (一)有限总体 总体中的个体数是有确定值的。 (二)无限总体 总中的个体数是无限的。 研究者按研究目的规定的总体称为目标总体。
四、概率抽样方法 例某中学有2000名学生(6个年级、40个班、6个组/班),用抽样方法调查其近视眼患病率。 (一)简单随机抽样 1、方法先将总体中的所有个体顺序编号,再用随机的方法抽取个体组成样本。 本例学生编号:0,1,2,3,4,5,6,…,1999 随机数字: 9382,6364,3907,1063,…,0102 共200个 抽取学生编号:1382,0364,1907,1063,…,0102
总体类型 均数标准误 率的标准误 无限总体 有限总体 2、抽样误差及总体率π的估计 总体率π95%的可信区间:p-1.96Sp~p+1.96Sp
3、优缺点 (1)均数(或率)及其标准误计算简单。 (2)总体例数多时抽样麻烦。
(二)系统抽样(等距或机械抽样) 1、方法 本例2000/200=10(人)— 抽样间距 0,1,2,3,4,5,6,7,8,9 样本:6,16,26,36,… ,1996 — 200人 先将总体中的个体顺序编号,再每隔相等的间隔抽取一个个体组成样本。
观测值 如 1 2 3 4 5 6 7 8 9 10 11 12 观察单位 2、优缺点 (1)简便易行,抽样误差小于简单随机抽样。 (2)无统一计算标准误的方法。在特定情况下有较大误差。 抽样样距为4:1,5,9 4 ,8,12
(三)分层抽样(分类抽样) 1、方法 先将总体按某种特征的不同程度分类若干类型或组别,统计上称为不同层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。 用于分层的特征是指影响观察值变化的主要因素。 本例:6个年级,每个年级为一层,每层随机抽取1/10的学生,合起来为200学生。 2、特点 (1)抽样误差小。 (2)便于各层单独分析和相互比较。
(四)整群抽样 1、方法 班级编号:0,1,2,3,……,39 随机数字:22,56,07,97,75 ←40~79者减40,× ≥80者弃去 抽中班号:22,16,07,35 先将总体化分为若干个群,再随机抽取部分群,由抽取群的所有个体组成样本。 2、优缺点 (1)经济,易组织。 (2)抽样误差大于简单随机抽样。
2000人,6个年级,共40个班,每班50人,分为6个组。2000人,6个年级,共40个班,每班50人,分为6个组。 (五)多阶段抽样将总体分成多级抽样单位。 优缺点 1、便于组织,抽样误差小于整群抽样。 2、均数(率)及其标准误的计算随设计不同而变化。
第三节 敏感问题调查—随机应答技术 例某地区拟调查去年育龄妇女人工流产情况,用什么指标?如何调查? 随机抽取1000名育龄妇女,对每个人提出两个不相关的问题,如: (1)去年您做过人工流产吗?(2)您去过长城吗?
设调查对象抽中(1)题的概率为:p=0.5 设调查对象抽中(2)题的概率为:1-p=0.5 样本中所有人对(1)回答是的概率为:p1——样本人工 流产率,待求。 样本中所有人对(2)回答是的概率为:p2——再做一次 调查,可知。 则:抽中(1)且回答是的概率为:p×p1=0.5p1。 抽中(2)且回答是的概率为:(1-p)×p2=0.5p2。 若样本中对(1)、(2)两题回答是的总率为λ
n=1000 p=0.5 该地区育龄妇女人工流产率的95%可信区间 :
调查研究的用途 (一)估计总体参数 如毕业生就业的平均工资 (二)参数比较 如新旧教学方法教学质量比较 (三)相关研究 如学生综合成绩提高与哪些因 素有关 (四)回归研究 如上例综合成绩的提高与影响 因素的定量分析 (五)评价研究 改革项目多方面的综合评价 (六)其它研究 聚类分析、判别分析、对应分析等
调查研究设计方案 一、调查目的 21世纪以来,随着我国加入WTO,社会和用人单位对人才标准重新定位,对大学生—未来人才的生力军和后备力量的综合素质提出了更高的要求。本研究通过对某医科大学生综合素质影响因素分析,筛选出影响较大的指标,建立评估模型,为进一步提高大学生综合素质、完善其培养机制提供理论依据。 某医科大学学生综合素质的影响因素研究 二、调查对象与抽样方法 以某高等医学院校在校医学生为研究对象,采用分层整群抽样方法,每年级为一层,每个班为“群”的抽样单位,由抽取班的所有学生组成样本。
三、调查项目及调查量表 结合以往的文献资料,多次征求相关专家、学者意见经多次论证确定了调查内容和项目。调查项目主要包括(1)生理健康状况,如身体健康状况、户外活动等。(2)智力因素,如记忆力、逻辑思维能力、创新能力等。(3)非智力因素,如性格、意志力、自信心、兴趣等。(4)家庭环境因素,如父母职业、父母学历、家庭住址等。(5)学校环境因素,如教学质量、教学条件、学习氛围等因素(6)社会环境因素,如就业形势、就业担心等多方面的影响因素。 调查项目的答案为封闭式,采用了无序定性和有序定性两种答案,以便于logistic回归模型的量化分析。 综合分析调查目的、内容及资料分析方法的基础上,形成以下调查表:
影响医学大学生综合素质因素调查量表 亲爱的同学: 您好!大学生综合素质是我们广大师生普遍关注的问题,关系到我们将来的发展和成才。为了研究影响大学生综合素质的相关因素,从而为大学生提高自己的综合素质提供科学依据,同时也为您提供一个了解自己将来发展成才有关情况的机会,我们特地进行此次调查。对调查情况我们将严格保密,仅作研究之用,请您认真如实的填写,以便保证总体研究的可靠性和科学性,我们会为您提供一个可以查询自己测试结果的平台,您可以方便的查询到自己的测试结果。对您的真诚参与和热情支持在此表示衷心的感谢! 填写说明:本调查量表主要包括填空和选择。对于填空题,您只需在横线上填写相应的内容;对于选择题,请您在最符合您自己情况的选项上打“√”号。
(一) 基本情况 学号:_________ 年龄:______ 周岁 专 业: _____________________ 学历:①专科 ②专升本 ③本科 ④研究生 性别:①男 ② 女 家庭住址:① 城市 ②农村 年级: ①大一 ②大二 ③大三 ④大四 ⑤大五 政治面貌: ①群众 ②团员 ③党员
(二) 调查项目 1.您自入大学以来获得过奖学金吗?① 是 ②否 (选择“是”的继续填写以下几项,选择“否”的跳过以下几项直接作答第2题)。 获得奖学金的等级,次数 (可以多选): ①一等,次数_____次 ②二等,次数_____次 ③三等,次数_____次 2.您的文化课的成绩在班级中大体排名:①上游 ②中上游 ③中游 ④中下游 ⑤下游 3.是否在班团委、学生会、各种社团担任职务: ①是 ②否 4.您感觉自己的学习兴趣:① 很浓厚 ②比较浓厚 ③一般 ④不感兴趣 ⑤很不感兴趣 • • • 36.您对自己以后的就业问题担心吗?①很担心 ②比较担心 ③不担心
四、调查方式 调查方式采取现场问卷调查方式。调查前对调查员进行严格培训,统计专业研究生进行现场调查,在班级辅导员配合下,对调查对象讲清本次调查的目的、意义以及在调查量表填写过程中应该注意的问题,并适当给与被调查者一定的物质奖励,以期获得较高依从性。问卷由调查对象在辅导员和调查员督导下独立完成填写。量表完成后及时收回,以免遗失。
五、统计分析 资料录入Excel2000 建立数据库。 (1) 采用当前对量表信度评价最常用的方法—Chronbach’s 系数法,对量表进行信度评价;采用探索性因子分析法对量表进行结构效度检验。 (2) 把经过因子分析所得的因子得分作为新变量纳入到多因素Logistic 逐步回归模型中进行分析,采用最大似然法逐步筛选变量建立最优模型, 并结合专业知识对模型拟合优度和科学性进行了分析评价。上述所有资料均使用SAS8.0和SPSS10.0软件进行统计学处理。
1. 优秀测评标准 以奖学金得分高低为判断学生优秀与否的标准。按照专家建议和相关文献,按照一等奖学金7分,二等奖学金5分、三等奖学金3分标准。平均每学期奖学金得分=总得分/学期数。平均每学期奖学金得分≥3分的判为优秀,<3分的判为不优秀。 2. 变量赋值方法 二分类资料按照不发生为0、发生为1进行量化处理;多分类有序资料进行等距自然数编码;多分类无序资料设置哑变量;连续性计量资料按等距分组转化成有序分类资料,然后进行等距自然数编码。 其余内容略