110 likes | 199 Views
第三次国家卫生服务调查西部扩大调查 抽样方案. 北京大学公共卫生学院 陈育德. 省 级代表性抽样方法. 基本抽样单位:乡镇和街道 每省分别抽取 30 个乡镇和 30 个街道 每个乡镇 / 街道分别抽 2 个行政村 / 2 个居委会 每个村 / 居委会随机抽 33 户(考虑到失访或拒绝调查每个村或居委会可多抽 3-5 户作为备选户) 合计:每个省共抽取调查住户 3960 户. 多阶段分层整群系统随机抽样方法 表. 第一阶段:确定抽样乡镇 / 街道.
E N D
第三次国家卫生服务调查西部扩大调查抽样方案第三次国家卫生服务调查西部扩大调查抽样方案 北京大学公共卫生学院 陈育德
省级代表性抽样方法 • 基本抽样单位:乡镇和街道 • 每省分别抽取30个乡镇和30个街道 • 每个乡镇/街道分别抽2个行政村/2个居委会 • 每个村/居委会随机抽33户(考虑到失访或拒绝调查每个村或居委会可多抽3-5户作为备选户) • 合计:每个省共抽取调查住户3960户
第一阶段:确定抽样乡镇/街道 • 样本总体:本次调查的样本街道是在地级市和省会城市的街道(剔除了国家样本街道)中抽取,样本乡镇是在剔除了国家样本乡镇后在全省所有其他的乡镇中抽取。
抽样方法 • 将全省(市)内乡镇、街道(剔除国家样本乡镇、街道),按其名称第一个字的拼音字母顺序,地(市)分别排序编号,参加抽样。 • 分别计算各地(市)内乡镇、街道的抽样数:即30×本地(市)参加抽样乡镇、街道数/全省(市)参加抽样乡镇、街道总数 • 确定各地(市)的抽样间隔:即本地(市)参加抽样的乡镇、街道数/本地(市)应抽乡镇、街道数 • 确定抽样乡镇:随机抽一张人民币。取其末四位数,该数除以抽样间隔的余数为K值,K≤抽样间隔。K值为被抽第1个样本乡镇、街道编号;K值加抽样间隔为第2个样本乡镇、街道编号;K值加2个抽样间隔为第3个样本乡镇、街道编号,以此类推。
抽样方法实例 • 某省共有1650个乡镇(均非国家样本乡镇),其中某地(市)有105个乡镇,则该地(市)应抽:30 × 105 / 1650 = 2 个乡镇 • 该地(市)的抽样间隔为:105 / 2 ≈ 50 • 随机抽取的人民币后四位数:6332, 6332 / 50=126 余数为32 • 即K值= 32 • 则第一个抽样乡编号为32,第二个抽样乡编号为32+50=82号。
第二阶段:确定样本村、居委会 • 确定样本村 1、将样本乡镇的村,按经济水平分为等量的两组,并编号; 2、用单纯随机(抓阄)的方法在两组内,各抽一个村。 • 确定样本居委会 在样本街道中随机抽取(抓阄)两个居委会
第三阶段:确定抽样住户 • 1、将样本村、居委会内全部住户(包括非本地户口住户)名单编号; • 2、确定抽样间隔:本村、居委会内户数/ 33 • 3、确定抽样住户:首先随机抽一张人民币,取其末四位数,该数除以抽样间隔后的余数确定为K值,要求K≤抽样间隔。 • K值为被抽第1个住户编号,K 值加抽样间隔为被抽中的第二个住户编号,K值加两个抽样间隔为第3个被抽住户编号, • 以此类推。
实例 • 1、某样本村内共有住户109户,编为001~109号 • 2、确定抽样间隔109户/ 33 = 3.3 ≈3 • 3、随机抽取的人民币后四位数:7832, 7832/3 =2610 余数为2。即K值= 2 • 则该村第2,5,8,11,14,17,20,23,26,29,32,35,38,41,44,47,50,53,56,59,62,65,68,71,74,77,80,83,86,89,92,95,98共33户。 • 说明:计算抽样间隔为3.3,但为了便于操作,则取3,这样使实际抽样间隔人为变小,到第98号即抽满33户,多余的第101,104,107共3户则删去。