100 likes | 238 Views
抽样方法简介. 北京大学公共卫生学院 陈育德. 抽样方法. 单纯随机抽样:如:抽签、摸球、随机数字表 系统抽样:又称间隔抽样、机械抽样:例如:抽户的方法是先确定一户,如第 5 户,以后每间隔 10 户抽一户,则得到样本户 5 、 15 、 25 、 35 …… 分层抽样:先按某种特征将总体分为若干组(类型、区),统称为“层”,再从每一“层”中进行随机抽样。 整群抽样:以“整群”为抽样单位。例如以乡、村等为“整群”进行抽样。 阶段抽样(多阶段抽样):例如在市(区、县)中先以乡镇(街道)为整群进行抽样再在乡(街道)中以管理区(村)、居委会为整群进行抽样。.
E N D
抽样方法简介 北京大学公共卫生学院 陈育德
抽样方法 • 单纯随机抽样:如:抽签、摸球、随机数字表 • 系统抽样:又称间隔抽样、机械抽样:例如:抽户的方法是先确定一户,如第5户,以后每间隔10户抽一户,则得到样本户5、15、25、35…… • 分层抽样:先按某种特征将总体分为若干组(类型、区),统称为“层”,再从每一“层”中进行随机抽样。 • 整群抽样:以“整群”为抽样单位。例如以乡、村等为“整群”进行抽样。 • 阶段抽样(多阶段抽样):例如在市(区、县)中先以乡镇(街道)为整群进行抽样再在乡(街道)中以管理区(村)、居委会为整群进行抽样。
第二阶段抽样调查实例 • 全县人口累计(各乡)数为:248600 • 抽样间隔:248600/5=49720 • 取一张人民币:号为FP59243854,后5位为43854,是为随机数 • 确定第一个样本:43854落在第3编号乡(玉阳镇)后面的累计数之内,故确定玉阳为第1个样本。 • 确定第二个样本:43854+49720=93574,落在第5编号乡(新龙乡)后面的累计数之内,故确定新龙乡为第2个样本。 • 确定第三个样本:93574+49720=143294,落在第8编号乡(新原乡)后面的累计数之内,故确定新原乡为第3个样本。
编号乡镇 人口数 累计 编号乡镇 人口数 累计 编号乡镇 人口数 累计 1城关镇 22000 22000 7平原乡 16400 134900 13新店镇 10000 205500 2平湖镇 21000 43000 8新原乡 15000 149900* 14安定乡 9500 215000 3玉阳镇 20000 63000* 9古农乡 14000 163900 15五岖乡 8900 223900 4五一乡 19500 82500 10王店乡 11000 174900 16五庙乡 8500 232400 5新龙乡 18400 100900* 11双莲乡 10500 185400* 17双山乡 8200 240600 6湖泊乡 17600 118500 12桐连乡 10100 195500* 18四顶乡 8000 248600* 第二阶段抽样调查实例
第三阶段随机整群抽样实例 • 全乡人口(各村人口累计):7337 • 抽样间隔:7337/2=3669 • 取一张人民币,确定其编号后四位数2273为随机数 • 确定第一个样本:2273落在第四编号(镇北村)的累计数之内,确定镇北村为第一个样本。 • 确定第二个样本:2273+3669=5942,落在第10编号的累计数之内,确定清平村为第二样本村。
编号 村 人口数 累计数 编号 村 人口数 累计数 1 镇西店村 724 724 7 长生庙村 589 4606 2 唐家铺村 721 1445 8 王甸子村 574 5180 3 镇东村 689 2134 9 民生村 571 5751 4 镇北村 671 2805* 10 清平村 544 6295* 5 李家店村 610 3415 11 老平埠村 534 6829 6 湖泊村 602 4017 12 高水村 508 7337 第三阶段随机整群抽样实例
样本个体的抽样 • 最终的抽样单位是住户,在每个“样本村”(居委会)中按20%的比例随机抽取住户,平均每个村抽60户,全国共抽取54000户。全国平均每户被抽取为样本的概率为54000/28000万,约每5000户中抽一户。如果按每户四人计算,人口抽样比也为1:5000左右。
样本个体的抽样 • 抽户方法是个样本乡镇(街道)的调查指导员按上述抽样比例在样本村(居委会)随机抽取。具体方法是: • 按人口普查的编码顺序,按门牌号、楼号、单元号、门号从小到大排列; • 对同一门牌号、同一个大院和楼号的,按门号从小到大排列,对同一门牌号内没有门号的按从左到右、从外到里、从下到上的原则编码,一经编码不许变动。 • 编好住户码列入住户清单表式中:
样本个体的抽样 • 本村人口:1200,户数300,每户平均人口数4人 • 应抽户数:60 • 抽样间隔:1200/60=20 • 确定随机数字:取一张人民币,后两位数为12 • 确定第一样本户:12落在第三编号户累计数之内,故确定第三户为第一样本户。 • 确定第二样本户:12+20=32,落在第几编号户累计数内,该户即为第二样本户。
序号 户主名称 家庭住址 门牌号码 家庭人口数 累计人口数 抽中住户 1 张三 *村*组 东1 5 5 2 李四 *村*组 东2 4 9 3 王五 *村*组 东3 4 13 * 4 赵六 *村*组 东4 3 17 5 陈七 *村*组 东5 5 22 …… …… 300 赵末 *村*组 北6 6 1200 样本个体的抽样