170 likes | 296 Views
新世纪全国高等中医药院校规划教材. 中医药统计学. 主编 周仁郁. 8 调查设计. 8.1 调查设计的全过程. 8.1.1 调查设计的目的与方法. 不加任何干预措施 , 客观描述研究总体的统计设计 , 称为调查设计. 调查设计包括确定方案 , 组织调查 , 整理分析全过程. 调查方法可分为普查 , 抽样调查 , 典型调查 3 种. 设计方案. 确定目的及 调查对象. 定抽样方法 及样本容量. 定调查项目 及观测指标. 组织调查. 确定调查方 式及调查表. 宣传目的及培训调查员. 实施调查及 抽样复查. 整理分析.
E N D
新世纪全国高等中医药院校规划教材 中医药统计学 主编 周仁郁
8 调查设计 8.1 调查设计的全过程 8.1.1 调查设计的目的与方法 不加任何干预措施,客观描述研究总体的统计设计,称为调查设计 调查设计包括确定方案,组织调查,整理分析全过程 调查方法可分为普查,抽样调查,典型调查3种
设计方案 确定目的及 调查对象 定抽样方法 及样本容量 定调查项目 及观测指标 组织调查 确定调查方 式及调查表 宣传目的及培训调查员 实施调查及 抽样复查 整理分析 数据录入汇总及复查 计算得统计及专业结论 普查称全面调查:就是对总体进行调查。普查一般用于了解总体在某一特定时点上的情况 抽样调查:从总体中抽取一定数量观察单位组成样本,然后根据样本信息来推断总体特征 典型调查:称案例调查。在对事物进行全面分析的基础上,选择典型的人或单位进行调查
8.1.2 随机与系统抽样 抽样调查的方法有单纯随机抽样、系统抽样、整群抽样、分层抽样 单纯随机抽样,是把调查总体的全部观察单位进行编号,再用随机数表或抽签等方法随机抽取部分观察单位组成样本。总体例数为N,样本例数为n,样本均数及样本率的标准误分别为
随机抽样时,样本容量估计使用6.1的方法,但要用有限总体公式进行校正。总体均数、总体率的样本容量估计校正式分别为 整群抽样≥随机抽样≥系统抽样≥分层抽样 系统抽样又称为机械抽样或等距抽样,是把总体观察单位按一定顺序分为n个部分,从第一个部分随机抽取第k位次的观察单位,再从每一部分中抽取相同位次的观察单位,由这些观察单位组成样本
例1某校3000学生用随机数表抽取100人,若乙肝表面抗原阳性样本率10%,求总体率95%置信区间 把全校学生编为0、1、…、2999号,查统计用表23,任意指定某行某列,以4个数字为一组,除以3000取余数为抽取的编号,后面出现与前面有相同的数字者弃去。如从第9行第5列顺序取100组数 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966… 除以3000取余,随机抽样编号为 1234 2978 0456 0782 2242 0744 0815 2100 1342 0966… N=3000,n=100为大样本,样本率p=0.1,标准误为
故总体率的95%置信区间为 =0.1±1.96×0.0296=(0.0419,0.1581) 例2 欲调查某社区贫血患病情况,该社区有居民1000人,试按系统抽样方法,抽取例数为100的样本 先将1000名居民按某一特征的顺序编号,总体例数N=1000,样本例数n=100,抽样间隔1000/100=10,在 1~ 10之间随机确定一个数字,比如7,每间隔10个观察单位取一个,抽取7,17,27,…,997组成样本
8.1.3 整群与分层抽样 整群抽样是把总体N个观察单位分为K个“群”,每个群包含若干观察单位,随机抽取k个“群”,用这些群中的全部观察对象组成样本。 整群抽样样本均数及其标准误分别为 ∑X为各群观察单位之和,Ti为第i群内观察值之和 整群抽样时,样本率及其标准误分别为
其中,∑ai为各群阳性数之和 分层抽样又称分类抽样,是把总体按影响观察值变异较大的某种特征分为若干类型或组别,称为层,再从每一层随机抽取一定数量的观察单位合起来组成样本 分层设计时,先确定总样本容量n,再用按比例或最优法确定第i层样本容量n 按比例分配,是由总体第i层的观察单位数Ni占总体所有观察单位数的比例Ni/N决定样本各层的容量ni
最优分配,是由总体第j层观察单位数Nj和标准差的大小决定样本各层的容量nj,均数抽样和率抽样的公式分别为 分层抽样中,样本均数及其标准误分别为
分层抽样中,样本率及其标准误分别为 例3在某校40个班3000学生中,随机抽查4个班,学生人数分别为60、80、90、120人,用锡克试验检查白喉易感情况,查得阳性人数分别为12、11、15、17,试以α=0.05水准估计该校学生锡克试验阳性率 这是整群抽样,N=3000,K=40、k=4、a1=12、a2=11、a3=15、a4=17 a-=(12+11+15+17)/4=55/4=13.75
=(12-13.75)2+(11-13.75)2+(15-13.75)2 +(17-13.75)2=22.75 总体率95%的置信区间为 0.1833±1.96×0.0174=(0.1492,0.2174) 例4某地0~19岁人群共14万人,欲调查其HbsAg
阳性率,已知各年龄组分组、人数及既往阳性率,若确定样本例数为1000 人,试分别按比例分配和最优分配确定各年龄组的调查人数 这是分层抽样,按年龄组分为四层 按比例分配时,N=140000,N1=25000、N2=31000, N3=38000、N4=46000 n1=1000×25000/140000=178.57 n2=221.43,n3=271.43,n4=328.57 最优分配时,以既往阳性率为各层总体率pj的估计值 由p1=0.03、p2=0.08、p3=0.10、p4=0.11,计算得
=4264.68+8410.09+11400.00+14392.93=38467.6985 n1=1000×4264.6805/38467.6985=110.8639 n2=218.6273,n3=296.3525,n4=374.1562
8.1.4 调查误差的控制 在设计阶段常见的非抽样误差及控制方法有下面6种
⑴ 正确划分调查范围 ⑵ 正确选择调查指标 ⑶ 明确定义调查项目 ⑷ 正确设置调查问题 ⑸ 选择恰当的调查方式 ⑹ 预调查 在调查阶段,常见非抽样误差及控制方法有下面2种 ⑴ 调查人员的工作态度不好,专业知识欠缺,业务水平不足
⑵ 被调查者不能很好配合,因故不在,故意躲避、拒查、有意隐瞒事情真相,记忆不清 在整理与分析阶段,非抽样误差主要源于计算机数据录入、汇总、计算等方面的错误,在条件许可时应当使用机读卡 调查质量一般使用效度与信度两个指标进行评价,应做到效度与信度的统一。效度是调查工具对调查对象测量的有效程度或准确程度,反映调查的真实性。信度是调查工具对调查对象测量的可靠程度,反映调查的稳定性或一致性。