150 likes | 288 Views
§1.2 系统抽样与分层抽样. 黄石三中 张菊荣. 复习回顾. 1 、什么是简单随机抽样?. 设一个总体的个数为 N 。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。. 2 、什么样的总体适宜简单随机抽样?. 适用范围:总体的个体数不多时。. 3 、随机数表法的步骤如何?. 1 、给总体中各个个体编号;(起始号码选 00 ,而不选 01 ,可使 100 个个体都可用 2 位数表示) 2 、选定开始的数字;(随机) 3 、获取样本号码。(按顺序列出,以免重复). 若总体个数较多时该怎么办呢?.
E N D
§1.2系统抽样与分层抽样 黄石三中 张菊荣
复习回顾 1、什么是简单随机抽样? 设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。 2、什么样的总体适宜简单随机抽样? 适用范围:总体的个体数不多时。 3、随机数表法的步骤如何? 1、给总体中各个个体编号;(起始号码选00,而不选01,可使100个个体都可用2位数表示) 2、选定开始的数字;(随机) 3、获取样本号码。(按顺序列出,以免重复) 若总体个数较多时该怎么办呢?
系统抽样 例1 为了解参加某种知识竞赛的1000名学生的成绩,打算抽取容量为50的一个样本进行了解。过程如下: (1)随机将这1000名学生编号为1,2,3,……,1000; (2)将总体按编号顺序平均分成50部分,每部分包含20个个体; (3)在第一部分的个体编号1,2,……,20中,利用简单随机抽样抽取一个号码,比如13; (4)以13为起始号,每间隔20抽取一个号码,这样就得到一个容量为50的样本:13,33,53,……,973,993。
答:在上面的抽样中,由于在第一部分(编号为1—20)中的起始号码是随机确定的,每个号码被抽取的概率都答:在上面的抽样中,由于在第一部分(编号为1—20)中的起始号码是随机确定的,每个号码被抽取的概率都 等于 ,所以在抽取第1部分的个体前,其他各部分中 每个号码被抽取的概率也都是 。就是说,在这个系统 抽样中,每个个体被抽取的概率都是 。 系统抽样 将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。 问题一 系统抽样中,每个个体被抽中的概率是否一样? 与简单随机抽样的概率一样
情景设置 例2 为了了解参加某种知识竞赛的1003名学生的成绩,应采用什么样的抽样方法恰当? 解:(1)随机将这1003个个体进行编号1,2,3,……1003。 (2)利用简单随机抽样,先从总体中剔除3个个体(可以随机数表法),剩下的个体数1000通通被50整除,然后按系统抽样的方法进行。 问题2 如果个体总数不能被样本容量整除时该怎么办? 答:先从总体中随机地剔除余数(可用随机数表),再按系统抽样方法往下进行。(每个被抽到的概率是否一样?)
1、总体中的每个个体被剔除的概率是相等的 , 2、也就是每个个体不被剔除的概率相等 ; 3、采用系统抽样时每个个体被抽取的概率都是 ; 4、在整个抽样过程中每个个体被抽取的概率仍 相等,都是 。 情景设置 讨论:在这整个抽样过程中每个个体被抽取的概率是否相等?
②整个的编号分段(即分成几个部分),要确定分段的间②整个的编号分段(即分成几个部分),要确定分段的间 隔k。当 (N为总体中的个体的个数,n为样本容量)是 整数时,k= ;当 不是整数时,通过从总体中剔除一 些个体使剩下的总体中个体的个数N,能被n整除,这时k= ; 阶段小结 系统抽样的步骤: ①采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 ; ③在第一段用简单随机抽样确定起始的个体编号l; ④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本)。
阶段练习 1、P21练习1、2 2、从含有500个个体的总体中一次性抽取25个个体,每个个体被抽到的概率相等,那么总体中的每个个体被抽到的概率等于?
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。 分层抽样 问题 一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在500人中任意取100个吗?能将100个份额均分到这三部分中吗? 分析:考察对象的特点是由具有明显差异的几部分组成。
(2)利用抽样比确定各年龄段应抽取的个体数,依次(2)利用抽样比确定各年龄段应抽取的个体数,依次 为 ,即25,56,19。 分层抽样 问题 一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在500人中任意取100个吗?能将100个份额均分到这三部分中吗? 解:(1)确定样本容量与总体的个体数之比100:500=1:5。 (3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56。19人,然后合在一起,就是所抽取的样本。
(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中 每个个体被抽到的概率相等,都等于 。 阶段练习 1、P22练习1、2、3 2、某单位有职工200人,其中老年职工40人,现从该单位的200人中抽取40人进行健康普查,如果采用分层抽样进行抽取,则老年职工应抽取的人数为多少? 强调两点: (2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。