390 likes | 543 Views
第 8 章 抽样推断与参数估计. 第一节 抽样误差 第二节 抽样单位数目的确定 第三节 参数估计. 第一节 抽样误差. 2.1 、抽样平均误差 (一)概念 (二)计算 1 、简单随机抽样 2 、类型抽样 3 、等距抽样 4 、整群抽样 5 、阶段抽样 (三)影响抽样平均误差的因素 2.2 、抽样极限误差 2.3 、抽样极限误差与抽样平均误差的关系 返回. 实际误差. 平均误差. 一、抽样平均误差. (一)抽样平均误差的概念. 抽样平均误差:样本指标与总体指标间平均的离差. 二、抽样平均误差计算.
E N D
第一节 抽样误差 • 第二节 抽样单位数目的确定 • 第三节 参数估计
第一节 抽样误差 • 2.1、抽样平均误差 • (一)概念 • (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样 (三)影响抽样平均误差的因素 2.2、抽样极限误差 2.3、抽样极限误差与抽样平均误差的关系 返回
实际误差 平均误差 一、抽样平均误差 • (一)抽样平均误差的概念 • 抽样平均误差:样本指标与总体指标间平均的离差
二、抽样平均误差计算 • 1、简单随机抽样平均误差的计算公式 • ①平均数的抽样平均误差 • ②成数的抽样平均误差
练习 • 1、某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。 • 2、该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。
3、据电视观众抽样调查资料显示:电视观众平均收视时间为95分钟,标准差为70,如果采用重复抽样的方法随机抽取10000人或40000人,分别计算抽样平均误差。3、据电视观众抽样调查资料显示:电视观众平均收视时间为95分钟,标准差为70,如果采用重复抽样的方法随机抽取10000人或40000人,分别计算抽样平均误差。 • 4、据CNNIC “中国互联网络发展状况统计报告”显示:截止到 2009年1月中国宽带网民占网民总体的90.6%,如果采用重复随机抽取方法在网民中抽取100人和400人,分别计算抽样平均误差。
5. 从总体300个单位中随机重复抽取36个单位作样本,其标准差为6,则平均数的平均抽样误差为: ( ) (1)2 (2)1 (3) 3 (4) 4 6.从总体300个单位中随机不重复抽取36个单位作样本,其标准差为6,则平均数的平均抽样误差为: ( ) 7.在随机重复抽样条件下,为使抽样误差减少一半,样本容量应增加到: ( ) (1) 1 倍 (2) 2 倍 (3) 3 倍 (4) 4 倍
2、类型抽样 • (1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。 • (2)样本单位数在各类型组中的分配方式 • ①等额分配:在各类型组中分配同等单位数。 • ②等比例分配:按各类型组在总体中所占比例分配样本单位数。即: • ③最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。
(3)抽样平均误差的计算公式 • ①平均数的抽样平均误差 • 重复 • 不重复且等比例 • ②成数的抽样平均误差 • 重复 • 不重复且等比例
例 题 • ①有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为:300 330 330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为:420 420 450 460 490 520。抽查4块,测定12块地的平均亩产量,计算其抽样误差。 • ②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 • 用类型抽样,每类抽2块 • 计算各组方差 平均组内方差 抽样误差
平原 丘陵
3、等距抽样 • (1)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。 • (2)排对的方法 • ①无关标志排队 ②有关标志排队 • (3)抽取样本单位的方法 • ①按相等的距离取样 • ②对称等距取样 • (4)抽取第一个样本单位的方法 • ①随机抽取 ②居中抽取
4、整群抽样 • (1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。 (2)抽样平均误差的计算公式 某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检查平均每袋重量和一级品率,样本资料如下: 计算抽样平均误差 (3)例题
一昼夜有1440分钟,即把总体分为1440群,R=1440 每隔144分钟抽取1分钟的水泥(10袋),r= 10
(三)影响抽样平均误差的因素 • 1、总体标准差的大小 • 2、样本单位数的多少 • 3、抽样方法的不同 • 4、抽样组织方式的差别
2.2 抽样极限误差 • 样本指标围绕总体指标左右两侧波动形成的一定范围。 • 抽样极限误差:样本指标与总体指标最大可能的误差范围
2.3、抽样极限误差与抽样平均误差的关系 (一)抽样分布 据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。 (二)关系
第三节 抽样单位数目的确定 3.1、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样 3.2、影响抽样单位数目的因素
3.1 抽样单位数目的计算 (一)简单随机抽样单位数目的确定 1、计算公式 (1)平均数 (2)成数
2.例题 (1)某类产品根据以往资料的估计,总体方差5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到99.73%,误差范围不超过0.9千克,需要抽多少样本单位? 按题意 (2)根据以往资料的估计,该类产品的一等品率为 • 90%,可靠程度仍为99.73%,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本单位? 按题意
(二)类型抽样 • 1、计算公式
2、例题 • 某工厂早、中、晚生产罐头10000瓶,根据以往资料的估计平均重量的类型平均方差为0.549克,合格率的类型平均方差为0.02787,要求可靠程度为何95%,平均重量的允许误差为0.11克,合格率的允许误差为0.025,用类型抽样推断10000瓶罐头的平均重量和合格率,需要抽多少样本单位? 据题意
(三)等距抽样 • 计算公式 • (1)按有关标志排队 • 同类型重复抽样 • (2)按无关标志排队 • 同简单随机不重复抽样
3.2、影响抽样单位数目的因素 • 总体各单位的变异程度 • 抽样推断的准确程度△ • 抽样推断的可靠程度Z • 抽样的组织形式 • 抽样的方法
第四节 抽样估计 4.1 估计量的优良标准:无偏性、有效性、一致性 4.2 抽样估计的方法 (一)点估计:直接用样本指标代替总体指标 不能准确的告诉我们估计的把握程度 (二)区间估计 :不仅仅告诉我们一个范围,告诉我们估计的把握程度 1、平均数的区间估计 2、成数的区间估计 3、2个总体平均数之差的估计 4、两个总体比例之差的估计
二、抽样估计的方法 返回 • (一)点估计 • (二)区间估计 • 特点:不是指出被估计参数的确定数值,而是指出被估计参数的的可能范围,同时对参数落在某一范围内给定相应概率的保证程度。z-概率度 • 1、平均数的区间估计 • (1)样本取自总体方差已知的正态分布(大、小样本)
例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差是3公斤,现给定抽样误差极限为6公斤,求总体平均亩产落在估计区间的概率?例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差是3公斤,现给定抽样误差极限为6公斤,求总体平均亩产落在估计区间的概率? • 已知: u=3公斤 Δ=6公斤 • 则估计区间(600-6,600+6)=(594,606) • 查正态概率表得,落在估计区间的概率为: • F(z)=F(2)=95.45%
例:麦当劳餐馆在7星期内抽查49名顾客的消费额如下,在概率90%的保证下,顾客平均消费额的估计区间.例:麦当劳餐馆在7星期内抽查49名顾客的消费额如下,在概率90%的保证下,顾客平均消费额的估计区间. • 15 24 38 26 30 42 18 30 25 34 44 20 35 46 28 47….. • 解:①计算样本的平均数和标准差: • ②根据给定的置信度F(z)=90%,查概率表z=1.64 • ③计算: • 消费额下限= • 消费额上限= • 点估计:麦当劳餐馆顾客平均消费额为32元 • 区间估计:以90%的概率保证,麦当劳餐馆顾客消费额在29.8-34.2之间
某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料的置信区间。某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料的置信区间。 • 5500包原材料的平均重量在63.14~66.86之间。
总体平均数估计 • 根据置信度的要求,估计极限误差可能的范围,并指出估计区间,具体步骤如下: • ①抽取样本,并根据样本的标志值求出样本平均数 和标准差S,在大样本的情况下用S代替 • ②根据给定的置信度F(z),查正态分布概率表得到z • ③根据 计算估计区间的上下限。
例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为96.76%(z=2.14)的条件下建立广告平均费用的置信区间。例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为96.76%(z=2.14)的条件下建立广告平均费用的置信区间。 • 电视台一分钟广告的平均费用在8894~11106之间。
(二)根据极限抽样误差 ,求概率保证度F(z) 。 • 具体步骤如下: • ①抽取样本,并根据样本的标志值求出样本平均数 作为总体平均数的估计值,并计算标准差S以推算平均误差 • ②根据给定的极限抽样误差,估计总体平均数上下限。 • ③根据 概率度z, 查正态分布概率表,求得置信度F(z)。
在一项新广告的跟踪调查中,在被调查的400人中有240人会记起广告的标语。试求会记起广告语占总体比率的95%置信度的估计区间。在一项新广告的跟踪调查中,在被调查的400人中有240人会记起广告的标语。试求会记起广告语占总体比率的95%置信度的估计区间。 • 根据样本资料计算: • P=n1/n2=240/400=60% • 根据给定的置信度要求F(Z)= 95%,查表Z=1.96 • 根据 • 以概率95%的保证程度,会计会记起广告语的人数占总体比率的55.2-64.8之间
总体成数的估计 • (一)根据置信度的要求,估计极限误差可能的范围,并指出估计区间范围,具体步骤如下: • ①抽取样本,计算样本的成数 p和标准差S,并由此推算出抽样的平均误差u • ②根据给定的置信度F(z),查正态分布概率表得到z • ③根据 计算总体成数的上下限。
成数的区间估计 • 例1:某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了200人访问,有140人离开的原因是工资太低。以95%的置信水平对总体这种原因离开的人员比例进行区间估计。 该企业由于工资低离开的职工比例为63.6% 与76.4%之间