1.26k likes | 1.39k Views
第 5 章 统计抽样与参数估计. ★. 第一节 抽样推断 第二节 抽样误差 第三节 参数估计的基本方法 第四节 抽样组织的设计. 第一节 抽样推断. ★. 一、抽样推断的意义和一般步骤 二、总体参数与样本统计量 三、抽样框与样本数 四、概率抽样与非概率抽样. 一、抽样推断的意义和一般步骤. ㈠ 抽样推断的定义 ㈡ 抽样推断的特点 ㈢ 抽样推断的运用 ㈣ 抽样推断的一般步骤. 抽样推断. 按照 随机原则 从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法.
E N D
第5章 统计抽样与参数估计 ★ 第一节抽样推断 第二节抽样误差 第三节参数估计的基本方法 第四节 抽样组织的设计
第一节抽样推断 ★ 一、抽样推断的意义和一般步骤 二、总体参数与样本统计量 三、抽样框与样本数 四、概率抽样与非概率抽样
一、抽样推断的意义和一般步骤 ㈠ 抽样推断的定义 ㈡ 抽样推断的特点 ㈢ 抽样推断的运用 ㈣ 抽样推断的一般步骤
抽样推断 按照随机原则从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法 指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会
抽样推断 全及总体指标:参数(未知量) 统计推断 样本总体指标:统计量(已知量)
随机样本 与总体分布特征相同 与总体分布特征不同 总体 非随机样本 并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样
抽样推断的特点 • 按随机原则抽取样本单位 • 目的是推断总体的数量特征 • 抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制
抽样推断的应用 • 不可能进行全面调查时 • 不必要进行全面调查时 • 来不及进行全面调查时 • 对全面调查资料进行补充修正时
抽样调查研究Sampling Study • 为什么要抽样? • 1.涉及破坏受试对象 • 质量控制 • 2. 取得精确可靠的结果 • 3. 实际情况的约束 • 时间,成本等
抽样推断的一般步骤 设 计 抽 样 方 案 抽 取 样 本 单 位 收 集 样 本 数 据 计 算 样 本 统 计 量 推 断 总 体 参 数
第一节抽样推断 ★ 一、抽样推断的意义和一般步骤 二、总体参数与样本统计量 三、抽样框与样本数 四、概率抽样与非概率抽样 ★
二、总体参数和样本估计量 ㈠ 总体和样本 ㈡ 总体参数和样本统计量
总体(population) 全及总体简称总体,是指所要认识对象的全体。 全及总体的单位数用N表示,即使是有限总体,N一般也都是很大的。 • 样本(sample) 样本总体简称样本。是从全及总体中随机抽取出来,代表全及总体的部分单位的集合体。 样本总体的单位数通常用n表示,对于N来说,n是很小的。
一般来说,样本单位数达到或超过30个称为大样本,30个以下称为小样本。社会经济调查一般为大样本。一般来说,样本单位数达到或超过30个称为大样本,30个以下称为小样本。社会经济调查一般为大样本。 • 以很小的样本来推断很大的总体,这是抽样推断的特点之一。 • 把 n/N 叫做抽样比例。 • 全及总体是唯一确定的。而一个总体中可能抽取很多个抽样的样本。 • 样本概念的二重性:一般的讨论样本时,样本应理解为n维随机变量;在一次具体容量为n的抽样中,则样本是n维随机变量的一个观察值。
更大样本容量的抽样分布 某个样本容量的抽样分布
指被估计的总体指标,又被称为全及指标 总体参数 设总体中 个总体单位某项标志的标志值分别 为 ,其中具有某种属性的有 个 单位,不具有某种属性的有 个单位,则 ⒈ 总体平均数(又叫总体均值):
⒉ 总体单位标志值的标准差: ⒊ 总体单位标志值的方差:
⒋ 总体成数: ⒌ 总体是非标志的标准差: ⒍ 总体是非标志的方差:
设样本中 个样本单位某项标志的标志值 分别为 ,其中具有和不具有某 种属性的样本单位数目分别为 和 个,则 指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量 样本估计量 ⒈ 样本平均数(又叫样本均值):
为自由度 为 的无偏估计 为 的无偏估计 ⒉ 样本单位标志值的标准差: ⒊ 样本单位标志值的方差:
⒋ 样本成数: 为 的 无偏估计 ⒌ 样本单位是非标志的标准差: 为 的 无偏估计 ⒍ 样本单位是非标志的方差:
第一节抽样推断 ★ 一、抽样推断的意义和一般步骤 二、总体参数与样本统计量 三、抽样框与样本数 四、概率抽样与非概率抽样 ★ ★
三、抽样框与样本数 ㈠ 抽样框 ㈡ 抽样方法 ㈢ 抽样组织方式 ㈣ 样本数和样本容量
抽样方案设计的基本准则 ㈠ 随机原则 ——抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位 ㈡ 抽样误差最小 ——在其他条件相同的情况下,选抽样误差最小的方案 设计抽样方案时,通常是 在误差达到一定要求的条 件下,选择费用最少的方案 ㈢ 费用最少 ——在其他条件相同的情况下,选费用最少的方案
指包括全部抽样单位的名单框架,仅对有限总体而言指包括全部抽样单位的名单框架,仅对有限总体而言 抽样框 名单抽样框 主要形式 区域抽样框 时间表抽样框 编制抽样框
名单抽样框 • 列出全部总体单位名录的一览表。 • 如职工或企业名单等。 • 可采用抽签方式或随机数字表进行抽选样本的单位。
某外国公司在天津进行微波炉市场调查: 区域抽样框 和平区、河西区…南开区 八里台街、新兴路街… 学府街 平湖里、风湖里… 照湖里 居民一组 居民二组… 在商场的大门口 在微波炉柜台前 在市区街道旁边 在某个住宅小区
时间表抽样框 连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。 连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。
抽样方法 重复抽样 又被称作重置抽样、有放回抽样 抽出 个体 登记 特征 放回 总体 继续 抽取 同一总体单位有可能被重复抽中,而且每次抽取都是独立进行 特点
又被称作不重置抽样、不放回抽样 不重复抽样 抽出 个体 继续 抽取 登记 特征 同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行 特点 是最为常用的抽样方法,用于无限总体和 许多有限总体样本单位的抽样。
第一节抽样推断 ★ 一、抽样推断的意义和一般步骤 二、总体参数与样本统计量 三、抽样框与样本数 四、概率抽样与非概率抽样 ★ ★ ★
概率抽样 • 按照概率的随机原则抽取样本,称为概率抽样,得到的样本称为随机样本。 • 基本的概率抽样方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。 • 从理论上说,概率抽样是最理想最科学的抽样方法,能保证样本数据对总体参数的代表性,而且能够将抽样误差限制在一定范围之内。相对来说,也是花费较大的抽样方式。
非概率抽样 • 也叫做非随机抽样。是根据调查者的经验或判断,从总体中有意识的抽取若干单位构成样本。 • 重点调查、典型调查、配额调查、方便调查等都属于非随机抽样。 • 大多数种类的研究,如产品测试、街头访问、电话调查、座谈会等,只要不是属于要进行总体数量推论的项目都可以使用。 • 容易产生倾向性误差,且不能计算和控制抽样误差,无法说明调查结果的可靠程度。
第5章 统计抽样与参数估计 ★ 第一节抽样推断 第二节抽样误差 第三节参数估计的基本方法 第四节 抽样组织的设计 ★
★ 一、抽样误差的概念 二、影响抽样误差的因素 三、抽样平均误差 四、抽样极限误差 五、抽样估计的概率度、精度 和可靠程度 第二节抽样误差
统计误差 • 统计调查中的两类误差: • 一类是调查误差——各种调查方式中都可能出现。指在调查过程中由于观察、测量、登记、计算上的差错而引起的误差。又称为登记性误差。 • 一类是代表性误差——指在抽样调查过程中用样本推断总体指标时可能产生的误差,是样本对于总体代表性引起的误差。
代表性误差的两种情况: • 系统性偏误——由于违反随机原则而产生的系统性误差。 • 随机性误差——按随机原则抽样时,不同抽样所得到的不同抽样指标值与总体参数之间的差异,具有随机性和偶然性,是抽样调查本身不可避免的误差。但这种随机性误差可利用大数定律精确的计算并通过抽样设计加以控制。
指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差 抽样误差 • 对于任何一个样本,其抽样误差都不可能测量出来 • 抽样误差的大小可以依据概率分布理论加以说明 说 明
常见的抽样误差 • 抽样平均数与总体平均数之差 • 抽样成数与总体成数之差
★ 一、抽样误差的概念 二、影响抽样误差的因素 三、抽样平均误差 四、抽样极限误差 五、抽样估计的概率度、精度 和可靠程度 第二节抽样误差 ★
影响抽样误差的因素 • 总体各单位标志值的差异程度(即标准差的大小):越大,抽样误差越大; • 样本单位数的多少:越大,抽样误差越小; • 抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小; • 抽样组织方式:简单随机抽样的误差最大。
抽样分布(概念要点) • 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布 • 是一种理论概率分布 • 随机变量是 样本统计量 ——样本均值, 样本比例等 • 结果来自容量相同的所有可能样本
样本统计量所有可能值的概率分布 抽样分布 平均数 比率(成数) 方差 样本统计量 样本统计量 样本统计量 样本统计量 总体未知参数 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 主要样本 统计量
总体分布 .3 .2 .1 0 1 2 3 4 样本均值的抽样分布(一个例子) 【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下 均值和方差
所有可能的n = 2 的样本(共16个) • 第一个 • 观察值 • 第二个观察值 • 1 • 2 • 3 • 4 • 1 • 1,1 • 1,2 • 1,3 • 1,4 • 2 • 2,1 • 2,2 • 2,3 • 2,4 • 3 • 3,1 • 3,2 • 3,3 • 3,4 • 4 • 4,1 • 4,2 • 4,3 • 4,4 样本均值的抽样分布(一个例子) 现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表
16个样本的均值(x) .3 • 第一个 • 观察值 • 第二个观察值 • 1 • 2 • 3 • 4 .2 P ( x ) • 1 • 1.0 • 1.5 • 2.0 • 2.5 .1 • 2 • 1.5 • 2.0 • 2.5 • 3.0 0 • 3 • 2.0 • 2.5 • 3.0 • 3.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 • 4 • 2.5 • 3.0 • 3.5 • 4.0 样本均值的抽样分布 x 样本均值的抽样分布(一个例子) 计算出各样本的均值,如下表。并给出样本均值的抽样分布
所有样本均值的均值和方差 n å x + + + 1 . 0 1 . 5 4 . 0 L i = = = 2 . 5= u = i 1 M 16 式中:M为样本数目 比较及结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
.3 .3 .2 .2 .1 .1 P ( x ) 0 0 1 2 3 4 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x 样本均值的分布与总体分布的比较 总体分布 抽样分布 = 2.5 = 2.5 σ2 =1.25