1 / 101

第一节 抽样推断概述

第五章 抽样推断. 第一节 抽样推断概述. 第二节 随机抽样的概率分布. 第三节 参数估计. 第四节 抽样设计. 重要概念: 抽样推断,全及指标,抽样指标,抽样误差,抽样平均误差,极限误差,概率度,简单随机抽样,类型抽样,等距抽样,整群抽样。. 重点内容: 抽样平均误差的计算,总体平均数和成数的区间估计,样本容量的确定。. 思考问题: 1 、抽样推断与抽样调查的区别和联系? 2 、如何理解抽样误差?当样本容量一定时,抽样误差可以消除么?

ronald
Download Presentation

第一节 抽样推断概述

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 抽样推断 第一节 抽样推断概述 第二节 随机抽样的概率分布 第三节 参数估计 第四节 抽样设计

  2. 重要概念: 抽样推断,全及指标,抽样指标,抽样误差,抽样平均误差,极限误差,概率度,简单随机抽样,类型抽样,等距抽样,整群抽样。 重点内容: 抽样平均误差的计算,总体平均数和成数的区间估计,样本容量的确定。

  3. 思考问题: 1、抽样推断与抽样调查的区别和联系? 2、如何理解抽样误差?当样本容量一定时,抽样误差可以消除么? 3、什么是抽样平均误差?它的影响因素有哪些?它与样本标准差是否相同,并指出相同点或不同点? 4、总体平均数与总体成数的关系如何? 5、样本容量的影响因素有哪些?

  4. 第一节 抽样推断概述 抽样推断 按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。 指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会

  5. 抽样推断 全及总体指标:参数(未知量) 统计推断 样本总体指标:统计量(已知量)

  6. 随机原则的实现 是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。 抽签法 将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。 随机数表法 是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。 计算机模拟法

  7. 随机样本 与总体分布特征相同 与总体分布特征不同 总体 非随机样本 并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样

  8. 抽样推断的特点 • 按随机原则抽取样本单位 • 以样本的数量特征推断总体的数量特征 • 抽样推断产生抽样误差,但抽样误差可以事先计算并控制 与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。我国在1994年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。

  9. 抽样推断的应用 • 不可能进行全面调查时 • 不必要进行全面调查时 • 来不及进行全面调查时 •  对全面调查资料进行补充修正时

  10. 抽样推断的理论基础 表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。 大数定律 如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。 中心极限定律

  11. 抽样推断的基本概念 又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。常用N表示全及总体的单位数目。 全及总体 又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1<n<N。 抽样总体 n≥30称为大样本,n<30称为小样本.n/N称为抽样比. 例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。

  12. 设总体中 个总体单位某项标志的标志值分别 为 ,其中具有某种属性的有 个 单位,不具有某种属性的有 个单位,则 根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标 ,又称总体参数。 全及指标 ⒈ 总体平均数(又叫总体均值):

  13. ⒉ 总体单位标志值的标准差: ⒊ 总体单位标志值的方差:

  14. ⒋ 总体成数: ⒌ 总体是非标志的标准差: ⒍ 总体是非标志的方差:

  15. 指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被称为统计量,它是随机变量。指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被称为统计量,它是随机变量。 抽样指标 设样本中 个样本单位某项标志的标志值 分别为 ,其中具有和不具有某 种属性的样本单位数目分别为 和 个,则 ⒈ 样本平均数(又叫样本均值):

  16. 为自由度 为 的无偏估计 为 的无偏估计 ⒉ 样本单位标志值的标准差: ⒊ 样本单位标志值的方差:

  17. ⒋ 样本成数: 为 的 无偏估计 ⒌ 样本单位是非标志的标准差: 为 的 无偏估计 ⒍ 样本单位是非标志的方差:

  18. 抽样方法的分类 根据取样方式不同,可分为: 从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样 重复抽样 总体单位数N不变,同一单位可能多次被抽中。 每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样. 不重复抽样 总体单位数减少n,同一单位只可能被抽中一次。

  19. 抽样方法的分类 根据对样本的要求不同,可分为: 考虑顺序抽样 考虑各单位的中选顺序。 ABC≠CBA 不考虑各单位的中选顺序。 不考虑顺序抽样 ABC=CBA 考虑顺序的重复抽样 考虑顺序的不重复抽样 综合起来共有四种抽样方法 不考虑顺序的不重复抽样 不考虑顺序的重复抽样

  20. 样本的可能数目 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样 把填湖南风采35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?中特等奖的概率是多少?(0—9选6呢?) 不考虑顺序的不重复抽样,

  21. 样本的概率分布 把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分布。 若将样本指标的取值分别记为 其相应的概率记为P1,P2,…Pn,将它们按顺序排列起来,可得如下概率分布表。 …… ……

  22. 样本统计量所有可能值的概率分布 抽样分布 样本统计量 样本统计量 样本统计量 样本统计量 总体未知参数 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 第二节 随机抽样的概率分布 分布的形状及接近总体参数的程度 平均数 比率(成数) 方差 主要样本 统计量

  23. 平均数的抽样分布 学生 A B C D E F G 成绩 30 40 50 60 70 80 90 按随机原则抽选出4名学生,并计算平均分数。 二者均值相等

  24. 学生 A B C D E F G 成绩 30 40 50 60 70 80 90 离差 -30 -20 -10 0 10 20 30

  25. 全部可能样本平均数的均值等于总体均值,即:  • 从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。  • 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。  • 样本均值的标准差为总体标准差的 平均数的抽样分布

  26. 比率的抽样分布 • 全部可能样本比率的均值等于总体比率,即:     • 从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。  • 从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。 • 样本比率的标准差为总体标准的  。

  27. 具有博士学位的比率:  P=0.5 比率的标准差:   =0.5 从总体中按重复抽样方法随机抽取4人,计算其比率P和标准差 比率的抽样分布 教师 是否博士 A 是 B 是 C 否 D 否 E 否 F 是

  28. 比率的抽样分布

  29. 比率的抽样分布   全部可能样本比率的均值等于总体比率,即:       从非正态总体中抽取的样本比率当n足够大时其分布接近正态分布。  从正态总体中抽取的样本比率不论容量大小其分布均为正态分布。   样本比率的标准差为总体标准差的   。

  30. 从中按重复抽样方式抽取2人,计算样本的均值 及方差S2。从中按重复抽样方式抽取2人,计算样本的均值 及方差S2。 方差的抽样分布 学生 A B C D 成绩 60 70 80 90 均值 =75 方差 2=125

  31. 样本抽样分布 原总体分布

  32. 抽样误差 167CM 169CM 172CM 160CM 162CM 167CM 175CM 180CM 165CM 167CM 170CM 175CM 178CM 180CM 162CM 173CM 155CM 160CM 170CM 165CM 平均身高=169.8CM 总平均身高=168.6CM 平均身高=174.6CM

  33. 第三节 参数估计 也叫抽样估计,就是根据样本指标数值对总体指标数值作出估计或推断。 参数估计 通常,把用来估计总体特征的样本指标叫估计量或统计量,待估计的总体指标叫总体参数。 1、它在逻辑上运用归纳推理而不是演绎推理。 特点 2、在方法上运用不确定的概率估计方法,而不是运用确定的数学分析方法。 3、抽样估计存在抽样误差。

  34. 优点 简单,具体明确 无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况 缺点 从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量视为总体参数的估计值,称为参数的点估计。 点估计

  35. 的抽样分布 点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差

  36. 估计值的优良标准 问题:   第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?               第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优于另一个? 估计值的优良标准:      无偏性、有效性、一致性

  37. 设 为待估计的总体参数, 为样本统计量,则 的优良标准为: 指样本指标的均值应等于被估计的总体指标 无偏性 抽样估计量的优良标准 若     ,则称 为 的无偏估计量

  38. 若    ,则称 为比 更有效的估计量 指随着样本单位数 的增大,样本估计量将在概率意义下越来越接近于总体真实值 若 越大 越小,则称 为 的一致估计量 抽样估计量的优良标准 作为优良的估计量,除了满足无偏性的要求外,其方差应比较小 有效性 一致性

  39. 有效性 学生 A B C D E F G 成绩 30 40 50 60 70 80 90 按随机原则抽选出4名学生,并计算平均分数和中位分数。

  40. 有效性 中位数的抽样分布 平均数的抽样分布

  41. 无偏性 有偏 无偏

  42. n=4时 的抽样分布 n=5时 的抽样分布 一致性 学生 A B C D E F G 成绩 30 40 50 60 70 80 90 按随机原则抽选出5名学生,并计算平均分数。

  43. 数理统计证明: • 为 的无偏、有效、一致估计量; • 为 的无偏、有效、一致估计量; • 为 的无偏、有效、一致估计量。 抽样估计量的优良标准

  44. 式中: 为样本平均数的抽样平均误差; 为可能的样本数目; 为第 个可能样本的平均数; 为总体平均数 区间估计 给出一个区间(置信区间)并推断真正的参数以一定的概率存在于这个区间的方法。 指每一个可能样本的指标值与总体指标值之间平均离差,即一系列样本指标的标准差 抽样平均 误差 注意:不要混淆抽样 标准差与样本标准差!

  45. 当N≥500时,有 抽样平均误差的计算 ⒈ 样本平均数的抽样平均误差 重复抽样时: 不重复抽样时:

  46. 当N≥500时,有 抽样平均误差的计算公式 ⒉ 样本成数的抽样平均误差 重复抽样时: 不重复抽样时:

  47. 用过去同类问题全面调查或抽样调查的经验数据代替;用过去同类问题全面调查或抽样调查的经验数据代替; • 用样本标准差 代替总体标准差 ,用 代替 。 抽样平均误差的计算公式 关于总体方差的估计方法

  48. 影响抽样误差的因素 • 总体各单位标志值的差异程度(即标准差的大小):越大,抽样误差越大; • 样本单位数的多少:越大,抽样误差越小; • 抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小; • 抽样组织方式:简单随机抽样的误差最大。

  49. 指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最大可能范围,也称作抽样允许误差。常用△表示。指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最大可能范围,也称作抽样允许误差。常用△表示。 抽样极限 误差 上式表明,样本平均数(成数)是以总体平均数(成数)为中心,,在相应的区间内变动。

More Related