240 likes | 470 Views
《 应用统计学 》 习题课. 北航经管学院 2011-2012 学年第二学期. 同学。。。 你 是 “ 表哥” 还是 “表姐” ??. 这位同学, 你的大名在哪里。。。. 统计学 : 是一门关于数据资料的 收集 、 描述 、 分析 、 解释 的学科。. 统计学 : 是一门关于数据资料的 收集 、 描述 、 分析 、 解释 的学科。. 判别分析. 对数据 disc.sav 进行计算. 提取出两个非零特征根,其中,第一个特征根能解释 99% 的原始信息。. 8 个原始变量中,有 7 个变量进入了模型(变量 cp 未进入模型) 。
E N D
《应用统计学》习题课 北航经管学院 2011-2012学年第二学期
同学。。。 你是“表哥” 还是“表姐” ??
这位同学, 你的大名在哪里。。。
统计学 : • 是一门关于数据资料的收集、描述、分析、解释的学科。 • 统计学 : • 是一门关于数据资料的收集、描述、分析、解释的学科。
判别分析 对数据disc.sav进行计算
提取出两个非零特征根,其中,第一个特征根能解释99%的原始信息。提取出两个非零特征根,其中,第一个特征根能解释99%的原始信息。 • 8个原始变量中,有7个变量进入了模型(变量cp未进入模型)。 • 两个判别函数的表达式如下:
(-6.296+0.154)/2=-3.071 (0.154+6.141)/2=3.1475 • 将新样本点的观测值带入线性判别函数,哪个函数的数值大,就将新样本点判为对应的那一类
如图所示,分类效果很好。 模型的正判率达到了100%
盲点 作业中 普遍存在的一些问题…
聚类分析 下表给出6种精神治疗药物的3种临床测量指标数据,请利用谱系图做聚类分析(绝对值距离和最短距离法)
绘制谱系图的盲点: 1、横坐标标注(样本点可以不按照原始的顺序排列;排列的原则:保证谱系图中的线段不相互交叉) 2、纵坐标刻度(聚合指数)
主成分分析 • 管理期刊遴选 • 请分析以下内容: • (1)指出主平面图的累计贡献率 • (2)利用因子载荷图给主成分(或主因子)命名 • (3)解释主平面图的含义
前两个主成分(主平面)的累积贡献率是63.937%,对4个原始变量具有较好的代表性前两个主成分(主平面)的累积贡献率是63.937%,对4个原始变量具有较好的代表性
第一个主成分与“被引频次”、“引证期刊数”、“nsfc基金标注数”这三个变量正相关,且相关性较高,可以命名为“科学性和规范性”第一个主成分与“被引频次”、“引证期刊数”、“nsfc基金标注数”这三个变量正相关,且相关性较高,可以命名为“科学性和规范性” • 第二个主成分主要由“载文量”解释,可以命名为“信息量”
判断相关形态 线性相关 一元线性相关 正相关 • 两个变量呈正相关关系,且线性关系比较明显 计算相关系数
F检验 t检验
方差分析 显著! 检验通过。 由于p-value=0.2459>0.05,因此不能拒绝原假设,即不能认为三种方法组装的产品数量是有显著差异的。
抽样调查 1、某调查公司欲了解一居民区内看过某电视广告的家庭所占比重,需要从该区抽选多个家庭作样本。该小区居民共有1050户,分析人员希望以95%的置信度对这个比重值做出估计,并使估计精度在0.05的范围内。在一个以前抽取的样本中,曾统计有28%的家庭看过该广告。试问应抽取多大容量的样本? 要求估计精度 有 若考虑不放回抽样,有 注意向上取整!
描述性统计 收益率的标准差或者方差
Ready? • Go!!! 预祝大家 取得好成绩!