310 likes | 491 Views
第 5 章 实用线性模型. 5.2 方差分析. 5.2.1 单因子方差分析. 在科学试验和生产实践中,影响一事物的因素往往是很多的。如产品质量是否受到配料、设备、人工等的差异的影响。要找出对产品质量有影响的因素,我们需要进行试验。方差分析就是根据试验的结果进行分析,鉴别各个有关因素对试验结果影响的有效方法。 在实验中我们称要考察的指标为试验指标。称影响指标的条件为因素。称因素所处的状态为水平。如果在一项试验中只有一个因素在改变称为单因子试验,如果多于一个因素在改变称为多因子试验。.
E N D
第5章 实用线性模型 5.2 方差分析 5.2.1 单因子方差分析 在科学试验和生产实践中,影响一事物的因素往往是很多的。如产品质量是否受到配料、设备、人工等的差异的影响。要找出对产品质量有影响的因素,我们需要进行试验。方差分析就是根据试验的结果进行分析,鉴别各个有关因素对试验结果影响的有效方法。 在实验中我们称要考察的指标为试验指标。称影响指标的条件为因素。称因素所处的状态为水平。如果在一项试验中只有一个因素在改变称为单因子试验,如果多于一个因素在改变称为多因子试验。
例1.对某农作物采取五种不同的施肥方案进行收获量试验。每种方案作四块田,结果如下表。试求不同施肥方案对农作物收获量有无显著性影响。
在双因素试验中,如果不仅考虑因素 及 各自对试验结果的影响,而且还要考虑因素 与 的交互作用(记作 ,简记作 )对试验结果的影响,则应该对于因素 与 的各个水平的每一种配合 分别进行 次重复试验,即共进行 次试验,假定各次试验都是独立的,得到样本观测值 如下表: 5.2.2 双因子等重复试验的方差分析
397 98 100 105 94 471 说明:红色数字为和 120 130 116 105 353 75 84 102 92 293 314 323 291 1221 例2. 为比较三种松树在不同的地区的生长情况有无差别,在每个地区对每种松树随机的选取五株,测量它们的胸径,得到如下的数据:
5.3 线性回归 我们知道现实生活中的许多现象之间存在着相互依赖、相互制约的关系.一切事物都是相互联系着、发展变化着的。变量间的关系一般可以分为两大类。 1、确定性关系,即我们所熟悉的变量间的关系可以用函数关系来表达,如圆的半径R与圆的面积S之间就存在确定的函数关系。 2、非确定性关系,即变量之间虽有密切的关系,但这种关系无法用确定的函数关系表达,如人的年龄与血压之间有密切关系,但却找不到一个函数能准确地表示它们之间的关系,变量之间这种非确定性关系,称为相关关系。 即使是具有确定性关系的变量,由于测量误差的影响,其表现形式也具有某种程度的不确定性。 回归分析是分析变量间的不确定性关系的一种方法,有时也称为相关分析。
1.回归分析的内容: (1)从一组数据出发,分析变量之间存在着什么关系,建立这些变量之间的关系式(回归方程)并对关系式的可信程度进行统计检验。 (2)利用回归方程式,根据一个或几个变量的值预测或控制另一个变量的取值。 (3)从影响某一变量的诸多变量中判断哪些变量对它的影响是显著的,哪些是不显著的从而建立起更实用的回归方程。 (4)根据预测和控制提出要求,选择试验点对试验进行设计。
例3. 在硝酸纳(NaNO3)的溶解度试验中,测得在不同温度x下,溶解于100份水中的硝酸纳份数y的数据如下表: 这里 为自变量, 是随机变量,我们要求 对 的回归。 以温度 为横坐标,硝酸纳份数 为纵坐标将这些观察值 描在平面直角坐标系上.称为散点图。根据散点图可以作出经验直线:
一元线性回归分析的主要任务是: (1) 用试验值(样本值)对 、 和 作点估计; (2) 对回归系数 、 作假设检验; (3) 在 处对 作预测,对 作区间估计.
3.模型参数估计 (1)回归系数的最小二乘估计
(1) 回归方程的显著性检验 4.检验、预测与控制
1)预测 (3)预测与控制
在实际问题中样本容量 常常很大,这时我们不但能得到较短的预测区间,还可以 简化式子 ,得到近似的预测区间. 在 很大时,上式中根式近似等于 1, 近似,于是 预测区间近似地为: 特别, 的 置信度为99.7%的预测区间近似地为: 置信度为99.%的预测区间近似地为:
控制是预测的反问题,即要求观察值 在某区间 内取值时,应控制 在什么范围。亦即要求以 的置信 度求出相应的 使 所队应的观察值 落在 内。 这里我们只讨论 很大时的情形。利用前面的式子 2)控制 第5章结束
全课程结束 再见