280 likes | 477 Views
第 15 章 综合应用. 15.1 回归分析在钢铁质量管理中的应用 15.2 时间序列分析在股票市场中的应用. 15.1 回归分析在钢铁质量管理中的应用.
E N D
第15章 综合应用 15.1 回归分析在钢铁质量管理中的应用 15.2 时间序列分析在股票市场中的应用
15.1 回归分析在钢铁质量管理中的应用 从某钢铁集团公司钢研所获得一些钢铁冶炼的实测数据(Fedata.sav)。影响合金钢力学性能的因素很多, 如果将所有的影响都加以考虑, 则不仅使得计算工作量极为庞大, 而且也使得回归模型极为复杂, 算法可能也会难以运行。因此, 必须对这些因素进行分析处理, 突出其中的主要因素, 忽略次要因素,以尽量得到较优的回归模型。这里,研究C、Si、Mn、P、S、Al、Ni、Cr、Cu、Mo、As11中元素对钢铁厚度、屈服、抗拉和延伸性能的影响。
15.1.1 数据预处理 ● 处理缺失数据 如果样本量比较大,针对X缺失较多,Y缺失较少的情况,删除缺失Y的行,对缺失X的地方用该列的均值填补。 ● 剔除异常值 在多种剔除异常值的方法中,这里选择的是常用的3sigma原理对异常值进行了剔除。最后,编程载入数据。通过比较,发现数据不作处理会有更好的实际意义。 ● 数据变换 对以上处理后的数据进行正态性检验,并对没有通过检验的数据进行BOX-COX变换,以满足利用数据进行回归建模的要求。 ● 工艺制度的影响 根据炼钢工艺、轧钢工艺的不同,对数据进行分组处理,如炼钢工艺中的断面、轧钢工艺中所采用的不同热处理工艺。区分后的数据组采用用于程序处理。
15.1.2 逐步回归 这里,仅对抗拉性能针对11种元素做逐步回归,其余三种性能的做法和此方法类似。SPSS演示步骤如下: 1. 启动SPSS软件,打开选用数据,如图15.1;
2. 单击【分析】、【回归】、【线性】得到如图15.2所示的“线性回归”窗口; 图15.2 线性回归
3. 将因变量和自变量分别选入,见图15.3; 图15.3 选入变量图
4. 分别点击“统计量”、“绘制”、“选项”选项卡,按图15.4、15.5、15.6所示选中选项; 图15.5 统计量选项卡
图15.7 抗拉回归标准化残差直方图 图15.8标准化残差P-P图
经过对上述结果的分析,剔除了对抗拉影响不显著的Mn、P、S等8中元素的影响,得到如下的回归方程:经过对上述结果的分析,剔除了对抗拉影响不显著的Mn、P、S等8中元素的影响,得到如下的回归方程: . 从回归方程可知,C、Si、Cr对抗拉都存在正向的影响,其中对抗拉的影响程度较大,影响系数是12.505,对抗拉的影响较小,为0.207。
15.2 时间序列分析在股票市场中的应用 本节使用SPSS软件对股市加以研究。首先,可以获取上证指数1998年1月至2011年12月的周度数据(http://finance.sina.com.cn/),见股市数据.xls。 1. 画出序列趋势图: ⅰ 启动SPSS软件,在数据编辑器中输入数据; ⅱ 在工具栏中分别点击【分析】、【预测】、【序列图】,得到时间序列图窗口,如图15.1所示;
ⅲ 将时间序列图窗口中两个变量日期、收盘价格分别选入自变量、因变量,单击确定,即可得到序列趋势图15.2。 图15.2 收盘价格序列趋势图
从图15.2中,可以看出,序列没有明显的季节成分,但存在一个明显的变化,因此没有必要做季节分解。从图15.2中,可以看出,序列没有明显的季节成分,但存在一个明显的变化,因此没有必要做季节分解。
2. 绘制序列的自相关图和偏自相关图 首先画出股票序列的自相关图和偏自相关图,如图15.3所示。 图15.3 股票序列的自相关图和偏自相关图
从图中不难看出,序列的acf和pacf图都是拖尾的,说明序列是非平稳的。众所周知,股票数据序列通常都不是平稳序列,但其一阶差分数据是平稳的,因此可以做进一步分析。从图中不难看出,序列的acf和pacf图都是拖尾的,说明序列是非平稳的。众所周知,股票数据序列通常都不是平稳序列,但其一阶差分数据是平稳的,因此可以做进一步分析。
3. 建立合适的模型 首先画出差分序列的趋势图15.3: 图15.3 差分序列的趋势图
从图中可以看出,差分序列的值均匀分布在平衡位置两侧,序列是平稳的。从而,差分序列的acf和pacf图也可得到,见图15.4。从图中可以看出,差分序列的值均匀分布在平衡位置两侧,序列是平稳的。从而,差分序列的acf和pacf图也可得到,见图15.4。 图15.4 差分序列的acf和pacf条图
从图15.4可知,差分序列的acf和pacf都是拖尾的,因此,可对原始序列建立模型,经过反复试验,可得到如下结果:从图15.4可知,差分序列的acf和pacf都是拖尾的,因此,可对原始序列建立模型,经过反复试验,可得到如下结果:
图15.5 残差序列的acf和pacf 由图15.5的可知,残差的acf和pacf都是平稳的,从 而所确定的模型是合理的,即
4. 拟合预测 根据第3步得出的模型,可以根据原始数据序列对模型进行拟合,结果如图15.6。 图15.6 序列拟合图