1.02k likes | 1.16k Views
Market survey & Forecast 市场调查与预测 (6) 制作:陈晓慧 武汉理工大学出版社 2009 年 4 月. 第六章 时间序列预测法. 在我们的生活中,有时候需要对未来的经济现象进行预测。而预测的依据就是已经发生的经济现象,当把历史数据按照时间顺序排列进行分析、归纳、总结,就可从中得到一些规律东西,并利用这些规律进行预测。而 时间序列预测法 是市场预测中一个重要方法之一。 时间序列 是指各种各样的社会、经济、自然现象的 数量指标依时间秩序排列起来的统计数据 ( 动态 ) 。
E N D
Market survey & Forecast 市场调查与预测 (6) 制作:陈晓慧 武汉理工大学出版社 2009年4月
第六章 时间序列预测法 在我们的生活中,有时候需要对未来的经济现象进行预测。而预测的依据就是已经发生的经济现象,当把历史数据按照时间顺序排列进行分析、归纳、总结,就可从中得到一些规律东西,并利用这些规律进行预测。而时间序列预测法是市场预测中一个重要方法之一。 时间序列是指各种各样的社会、经济、自然现象的数量指标依时间秩序排列起来的统计数据(动态)。 例如,武汉理工大学的每年招生人数是依时间变化的,这就是一种时间序列。
时间序列预测法 • 是根据历史资料和数据,按照时间序列所反映的经济现象的发展过程、方向和趋势、将时间序列外推或延伸,以预测经济现象未来可能达到的水平。 • 时间序列预测法特点 • 在时间序列中,数据的大小受到各种因素的影响。数据的变化趋势也表现出各种形状,通常根据这些影响因素将数据的变化趋势分为四大类:长期趋势、季节趋势、循环趋势、和不规则变动。 • 对于前三种数据趋势预测问题,由于数据呈现某种规律性,因此能够将数据进行简化、分析,从而使预测成为可能;而不规则变动是指由某种偶然因素引起的突然变动,如战争的发生、政权的更迭、重大的自然灾害(地震、海啸)等,预测的难度就大,有的甚至无法预测。
第一节 时间序列概述 时间序列预测法早在国外应用,国内是在二十世纪60年代初应用于水文预测,随计算机的广泛应用,在许多领域已经应用,并取得了很好的效果。目前,已成为世界各国进行市场预测的基本方法。 一、时间序列分析 时间序列一般用:y1,y2,…,yt…;表示,其中t—时间 在时间序列中,每个时期变量数值的大小,都受到许多不同因素的影响。例如,手机销售量受到居民的收入、质量,功能、价格等因素的影响。因此,时间序列按性质不同分成一下四类:
1、长期趋势(Long-term Tend) 指受某种根本性因素的影响,时间序列在较长时间内朝着一定的方向持续上升或下降,以及停留在某一水平上的倾向。 如图所示。 . . . . . 销售额 销售额 销售额 时间 时间 时间 (a)上升变动趋势图 (b) 下降变动趋势图 (c) 水平变动趋势图 图 时间序列数据长期趋势变化曲线
2、季节变动(Seasons Variety)指由于自然条件和社会条件的影响,时间序列在一年内随着季节的转变而引起某一因子呈周期性的变动。例如,农作物的生长季节影响,导致农产品加工业的季节变动。 季节变动的周期比较稳定,一般,周期为一年。 季 销 售 额 年销售额 时间 时间 图4-2 时间序列数据季节变化曲线 图4-3 时间序列数据循环变化曲线
3、循环变动(Alternation variety )如图4-3所示。 循环变动与季节变动有相似之处,时间序列都会在周期内有波动,而季节波动的时间序列周期长短固定;而循环变动的时间序列波动较长、周期长短不一,少则一两年,多则数年甚至是数十年,周期不好预测。 4、不规则变动(Irregular Variety) 它是由各种偶然性因素引起的无周期变动。又可分为突然变动和随机变动。例如,战争、自然灾害、地震、意外事故的改变所引起的变动都属于突然变动;而随机变动是由随机因素所产生的影响。(前两天,日本地震) 二、时间序列的组合形式 时间序列是由长期变动、季节变动、循环变动和不规则变动四类因素组成。四类因素的组合形式,常见的有以下几种类型:
对于一个具体的时间序列,由哪几类变动组合,采用哪种组合形式,应根据所掌握的资料、时间序列、及研究的目的来确定。下面,我们将要分别介绍这类问题的预测方法。对于一个具体的时间序列,由哪几类变动组合,采用哪种组合形式,应根据所掌握的资料、时间序列、及研究的目的来确定。下面,我们将要分别介绍这类问题的预测方法。
第二节 平均数预测法 平均数法是一种传统的趋势变动分析预测法,它通过计算时间序列一定项数的平均数,来估计模型参数,建立趋势变动分析预测模型进行外推预测。 一、全列算术平均法(Average) 是移动平均法的一种,它含有算术平均法、几何平均法、加权平均法等。 1、算术平均法:设时间序列为:
用此公式应注意: (1)时间序列波动较小的情况下使用; (2)预测值可用最后一年的每月平均值或数年的每月平均值; (3)当观察期的长短不同,预测值也随之不同(误差) 若误差过大,就会使预测失去意义,因此,预测时应确定合理的误差,误差公式为: (4)当时间序列波动较小时,预测期可短一些; 反之,可长一些。
补充资料 1、显著性水平(α)—本来正确的数据却被错误的否定掉,即犯弃真错误,犯此错误的概率称为显著性水平。 β—本来错误的数据却被认为是正确的而被保留下来,即犯存伪错误,犯此错误的概率记作β。 (n-m-1)—自由度。 其中:n—时间序列的个数 m—自变量的个数 2、标准差(S)—实质上是平均差,它反映个体与平均值差别的程度。
算数平均预测法举例1 请你根据食盐在2001年~2004年的每月销售量见表所示,预测2005年的每月销售量。 表 食盐的销售量及平均值
解:由表可知, 方法(1) 以2001年~2004年的4年的月平均值作为2005年的预测值,则有:
在95%的置信度下,确定2005年每月预测区间为:在95%的置信度下,确定2005年每月预测区间为: 方法(2) 以2004年每月的平均值作为1998年的每月预测值 结论 比较 (1)、(2)可知:方法(1)精确度高。
问题 表 某商店汗衫的销售量统计表 单位:百元 某商店汗衫的销售量如表所示,试预测第第五年每月的销售量。
由表可知: (1)1~12月内出现季节波动,特别是在6~8月份,要比淡季高出2~3倍。 (2)汗衫销售量还出现长期变动趋势(每一年的销售量逐年增加) 在这种情况下,用算术平均法求第四年每月的平均值,显然误差较大,就不能用这种方法
2、几何平均(Geometry Mean ) (1)n个变量值乘积的n次根; (2)适用于对比率数据的平均; (3)主要用于计算平均增长率; (4)G的确定方法:①根据公式直接 计算 ② (5)可看作是平均数的一种变形。
问题1 某水泥厂1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2002年相比增长率为16%,2002年与2001年相比增长率为20%,求各年的平均增长率。 解:
问题2 一位投资者购有一种股票,在2000,2001,2002,2003年收益率分别为4.5%,2.1%,25.5%,1.9%,计算其平均收益率。
几何平均预测法 适用条件:具有对比或近似对比关系的时间序列。
问题3 某企业1991~2004年的销售额资料如表所示,预测该企业2005年的销售额 表 某企业1991~2004年的销售额
解:(方法一)由预测公式直接计算(略) (方法二)由环比指数进行预测 预测步骤如下: (1)以上年度的基数分别求各年的环比指数。 1991年的环比指数=81/71×100%=114.08% 2004年的环比指数=83/81×100%=102.47%, 同理可得出各年的环比指数,见表 (2)求环比指数的几何平均数,即发展速度。可用两种方法: ①直接用所求得的环比指数,求平均发展速度。
②采用对数运算,求得的环比指数的几何平均数,见表。②采用对数运算,求得的环比指数的几何平均数,见表。 G=arclg ∑lgxi/n=arclg2.0231=105.46 平均发展速度为5.52%。 两种方法所得结果梢有差异,是由于计算中四舍五如的原因。 (3)求环比指数几何平均数的简便算法。 以1991年销售额为x0(基数),……,2004年销售额为xn (当前期),那么其环比指数的几何平均数为:
表 1991 ~ 2004年销售额及几何发展速度 单位:万元
3、加权平均法 是在求平均数时,根据观察期各资料重要性的不同,分别赋予不同的权重,然后再平均的方法。 特点:加权后的平均值包含了长期趋势变动。
ω的选择原则: 由表达式可知, ω的选择不同, 近期数据的数据权重选择大一些;远期数据权重选择小一些. 有三种形式: (1)当xt 变动不大时, 采用等差级数的形式,1,2,…,n (2)当xt变动较大时,采用等比级数的形式,1,2,4,8…, (3)当 xt变动不大时,采用0.2,0.3,0.5, …等
问题: 某商店近几年的资料如表所示,试预测1998年的销售额。 表 1993~1997年销售额及赋权权值 单位: 万元
二、移动平均法 分析:由表可知,随着时间的推移,销售额逐年稳步的增加,若用算术平均或几何平均,其预测值较小,不能刻化时间序列的长期趋势.而加权平均法只要ω选取的好,就能较好的反映长期趋势,故选用加权平均法进行预测. 是将观察期的数据,按时间先后顺序排列,由远及近,以一定的跨越期进行移动的平均,求得的平均值,即:x1,x2,…,xn, 方法: 每次移动平均总是在上次移动平均的基础上,去掉一个最远的数据,增加一个紧挨跨越期后面的新数据新数据,保持跨越期不变,每次只向前移动一步,逐项移动,滚动前移。 下面具体介绍如下:
(一)一次移动平均法 1、原理
问题:移动平均法中n的大小比较 某城市汽车配件销售公司某年1月至12月的化油器销售量如表所示,请预测明年1月的销售量。
解:(1)分别取N=3,和N=5 由预测公式: 其结果作图分别为: 注:右图, 兰线为n=3, 红线为n=5. 三期移动平均预测 月 图4-4
讨论1 1、由图可知:销售量的随机波动较大,经过平均移动法计算后,随机波动显著减少,即较大程度消除了随机因素的影响。 2、n的取值愈大,修匀的程度也愈大,因此波动也愈小。但对实际销售量的真实变化趋势反应也愈迟钝;反之,N的取值愈小,对实际销售量的真实变化趋势反应也愈灵敏。
讨论2 由前面的讨论可知: 1、N的取值大小,决定了对实际情况描述误差的大 小。故N的取值很重要。N应取多大,才能基本反应真实情况应视具体情况而定。 2、在实际应用中,是取几个N值进行试算,比较他们的预测误差的大小。具体方法如下:
移动平均法特点: 所求得的各序列平均值,不仅构成了新的时间序列,而且新的时间序列与原时间序列相比较,削弱了季节变动、周期变动和不规则变动的影响,具有明显的修复效果,同时又保持了原时间序列的长期趋势变动,正是它具有这种特点,因此,移动平均法在市场预测这被非常广泛的应用。
2、一次平均移动值的位置 由 的表达式可知: 是时间序列的中间值,即 放在中间的位置。但实际上是放在跨越期末的位置。这就出现了偏差,即使得预测值落后与实际值n-1/2,为了纠正这种误差,规定将 放在n+1/2的位置上。 3、一次移动平均法预测的步骤(1)绘制散点图(根据收集的资料) (2) 选择跨越期并计算移动平均值 (3)计算趋势变动值 (4)当年趋势变动值=当年移动平均值—上年的移动平均值 = • n+1/2 n • 一次移动产生滞后偏差的原因
注意:在以下情况,趋势变动情况可分别处理:注意:在以下情况,趋势变动情况可分别处理: ①当各年的趋势变动值比较平稳时,可直接采用最后一 年的趋势变动值进行预测。 ②当各年的趋势变动值波动较大时,可采用下面两种方法: (a)趋势变动值=算术平均值 (b)趋势变动值=各年的趋势变动值求移动平均,并以最后一个移动平均值作为趋势变动值。 (5)计算绝对误差、平均绝对误差 绝对误差= (6)建立预测模型
应 用1 我国1985~2003年的发电总量基本呈直线上升趋势,具体资料如表所示,请你预测2004年和2005年的发电总量? 我国发电总量及一次移动平均值计算表
解: (1)绘制散点图 由散点图可以看出,发电量基本呈直线上升趋势,可用移动平均法进行预测。 yt 观察值曲线 5000 4000 3000 2000 1000 0 N=7时移动平均曲线 t 1985 1990 1995 2000 2005 图 我国1985~2003发电量及一次移动平均值的散点图 (2)选择跨越期 取N=7。
由上可知,趋势变动值采用不同的算法,其结果很不一样,这三答案都是对的。那么在实际的预测中到底采用哪一个预测值呢?只有决策才能最后选定。由上可知,趋势变动值采用不同的算法,其结果很不一样,这三答案都是对的。那么在实际的预测中到底采用哪一个预测值呢?只有决策才能最后选定。
(二)二次移动平均法 1、二次移动平均法原理 二次移动平均法是对一组时间序列数据先后进行两次移动平均,即在一次的基础上,再进行第二次移动的平均,并根据最后的两个移动平均值的结果建立预测模型,求得预测值。 二次移动平均法与一次移动平均法关系密切。 第一,一次移动平均法,存在滞后偏差,使移动平均值滞后于实际观察值的 期,而二次移动平均法正是利用这一滞后偏差,把一次、二次移动平均值置于跨越期末的水平上,并建立预测模型,求得预测值。 第二 ,二次移动平均法不是一种独立的方法,它必须在一次移动平均值的基础上再进行第二次移动平均,同时,要与一次移动平均值(最后一项的一次移动平均值)一起才能建立预测模型进行预测。
二次移动平均法预测步骤 (1)选择跨越期 一般情况下,求二次移动平均时,采用与一次相同的跨越期。 (2)计算一次移动平均值( ★ 的第一个放在n=7上) (3)计算二次移动平均值( ★ 的第一个放在n=7上) (4)建立二次移动平均法预测模型
应用3 时间序列的数据资料如应用2,试用二次移动平均法预测2006年、2007年的发电量。 解: (1)选择跨越期 n=7。 (2)计算 、 (3)建立二次预测模型 见表
第三节 指数平滑 前面介绍的移动平均法存在两个不足之处,一是存储数据数量较大,二是对最近的N期数据等权看待,而 对t-T期以前的数据则完全不考虑。因此,预测的结果准确度不高。指数平滑法却有效的克服了这两个缺点。它既不需要存储大量的历史数据,又考虑了各期数据的重要性,而且使用了全部历史资料。因此,指数平滑移动平均法的改进和发展,应用极为广泛。 指数平滑法根据平滑的次数不同,可分为一次指数平滑、二次指数平滑、三次指数平滑等。分别介绍如下: