820 likes | 910 Views
统计学. 天津财经大学统计系. 第十三章 时间数列数据研究. 第一节 时间数列的分析指标 第二节 时间数列数据变动规律图示 第三节 水平型时间数列和预测 第四节 趋势型时间数列和预测 第五节 季节型时间数列和预测 第六节 混合型时间数列和预测. 第一节 时间数列的分析指标. 一、时间数列的概念、种类及编制原则 二、时间数列的发展水平和平均发展水平 三、时间数列的增长量和平均增长量 四、时间数列的速度指标. 表 13-1. 一、时间数列的概念.
E N D
统计学 天津财经大学统计系
第十三章 时间数列数据研究 • 第一节 时间数列的分析指标 • 第二节 时间数列数据变动规律图示 • 第三节 水平型时间数列和预测 • 第四节 趋势型时间数列和预测 • 第五节 季节型时间数列和预测 • 第六节 混合型时间数列和预测
第一节 时间数列的分析指标 一、时间数列的概念、种类及编制原则 二、时间数列的发展水平和平均发展水平 三、时间数列的增长量和平均增长量 四、时间数列的速度指标
一、时间数列的概念 • 时间数列(time series)— 动态数列, 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列。 • 两个基本要素: • 时间 t ; • 时间t 的数据(水平) yt . • 基期水平与报告期水平; • 期初水平(y0或y1), 期末水平(yn)与中间水平。 • 时间数列是动态分析的依据。
时间数列的种类 • (一)绝对数时间数列——最基本的时间数列 • 时期数列 • 时点数列 • (二)相对数时间数列 • 如 第三产业所占比重数列 • (三)均值时间数列 • 如居民消费水平数列 有关的绝对数序列派生的
(一)绝对数时间数列 • 又称为总量指标时间数列; • 是指一系列同类的总量指标数据按时间先后顺序排列而形成的序列,反映现象在各个时间上达到的绝对水平。 • 可分为时期数列和时点数列。 • 时期数列,如国内生产总值数列 • 时点数列,如年末总人口数列
时期数列和时点数列的特点 • ①时期数列的各个数据为时期指标(流量),表示现象在各段时期内的总量。时期序列的各个数据为时点指标(存量),反映现象在各个时点上所处的状态和所达到的水平. • ②时期数列中各期数据具有可加性,通过加总即可得到更长一段时间内的总量。时期数列中不同时点上的数据不能相加,即它们相加的结果没有意义。 • ③时期数列中数值大小与所属时期长短有直接的关系,时期序列中各时点数值大小与时点间隔长短没有直接的联系。 • ④时期数列中各期数据是对每段时间内发生的数量连续登记的结果,时点序列中数据通常不可能也不必要连续登记,
时间数列的编制原则 • 保证时间序列中各项数据的可比性,是编制时间数列的基本原则。 • (一) 时间一致 • (二) 总体范围一致 • (三) 经济内容、计算口径和计算方法一致
二、时间数列的发展水平和平均发展水平 • 描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少。 • 包括: • 发展水平 • 平均发展水平 • 增长量 • 平均增长量
(一)平均发展水平 • 平均发展水平是不同时间上发展水平的平均数。 • 统计上习惯把这种不同时间上数据的平均数称为序时平均数。 • 它将现象在不同时间上的数量差异抽象掉,从动态上说明现象在一定发展阶段的一般水平。 • 不同性质的时间序列,其计算方法也有所不同。
1. 绝对数时间序列的平均发展水平 • (1)时期序列的平均发展水平 • 采用简单算术平均法: • 【例13-1】根据表11-1的数据,计算我国1991-2003年国内生产总值的年平均水平。 • 解:
(2)时点序列的平均发展水平 • 连续时点序列——用简单算术平均法 • 对社会经济现象而言,已知每天数据可视为连续序列。 • 不连续时点数列计算序时平均数 • 先求分段平均数 • 用来代表相邻两个时点之间各个时点上的水平 • 假定现象均匀变化,分段平均数=相邻两点数据的简单算术平均 • 再求全期总平均数 • 求全期总平均数=分段平均数的加权算术平均 • 权数f=时点间的间隔长度
不连续时点数列计算序时平均数的公式 当时点间隔相等,上式简化为: “首末折半法”——
【例13-2】 • 某地区2004年生猪存栏数量的几个时点数据,试计算该地区全年的生猪平均存栏数量。 • 解:
【例13-3】 • 根据表13-1中各年年末人口数,计算1991~2003年这13年间的平均人口数。 • 解: • 由不连续时点序列计算平均发展水平的计算公式是有假定条件的。实际中,计算结果通常只是近似值。 • 一般认为,间隔越短,计算结果就越准确。
2.相对数(或平均数) 序列的平均发展水平 • 相对数(或平均数) zi= yi / xi (yi 和 xi 为总量指标) • 由于各个zi 的对比基数 xi 不尽相同,所以不能将各期 zi 简单算术平均。 • 正确的计算方法是: • 分别计算绝对数序列 y 和 x的平均发展水平; • 再由这两个平均发展水平对比来得到所求的平均发展水平,即: 其实质是对各期的相对数(或平均数)加权算术平均!
【例13-4】 • 根据表13-1的数据,试计算1991~2003年中国人均国内生产总值的平均发展水平。 • 解: • 年平均国内生产总值为 69238.06 亿元, • 平均人口数为 122588.23 万人, • 故人均国内生产总值的平均发展水平(单位:元/人)
三、时间数列的增长量与平均增长量 (一)增长量(增减量)=报告期水平-基期水平 • 说明现象在观察期内增长的绝对数量; • 基期不同,有逐期增长量与累计增长量之分: * 逐期增长量=报告期水平-上期水平 • 逐期增长量说明现象逐期增长的数量。 * 累计增长量=报告期水平-固定基期水平 • 累计增长量说明一段时期内总共增长的数量。 关系:累计增长量=相应时期的逐期增长量总和. * 同比增长量=报告期水平 -上年同期水平
(二)平均增长量 平均增长量 • 逐期增长量的序时平均数; • 计算方法采用算术平均法。
例13-5 根据下表数据,计算我国居民消费水平的增长量和平均增长量。 • 解:居民消费水平的年平均增长量为:
四、时间数列的速度指标 (一)发展速度=报告期水平/基期水平 • 说明现象在观察期内发展变化的相对程度; • 有环比发展速度与定基发展速度之分 • 环比发展速度=报告期水平/上期水平 • 反映现象逐期发展变动的程度,也可称为逐期发展速度。 • 定基发展速度=报告期水平/固定基期水平 • 反映现象在较长一段时间内总的发展变动程度,也称为发展总速度。
二者关系: • 定基发展速度=相应时期的环比发展速度之积。 • 相邻两定基发展速度之商=相应的环比发展速度。 • 为了消除季节变动因素的影响,可计算:
(二)增长速度(增长率) 增长速度(增减速度)——增长量与基期水平之比,说明现象增长变化的相对程度; 基期不同,分环比增长速度与定基增长速度 • 环比增长速度=逐期增长量/上期水平 • =环比发展速度-1 • 定基增长速度=累计增长量/固定基期水平 • =定基发展速度-1
环比增长速度 定基增长速度 环比发展速度 定基发展速度 乘/除 • 二者关系: • 定基增长速度(总增长速度)不等于相应各环比增长速度之和(积)。 • 几种速度指标之间的相互关系如下所示:
速度的表现形式和文字表述 • 速度指标的表现形式:一般为 %、倍数,也有用‰、番数等等。 • 翻 m 番,则有:报告期水平= 基期水平×2m • 速度的文字表述: • 发展速度—相当于、发展为、增长到、减少到、下降为… • 报告期水平增长为基期水平的…%; • 以基期水平为100%,报告期水平增长为…%. • 增长速度—提高(了)、减少(了)、下降(了)… • 报告期水平比基期水平增长(了)的…%; • 以基期水平为100%,报告期水平增长(了)…%。
(三)平均发展速度和平均增长速度 平均增长速度——表示逐期增长变动的平均程度,即各期环比增长速度的一般水平,但不能对各环比增长速度直接平均。 • 因为算术平均法或几何平均法都不符合增长速度这种现象的性质。 • 正确的计算方法: • 平均增长速度=平均发展速度— 1 • 平均增长速度为正(负)值,表明平均说来现象在考察期内逐期递增(减)。
平均发展速度的计算方法 1.几何平均法计算平均发展速度(水平法) 以xi表示环比发展速度,根据环比发展速度与总速度的关系,计算平均发展速度可该采用几何平均法: n=环比发展速度个数 =时间序列水平项数-1 三个计算公式实质上是一致的。可根据所掌握的数据来选择。
【例13-6】 • 根据表13-4的数据,计算中国1991~2003年居民消费水平的平均发展速度和平均增长速度。 • 解:平均发展速度可根据三种资料来计算: 平均增长速度=107.84%-100%=7.84% 即1991~2003年间,我国居民消费水平平均每年递增7.84%.
几何平均法的特点 用所求平均发展速度代表各环比发展速度, • 推算的最末一期的水平与实际相等 • 推算的总速度(最末一期的定基速度)也与实际相等 。 几何平均法计算平均发展速度着眼于最末一期的水平,故称为“水平法”。 • 如果关心现象在最后一期应达到的水平时,采用水平法计算平均发展速度比较合适。 几何平均法较为简单直观,既便于各种速度之间的推算,也便于预测未来某期的水平,因此有着广泛的应用。
平均发展速度的应用 • 根据平均速度预测现象经过一段时间以后可能达到的水平。 • 例如,若我国居民消费水平继续按上面所求出的平均速度递增,则可预测到2010年,居民消费水平可达: • y2010=y2003×(平均发展速度)7 • =4089×1.07847=6935.48(元)
利用平均发展速度的原理,还可在年度增长率zy与月增长率 zm(季增长率zs)之间进行换算。它们的关系可表示为: • 例如,某地区居民消费总额2003年9月为200亿元,2005年5为260亿元。则居民民消费总额的月平均增长率和年平均增长率分别为:
2.方程式法计算平均发展速度 • 各期实际水平的总和为: • 将各期水平 yi 用期初水平与各期环比发展速度 xi的乘积来表示,则上式可变成为: 以平均发展速度 作为各环比发展速度的代表值,用它来推算各期水平,并能使所推算的各期水平总和与实际相等,则有: 解上述方程,其正根=平均发展速度。
方程式法计算平均发展速度的特点 • 方程式法计算结果取决于考察期内各期实际水平的累计总和,所以计算平均发展速度的方程式法又称为“累计法”。 • 以所求平均发展速度代替各期环比发展速度,推算的考察期内各期水平的累计总和与实际相等。 • 着眼于考察全期的累计水平时,就适合用方程式法来计算平均发展速度。 • 例,采用方程式法计算居民消费水平的平均发展速度:
(四)水平分析与速度分析的结合与应用 1.正确选择基期 • 首先要根据研究目的,正确选择基期。 • 基期的选择一般要避开异常时期。 2.注意数据的同质性 • 不容许有0和负数,否则就不适宜计算速度,而只能直接用绝对数进行水平分析。 • 如果现象在某各阶段内的发展非常不平衡,大起大落,就会降低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义。 3.将总平均速度与分段平均速度及环比速度结合分析 4.将速度与水平结合起来分析 • 既要考虑速度的快慢,也要考虑实际水平的高低 • 把相对速度与绝对水平结合,可计算增长1%的绝对量。
增长1%的绝对量是用来补充说明增长速度的. • 一般只对环比增长速度计算,其计算公式为: 例
第二节 时间数列数据变动规律图示 • 一、时间数列资料的图示 • 我们可以在直角坐标系里用散点图或线图来描绘时间数列。根据坐标轴尺度设计方法的不同,又可分为算术尺度图和半对数尺度图。 • 二、水平型、季节型、趋势型、混和型时间数列的图形 • 1.水平型 • 水平型时间数列中只包含现象的不规则变动。 • 2.季节型 • 季节型时间数列中包含了现象的季节变动和不规则变动。
3.趋势型 • 如果时间数列大体上存在着一种递增或递减的趋势,这样的时间数列称作趋势型数列。趋势型时间数列中包含了现象的长期趋势和不规则变动。 • 4.混和型 • 如果时间数列围绕着某种趋势发生周期长度相等的循环往复变动,这样的时间数列称作混和型时间数列。混和型时间数列中包含了现象的长期趋势、季节变动和不规则变动。 • 识别时间数列类型的最基本方法是绘制动态散点图或折线图,观察资料的变动特征,同时结合实际情况作出判断。
第三节 水平型时间数列和预测 • 一 、时间数列的数据结构 • 时间数列x1,x2,…,xN中,第t期数据xt(t = 1,2,…,N)的数据结构为 • xt=t+t式中,t为常数,t为随机项,假定E(t) = 0。于是,t为第t期的期望水平(平均水平)。 • 二、水平型时间数列 • 在数据结构式中,如果时间数列各期的t相等,即1=2=…=N,称这样的时间数列为水平型时间数列,称作数列的“水平”,数列的各项观察值围绕 上下波动。
三、移动平均修匀和预测 • 1.适用的对象:适用于1,2,…,N有缓慢变化的水平型时间数列。 • 2.修匀的意图:尽可能把数列观察值由于受偶然因素影响发生的波动“修整”掉,从而近似显示出t的轨迹。 • 3.修匀的思路是:(1)用简单算术平均的手段抵销数列中由偶然因素影响引起的波动;(2)参加平均的数据项数不宜太多,因为在较长的一段时间内的各项t可能会出现不同的水平;(3)随时间的推移,应陆续引入新的观察值,以便使平均数中反映数列“水平”可能会发生变化的信息(为使平均的项数保持不变,在引入新观察值的同时,应当相应地删掉老的早期观察值)。
5.移动平均数的概念:在时间数列中由远及近逐项移动计算一系列算术平均数。 5.移动平均数的概念:在时间数列中由远及近逐项移动计算一系列算术平均数。 • 6.预测:把数列中最近的一个移动平均数作为未来1期的预测值。 • 移动平均数预测的公式为 • 7.简单移动平均预测法:上面的方法中用简单算术平均计算移动平均数,因此叫作简单移动平均预测法。 • 8.加权移动平均预测法:在预测时可以给近期的数值以较大的权数,给远期的数值以较小的权数,经过这样改进的移动平均预测法叫作加权移动平均预测法。
四、指数平滑平均修匀和预测 1.概念:一次指数平滑预测法:把第t期计算的一次指数平滑平均数作为第t+1期的预测值。为适当选定的小于1的正数,称作平滑常数。 • 2.第t期的指数平滑平均数记作St,计算公式为: • St = x t + ( 1 – ) S t – 1 • 式中,xt是第t期的实际观察值。 • 3. 第t+1期的预测值记作,计算公式为: • = xt+( 1 – ) • 在运用上述公式时要假定一个数字作初始值。
4.指数平滑预测法和移动平均预测法相比较,主要的优点是:4.指数平滑预测法和移动平均预测法相比较,主要的优点是: • 第一,指数平滑预测值在实质上是数列全部各期数据的平均数,而移动平均预测值则只是最近的 N 期数值的平均数。 • 第二,指数平滑法对近期和远期资料分别给了由大到小不同的权数,而简单移动平均法是把各期资料等同看待。 • 第三,指数平滑法把需要贮存的数据量压缩到最少。
平滑系数α的选择 α的选择是指数平滑法的关键,一般可从以下几个方面来考虑: • (1)如果认为时间序列中随机波动成份较大,为了尽可能消除随机波动的影响,可选择较小的α;反之,若认为随机波动成份较小,为了及时跟踪现象的变化,突出最新数据的信息,可选择较大的α。 • (2)如果现象趋势的变化很平缓,可选择较小的α;如果现象趋势的变化比较剧烈,例如呈阶梯式特征,应选择较大的α。 • (3)通过大小不同的α值进行试算,使得预测误差最小的α值就是最合适的平滑系数。
第四节 趋势型时间数列和预测 • 一、趋势型时间数列的种类 • 二、p次指数平滑预测法 • 三、数学模型拟合法
一、趋势型时间数列的种类 • 常见的有下列一些型式: • 直线 • 抛物线 • 指数曲线 • 修正指数曲线 • 罗吉斯曲线 • 龚珀兹曲线等等
二、二次指数平滑的预测模型 • 二次指数平滑 E(2)是对第一次指数平滑值序列 E(1)再计算指数平滑值 ,即: • 当现象有明显上升或下降趋势时,指数平滑值 E(1)与趋势值 之间存在明显的滞后偏差,E(2)与 E(1)之间也存在着同样的滞后偏差。根据三者之间滞后偏差的数量关系,可得出线性趋势模型中参数估计值 at和 bt 的,并由此得到相应的线性趋势预测模型。
【例13-7】 • 根据表13-5的数据,利用指数平滑法进行预测. 解:取α=0.45,两次平滑的初始值都取为y1。参数估计值为: 2005年和2006年的销售量预测值为: