840 likes | 1.16k Views
时间序列分析 中国人民大学统计学院 易丹辉. 二 ○ 一二 年七月. 参考书目. 易丹辉:时间序列分析:方法与应用,中国统计出版社, 2011 年 4 月 易丹辉:数据分析与 Eviews 应用,中国人民大学出版社, 2008 年 10 月 Philip Hans Franscs : 商业和经济预测中的时间序列模型,中国人民大学出版社, 2002 年 12 月 陆懋祖:高等时间序列经济计量学,上海人民出版社, 1999 年 8 月 罗伯特 S. 平狄克 丹尼尔 L. 鲁宾费尔德:计量经济模型与经济预测,机械工业出版社, 2000 年 9 月.
E N D
时间序列分析中国人民大学统计学院易丹辉 二○ 一二年七月
参考书目 易丹辉:时间序列分析:方法与应用,中国统计出版社,2011年4月 易丹辉:数据分析与Eviews应用,中国人民大学出版社,2008年10月 Philip Hans Franscs : 商业和经济预测中的时间序列模型,中国人民大学出版社,2002年12月 陆懋祖:高等时间序列经济计量学,上海人民出版社,1999年8月 罗伯特 S. 平狄克 丹尼尔 L. 鲁宾费尔德:计量经济模型与经济预测,机械工业出版社,2000年9月
概 述 时间序列的含义 时间单位 年 季 月 周 日 时 低频数据 高频数据 时序数据特点
数据量 足够数量的数据反映变化规律 支持模型的建立 数据量并不是越大越好 注意延伸到未来的规律 数据管理 ——数据库 数据的更新
10000 8000 6000 4000 2000 0 80 82 84 86 88 90 92 94 96 98 Y
9000 8000 7000 6000 5000 4000 95:1 95:3 96:1 96:3 97:1 97:3 98:1 98:3 99:1 Y
数据表现 观察数据的变化 是否有异常数据出现 原因分析 规律分析 是否有冲击或干扰 瞬间 持续
140000 120000 100000 80000 60000 98 99 00 01 02 03 Y
3.5E+09 3.0E+09 2.5E+09 2.0E+09 1.5E+09 1.0E+09 5.0E+08 99:01 99:07 00:01 00:07 01:01 01:07 02:01 02:07 Y
时间序列分析方法 传统时序分析 四因素分解 长期趋势 T 季节变动 S 循环变动 C 偶然变动 I 加法形式 乘法形式
一、ARMA模型 (一)模型的引进 多元线性回归 自回归 移动平均模型 简单平均:序列平稳 围绕均值波动 = = = =
移动平均:近期数据对预测的影响更重要 加进新数据,则删除远离现在的数据 = = = = T的作用:平滑数据 T的取值:自然数 数值大小对结果的影响
以均值替代 有 = + ( ) = + 特点:利用误差修正,调整前期预测值 跟踪数据变化 时间序列可以用过去的误差项表出 = + +……+ +
(二)方法性工具 1. 自相关 含义:时间序列诸项之间的简单相关 自相关系数: 计算公式 取值 作用 自相关函数 抽样分布
2.偏自相关 含义:时间序列 ,在给定了 , ,……, 的条件下, 与 之间的条件相关。 偏自相关系数: 计算公式取值作用 偏自相关函数
(三)时序特性分析 1. 平稳性分析 (1) 平稳时序 描述性定义:序列的统计特征不随时间而变化 均值恒为常数;自相关系数只与时间间隔有关,与时间起始点无关。 自相关的特点: 自相关系数 在K等于2或3后迅速趋于零。
(2) 趋势消除 差分(逐期、短差) 2. 季节性分析 (1) 自相关的特点 注意时滞 (2) 季节差分 3. 随机性
(四)ARMA模型及其改进 1. 自回归模型AR(p) 模型的一般形式 AR (p) 序列的自相关和偏自相关 :拖尾性 :截尾性 =
2. 移动平均模型MA( q ) 模型的一般形式 MA (q) 序列的自相关和偏自相关 = 截尾性 : :拖尾性
AR与MA间的对偶性 相互表出 AR(P) 可以用既往的 有限加权和表出 可以用既往的 无限加权和表出 = = MA (q) = = 可以用既往的 有限加权和表出 可以用既往的 无限加权和表出
相关函数 平稳与可逆 若一个序列可以用无限阶的自回归模型逼近,即逆函数存在,称为具有可逆性,也就是可逆的。
3. 自回归移动平均混合模型 ARMA( p, q ) 模型的一般形式 ARMA (p , q) 序列 的自相关和偏自相关 4. 改进的ARMA模型 ARIMA( p , d , q ) ARIMA (P,D,Q ARIMA(p,d,q) (P,D,Q
(五) 模型的建立 1. 模型识别 选择各个阶数 d ,D p, q P,Q 2. 参数估计 3.模型检验 残差序列的自相关检验 直观判断 残差序列的自相关系数是否落入随机区间
统计检验 检验法 m个独立N(0,1)随机变量的平方和,服从自由度 为m的 分布。如果将残差序列的自相关函数作为一 个整体考虑,当模型选择合适时,可以证明: Q = n (e) 为近似的 (m – p – q )分布。其中,m 是最大时 滞数,n 为计算 (e)的数据个数。
(六)预测 1. 最小方差预测: 使时间序列未来值的预测误差尽可能小 预测误差 (L)= - (L)的方差 E( (L) = E( - (L) 应达到最小 。
也就是要使选择的时间序列L步预测值(L)与时间序列实际值之间距离比其它任何一点都短。也就是要使选择的时间序列L步预测值(L)与时间序列实际值之间距离比其它任何一点都短。 2. 预测的递推形式
(七)单位根过程 • 问题的提出 • 用于预测的线性平稳模型: • AR(p)模型 (B) = 方程(B)= 0称为过程的特征方程,过程平稳的条件是,特征方程所有根的绝对值都必须大于1,即在单位圆外。
2. 单位根的定义 随机过程{ ,t = 1,2,......},若 = t = 1,2,...... 其中,= 1,{ }为一稳定过程,且E( )= 0, cov ( , ) = < , 这里 s = 0,1,2,......,则该过程称为单位根过程(unit root process)。 + +
特别地,若 = + t = 1,2,...... 其中,{ }为独立同分布,且E( ) = 0, D( ) = < ,则{ }为一随机游动过程(random waik process)。可以看出,随机游动过程是单位根过程的一个特例。
若随机过程{ }的一阶差分过程( = )为一稳定过程,则{ }服从单位根过程。 分别以I(1)和I(0)表示单位根过程和稳定过程, 则可将 和 记为 ~ I(1)~ I(0)
3.趋势类型 确定性趋势模型趋势平稳 时间序列中的趋势有不同的表现形式,如,带趋势的稳定过程 = c + t + 其中,f ( t ) = c + t,表示时间序列{ }的确定性趋势(deterministic trend)。 的期望是时间t的线性函数,其值在c + t周围波动。 为一稳定过程。
随机性趋势模型差分平稳 带常数项的单位根过程 = c + + 其中,c是常数项。对 不断地向后迭代,得到 = c + (c + + )+ = ....... = ct + 确定的时间趋势ct ,是由单位根过程中的常数项积累而成
时间序列的趋势大体有以下三种基本类型: (1)(1)序列不含常数项、时间趋势项 = + 若 =1 ,序列为一单位根过程;若< 1, 序列为一稳定过程。 (2)序列含常数项、不含时间趋势项 = c + + 若 =1 ,序列为一带常数项的单位根过程; 若< 1,序列为一带常数项的稳定过程。
(3)序列带常数项和时间趋势项 = c + + t + 若 =1 ,序列为一带常数项和时间趋势项的 单位根过程; 若< 1,序列为一带常数项和时间趋势项的稳定过程。
4. 单位根检验 (1)迪基—福勒(DF)检验 一阶自回归模型 = + := 1 为真时 最小二乘估计的t统计量为 t = 式中,为 的最小二乘估计,SE( )为 的标准差。
检验标准: t统计量有非标准和非对称的极限分布, 记作 ,对于给定的样本量n和显著性水平 , 若统计量的实际计算值 小于临界值,则拒绝原假设 。
(2)ADF检验 DF检验只对存在一阶自相关的序列适用。 ADF检验适用于存在高阶滞后相关的序列。 = + 表述为 = + 存在高阶滞后相关的序列,经过处理可以表述为 = + + + ....... + + 上式中,检验假设为 或加带常数项,或加带趋势项,或加带常数项和趋势项, := 0 检验标准同DF检验。
二、向量自回归过程(vector autoregressive process) 向量自回归过程简称VAR过程,是分析多变量时间序列的有力工具。 (一)传统的向量自回归模型 1. 模型 VAR(p)模型表示为 其中, 是n维变量序列, (i = 1,2, ...... ,p)为n n维模型系数矩阵,{ }为n维独立同分布随机向量,E( )= 0 ,D( )= 。 = + + ...... + +
2. 互相关函数 协方差矩阵 设 = [ , , ... , ], (t = 0 , 1, 2 , ... ) 为n维联合平稳实向量过程. 对于每一个分量序列 ( i = 1, 2, ... , n ) ,其均值E( ) = 是常数, 对于每一个分量序列 和 ( i = 1, 2, ... , n ; j = 1, 2, ... , n)之间的互协方差仅与时间间隔 (k = t - s)有关,是时间间隔k的函数.
可以得到均值 E( ) = = 和协方差矩阵 (k) = Cov( , ) = E [( -- ) ( -- ] = Cov( , )
记 = E ( - )( - ) = E ( - )( - ) k = 0 , 1 , 2 , ... ; i = 1 , 2 , ... , n ; j = 1 , 2 , ... , n . 当i = j时, 是i个分量的自相关函数; 当i j时, 是 和 之间的互协方差函数.
(2)互相关函数 和 之间的互相关函数可以表示为 3. 参数估计 普通最小二乘法 =
4. 模型识别 对模型阶数p作出选择 (1)阶数的初选 阶数p的初选,通常可以借助序列间的互相关函数进行。 阶数p要足够大,以完整反映变量之间的动态特征; p不宜过大,模型待估计参数增多,自由度减少,没有足够的样本数目时,可能导致参数不能得到正确有效的估计。 和普通线性回归一样,一个待估计参数,一般来说,至少需要10个观测期的数据。
(2)利用评价指标确认 利用初选的阶数p可以构建VAR模型,参数估计后,可以利用几个评价指标帮助判断合适的阶数 1)LR检验(似然比检验) :附加约束是正确的 服从自由度为M的分布 2)最终预测误差FPE(Final prediction error ) 其中, 是滞后p期时模型残差的方差估计, n是样本量,k是待估计参数的个数 。 FPE(p)=
3)AIC(Akaike inof criterion) 准则 其中:∣∣指VAR(p) 模型残差的协方差阵的行列式;n是有效的观测数目;m是变量序列的数目;p是阶数 4)SC(Schwarz criterion)准则 5)HQ(Hannan-Quinn criterion)准则 其中:L是似然函数,k是待估计参数的个数,其它符号意义同上 AIC=log∣ ∣+2m2p/n,p=1, …, k ∣+(logn) ,p=1, …, k SC=log∣ ∣+(logn) HQ =