490 likes | 897 Views
第十章 B-J 预测方法 本章的 随机时间序列模型 揭示的时间序列不同时点观测值之间的关系,也称 无条件预测模型。 随机性时间序列模型包括: AR(p) 、 MA(q) 、 ARMA(p,q) 。. 博克斯 — 詹金斯法 Box-Jenkins. 时间序列分析方法由 Box-Jenkins (1976) 年提出,简称 B-J 法或 ARMA 模型法。 它是以美国统计学家 Geogre E . P . Box 和英国统计学家 Gwilym M . Jenkins 的名字命名的一种时间序列预测方法。 它适用于各种领域的时间序列分析。. 博克斯 — 詹金斯法.
E N D
第十章 B-J预测方法 • 本章的随机时间序列模型揭示的时间序列不同时点观测值之间的关系,也称无条件预测模型。 • 随机性时间序列模型包括: AR(p)、MA(q)、ARMA(p,q)。
博克斯—詹金斯法Box-Jenkins • 时间序列分析方法由Box-Jenkins (1976)年提出,简称B-J法或ARMA模型法。 • 它是以美国统计学家Geogre E.P.Box和英国统计学家Gwilym M.Jenkins的名字命名的一种时间序列预测方法。 • 它适用于各种领域的时间序列分析。
博克斯—詹金斯法 • Box-Jenkins方法主要研究两个问题: • 一、研究时间序列的随机性、季节性、平稳性; • 二、在对时间序列分析的基础上,选择适当的模型进行预测。 • 其模型可分为: • 1自回归模型(简称AR模型); • 2滑动平均模型(简称MA模型); • 3自回归滑动平均混合模型(简称ARMA模型)。
博克斯—詹金斯 (Box- Jenkins) 时间序列模型与经济计量模型的区别是: 1 建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。 2 明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。
博克斯一詹金斯法的基本思想 1 将预测对象随时间推移而形成的数据序列 视为一个随机序列,是一组依赖于时间t的 随机变量。 2这组随机变量所具有的自相关性表现了预测 对象发展的延续性, 3将自相关性用相应的数学模型描述出来,就 可以从时间序列的过去值及现在值预测其未 来的值。
自回归模型AR (p) AR (Autoregressive) 模型 假定时间序列用X1, X2, …, Xt表 示;则一个纯粹 的AR (p)模型意味着变量的一个观测值由 其以前的 p个观测值的线性组合加上随机误差项 (该误 差为 独立无关的)而得: 称为自回归模型。 它涉及到过去p个观测值 是未知参数
移动平均模型MA (q) MA(Moving Average)模型 MA (q)模型意味着变量的一个观测值由目前的和先前的q个随机误差的线性的组合: 称移动平均系数, q为移动平均阶数 由于右边系数的和不为1(q甚至不一定是正数),因此叫做“移动平均”不如叫做“移动线性组合”更确切;虽然行家已经习惯于叫“平均”了,但初学者还是因此可能和初等平滑方法中的什么“三点平均”之类的术语混淆。
ARMA(p,q)模型(Autoregressive and Moving Average) 这样,ARMA(p,q)模型应该是AR (p)模型和MA(q)模型的组合了: 显然 ARMA(p,0)模型就是AR (p)模型 ARMA(0,q)模型就是MA(q)模型 这个一般模型有p+q个参数要估计,看起来很繁琐,但利用计算机软件运算并不复杂。 ARMA(p,q)模型要求时间序列满足平稳性(stationarity)
ARMA(p,q)的平稳性条件 • ARMA(p,q)平稳性取决于AR(p)的平稳性。 • 当AR(p)部分平稳时,则该ARMA(p,q)模型是平稳的,否则,非平稳。
现实经济生活中只有少数经济指标的时间序列表现为平稳的,如利率等;现实经济生活中只有少数经济指标的时间序列表现为平稳的,如利率等; • 大多数指标的时间序列是非平稳的,例如,以当年价表示的消费额、收入等常是2阶单整的,以不变价格表示的消费额、收入等常表现为1阶单整。 • 大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的。 • 但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这种序列被称为非单整的(non-integrated)。
ARIMA模型 • 非平稳指:有趋势、季节、循环成分 • 上述情况需要对时间序列进行差分(difference)来消除不平稳的成分,使其变成平稳的时间序列,并估计ARMA模型;估计之后再转变该模型,使之适应于差分之前的序列(这个过程和差分相反)。 • 因此称为整合的(integrated)ARMA模型,得到的模型称为ARIMA模型。是Autoregressive Integrated Moving Average一些关键字母的缩写。 • ARIMA的基础是ARMA模型。
趋势或季节时间序列平稳化 • 短差分:观测值减去其前面的一个观测值,即 • 如果时间序列有一个斜率不变的趋势,经过这样的差分之后,该趋势就会被消除了。 • 长差分:观测值减去其前面任意间隔的一个观测值;如时间序列存在周期为s的季节成分,那么相隔s的差分 ARIAM (p,d,q) • 就可以把这种以s为周期的季节成分消除。 • 对于复杂情况,可能要进行多次差分,才能够使得变换后的时间序列平稳。 ARIAM(PDQ)s Wbl/XSE
如果一个时间序列经过一次差分变成平稳的,就称原序列是一阶单整(integrated of 1)序列,记为I(1)。 • 一般地,如果一个时间序列经过d次差分后变成平稳序列,则称原序列是d 阶单整(integrated of d)序列,记为I(d)。 • I(0)代表一平稳时间序列。
ARIMA(p,d,q)模型 • ARIMA(1,1,1)的数学形式为: 一阶短差分AR(1) MA(1) • ARIMA(p,d,q)的数学形式为:
趋势与季节时间序列平稳化 ARMA模型记为ARIAM (p,d,q)(PDQ)s P是季节性自回归阶数; D消除季节性的差分次数; Q是季节性移动平均阶数; S是季节周期,它的取值为4或12。 短差分、长差分
博克斯和詹金斯在说明他们的预测方法时,曾绘制了预测流程图。该预测方法把预测问题划分为三个阶段:(后图)博克斯和詹金斯在说明他们的预测方法时,曾绘制了预测流程图。该预测方法把预测问题划分为三个阶段:(后图) (1)模型的识别; (2)模型中参数的估计和模型的检验; (3)预测应用。 Box- Jenkins法使用的模型是ARMA模型体系。
随机时间序列模型的识别工具 • 所谓随机时间序列模型的识别,就是对于一个平稳的随机时间序列,找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。 • 所使用的工具主要是时间序列的自相关函数(autocorrelation function,ACF)及偏自相关函数(partial autocorrelation function, PACF )。
自相关函数ACF • 计算公式:[-1,1] • 当K等于1时 P305 相邻的数据配对共有N-1对数据 间隔一期的数据配对共有N-2对数据
自相关函数ACF的抽样分布 如自相关函数全部落在这个区间内,则时间序列为随机时间序列:
自相关函数的检验 假设: 计算样本自相关系数 计算自相关系数的标准差 当k=1时, 计算t统计量 根据给定的显著性水平α,自由度为(n-1),查 的 值。当 时,则接受“ ”的假设;否则拒绝假设。
可以根据样本自相关函数和样本偏自相关函数识别时序模型形式,即根据自相关函数ACF和偏自相关函数PACF的估计,识别时序模型,这种识别可根据下表进行 一般地一个平稳的时间序列的自相关函数呈指数衰减特征,如果 自相关函数衰减非常慢,则…… 一个时间序列的自相关函数呈周期性变化,则……
如果时间序列 自相关函数呈指数衰减(拖尾) 偏自相关函数p步截尾,为P阶AR模型 如果时间序列 自相关函数q步截尾, 偏自相关函数拖尾,为q阶MA模型 如果时间序列 自相关函数拖尾 偏自相关函数拖尾,ARMA(p,q)模型
偏自相关函数 自相关函数ACF(k)给出了Xt与Xt-1的总体相关性,但总体相关性可能掩盖了变量间完全不同的隐含关系。 与之相反,Xt与Xt-k间的偏自相关函数(partial autocorrelation,简记为PACF)则是消除了中间变量Xt-1,…,Xt-k+1带来的间接相关后的直接相关性,它是在已知序列值Xt-1,…,Xt-k+1的条件下,Xt与Xt-k间关系的度量。 AR(p)的一个主要特征是:k>p时,k*=Corr(Xt,Xt-k)=0,即k*在p以后是截尾的。
建立时间序列模型通常包括三个步骤: • (1)模型的识别 • (2)模型参数的估计 • (3)诊断与检验
模型的识别就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定d, p, q的取值。 • 模型参数的估计就是待初步确定模型形式后对模型参数进行估计。 • 诊断与检验就是以样本为基础检验拟合的模型,以求发现某些不妥之处。如果模型的某些参数估计值不能通过显著性检验,或者残差序列不能近似为一个白噪声过程,应返回第一步再次对模型进行识别。如果上述两个问题都不存在,就可接受所建立的模型。建模过程用图3表示。
模型的识别 • 模型的识别主要依赖于对相关图与偏相关图的分析。 • 在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图。 • 通常模型识别要经过2步来完成: • 第1步是:判断随机过程是否平稳 • 第2步是:在平稳时间序列基础上识别ARMA模型阶数p, q
识别的第1步是:判断随机过程是否平稳 • 如果一个随机过程是非平稳的,自相关函数将衰减的很慢。所以在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。 • 这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳的序列。对于经济时间序列,差分次数d通常只取0、1或2。
注意: • 实际中也要防止过度差分。一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数过多时存在两个缺点: • (1)序列的样本容量减小; • (2)方差变大; • 所以建模过程中要防止差分过度。对于一个序列,差分后若数据的极差变大,说明差分过度。
用样本得到的只是估计的自相关函数和偏 自相关函数,即相关图和偏相关图。建立 ARMA模型,时间序列的相关图与偏相关 图可为识别模型参数p, q提供信息。 • 在平稳时间序列基础上识别ARMA模型阶 数p, q
诊断与检验 • 诊断残差是否白噪声过程 • 检验参数是否显著 • 要尽量做到 模型结构应当尽量简练; 参数稳定性要好; 预测精度要高。
白噪声过程 P329 白噪声过程(white noise process) 设随机变量,满足: , 则随机变量为白噪声过程。 是白噪声过程 统计量 Q= 不是白噪声过程 统计量 Q=