1 / 52

第七章 误差序列相关

第七章 误差序列相关. Serial Correlation. 本章主要内容. 第一节 误差序列相关的概念 第二节 误差序列相关 的后果 第三节 误差序列相关 的检验 第四节 误差序列相关 的 处理. 第一节 误差序列相关的概念. 在其他假设仍成立的条件下. 注意. 称为 一阶序列相关 ,或 自相关 ( autocorrelation )。这是最常见的一种序列相关问题。 自相关 往往可写成如下形式:.

Download Presentation

第七章 误差序列相关

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第七章 误差序列相关 Serial Correlation

  2. 本章主要内容 • 第一节 误差序列相关的概念 • 第二节 误差序列相关的后果 • 第三节 误差序列相关的检验 • 第四节 误差序列相关的处理

  3. 第一节 误差序列相关的概念

  4. 在其他假设仍成立的条件下

  5. 注意 称为一阶序列相关,或自相关(autocorrelation)。这是最常见的一种序列相关问题。 自相关往往可写成如下形式: 其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation)。

  6. 序列相关产生的原因 • (1)惯性 大多数经济时间数据都有一个明显的特点,就是它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况(如利率或课税的升高)出现才把它拖慢下来。

  7. 序列相关产生的原因(续) • (2)设定偏误:模型中遗漏了显著的变量 例如:如果对牛肉需求的正确模型应为 Yt=0+1Xt1+2Xt2+3Xt3+t 其中:Y=牛肉需求量,X1=牛肉价格,X2=消费者收入,X3=猪肉价格。 如果模型设定为: Yt= 0+1Xt1+2Xt2+vt 那么该式中的随机误差项实际上是:vt= 3X3t+t, 于是在猪肉价格影响牛肉消费量的情况下,这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素,使其呈序列相关性。

  8. 序列相关产生的原因(续) • (3)设定偏误:不正确的函数形式 例如:如果边际成本模型应为: Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t,,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。

  9. 序列相关产生的原因(续) • (4)蛛网现象 例如,农产品供给对价格的反映本身存在一个滞后期: 供给t= 0+1价格t-1+t 意味着,农民由于在年度t的过量生产(使该期价格下降)很可能导致在年度t+1时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。

  10. 序列相关产生的原因(续) • (5)数据的“编造” 例如,季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性本身就能使干扰项中出现系统性的因素,从而出现序列相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。

  11. 第二节 误差序列相关的后果 • 1. 参数估计量非有效 • 2. 变量的t检验失去意义 • 3. 模型的预测失效

  12. 1. 参数估计量非有效 • OLS参数估计量仍然具有无偏性 • OLS参数估计量不具有有效性。 • OLS参数估计量仍然具有一致性。

  13. 2. 变量的t检验失去意义 • 在关于变量的显著性检验中,当存在序列相关时,参数的OLS估计量的方差增大,标准差也增大,因此实际的 t 统计量变小,从而接受原假设βi=0的可能性增大, 检验就失去意义。 • 其它t检验也是如此。

  14. 3. 模型的预测失效 • 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。

  15. 第三节 误差序列相关的检验 • 1. 残差序列图分析 • 2. 杜宾—瓦森检验(DW检验)

  16. 检验方法的基本思路 • 序列相关性检验方法有多种,但基本思路是相同的。 • 首先采用普通最小二乘法估计模型,以求得随机误差项的“近似估计量”: • 然后,通过分析这些“近似估计量”之间的相关性,以达到判断随机误差项是否具有序列相关性的目的。

  17. 1. 残差序列图分析 • 由于残差项ei可以作为随机误差项i的估计,因此如果随机误差项i存在序列相关,必然会由残差项ei反映出来,因此可利用残差项ei的变化图形来判断随机误差项的序列相关性。

  18. 不存在序列相关

  19. 正序列相关

  20. 负序列相关

  21. 2. 杜宾—瓦森检验(DW检验) • DW检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法。 • 该方法的假定条件是: • (1)解释变量 X非随机; • (2)随机误差项i为一阶自回归形式: i =i-1+i’ • (3)回归模型中不应含有滞后因变量作为解释变量,即不应出现下列形式: Yi=0+1Xi1+kXik+Yi-1+ i • (4)回归含有截距项; • (5)没有缺落数据。

  22. DW检验的原理 对线性回归模型 如果误差项有一阶自回归问题,那么 其中的 , 是均值为0的独立同分布随机变量。

  23. DW统计量

  24. DW统计量的分布与给定样本中的X值有复杂的关系,因此其精确的分布很难得到。DW统计量的分布与给定样本中的X值有复杂的关系,因此其精确的分布很难得到。 • 但是,Durbin和Watson成功地导出了(给定显著性水平λ的) 临界值的下限dλL和上限dλU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。 • 检验步骤: • ①计算该统计量的值; • ②根据样本容量n和解释变量数目k查DW分布表,得到临界值dλL和dλU ; • ③按照下列准则考察计算得到的DW值,以判断模型的自相关状态。

  25. 一阶正自相关 无法判断 无一阶自相关性 无法判断 一阶负自相关 检验误差序列自相关性—DW检验区域图

  26. 可以看出,当D.W.值在2左右时,模型不存在一阶自相关。可以看出,当D.W.值在2左右时,模型不存在一阶自相关。 • 如果存在完全一阶正相关,即 =1, 则 DW 0 • 如果存在完全一阶负相关,即 =-1, 则 DW 4 • 如果不存在一阶自相关,即 =0, 则 DW2

  27. 注意: • (1)从判断准则看到,存在一个不能确定的DW值区域,这是这种检验方法的一大缺陷。 • (2)DW检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关; • (3)经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。 • 所以在实际应用中,对于序列相关问题一般只进行DW检验。

  28. 第四节 误差序列相关的处理 • 1. 一阶差分法 • 2. 广义差分法 • 3. 柯-奥迭代法 • 4. 杜宾两步法

  29. 1. 一阶差分法

  30. 变量的增长率与一阶差分有密切关系,用变量的增长率进行回归也能起到消除误差项强正自相关性的作用。 • 一阶差分模型在克服误差序列相关性方面的作用有较大的局限,只适用ρ接近1的一阶正自相关性,而且如果模型没有误差序列相关性、有负自相关性或只有轻微正自相关性,运用一阶差分模型反而会导致更强的误差序列相关性。

  31. 2. 广义差分法

  32. 应用广义差分法,必须已知不同样本点之间随机误差项的相关系数ρ1,ρ2,…, ρi。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。 • 常用的方法有: • 科-奥(Cochrane-Orcutt)迭代法。 • 杜宾(durbin)两步法。

  33. 3. 柯-奥迭代法 首先,采用OLS法估计原模型 Yi=0+1Xi+i 得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下式 i=1 i-1+2 i-2+ +li-l+i ’

  34. $ $ $ r r r 其次 ,将上述 代入广义差分模型 , , , L 1 2 l e’ - r - - r = b - r - - r + b - r - - r + Y Y Y ( 1 ) ( X X X ) L L L - - - - i 1 i 1 l i l 0 1 l 1 i 1 i 1 l i l i = + + i 1 l , 2 l , , n L ˆ ˆ ˆ ˆ b b 并对之进行 OLS 估计,得到 、 。 1 0

  35. ˆ ˆ 再次 ,将 、 代回原模型,计算出原模型随机误 ˆ ˆ b b 0 1 差项i的新的 “近拟估计值”, 并以之作为模型 L  = r  + r  + + r  + e ’ - - - 1 1 2 2 i i i l i l i 的样本观测值,采用 OLS 法估计该方程,得到 r r r ˆ ˆ ˆ , , , 的 第二次估计值 。 ,作为相关系数 r r r ˆ ˆ ˆ , , , L L l 1 2 1 2 l

  36. 类似地,可进行第三次、第四次迭代。 • 关于迭代的次数,可根据具体的问题来定。 • 一般是事先给出一个精度,当相邻两次1,2,,l的估计值之差小于这一精度时,迭代终止。 • 实践中,有时只要迭代两次,就可得到较满意的结果。

  37. 4. 杜宾两步法 • 我们直接从两变量模型的广义差分式 出发。如果我们对该式稍作调整,可得 这是一个带滞后变量的多元线性回归模型,其中 为均值为0的独立同分布随机变量。

  38. 因此可直接用最小二乘法估计四个参数 、 、 和 的值。 但问题是原模型连 在内只有三个参数,因此通常会导致求解矛盾,无法解出原模型三个参数的估计值。 • 为此只能考虑分步解决问题。

  39. 具体方法是只接受上述多元线性回归 的估计值 ,然后利用它对数据进行广义差分变换,再对广义差分模型 进行最小二乘估计,并根据回归结果计算原模型参数的估计 和 。

  40. 案例:地区商品出口模型 某地区商品出口总值与国内生产总值的数据

  41. 1序列相关性检验(残差序列图分析)

  42. ˆ = - + Y 2531 . 83 0 . 28 X t t 1序列相关性检验(DW检验) 回归结果: (-9.34) (30.11) - 2 2 R =0.9816, R =0.9805 DW=0.9505 在5%在显著性水平下,n=19,k=2(包含常数项),查表得dL=1.18,dU=1.40, 由于DW=0.9505<dL,故存在正自相关。

  43. 2误差序列相关的处理(一阶差分法) R2=0.4747, DW=1.8623 由于DW>du=1.39(注:样本容量为18个),已不存在自相关。

  44. 1 )估计模型 = b + r + b + b + e * * * Y Y X X - - - t 0 t 1 1 t 2 t 1 t 1 得: ˆ = - + + - Y 1334 . 79 0 . 5939 Y 0 . 3348 X 0 . 2109 X - - 1 1 t t t t ( -1 . 86 ) (2.01) (3.41) (-1.53) - 2 2 R =0.9862, R =0.9832, D.W.=1.6282 2误差序列相关的处理(杜宾两步法)

  45. r ˆ 2) 将 =0 .5939 代入差分模型 - = b + b - + e * * Y 0 . 5939 Y ( X 0 . 5939 X ) - - 1 0 1 1 t t t t t OLS 法估计得: - = - + - + e Y 0 . 5939 Y 1351 . 01 0 . 3083 ( X 0 . 5939 X ) - - t t 1 t t 1 t ( -5 .53 ) (15.58) - 2 2 R =0.9382, R =0.9343, DW=1.6570 由于DW>=1.39(注:样本容量为19-1=18个),已不存在自相关。于是原模型估计式为:

More Related