580 likes | 1.49k Views
时间序列分析 Time series Analysis. 2014 Spring. 周凡吟 统计学院. 关于 偶. 主要经 历 2012.4-2012.10 Algorithmic Trading Research Team, Citi, London 2006.10-2011.2 Imperial College London, London, UK Ph.D . in Financial Statistics 2005.9-2006.7 University of Cambridge, Cambridge, UK
E N D
时间序列分析Time series Analysis 2014 Spring 周凡吟 统计学院
关于偶 主要经历 • 2012.4-2012.10 Algorithmic Trading Research Team, Citi, London • 2006.10-2011.2 Imperial College London, London, UK Ph.D. in Financial Statistics • 2005.9-2006.7 University of Cambridge, Cambridge, UK MPhil in Statistical Science • 2002.9-2005.7 University of Manchester, Manchester, UK Bsc(Hons) Mathematics with Statistics • Office hour • 致知园234 • 周三上午10:30-11:30 • 或邮箱预约 • 邮箱 zfy@swufe.edu.cn • 人人网
关于这门课 • 预备知识的要求: 概率论,统计学,计量经济学以及少量随机过程的知识。 • 对这门课的定义: • 时间序列的基础知识课。 • 用来解决在一些“为什么”? • 课程内容的是啥? • 相当数理化! • 枯燥,死记硬背没用。 • 有逻辑性,有规律,有统一的标准。 feel
关于这门课 • 课堂教学形式: 知识点讲述,例题的讲述和演示,课堂练习。 上机课程:暂定第13周 • 课程主页 http://csr.swufe.edu.cn/fanyin/course.html • 课程考核方式: • 20% 课程作业 (4 次) • 80% 期末考试 (闭卷) • 关于抄袭、作弊 • 关于课堂点名。
关于这门课 • 我希望大家在这么课能学到: • 逻辑推理的能力 • 能解决新问题的能力 • 能通过所学,举一反三的能力。
关于参考书目 [1]史代敏等. 应用时间序列分析,北京:高等教育出版社,2011 [2]王燕. 应用时间序列分析,北京:中国人民大学出版社,2005 [3]王振龙等。应用时间序列分析。北京:中国统计出版社。2010 [4]Shumway, R. and Stoffer, D., Time Series Analysis and Its Applications: With R Examples (2nd Ed.), Springer, 2006 [5] Brockwell, P. and Davis, R., Time Series: Theory and Methods (2nd Ed), Springer, 1991 [6]Brockwell, P. and Davis, R., Introduction to Time Series and Forecasting (2nd Ed), Springer, 2002
课程内容 • 第一章 时间序列数据的总体概述 • 第二章 时间序列的预处理 • 第三章 线性平稳时间序列模型 • 第四章 ARMA模型的特征 • 第五章 平稳时间序列模型的建立 • 第六章 平稳时间序列的预测 • 第七章* 非平稳时间序列分析
第一章 绪论 第一节 时间序列分析概论 第二节 时间序列分析的基本概念
1.1 时间序列的含义 最早的时间序列分析可以追溯到7000年前的古埃及。 • 古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。
1.1时间序列的含义 • 从经济统计的角度讲:时间序列是某一个数量指标在不同的时间上的观测数值按时间先后顺序排成的序列。 • 从这个定义可看出时间序列由两个要素构成:一个是指标数值,一个是时间。 • 如GDP,失业人数统计,产品销售量,公司利润,股票价格指数,网站的访问量等都呈时间序列的形式。
1.1时间序列的含义 从概率统计意义上讲:时间序列是一组随机变量 (或一个随机过程 在一系列时刻(的一次样本实现 • 从这个定义可看出,时间序列与通常统计分析不同,通常统计分析中总是对一个随机变量进行独立的大量观察,得到这个随机变量的多个实现,然后再去分析和研究。
时间序列数据-案例 Peak breaking-up times:
时间序列数据-案例 《来自星星的你》百度热点指数
时间序列数据-案例 余额宝每日收益
数据视觉化案例 汉斯罗斯林:用好方法诠释数字统计
1.1.2 时间序列数据的特点 • 时间序列中数据的位置与时间有关。通常是固定的观测频率或观测时间间隔。 • 高频数据(high-frequency or tick-by-tick data)中,观测时间间隔大多是 irregular和asynchronous。 • 在每一时间点上,指标(变量)受众多因素影响,其取值有一定的随机性。 • 每个时点上的观测值可以是流量或存量数据。 • 前后时间点上的观测值具有一定的相关性。
1.1.3 时间序列的主要分类 按所研究现象的多少分: 一元时间序列 多元时间序列 研究的是某一个指标的时间序列。 如GDP序列,销售量序列等。 研究的是多个指标的时间序列。 如广告费用和销售量序列,货币供应量与股标价格指数序列等。
1.1.3 时间序列的主要分类 按观察时间的连续性: 离散性时间序列 连续时间序列 每一个序列所对应的时间参数为间断点。如商品库存序列等。 每一个序列所对应的时间参数为时间的连续函数。如气温序列等。 我们所研究的是离散性时间序列,对于连续性时间序列,可以采用等间隔采样使之化为离散序列。
1.1.3 时间序列的主要分类 按序列的统计特征: 平稳时间序列 非平稳时间序列 时间序列的统计特性不随时间而变化。 • 时间序列的潜在随机过程是不变的。 • 序列的未来变化趋势是可以从过去的变化趋势得知的。 时间序列的统计特性随时间而变化。 • 用一个建立在历史数据上的模型来反映序列的未来趋势是不可靠的。 • 但可能是有规律的可循的变化。 • 或者通过其他方法将非平稳序列转化为平稳或近似平稳序列。
典型的非平稳时间序列趋势性时间序列 确定性趋势:线性趋势时间序列
典型的非平稳时间序列趋势性时间序列 • 确定性时间序列:指数趋势 • 如我国1978年—2007年GDP数据(单位:亿元)的时间序列图。
随机趋势时间序列 典型的非平稳时间序列趋势性时间序列
随机趋势时间序列 香港恒生指数1990.1.1~1996.6.28各交易日数据
典型的非平稳时间序列季节性时间序列 • 本例给出1980年1月—1991年10月澳大利亚红酒的月度销量(单位:公升)时序图。
金融数据中广泛存在。表现形式为大的正的或负的观测值成群出现。金融数据中广泛存在。表现形式为大的正的或负的观测值成群出现。 典型的非平稳时间序列异方差时间序列
典型的非平稳时间序列有异常观测值的时间序列典型的非平稳时间序列有异常观测值的时间序列 • 2005年7月21日中国启动人民币汇率改革以来,不断完善汇率形成机制,人民币对美元汇率总体呈现小幅上扬态势。本例给出了1997年1月—2008年9月美元对人民币汇率的月度数据(单位:元)时序图。
1.1.4 时间序列分析 • 可以看出,所有上述序列的共同点为:每个序列都包含了产生该序列的系统的历史行为的全部信息。 • 问题在于如何才能根据这些时间序列,挖掘潜在系统的内在统计特性和动态变化规律。 • 实现上述目的的整个方法即为时间序列分析 基本思想:分析时间序列数据间的动态依存关系,找寻时间序列的动态变化规律以及多个序列间的相互作用关系,从而对序列的未来变化趋势和发展情况作出预测。
1.1.5时间序列分析方法概述 • 传统的确定性时间序列分析方法:将时间序列看作主要是由长期趋势(T)、季节变动(S)、循环变动(C)和随机变动(R)综合作用的结果。适用于由确定性的因素引起的时间序列的变动。通常表现出很显著的规律性。 • 加法模型: • 乘法模型:
1.1.5时间序列分析方法概述 • 现代随机时间序列分析方法:根据随机理论,对时间序列的随机因素进行分析。更好的反映了时间序列的随机性质,有较高的预测精度。 • 描述性时间序列分析 • 统计时间序列分析 • 频域分析 • 时域分析
描述性时序分析 • 通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 • 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。
描述性时序分析案例 强生公司的季度利润: Johnson & Johnson Quarterly Earnings
频域(Frequency domain)分析方法 • 原理 • 假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动 • 发展过程 • 早期的频域分析方法借助傅立叶(Fourier)分析从频率的角度揭示时间序列的规律 • 后来借助了傅立叶变换,用正弦、余弦项之和来逼近某个函数 • 20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段 • 特点 • 非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性。
时域 (Time Domain)分析方法 • 原理 • 事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系(记忆性),这种相关关系通常具有某种统计规律。 • 目的 • 寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势 • 特点 • 理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法
基础阶段 时域分析方法的发展过程 • G.U.Yule • 1927年,AR模型 • G.T.Walker • 1931年,MA模型,ARMA模型
核心阶段 • G.E.P.Box和 G.M.Jenkins • 1970年,出版《Time Series Analysis Forecasting and Control》 • 提出ARIMA模型(Box—Jenkins 模型) • Box—Jenkins模型实际上是主要运用于单变量、同方差场合的线性模型
完善阶段 • 异方差场合 • Robert F.Engle,1982年,ARCH模型 • Bollerslov,1985年GARCH模型 • 多变量场合 • C.Granger ,1987年,提出了协整(co-integration)理论 • 非线性场合 • 汤家豪等,1980年,门限自回归模型
时域分析法的概述 非线性函数 一元 多元 线性函数 齐方差 异方差 非线性参数函数 非参数函数 ARCH,GARCH AR, MA, ARMA ARIMA VAR, ECM, Cointegration SETAR,指数,双线性
1.1.6 时间序列分析方法与其它统计分析方法(回归分析)的主要区别 • 时间序列分析方法明确强调变量值顺序的重要性,而其它统计分析方法则不必如此。 • 时间序列各观察值之间存在一定的依存关系,而其它统计分析一般要求每一变量各自独立
1.1.6 时间序列分析方法与其它统计分析方法(回归分析)的主要区别 • 预测推断的依据不同:时间序列分析根据序列自身的变化规律来预测未来,而其它统计分析则根据某一变量与其它变量间的因果关系来预测该变量的未来。 • 时间序列是一组随机变量的一次样本实现,而其它统计分析的样本值一般是对同一随机变量进行N次独立重复实验的结果。
1.1.7 时间序列分析的目的和应用 分析时间序列数据间的动态依存关系,找寻时间序列的动态变化规律以及多个序列间的相互作用关系,从而对序列的未来变化趋势和发展情况作出预测。 • 应用: • 对潜在的系统运行规律的认知。 • 对外界因素(政策或者事件)的影响加以分析。 • 对未来发展的进行预测。 • 信号的提取。