1.2时问序列的定义 在统计研究中,常用按时间顺序排列的一组随机变量 …,X1,X2,…,X,… (1.1) 来表示一个随机事件的时间序列,简记为{X,t∈T}或{X,}。 用 x1x2,";工 (1.2) 或{x,t=L,2,,}表示该随机序列的n个有序观察值,称之为序列长度 为n的观察值序列,有时也称式(1.2)为式(1.1)的一个实现。 在日常生产生活中,观察值序列比比皆是。比如把北京市城镇居民1990 1999年每年的消费支出按照时间顺序记录下来,就构成了一个序列长度为10的 消费支出时间序列(单位:亿元): 1686,1925,2356,3027,3891,4874,5430,5796,6217,6796 我们研究的目的是想揭示随机时序{X,}的性质,而要实现这个目标就是 通过分析它的观察值序列{x}的性质,由观察值序列的性质来推断随机时序 {X}的性质。 1.3时间序列分析方法 1.3.1描述性时序分析 早期的时序分析通常都是通过直观的数据比较或绘图观测,寻找序列中蕴含 的发展规律,这种分析方法就称为描述性时序分析。古埃及人发现尼罗河泛溢的 规律就是依靠这种分析方法。而在天文、物理、海洋学等自然科学领域,这种简 单的描述性时序分析方法也常常能使人们发现意想不到的规律。 比如,19世纪中后叶,德国药剂师、业余天文学家施瓦尔就是运用这种方 法,经过几十年不断的观察、记录,发现了太阳黑子的活动具有11年左右的周 期(数据见附录1.1),如图1一1所示。 描述性时序分析方法具有操作简单、直观有效的特点,从史前直到现在一直 被人们广为使用,它通常是人们进行统计时序分析的第一步
sunspo 110900050 中由 中 中 中 1820 1830 1840 1850 1860 1870 year 图1一11820-1869年太阳黑子年度数据时序图 1.3.2统计时序分析 随着研究领域的不断拓广,人们发现单纯的描述性时序分析有很大的局限 性。在金融、保险、法律、人口、心理学等社会科学研究领域,随机变量的发展 通常会呈现出非常强的随机性,想通过对序列简单的观察和描述,总结出随机变 量发展变化的规律,并准确预测出它们将来的走势通常是非常困摊的。 为了更准确地估计随机序列发展变化的规律,从20世纪20年代开始,学术界 利用数理统计学原理分析时间序列。研究的重心从表面现象的总结转移到分析序列 值内在的相关关系上,由此开辟了一门应用统计学科一时间序列分析。 纵观时间序列分析方法的发展历史可以将时间序列分析方法分为两大类。 一、频城(frequency domain)分析方法 频域分析方法也被称为“频谱分析”或“谱分析”(spectral analysis)方法 早期的频域分析方法假设任何一种无趋势的时间序列都可以分解成若干不同 频率的周期波动,借助富里埃分析从颤率的角度揭示时间序列的规律,后来又借 助了傅里叶变换,用正弦、余弦项之和来逼近某个函数。20世纪60年代,Bug 在分析地震信号时提出最大嫡谱估计理论,该理论克服了传统谱分析所固有的分 辨率不高和频率漏泄等缺点,值谱分析进人一个新阶段,我们称之为现代谱分析 阶段。 目前谱分析方法主要运用于电力工程、信息工程、物理学、天文学、海洋学 3
和气象科学等领域,它是-一种非常有用的纵向数据分析方法。但是由于谱分析过 程一般都比较复杂,研究人员通常要具有很强的数学基础才能熟练使用它,同时 它的分析结果也比较抽象,不易于进行直观解释,导致谱分析方法的使用具有很 大的局限性。 二、时域(time domain)分析方法 时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。相对于 谱分析方法,它具有理论基础扎实、操作步骤规范、分析结果易于解释的优点 月前它已广泛应用于自然科学和社会科学的各个领域,成为时间序列分析的主流 方法。我们这本书主要就是介绍时域分析方法。 时域分析方法的基本思想是源于事件的发展通常都具有一定的惯性,这种惯 性用统计的语言来描述就是序列值之间存在着一定的相关关系,而且这种相关关 系具有某种统计规律。我们分析的重点就是寻找这种规律,并拟合出适当的数学 模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。 时域分析方法具有相对固定的分析套路,通常都遵循如下分析步骤 第一步:考察观察值序列的特征。 第二步:根据序列的特征选择适当的拟合模型 第三步:根据序列的观察数据确定模型的口径。 第四步:检验模型,优化模型。 第五步:利用拟合好的模型来推断序列其他的统计性质或预测序列将来的发 展。 时域分析方法的产生最早可以追潮到1927年,英国统计学家G.U.Yue (1871一1951)提出自回归(autoregressive,.AR)模型。不久之后,英国数学 家、天文学家G.T.Walker爵士在分析印度大气规律时使用了移动平均(mov ing average,MA)模型和自回妇移动平均(autoregressive moving average, ARMA)模型(1931年)。这些模型奠定了时间序列时域分析方法的基础。 l970年,美国统计学家G.E,P.Box和英国统计学家G.M.Jenkins联合出 版了Time Series Analysis Forecasting and Control一书。在书中,Box和Jen kins在总结前人研究的基础上,系统地闸述了对求和自回归移动平均(autore- gressive integrated moving average,ARIMA)模型的识别、估计、检验及预测 的原理及方法。这些知识现在被称为经典时间序列分析方法,是时域分析方法的 核心内容。为了纪念Box和Jenkins对时间序列发展的特殊贡献,现在人们也常 把ARIMA模型称为Box-Jenkins模型。 Box小enkins模型实际上是主要运用于单变量、同方差场合的线性模型。随
着人们对各领域时间序列的深入研究,发现该经典模型在理论和应用上都还存在 着许多局限性。所以近20年来,统计学家纷纷转向多变量场合、异方差场合和 非线性场合的时间序列分析方法的研究,并取得了突破性的进展 在异方差场合,美国统计学家、计量经济学家Robert F.Engle在l982年提 出了自回归条件异方差(ARCH)模型,用以研究英国通货膨胀率的建模问题 为了进一步放宽ARCH模型的约束条件,Boilerslov在l985年提出了广义自回 归条件异方差(GARCH)模型。随后Nelson等入又提出了指数广义自回归条 件异方差模型(EGARCH)、方差无穷广义自回归条件异方差模型(IGARCH) 和依均值广义自回归条件异方差(GARCH-M)等限制条件更为宽松的异方差模 型。这些异方差模型是对经典的ARIMA模型很好的补充。它比传统的方差齐性 模型更准确地刻画了金融市场风险的变化过程,因此ARCH模型及其衍生出的 一系列拓展模型在计量经济学领域有者广泛的应用。Egle也因此获得2003年 诺贝尔经济学奖。 在多变量场合,Box和Jenkins在Time Series Analysis Forecasting and Control一书中研究过平稳多变量序列的建模,Box和Tiao在1970年左右讨论 过带干扰变量的时间序列分析。这些研究实际上是把对随机事件的横向研究和纵 向研究有机地融合在一起,提高了对随机事件分析和预测的精度。1987年,英 国统计学家、计量经济学家C.Granger提出了协整(co-integration)理论,进 步为多变量时间序列建模松绑。有了协整的概念之后,在多变量时间序列建模过 程中“变量是平稳的”不再是必须条件了,而只要求它们的某种线性组合平稳。 协整概念的提出极大地促进了多变量时间序列分析方法的发展,Granger因此与 Engle一起获得了2003年诺贝尔经济学奖。 非线性时间序列分析也有重大发展,汤家豪教授等在1980年左右提出了利 用分段线性化构造的门限自回归模型成为目前分析非线性时间序列的经典模型。 1.4时间序列分析软件 随着计算机科学的高速发展,现在有许多软件可以帮助我们进行时间序列分 析。常用的软件有:S-plus,Matlab,.Gauss,TSP,Eviews和SAS 我们在本书中介绍和使用的软件是SAS。SAS的全称是Statistical Analysis System,直译过来就是统计分析系统,它最早是由美国北卡罗来纳州立大学 (North Carolina State University).的两位教授(AJ.Barr&.J.H.Goodnight) 5
联合升发的,专门进行数学建模和统计分析的软件。发展到今天,它不仅成为统 计分析领域的国际标准软件,而且已经成为具有完备的数据访问、数据管理、数 据分析和数据呈现功能的大型集成化软件系统。由于领先的技术和全面的功能, 它已经成为全球数据分析方面的首选软件。 在SAS系统中有一个专门的模块:SAS/ETS(Econometric&Time Se- ries),这是一个专门进行计量经济与时间序列分析的软件。SAS/ETS编程语言 简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软 件。由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间 序列分析时它具有其他统计软件无可比拟的优势。 为了让读者在了解时间序列分析基本原理的同时也能掌握一定的实际操作技 巧,本书在每一章后面都会有一小节的内容介绍本章分析方法在SAS/ETS软件 上的实现。本书所有的例题也都是以SAS/ETS作为操作软件。 1.5习题 1.1什么是时间序列?请收集几个生活中的观察值序列。 1.2时域方法的特点是什么? 1.3时域方法的发展轨迹是怎样的? 1.4在附录1中选择几个感兴趣的序列,创建数据集。 1.6上机指导 1.6.1SAS操作界面 在Windows操作系统下双击“The SAS System'”的图标薄,立刻就启动了 SAS系统,进人SAS操作界面。 SAS的操作界面主要由三个部分组成:菜单栏、工具栏和窗口。见图1一2。 一、菜单栏 莱单栏包括八个选项,它们分别是: 【Fl©】一文件选项。它主要用于处理文件的打开、关闭、保存、输入 输出、打印及发送等任务。 【E】一一编辑选项。它主要负责文件的复原、剪切、复制、粘贴、清除