任取正整数m,任取,2,…,m∈T,则m维随机向量(X,X2,…, X,)'的联合概率分布记为F(1,,,x),由这些有限维分布函 数构成的全体 {F(x1,x2,…,znm),m∈(1,2,…,m),i1,t2,…,tm∈T 就称为序列{X}的概率分布族。 概率分布族是极其重要的统计特征描述工具,因为序列的所有统计性质理论 上都可以通过概率分布椎测出来,但是概率分布族的重要性也就停留在这样的理 论意义上。在实际应用中,要得到序列的联合概率分布几乎是不可能的,而且联 合概率分布通常涉及非常复杂的数学运算,这些原因使我们很少直接使用联合概 率分布进行时间序列分析。 二、特征统计量 一个更简单、更实用的描述时间序列统计特征的方法是研究该序列的低阶 矩,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。 尽管这些特征量不能描述随机序列全部的统计性质,但由于它们核率意义明 显,易于计算,而且往往能代表随机序列的主要概率特征,所以我们对时间序列 进行分析,主要就是通过分析这些特征量的统计特性,推断出随机序列的性质。 1.均使 对时间序列{X,t∈T}而言,任意时刻的序列使X,都是一个随机变 量,都有它自己的概率分布,不妨记X的分布函数为F,(x)。只要满足条件 二xdR,(a)<c©,就一定存在着某个常数,使得随机变量X总是圈绕在常数 使一附近做随机波动。我们称出为序列{X}在t时刻的均值函数。 =EX.=rdF.(x) 当t取遍所有的观察时刻时,我们就得到一个均值函数序列{出,t∈T}。 它反映的是时间序列{X,t∈T}每时每刻的平均水平。 2.方差 当⑧F,(x)<四时,我们可以定义时间序列的方差函数用以描述序列 值围绕其均值做随机波动时平均的波动程度。 DX,=E(X,-4,)2=(x-4)dF,(x) 同样,当t取遍所有的观察附刻时,我们得到一个方差函数序列{Dx,t∈T}。 3.自协方差函数和自相关函数 公
类似于协方差函数和相关系数的定义,在时间序列分析中我们定义自协方差 函数(autocovariance function)和自相关系数(autocorrelation function)的概 念。 对于时间序列{X,t长T,任取t,s∈T,定义(t,s)为序列{X}的自 协方差函数: y(t,s)=E(X,4)(X,一4) 定义p(t,s)为时间序列{X}的自相关系数,简记为ACF。 p,)=Dx·DxX r(t,s) 之所以称它们为自协方差函数和自相关系数是因为通常的协方差函数和相关 系数度量的是两个不同的事件彼此之间的相互影响程度,而自协方差函数和自相 关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自 己过去的行为对自己现在的影响。 2.1.2平稳时间序列的定义 平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列 和宽平稳时间序列。 一、严平稳(strictly stationary】 所谓严平稳就是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的 统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。而我们 知道,随机变量族的统计性质完全由它们的联合概率分布族决定。所以严平稳时 间序列的定义如下: 定义2.1设{X}为一时间序列,对任意正整数m,任取,2,…,tn ∈T,对任意整数x,有 则称时间序列{X}为严平稳时间序列。 前而说过,在实践中要获得随机序列的联合分布是一件非常困难的事,而 且,即使知道随机序列的联合分布,计算和应用也非带不便。所以严平稳时间序 列通常只具有理论意义,在实践中用得更多的是条件比较宽松的宽平稳时间序 列。 二、宽平稳(week stationary) 宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性 质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序 18
列的主要性质近似稳定。 定义2.2如果{X}满足如下三个条件: (1)任取t∈T,有EX好<co; (2)任取t长T,有EX,=,u为带数 (3)任取t,5,k∈T,且k十5-ET,有y(t,5)=yk,k十3-t): 则称{X,}为宽平稳时间序列。宽平稳也称为弱平稳或二阶平稳(second-order stationary)。 显然,严平稳比宽平稳的条件严格。严平稳是对序列联合分布的要求,以保 证序列所有的统计特征都相同:而宽平稳只要求序列二阶平稳,对于高于二阶的 定没有任何要求。所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序 列不能反推严平稳成立。 但这不是绝对的,两种情况都有特例。 比如服从柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶 矩,所以无法验证它二阶平稳。严格地讲,只有存在二阶矩的严平稳序列才能保 证它一定也是宽平稳序列。 宽平稳一般推不出严平稳,但当序列服从多元正态分布时,则二阶平稳可以 推出严平稳。 定义2.3时间序列{X}称为正态时间序列,如果任取正整数n,任取1, 红,…,,∈T,相对应的有限维随机变量X,X2,…,Xn服从n维正态分布 密度函数为: f44(R)=(2x)|I.片exp[-(x-4)T(8,-4门 其中,文=(X,X2,…,X)',么n=(EX,EX2,…,EX)',Tm为协方 差阵: yt)y,2)…y(4,t) D- Y(t)y(tn:t2).Y(t,te) 从正态随机序列的密度函数可以看出,它的n维分布仅由均值向量和协方差 阵决定,换言之,对正态随机序列而言,只要二阶矩平稳,就等于分布平稳了。 所以宽平稳正态时间序列一定是严平稳时间序列。对于非正态过程,就没有这个 性质了。 在实际应用中,研究最多的是宽平稳随机序列,以后碰见平稳随机序列,如 19
果不加特殊注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为 非平稳序列。 2.1.3平稳时间序列的统计性质 根据平稳时间序列的定义,可以椎断出它一定具有如下两个重要的统计性 质。 一、常数均值 EX.=u,VIET 二、自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点 无关 y(t,s)=y(k,k+s-t),Yt,s,k E T 根据这个性质,可以将自协方差函数yt,s)由二维简化为一维Y(s一): y(s-t)÷y(t,s),t,s∈T 由此引出延迟是自协方差函数的概念 定义2.4对于平稳时间序列{X,t∈T},任取t,t十∈T,定义y(k)为 时间序列{X,}的延迟自协方差函数: y(k)=y(t,t+k) 根据平稳序列的这个性质,容易推新出平稳随机序列一定具有常数方差: DX,y(t,t)=y(0),VtET 由延迟是自协方差函数的概念可以等价得到延迟自相关系数的概念: 肤= X(i,t+k) 容易验证和相关系数一样,自相关系数具有如下三个性质: (1)规范性。 A=1且I|≤1,k (2)对称性。 Pap- (3)非负定性。 对任意正整数m,相关阵Im为对称非负定阵 I=P …p- 2
值得注意的是:除了具有这三个性质外,它还具有一个特别的性质:非惟 一性。 一个平稳时间序列一定准一决定了它的自相关函数,但一个自相关函数未必 惟一对应着一个平稳时间序列。我们在后面的章节中将证明这一点。这个性质就 给我们根据样本的自相关系数的特点来确定模型增加了一定的难度。 2.1.4平稳时间序列的意义 时间序列分析方法作为数理统计学的一个专业分支,它遵循数理统计学的基 本原理,都是利用样本信息来推测总体信息。 传统的统计分析通常都拥有如下数据结构,见表2一1。 表2- 随机变量 样本 X. 2 x12 n 根据数理统计学常识,显然要分析的随机变量越少越好(越小越好),而 每个变量获得的样本信息越多越好(越大越好)。因为随机变量越少,分析的 过程就会越简单,而样本容量越大,分析的结果就会越可靠。 但是时间序列分析的数据结构有它的特殊性。对随机序列{…,X1, X2,·,X,…〉面言,它在任意时刻t的序列值X,都是一个随机变量,而且 由于时间的不可重复性,该变量在任意一个时刻只能获得惟一的一个样本观察 值。因而时间序列分析的数据结构如下,见表22。 表2-2 随机变量 样本 … 由于样本信息太少,如果没有其他的辅助信息,通常这种统计结构是没有办 法进行分析的。而序列平稳性概念的提出可以有效地解决这个困难。 在平稳序列场合,序列的均值等于常数意味者原本含有可列多个随机变量的 均值序列 21