Autocorrelations Correlation-l98765432101234567891 :米米米家米家事率冰米米米率米率米率来率率】 0.180 -0.0083274 -003 48917 0260 88 -0.069243 -02605 "marks two standard eors 图2一61949-1998年北京市最高气温序列的自相关国 2.2纯随机性检验 拿到一个观察值序列之后,首先是判断它的平稳性。通过平稳性检验,序列 可以分为平稳序列和非平稳序列两大类。 对于非平稳序列,由于它不具有二阶矩平稳的性质,所以对它的统计分析装 周折一些,通常要进行进一步的检验、变换或处理之后,才能确定适当的拟合模 型。 如果序列平稳,情祝就简单多了,我们有一套非常成熟的平稳序列建模方 法。但是,并不是所有的平稳序列都值得建模。只有那些序列值之间具有密切的 相关关系,历史数据对未来的发展有一定影响的序列,才值得我们花时间去挖掘 历史数据中的有效信息,用来预测序列未来的发展。 如果序列值彼此之间没有任何相关性,那就意味者该序列是一个没有记忆的 序列,过去的行为对将来的发展没有丝毫影响,这种序列我们称之为纯随机序 列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。 为了确定平稳序列还值不值得继续分析下去,我们需要对平稳序列进行纯随 机性检验。 23
2.2.1纯随机序列的定义 定义2.5如果时间序列{X,}满足如下性质 (1)任取∈T,有EX,= (2)任取,s∈T,有 0,t=s 70=0+5 称序列{X)为纯随机序列,也称为白噪声(white noise)序列,简记为X, wN(w,d2)。 之所以称之为白噪声序列,是因为人们最初发现白光具有这种特性。容易证 明白噪声序列一定是平稳序列,而且是最简单的平稳序列。 【例2.4】随机产生10O0个服从标准正态分布的白噪声序列观察值,并绘 制时序图。见图2一7。 3 2 200 600 800 1000 图2一7标准正态白噪声序列时序围 2.2.2白噪声序列的性质 白噪声序列虽然很简单,但它在我们进行时间序列分析时所起的作用却非常 大。它的两个重要性质我们在后面的分析过程中要经常用到。 一、纯随机性 由于白螺声序列具有如下性质: 8
y)=0,k≠0 这说明白噪声序列的各项之间没有任何相关关系,这种“没有记忆”的序列就是 我们说的纯随机序列。 纯随机序列各项之间没有任何关联,序列在进行完全无序的随机波动。一旦 某个随机事件呈现出纯随机运动的特征,我们就认为该随机事件没有包含任何值 得提取的有用信息,我们就应该终止分析了。 如果序列值之间呈现出某种显著的相关关系 y()≠0,3k≠0 就说明该序列不是纯随机序列,该序列间隔k期的序列值之间存在着一定程度的 相互影响关系,这种相互影响关系,统计上称为相关信息。我们分析的目的就是 要想方设法把这种相关信息从观察值序列中提取出来。一旦观察值序列中蕴含的 相关信息被我们充分提取出来了,那么剩下的残差序列就应该呈现出纯随机的性 质了。所以纯随机性还是我们判断相关信息是否提取充分的一个判别标准。 二、方差齐性 所谓方差齐性,就是指序列中每个变量的方差都相等,即 DX:=y(0)= 如果序列不满足方差齐性,我们就称该序列具有异方差性质。 在时间序列分析中,方差齐性是一个非常重要的限制条件。因为根据马尔可 夫定理,只有方差齐性假定成立时,我们用最小二乘法得到的未知参数估计值才 是准确的、有效的。如果假定不成立,那么最小二乘估计值就不是方差最小线性 无偏估计,拟合模型的预测精度会受到很大影响。 所以我们在进行模型拟合时,检验内容之一就是要检验拟合棋型的残差是否 满足方差齐性假定。如果不满足,那就说明残差序列还不是白噪声序列,即拟合 模型没有充分提取随机序列中的相关信息,这时拟合模型的精度是值得怀疑的 在这种场合下,我们通常需要使用适当的条件异方差模型来拟合该序列的发展。 2.2.3纯随机性检验 纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的 一种方法。我们知道如果一个序列是纯随机序列,那它的序列值之间应该没有任 何相关关系,即满足 y(k)=0,V是≠0 这是一种理论上才会出现的理想状况。实际上,由于观察值序列的有限性,导致 纯随机序列的样本自相关系数不会绝对为零
【例2.4续】绘制例2.4标准正态白噪声序列的样本自相关图。如图2一8 所示。 Autocomelations Cor *L m-19876543210123456789 -0.00106 -0.0062 62 D. s 0.0088 -0.010179 0.02 3 0.035; 0.039 ".marks two standard errons 图2一8白噪声序列样本自相关围 样本自相关图显示这个纯随机序列没有一个样本自相关系数严格等于零。但 这些自相关系数确实都非常小,都在零值附近以一个很小的幅度做者随机波动。 这就提醒我们应该考虑样本自相关系数的分布性质,从统计意义上来判断序列的 性质。 Barlett证明,如果一个时间序列是纯随机的,得到一个观察期数为n的观 察序列{x,t=1,2,,n},那么该序列的延迟非零期的样本自相关系数将 近似服从均值为零、方差为序列观察期数倒数的正态分布,即 p4之N(0,1),Vk≠0 式中,n为序列观察期数。 根据Barlett定理,我们可以构造检验统计量来检验序列的纯随机性, 一、假设条件 由于序列值之间的变异性是绝对的,而相关性是偶然的,所以假设条件如下 确定 原假设:延迟期数小于或等于m期的序列值之间相互独立。 备择假设:延迟期数小于或等于期的序列值之间有相关性。 该假设条件用数学语言描述即为: H:p=a=…=A=0,Hm≥】 H1:至少存在某个≠0,m⊙l,k≤m
二、检验统计量 1.Q统计量 为∫检验这个联合假设,Box和Pierce推导出了Q统计量 Q-n>di 式中,n为序列观测期数:m为指定延迟期数 根据正态分布和卡方分布之间的关系,我们很容易推导出Q统计量近似服 从自由度为m的卡方分布: Q=n2强~X(m) 当Q统计量大于x-.(m)分位点,或该统计量的P值小于a时,则可以以1一a 的置信水平拒绝原假设,认为该序列为非白噪声序列;否则,接受原假设,认为 该序列为纯随机序列。 2.1B统计量 在实际应用中人们发现Q统计量在大样本场合(很大的场合)检验效果很 好,但在小样本场合就不太精确。为∫弥补这一缺陷,Box和Ljug又推导出 LB(Ljung-Box)统计量: B=aa+22(产) 式中,n为序列观测期数;m为指定延迟期数。Box和Ljug证明LB统计量同 样近似服从自由度为m的卡方分布。 实际上LB统计量就是Box和Pierce的Q统计量的修正,所以人们习惯把它 们统称为Q统计量,分别记作Q统计量(Box和Pierce的Q统计量)和Qa统 计量(Box和Ljug的Q统计量),在各种检验场合普遍采用的Q统计量通常指 的都是LB统计量 【例2.4续】计算例2.4中白噪声序列的延迟6期、延迟12期的Q统计 量的值,并判断该序列的随机性(a=0.05)。 由图2-8我们可以得到该序列延迟12期样本自相关系数,数据如下,见表2-3。 表2-3 延迟期数 6 -0.001-0.037-0.0060.012-0.025 -0.014 延迟期数 7 8 10 11 12 0.009 -0.010-0.027 -0.025 -0.014 0.035 31