目录 第六章时间序列分析及应用 153 第一节时间序列概述……… 153 、时间序列的意义 153 二、时间序列的种类 154 三、时间序列编制原则 154 四、时间序列的建立 ∴155 第二节时间序列分析 157 、时间序列分析概念 157 、确定性与随机性时间序列分析. 158 时间序列分析方法 158 四、时间序列的应用 159 第三节时间序列及其特征识别 160 、时间序列与随机过程 160 、时间序列的识别判据 162 三、时间序列特征的识别 164 第四节平稳时间序列模型… 167 一阶自回归模型… 167 、一般自回归模型. 移动平均模型 169 四、自回归移动平均模型 169 152
152 目录 第六章 时间序列分析及应用 ............................................................................................153 第一节 时间序列概述....................................................................................................153 一、时间序列的意义 ....................................................................................................153 二、时间序列的种类 ....................................................................................................154 三、时间序列编制原则 ................................................................................................154 四、时间序列的建立 ....................................................................................................155 第二节 时间序列分析....................................................................................................157 一、时间序列分析概念 ................................................................................................157 二、确定性与随机性时间序列分析.............................................................................158 三、时间序列分析方法 ................................................................................................158 四、时间序列的应用 ....................................................................................................159 第三节 时间序列及其特征识别 ....................................................................................160 一、时间序列与随机过程 ............................................................................................160 二、时间序列的识别判据 ............................................................................................162 三、时间序列特征的识别 ............................................................................................164 第四节 平稳时间序列模型 ............................................................................................167 一、一阶自回归模型 ....................................................................................................167 二、一般自回归模型 ....................................................................................................168 三、移动平均模型........................................................................................................169 四、自回归移动平均模型 ............................................................................................169
第六章时间序列分析及应用 第一节时间序列概述 、时间序列的意义 (1)时间序列的概念 也称时间数列、动态数列,是指将某一统计指标在不同时间上的数值,按时间先后顺序 加以排列后形成的统计数列。例如,某省1995-2001年的生产总值、年末总人口、人均生产 总值、职工年平均工资资料。见表6.1。 表611995-2001年某省有关指标 年份某省生产总值(亿元)年末总人口(万人)人均生产总值(元/人)职工年平均工资(元) 2849.52 6437 4444 4839 1996 3452.97 6484 5345 5286 1997 3953.78 6525 6079 5692 4256.01 50l 5820 1999 6614 6932 6421 2000 5088.96 6674 7663 7043 2001 5577.78 6699 8362 7864 我们可以从三个方面理解时间序列: 从统计意义上讲,时间序列指时间序列数据“ Time Series data”,即将某一个指标在不同 时间上的统计数值,按时间的先后顺序排列而成的数列。比如,1980~2016年中国的GDP。 常用的宏观时间序列有三种频率,月度( monthly)、季度( quarterly)、年度( annual)。 其它数据有截面、日度、周、时、不规则数据等。 从数学意义上讲,时间序列是随机过程( stochastic process)一个特例,即由有序的随机 变量( random variable)组成的序列,设T为一个有序集,以T中元素t为下标的变量Xt是随 机变量,则{Xt|t∈T}是一个时间序列,因为T为有序集,于是时间序列也可以表示为 {X,X1,X1,…} (6.1) 或简单表示为 (62) 通常我们用 XYZ 来表示时间序列。 153
153 第六章 时间序列分析及应用 第一节 时间序列概述 一、时间序列的意义 (1)时间序列的概念 也称时间数列、动态数列,是指将某一统计指标在不同时间上的数值,按时间先后顺序 加以排列后形成的统计数列。例如,某省 1995-2001 年的生产总值、年末总人口、人均生产 总值、职工年平均工资资料。见表 6.1。 表 6.1 1995-2001 年某省有关指标 年份 某省生产总值(亿元) 年末总人口(万人) 人均生产总值(元/人) 职工年平均工资(元) 1995 2849.52 6437 4444 4839 1996 3452.97 6484 5345 5286 1997 3953.78 6525 6079 5692 1998 4256.01 6569 6501 5820 1999 4569.19 6614 6932 6421 2000 5088.96 6674 7663 7043 2001 5577.78 6699 8362 7864 我们可以从三个方面理解时间序列: 从统计意义上讲,时间序列指时间序列数据“Time Series Data” ,即将某一个指标在不同 时间上的统计数值,按时间的先后顺序排列而成的数列。比如,1980~2016 年中国的 GDP。 常用的宏观时间序列有三种频率,月度(monthly)、季度(quarterly)、年度(annual)。 其它数据有截面、日度、周、时、不规则数据等。 从数学意义上讲,时间序列是随机过程(stochastic process)一个特例,即由有序的随机 变量(random variable)组成的序列,设 T 为一个有序集,以 T 中元素 t 为下标的变量 Xt 是随 机变量,则 {Xt | t∈T} 是一个时间序列,因为 T 为有序集,于是时间序列也可以表示为 {X ,X ,X , } 1 2 3 t t t (6.1) 或简单表示为 {X ,X ,X , } 1 2 3 (6.2) 通常我们用 t t Zt X , Y , (6.3) 来表示时间序列
时间序列中的时间指广义时间,即有序集,不一定非得是狭义的时间概念,只要是有顺 序的随机变量列就是时间序列,比如,温度、湿度、速度、压力等有“顺序”意义的物理量 从系统意义上讲,时间序列就是某一系统在不同时间(广义时间)上的响应,即系统在 不同时刻的状态值,比如正在飞行着的宇宙飞船系统每隔10分钟所记录的飞行速度等。 (2)时间序列的构成要素 现象所属的时间;是反映客观现象的指标数值。 (3)时间序列的作用 反映现象在不同时间上的规模和水平;反映社会经济现象发展变化的过程和趋势:探 索某些社会经济现象发展变化的规律性;建立数学模型,预测未来 二、时间序列的种类 l、绝对数时间序列 把总量指标在不同时间上的数值按时间先后顺序加以排列就形成了绝对数时间序列 (1)时期数列 所列总量指标都是反映社会经济现象在一段时间内发展过程的总量的时间序列。如:表 5-1中某省各年国内生产总值就是时期数列。其特点: 可相加性:时期数列中各指标数值可以相加。 直接相关性:时期数列中各指标数值的大小与所包含时期的长短有直接关系。 连续性:时期数列中各个指标数值是由连续不断的登记取得的 (2)时点数列 所列总量指标都是反映社会经济现象在某一时刻(或瞬间)上的总量的动态数列。如 表5-1中某省各年年末人口数就是该数列。 特点: 不可相加性:数列中各项指标数值不具有可加性: 无直接相关性:数列中各指标值的大小与其时间间隔无直接关系; 次性:数列中的各指标值一般是通过一次性登记取得的 2、相对数时间序列 把相对指标在不同时间上的数值按时间先后顺序加以排列就形成了相对数时间序列 如:表5-1中年人均生产总值就是相对数时间序列 特点:各个指标数值是不能相加的。 3、平均数时间序列 把平均指标在不同时间上的数值按时间先后顺序加以排列就形成了平均数时间序列。如 表5-1中,各年职工年平均工资就是平均数时间序列 特点数列中各个指标数值也是不能相加的。 三、时间序列编制原则 指标的可比性是编制时间序列要遵守的基本原则,具体说,可比性的具体表现如下: 1)时期长短应该相等 在时期数列中各个指标值的大小与时期长短有直接关系。一般时期越长,数值越大,反之 154
154 时间序列中的时间指广义时间,即有序集,不一定非得是狭义的时间概念,只要是有顺 序的随机变量列就是时间序列,比如,温度、湿度、速度、压力等有“顺序”意义的物理量。 从系统意义上讲,时间序列就是某一系统在不同时间(广义时间)上的响应,即系统在 不同时刻的状态值,比如正在飞行着的宇宙飞船系统每隔 10 分钟所记录的飞行速度等。 (2)时间序列的构成要素 现象所属的时间;是反映客观现象的指标数值。 (3)时间序列的作用 反映现象在不同时间上的规模和水平;反映社会经济现象发展变化的过程和趋势; 探 索某些社会经济现象发展变化的规律性;建立数学模型,预测未来。 二、时间序列的种类 1、绝对数时间序列 把总量指标在不同时间上的数值按时间先后顺序加以排列就形成了绝对数时间序列。 (1)时期数列 所列总量指标都是反映社会经济现象在一段时间内发展过程的总量的时间序列。如:表 5-1 中某省各年国内生产总值就是时期数列。其特点: 可相加性:时期数列中各指标数值可以相加。 直接相关性:时期数列中各指标数值的大小与所包含时期的长短有直接关系。 连续性:时期数列中各个指标数值是由连续不断的登记取得的。 (2)时点数列 所列总量指标都是反映社会经济现象在某一时刻(或瞬间)上的总量的动态数列。如: 表 5-1 中某省各年年末人口数就是该数列。 特点: 不可相加性:数列中各项指标数值不具有可加性; 无直接相关性:数列中各指标值的大小与其时间间隔无直接关系; 一次性:数列中的各指标值一般是通过一次性登记取得的。 2、相对数时间序列 把相对指标在不同时间上的数值按时间先后顺序加以排列就形成了相对数时间序列。 如:表 5-1 中年人均生产总值就是相对数时间序列。 特点: 各个指标数值是不能相加的。 3、平均数时间序列 把平均指标在不同时间上的数值按时间先后顺序加以排列就形成了平均数时间序列。如 表 5-1 中,各年职工年平均工资就是平均数时间序列。 特点: 数列中各个指标数值也是不能相加的。 三、时间序列编制原则 指标的可比性是编制时间序列要遵守的基本原则,具体说,可比性的具体表现如下: 1)时期长短应该相等。 在时期数列中各个指标值的大小与时期长短有直接关系。一般时期越长,数值越大,反之
就小,所以时期数列各指标所属时期的长短应该相等。 在特殊研究目的下,也可编制时期不等的时期数列 如:我国几个重要时期的钢产量资料(表62) 表6.2我国几个重要时期的钢产量(万吨) 时期190019491953-19571981-19851986-1901991-19951996-2000 钢产量 1667 20304 27372 42478 73407 时点数列间隔期是否相等可根据实际情况和需要而定。但为了便于比较分析,各指标数 值之间的间隔也最好相等。 2)指标的经济内容必须相同 例如:农业总产值指标在1993年前后对于副业的处理就不同,使用时应注意调整 3)指标值所属的总体范围应该一致 例如:要研究某一地区的经济发展情况,要注意该地区行政区划是否发生过变更。 4)指标的计算方法和计量单位必须统 例如:劳动生产率指标中的产量用实物量还是价值量,人数用从业人员数还是工人(含 学徒工)人数,前后要统 再如,产值指标的不变价格和现行价格问题 四、时间序列的建立 时间序列分析的主要处理对象是来自所研究系统的时间序列的数据样本资料。因此,获 取时间序列数据是时间序列分析的基础工作。时间序列数据在使用之前要进行认真的检查 我们把获取时间序列数据以及对其进行检查、整理和预处理工作,称为时间序列的建立, (1)时间序列数据的采集 对于时间序列所对应的系统来说,由于时间的连续性,时间序列系统也是连续的,但为 了数字计算处理的方便,往往只能按照一定的时间间隔对所研究的系统进行观察记录,称之 为采样。将观察记录的时间间隔称为采样间隔,用△表示。若采样间隔为一年,则△=1年 如年度GDP,若采样间隔为一月,则Δ=1月。同理,Δ可以是日、时、分等,每个观察值 也称为采样值,第k个采样值记为Xk 采样间隔可以相等,可以不等,我们所用的方法是间隔相等的情况。当确定了采样间隔 △之后,采得样本数据,这时我们便丢失了时间序列X1在X1与X1+(1=1,2,n-1)之间的 信息。然而,采样间隔Δ越小,信息损失虽也少,但数据收集、处理工作量加大,成本较大 反之,采样间隔Δ越大,收集处理工作量减少,但信息损失较大。因此,选择合适的采样间 隔是建立时间序列的关键。 (2)离群点的检验与处理 离群点( outlier)是指一个时间序列中,远离序列一般水平的极端大和极端小值。因此, 也称之为奇异值,有时也称其为野值。如描述1949年到1997年间我国的人口自然增长率 (X1)。1960年的人口自然增长率大大低于其它年份的值。从序列来看,X12(即1960年 的观察值)远离序列的一般趋势,称X12为离群点。 般来说,这种结果是由于系统受外部干扰而造成的,但形成离群点的系统外部干扰是 155
155 就小,所以时期数列各指标所属时期的长短应该相等。 在特殊研究目的下,也可编制时期不等的时期数列。 如:我国几个重要时期的钢产量资料(表 6.2) 表 6.2 我国几个重要时期的钢产量(万吨) 时 期 1900-1949 1953-1957 1981-1985 1986-1990 1991-1995 1996-2000 钢产量 776 1667 20304 27372 42478 73407 时点数列间隔期是否相等可根据实际情况和需要而定。但为了便于比较分析,各指标数 值之间的间隔也最好相等。 2)指标的经济内容必须相同 例如:农业总产值指标在 1993 年前后对于副业的处理就不同,使用时应注意调整。 3)指标值所属的总体范围应该一致 例如:要研究某一地区的经济发展情况,要注意该地区行政区划是否发生过变更。 4)指标的计算方法和计量单位必须统一。 例如:劳动生产率指标中的产量用实物量还是价值量,人数用从业人员数还是工人(含 学徒工)人数,前后要统一。 再如,产值指标的不变价格和现行价格问题。 四、时间序列的建立 时间序列分析的主要处理对象是来自所研究系统的时间序列的数据样本资料。因此,获 取时间序列数据是时间序列分析的基础工作。时间序列数据在使用之前要进行认真的检查, 我们把获取时间序列数据以及对其进行检查、整理和预处理工作,称为时间序列的建立。 (1)时间序列数据的采集 对于时间序列所对应的系统来说,由于时间的连续性,时间序列系统也是连续的,但为 了数字计算处理的方便,往往只能按照一定的时间间隔对所研究的系统进行观察记录,称之 为采样。将观察记录的时间间隔称为采样间隔,用△ 表示。若采样间隔为一年,则△=1 年, 如年度 GDP,若采样间隔为一月,则△=1 月。同理, △可以是日、时、分等,每个观察值 也称为采样值,第 k 个采样值记为 Xk。 采样间隔可以相等,可以不等,我们所用的方法是间隔相等的情况。当确定了采样间隔 △之后,采得样本数据,这时我们便丢失了时间序列 Xt 在 Xi 与 Xi+1(i=1,2,…,n-1)之间的 信息。然而,采样间隔△越小,信息损失虽也少,但数据收集、处理工作量加大,成本较大。 反之,采样间隔△越大,收集处理工作量减少,但信息损失较大。因此,选择合适的采样间 隔是建立时间序列的关键。 (2)离群点的检验与处理 离群点(outlier)是指一个时间序列中,远离序列一般水平的极端大和极端小值。因此, 也称之为奇异值,有时也称其为野值。如描述 1949 年到 1997 年间 我国的人口自然增长率 ( Xt )。1960 年的人口自然增长率大大低于其它年份的值。从序列来看, X12(即 1960 年 的观察值)远离序列的一般趋势,称 X12 为离群点。 一般来说,这种结果是由于系统受外部干扰而造成的,但形成离群点的系统外部干扰是
多种多样的。第一种可能性是采样误差,如记录仪偏误、工作人员岀现笔误、计算错误等都 可能产生极大或极小值。第二种是所研究的系统受到偶然、非正常因素而产生的,如上述人 口自然增长率时间序列中。由于受到象地震、水灾、旱灾等自然现象有影响某些经济指标出 现异常值。 不论是何种因素形成的离群点,对时间序列分析都会带来一定的影响,因而,对离群点 要进行与处理。 在时间序列分析中,通常把离群点分为四种 第一种是加性离群点( Additive outlier)。引起离群点的干扰,只影响该干扰发生的哪- 时刻T上的序列值XT,不会影响其后的值Xr+1,XT+2,(如记录或录入错误)。 第二种为更新离群点( Innovational outlier),产生离群点的干扰不仅作用于Xr,而且影 响T时刻以后序列的所有值,Xr+1,XT+2,,这一时刻意味着一个外部干扰作用于系统的开 始(如降息对于储蓄的影响)。 第三种是水平位移离群点( Level shift outlier),此时系统出现向上或冋下跳跃,引起此 类干扰的原因是系统在时刻T发生了结构性变化,并持续影响T时刻之后的所有行为(如农 村体制改革)。在数据上往往表现出T时刻前后发生水生水平位移 第四种是暂时变更离群点( Temporary change outlier),引进这一现象的干扰在T时刻发 生时具有一定的初始效应,以后随着时间根据衰减因子的大小呈现指数衰减趋势。(如消费受 价格的干扰)。 在取得时间序列之后,通过序列的直观变化图(Line)即可初步看出是否有离群点,如 果有,再作进一步的检查。 离群点的检验方法: 比较简单的一种检验方法是将序列值与平滑值进行比较,检验是否存在明显大或小的序 列值。这种方法是假定正常的序列是较为平滑的,而离群点使序列产生非平滑现象。具体方 法如下: 令2表示先对X1作平滑再取平方所得值:令H2表示先对x1取平方再作平滑所得值 若 X-k s Ytk 则认为X+1是正常点,否则,是离群点。k为分析时设定的数学,一般为3~9,不 妨取k=6。 若x1为离群点,用,来修正之,即用 (66) 来代替序列中Xt+1的值 (3)缺损值的补充
156 多种多样的。第一种可能性是采样误差,如记录仪偏误、工作人员出现笔误、计算错误等都 可能产生极大或极小值。第二种是所研究的系统受到偶然、非正常因素而产生的,如上述人 口自然增长率时间序列中。由于受到象地震、水灾、旱灾等自然现象有影响某些经济指标出 现异常值。 不论是何种因素形成的离群点,对时间序列分析都会带来一定的影响,因而,对离群点 要进行与处理。 在时间序列分析中,通常把离群点分为四种: 第一种是加性离群点(Additive outlier)。引起离群点的干扰,只影响该干扰发生的哪一 时刻 T 上的序列值 XT,不会影响其后的值 XT+1, XT+2 ,…(如记录或录入错误)。 第二种为更新离群点(Innovational outlier),产生离群点的干扰不仅作用于 XT ,而且影 响 T 时刻以后序列的所有值, XT+1, XT+2 ,…,这一时刻意味着一个外部干扰作用于系统的开 始(如降息对于储蓄的影响)。 第三种是水平位移离群点(Level shift outlier),此时系统出现向上或向下跳跃,引起此 类干扰的原因是系统在时刻 T 发生了结构性变化,并持续影响 T 时刻之后的所有行为(如农 村体制改革)。在数据上往往表现出 T 时刻前后发生水生水平位移。 第四种是暂时变更离群点(Temporary change outlier),引进这一现象的干扰在 T 时刻发 生时具有一定的初始效应,以后随着时间根据衰减因子的大小呈现指数衰减趋势。(如消费受 价格的干扰)。 在取得时间序列之后,通过序列的直观变化图(Line)即可初步看出是否有离群点,如 果有,再作进一步的检查。 离群点的检验方法: 比较简单的一种检验方法是将序列值与平滑值进行比较,检验是否存在明显大或小的序 列值。这种方法是假定正常的序列是较为平滑的,而离群点使序列产生非平滑现象。具体方 法如下: 令 2 t X 表示先对 Xt 作平滑再取平方所得值;令 2 t X 表示先对 Xt 取平方再作平滑所得值。 令 2 2 2 t t t S X X = − (6.4) 若 1 t t t t t X k S X X k S + − + (6.5) 则认为 Xt+1 是正常点,否则,是离群点。k 为分析时设定的数学,一般为 3~9,不 妨取 k=6。 若 Xt+1 为离群点,用 1 ˆ t X + 来修正之,即用 1 1 ˆ 2 t t t X X X + − = − (6.6) 来代替序列中 Xt+1 的值。 (3)缺损值的补充