顾名思义,时间序列数据就是按时间顺序排列的统计数据。如新中国建立以 来历年的工农业总产值、国民收入、发电量、钢产量、粮食产量等都是每年有 个对应的数据,那么到2010年每种指标就有60个按时间顺序排列的数据,它们 都是时间序列数据。研究宏观经济问题,这方面的时间序列数据来自国家统计局 或一些专业部委的统计年鉴。如果研究微观经济现象,如研究某企业的产值与能 耗,那么数据就要在这个企业的计划统计科获取。 对于收集到的时间序列资料要特别注意数据的可比性和数据的统计口径问 题。如历年的国民收入数据,是否按可比价格计算的。中国在改革开放前,几十 年物价不变,而从20世纪80年代初开始,物价变动儿乎是直线上升。那么你所 获得的数据是否具有可比性?这就需认真考虑。如在宏观经济研究中,国内生产 总值(GDP)与国民生产总值(GNP)二者在包括内容上是一致的,但在计算口径上 不同。国民生产总值按国民原测计算,反映一国常住居民当期在国内外所从事的 生产活动;国内生产总值则以国土为计算原则,反映一国国土范围内所发生的生 产活动量。对于没有可比性和统计口径计算不一致的统计数据就要作认真调整, 这个调整过程就是一个数据整理过程。 时间序列数据容易产生模型中随机误差项的序列相关,这是因为许多经济变 量的前后期之间总是有关联的。如在建立需求模型时,人们的消费习惯、商品短 缺程度等具有一定的延续性,它们对相当一段时间的需求量有影响,这样就产生 随机误差项的序列相关。对于具有随机误差项序列相关的情况,就要通过对数据 的某种计算整理来消除序列相关性。最常用的处理方法是差分法,我们将在后面 的章节中详细介绍。 横截面数据即为在同一时间截面上的统计数据。如同一年在不同的地块上测 得的施肥量与小麦产量试验的统计数据就是截面数据。再如某一年的全国人口普 查数据、,工业普查数据、同一年份全国35个大中城市的物价指数等都是裁面数 据。当用截面数据作样本时,容易产生异方差性。这是因为一个回归模型往往涉 及到众多解释变量,如果其中某一因素或一些因素随着解释变量观测值的变化而 对被解释变量产生不同影响,就产生异方差性。如在研究城镇居民收人与购买消 费品的关系时,用x:表示第:户的收人量:表示第i户的购买量,购买回归 模型为 :=30+B1x,+e:, 1】,4,7 1.9) 在此模型中,随机项:就具有不同的方差。因为在购买行为中,低收人的家庭 购买差异性比较小,大都购买生活必需品;高收入的家庭购买行为差异就很大 高档消费品很多,他们的选择余地很大,这样购买物品所用费用差异就较大。因 11 PDF created with pdfFactory Pro trial version www.pdffactory.com
PDF created with pdfFactory Pro trial version www.pdffactory.com
而,对于我们随机获取的样本数据,用来建立回归模型,它的随机项:就具有 异方差性。 对于具有异方差性的建模问题,数据整理就要注意消除异方差性,这常与模 型参数估计方法结合起来考虑。我们将在后面的章节中详细介绍。 不论是时间序列数据还是横截面数据的收集,样本容量的多少一殷要与设置 的解释变量数月相配套。通常为了使模型的参数估计更有效,要求样本容量W 大于解释变量个数。样本容量的个数小于解释变量数目时,普通的最小二乘估 计方法失数。与p到底应该有怎样-一个比例?英国的统计学家M.肯德尔 (Kendall)在他的《多元分析》中指出,样本容量n应是解释变量个数p的10倍 (见参考文献[3])。如果中较大时,按肯德尔的说法n就很大,这在许多经济问 题中是办不到的,尤其是中国才建国50多年,统计数据不全是普遍的现象。但 由肯德尔的视点我们看到,样本容量应比解释变量个数大一些才肯定好,这告诉 我们在收果数据时成尽可能多收集一些样本数据 统计数据的整理中不仅要把一些变量数据进行折算、差分,甚至把数据对数 化、标准化等,有时还须注意别除个别特别大或特别小的“野值”。在统计数据 质量不高时,经常会碰到这种情况。当然,有时还须利用据值的方法把空缺的数 据补齐。 三、确定理论回归模型的数学形式 当收集到所设置的变量的数据之后,就要确定适当的数学形式来描述这些变 量之间的关系。绘制变量”与.,(i=1,2,…,n)的样本散点图是选择数学模型形 式的重要一环。一般我们把(x,”)所对应的点在平面直角坐标系上画出来,看 散点图的分布状况。如果”个样本点大致分布在一条直线的周围,我们可考虑 用线性回归模型去拟合这条直线,也即选择线性回归模型。如果n个样本点的 分布大数在一条指数曲线的周围,我们就可选择指数形式的理论回归模型去描述 它。 经济回归模型的建立,通常要依据经济理论和一些数理经济学结果。如数理 经济学中已对投资函数、生产函数、需求函数、消费函数给了严格的定义,把它 们都分别用公式表示出来了。借用这些理论,我们给它们的公式中增加上随机误 差项,就可把问题转化为用随机数学工具处理的回归模型。如数理经济学中最有 名的生产函数CD生产函数是20世纪30年代初美国经济学家查尔斯W,柯布 (Charles W,Cobb)和保罗H.道格拉斯(Paul H.Douglos)根据历史统计数据建立 的,资本K和劳动L与产出被确切地表达为 12 PDF created with pdfFactory Pro trial version www.pdffactory.com
PDF created with pdfFactory Pro trial version www.pdffactory.com
y=AK"L8 (1.10) 其中,a,B分别为K和L对产出y的弹性。CD生产函数指出了广商行为的 种模式,在函数中变量之间的关系是准确实现的。但是由计量经济学的观点,变 量之间的关系并不符合数理经济学所拟定的准确关系模式,而是有随机偏差的。 因而给CD生产函数增加一个随机项U,将变量之间的关系描述为一个随机模 型,然后用随机数学方法加以研究,以得出非确定的概率性结论,这更能反映出 经济问题的特点。随机模型为 y=AKLU (1.11) 或 Iny=InA alnK BlnL InU (112 模型(1.11)式是一个非线性的回归模型形式;模型(1.12)式是一个对数线性 回归模型的形式。那么我们在研究工业生产和农业生产问题时就可考虑用上述的 理论模型。 有时候,我们无法根据所获信息确定模型的形式,这时可以采用不同的形式 进行计算机模拟,对于不同的模拟结果,选择较好的一个作为理论摸型 尽管模型中待估的未知参数要到参数估计、检验之后才能确定,但在很多情 况下可以根据所研究的经济问题对未知参数所带的符号以及大小范围事先给予确 定。如CD生产函数(1,11)式中的待估参数A,a,B都应为大于零的数:弹性 系数a,B应该满足 0<a<1,0<3<1 四、模型参数的估计 回归理论模型确定之后,利用收集、整理的样本数据对模型的未知参数给出 估计是间归分析的重要内容。未知参数的估计方法最常用的是普通最小二乘法, 它是经典的估计方法。对于不满足模型基本假设的回归问题,人们给出了种种新 方法,如岭回归、主成分回归、偏最小二乘估计等。但它们都是以普通最小二乘 法为基础,这些具体方法是我们后边一些章节研究的重点。这里要说明的是,参 数估计当变量及样本较多时,计算量很大,只有依靠计算机才能得到可靠的准确 结果。现在这方面的计算机软件很多,如TSP,SPSS,SAS等都是参数估计的 基本软件。 五、模型的检验与修改 当模型的未知参数估计出来后,可以说就初步建立了一个回归模型。我们建 13 PDF created with pdfFactory Pro trial version www.pdffactory.com
PDF created with pdfFactory Pro trial version www.pdffactory.com
立回归模型的目的是为了应用它来研究经济向题,但如果马上就用这个模型去作 预测、控制和分析,显然是不够慎重的。因为这个模型是否真正揭示了被解释变 量与解释变量之间的关系,必须通过对模型的检验才能决定。 对于回归模型的检验-一般需要进行统计检验和模型经济意义的检验。 统计检验通常是对回归方程的显著性检验,以及回归系数的显著性检验,还 有拟合优度的检验,随机误差项的序列相关检验,异方差性检验,解释变量的多 重共线性检验等。这些内容都将在后边的章节中详细讨论。 在经济问题问归模型中,往往还碰到回归模型通过了一系列统计检验,可就 是得不到合理的经济解释。例如,国民收入与工农业总产值之间应该是正相关 回归模型中工农业总产值变量前的系数应该为正的,但有时候由于样本容量的限 制或数据质量的问题,可能估计出的系数是负的。如此这般,这个回归模型就没 有意义,也就谈不上进一步应用了。可见回归方程经济意义的检验同样是非常重 要的。 如果一个河归模型没有通过某种统计检验,或者通过了统计检验而没有合理 的经济意义时,就需要对回归模型进行修政。模型的修改有时要从设置变量是否 合理开始,是不是把某些重要的变量忘记了考虑,变量间是否具有很强的依赖 性,样本量是不是太少,理论模型是否合适。譬如某个问题本应用曲线方程去拟 合,而我们误用直线方程去拟合,当然通不过检验。这就要重新构造理论模型。 模型的建立往往要反复几次修改,特别是建立一个实际经济问题的回归模 型,要反复修正才能得到一个理想模型。 六、回归模型的运用 当一个经济问题的回归模型通过了各种统计检验,且模型具有合理的经济意 义时,我们就可以运用这个模型来进一步研究经济问题了。 经济变量的因素分析是回归模型的一个重要应用。应用回归模型对经济变量 之间的关系作出了度量,从模遛的回归系数可发现经济变量的结构关系,给出政 策评价的一些量化依据。 既然回归模型揭示经济变量间的因果关系,那么就可以考虑给定被解释变量 值来控制解释变壁值。比如我们把某年的通货膨胀指标定为全国零售物份指数增 长3%以下,那么,从通货膨胀的回归模型可以确定货币的发行量、银行的存款 利率等。这就是对经济变量的一种控制。 进行经济预测是回归模型的另一个重要应用。比如我国2005年的国民收入 是多少?通过建立国民经济的宏观经济模型就可以对未来作出预测。用回归模型 14 PDF created with pdfFactory Pro trial version ww.pdffactory.com
PDF created with pdfFactory Pro trial version www.pdffactory.com
进行经济预测在我国已有不少成功例子。 在回归模型的运用中,我们还强调定性分析和定量分析的有机结合。这是因 为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定 性。单纯的表面上的数最关系是否反映事物的本质?这本质究竞如何?必须依靠 专门学科的研究才能下定论。所以,在经济问题的研究中,我们不能仅凭样本数 据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以 及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确运用。 1.5回归分析应用与发展述评 从高斯提出最小二乘法算起,回归分析已经有190多年的历史。回归分析的 应用非常广泛,我们大模很难找到不用它的领域,这也正是近200年来其经久不 衰、生命力强大的根本原因, 这里我们仅介绍回归分析在经济领域的广泛应用。我们知道计量经济学是现 代经济学中影响最大的一门独立学科,诺贝尔经济学奖获得者萨缪尔森曾经说 过:第二次世界大战后的经济学是计量经济学的时代。然而,计重经济学中的基 本计量方法就是回归分析,计重经济学的一个重要理论支柱是回归分析理论。 自从1969年设立诺贝尔经济学奖以来,已有近50位学者获奖,其中绝大部 分获奖者是统计学家、计量经济学家、数学家。从大多数获奖者的著作看,他们 对统计学及回归分析方法的应用都有娴熟的技巧,这足以说明统计学方法在现代 经济研究中的重要作用。 矩阵理论和计算机技术的发展为回归分析模型在经济研究中的应用提供了极 大的方便。国民经济是一个错综复杂的系统,对于宏观经济问题常需要涉及几十 个甚至几千个变量和方程,如果没有先进的计算机和求解线性方程组的矩阵计算 理论,要研究复杂的经济问题是不可想像的。比如一个20阶的线性方程组要用 克莱姆法则去求解,就需要计算102次乘法运算,这可是一个天文数字。然而用 矩阵变换的方法只需6000次乘法运算。也正是由于计算方法的改进和现代计算 机的发展,使得过去不可想保的事情变成了现实。计量经济学研究中涉及的变量 和方程也越来越多,例如英国剑桥大学的多部门动态模型,多达2759个方程, 7484个变量;由诺贝尔经济学奖获得者克莱因发起的国际连接系统,使用了 7447个方程和3368个外生变量。 模型技术在经济问题研究中的应用在我国也已盛行起来。从20世纪80年代 15 PDF created with pdfFactory Pro trial version www.pdffactory.com
PDF created with pdfFactory Pro trial version www.pdffactory.com