第五章经典单方程计量经济学模型:专门问题 、内容提要 本章主要讨论了经典单方程回归模型的几个专门题。 第一个专题是虚拟解释变量问题。虚拟变量将经济现象中的一些定性因素引入到可以 进行定量分析的回归模型,拓展了回归模型的功能。本专题的重点是如何引入不同类型的虚 拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法 方式以及二者的组合方式。在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基 准,二是避免出现“虚拟变量陷阱”。 第二个专题是滞后变量问题。滞后变量包括滞后解释变量与滞后被解释变量,根据模型 中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模 型等三类。本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、 分布滞后模型的修正估计方法以及自回归模型的估计方法。如对分布滞后模型可采用经验加 权法、 A lmon多项式法、 Koyck方法来减少滞项的数目以使估计变得更为可行。而对自回归 模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具 变量法或OLS法进行估计。由于滞后变量的引入,回归模型可将静态分析动态化,因此,可 通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数 第三个专题是模型设定偏误问题。主要讨论当放宽“模型的设定是正确的”这一基本假 定后所产生的问题及如何解决这些问题。模型设定偏误的类型包括解释变量选取偏误与模型 函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。在漏 选相关变量的情况下,OLS估计量在小样本下有偏,在大样本下非一致:当多选了无关变 量时,OLS估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS估 计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。 在模型设定的检验方面,检验是否含有无关变量,可用传统的t检验与F检验进行;检验是 否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验( RESET检验) 进行。本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法 第四个专题是关于建模一般方法论的问题。重点讨论了传统建模理论的缺陷以及为避 免这种缺陷而由 Hendry提出的“从一般到简单”的建模理论。传统建模方法对变量选取的
第五章 经典单方程计量经济学模型:专门问题 一、内容提要 本章主要讨论了经典单方程回归模型的几个专门题。 第一个专题是虚拟解释变量问题。虚拟变量将经济现象中的一些定性因素引入到可以 进行定量分析的回归模型,拓展了回归模型的功能。本专题的重点是如何引入不同类型的虚 拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法 方式以及二者的组合方式。在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基 准,二是避免出现“虚拟变量陷阱”。 第二个专题是滞后变量问题。滞后变量包括滞后解释变量与滞后被解释变量,根据模型 中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模 型等三类。本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、 分布滞后模型的修正估计方法以及自回归模型的估计方法。如对分布滞后模型可采用经验加 权法、Almon多项式法、Koyck方法来减少滞项的数目以使估计变得更为可行。而对自回归 模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具 变量法或OLS法进行估计。由于滞后变量的引入,回归模型可将静态分析动态化,因此,可 通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数。 第三个专题是模型设定偏误问题。主要讨论当放宽“模型的设定是正确的”这一基本假 定后所产生的问题及如何解决这些问题。模型设定偏误的类型包括解释变量选取偏误与模型 函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。在漏 选相关变量的情况下,OLS 估计量在小样本下有偏,在大样本下非一致;当多选了无关变 量时,OLS 估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS 估 计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。 在模型设定的检验方面,检验是否含有无关变量,可用传统的 t 检验与 F 检验进行;检验是 否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验(RESET 检验) 进行。本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法。 第四个专题是关于建模一般方法论的问题。重点讨论了传统建模理论的缺陷以及为避 免这种缺陷而由 Hendry 提出的“从一般到简单”的建模理论。传统建模方法对变量选取的
“偿试”性使得实际建模过程存在“数据开采”问题而受到质疑。 Hendry提出的约化建模 型理论正是针对这一缺陷而提出的一套全新的建模理论。该理论认为,在模型的最初设定上, 就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,然 后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。约化 建模理论的主要优点就在于,提出了一个对不同先验假设的更为系统的检验程序:同时由于 它的初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采” 问题:另外,由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在 相同的约化程序下,最后得到的最终模型也应该是相同的。本专题重点介绍了一个“一般” 模型所应具有的基本特征、“从一般到简单”的约化过程、相关的非嵌套检验以及约化模型 的准则 二、典型例题分析 例1.一个由容量为209的样本估计的解释CEO薪水的方程为 n(salary)=4.59 +0.257In(sales)+0.O1lroe-+0. 158finance +0. 181consprod-0. 283utility (15.3)(8.03) (2.75)(1.775) (-2.895) 其中, salary表示年薪水(万元) sales表示年收入(万元)、roe表示公司股票收益(万元); finance、 conrod和 utility均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设 对比产业为交通运输业。 (1)解释三个虚拟变量参数的经济含义 (2)保持 sales和roe不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异 这个差异在1%的显著水平上是统计显著的吗? (3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接 检验这个差异是否统计显著的方程。 解答: (1) finance的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的 CEO要比交通运输业的CEO多获薪水158个百分点。其他两个可类似解释。 (2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的 utility 的参数,即为283%。由于参数的t统计值为-2895,它大于1%显著性水平下自由度为203 的t分布的临界值1.96,因此这种差异是统计上显著的
“偿试”性使得实际建模过程存在“数据开采”问题而受到质疑。Hendry 提出的约化建模 型理论正是针对这一缺陷而提出的一套全新的建模理论。该理论认为,在模型的最初设定上, 就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,然 后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。约化 建模理论的主要优点就在于,提出了一个对不同先验假设的更为系统的检验程序;同时由于 它的初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采” 问题;另外,由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在 相同的约化程序下,最后得到的最终模型也应该是相同的。本专题重点介绍了一个“一般” 模型所应具有的基本特征、“从一般到简单”的约化过程、相关的非嵌套检验以及约化模型 的准则。 二、典型例题分析 例 1.一个由容量为 209 的样本估计的解释 CEO 薪水的方程为 Ln(salary)=4.59 +0.257ln(sales)+0.011roe+0.158finance +0.181consprod – 0.283utility (15.3) (8.03) (2.75) (1.775) (2.130) (-2.895) 其中,salary 表示年薪水(万元)、sales 表示年收入(万元)、roe 表示公司股票收益(万元); finance、consprod 和 utility 均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设 对比产业为交通运输业。 (1)解释三个虚拟变量参数的经济含义; (2)保持 sales 和 roe 不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。 这个差异在 1%的显著水平上是统计显著的吗? (3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接 检验这个差异是否统计显著的方程。 解答: (1)finance 的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的 CEO 要比交通运输业的 CEO 多获薪水 15.8 个百分点。其他两个可类似解释。 (2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的 utility 的参数,即为 28.3%。由于参数的 t 统计值为-2.895,它大于 1%显著性水平下自由度为 203 的 t 分布的临界值 1.96,因此这种差异是统计上显著的
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为158%与 18.1%,因此它们间的差异为18.1%-158%=23%。一个能直接检验这一差异是否显著的方 程为 In( salary )=Bo +B, In( salse)+B, roe +a,consprod+a,utilty +a, trans +u 其中, trans为交通运输业虚拟变量。这里对比基准为金融业,因此a1表示了消费品工业与 金融业薪水的百分数差异,其t统计值可用来进行显著性检验。 例2.假设货币需求关系式为M1=a+BY+yR,式中,M,为时间t的实际现金余 额;Y”为时间t的“期望”实际收入;R为时间t的利率。根据适应规则, =X1+(1-A)Y1+1,0<λ<1修改期望值。已知y,M1,R,的数据,但Y的 数据未知 (1)建立一个可以用于推导a,B,y和估计值的经济计量模型 (2)假设E(共)=0,E(Ax2)=a2,E(11)=0,.≠0,Y1,R,M1和R1与共都不相 关。OLS估计值是1)无偏的:2)一致的吗?为什么? (3)假设1=PH11+E,E1的性质类似(2)部分。那么,本例中OLS估计值是1)无偏 的:2)一致的吗?为什么? 解答: (1)由于 BY+yR ”=RY1-1+(1-4)Y1=1+ (2) 第二个方程乘以β有 (1-m)Bri_+BA 由第一个方程得 Br =M,-a-XR BY_=M 代入方程(3)得 M1-a-成=4BY-1+(1-4)B(M/-1-a-nR1)+B
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为 15.8%与 18.1%,因此它们间的差异为 18.1% - 15.8% = 2.3%。一个能直接检验这一差异是否显著的方 程为 ln(salary) = 0 + 1 ln(salse) + 2 roe +1 consprod + 2utilty +3 trans + u 其中,trans 为交通运输业虚拟变量。这里对比基准为金融业,因此 1 表示了消费品工业与 金融业薪水的百分数差异,其 t 统计值可用来进行显著性检验。 例 2.假设货币需求关系式为 M Y R t t t = + + ,式中, Mt 为时间 t 的实际现金余 额; Yt 为时间 t 的“ 期望”实 际收入 ; Rt 为时间 t 的利 率。根 据适应规 则, 1 1 (1 ) Y Y Y t t t t = + − + − − ,0 1 修改期望值。已知 Yt ,Mt , Rt 的数据,但 Yt 的 数据未知。 (1)建立一个可以用于推导 , , 和 估计值的经济计量模型。 (2)假设 2 2 1 ( ) 0, ( ) , ( ) 0, 0; , , E E E s Y R t t t t s t t = = = − − Mt−1 和 Rt−1 与 t 都不相 关。OLS 估计值是 1)无偏的;2)一致的吗?为什么? (3)假设 t = 1 , t t − + t 的性质类似(2)部分。那么,本例中 OLS 估计值是 1)无偏 的;2)一致的吗?为什么? 解答: (1)由于 M Y R t t t = + + (1) 1 1 (1 ) Y Y Y t t t t = + − + − − (2) 第二个方程乘以 有 1 1 (1 ) Y Y Y t t t t = + − + − − (3) 由第一个方程得 Yt Mt Rt = − − * 1 1 * Yt−1 = Mt− − − Rt− 代入方程(3)得 Mt Rt Yt Mt Rt t − − = −1 + (1− )( −1 − − −1 ) +
整理得 M1=a-a(1-A)+2B1+yR(1-A)M/1-(1-A)yR-1+B By1+(1-A)M/1+yR-(1-A)yR1+B 该模型可用来估计并计算出a,B,y和元。 (2)在给定的假设条件下,尽管H1与M,相关,但1与模型中出现的任何解释变量都 不相关,因此只是μ与M存在异期相关,所以OLS估计是一致的,但却是有偏的估计值 (3)如果H1=pH1-1+E1,则M1和1相关,因为M/1与1相关。所以OLS估计 结果有偏且不一致 3、一个估计某行业ECO薪水的回归模型如下 In( salary)=Po+B, In( sales )+B, In( mktvab+B3 profmarg +B2ceoten+ Bs comten+u 其中, salary为年薪 sales为公司的销售收入, mktva为公司的市值, promary为利润占销 售额的百分比, ceoten为其就任当前公司CEO的年数, comte为其在该公司的年数。一个 有177个样本数据集的估计得到R2=0353。若添加 ceoten2和 comte2后,R2=0.375。问:此 模型中是否有函数设定的偏误? 解答 若添加 ceoten2和 comte2后,估计的模型为 In( salary)=Bo+B, In( sales)+B2 In( mktval+B, profmarg +B2ceoten+ Bs comten +B ceoten"+B,comten +u 如果β6、β7是统计上显著不为零的,则有理由认为模型设定是有偏误的。而这一点可以通过 第三章介绍的受约束F检验来完成: (0.375-0.353)/2 =2.97 (1-0.375)(177-8) 在10%的显著性水平下,自由度为(2,∞)的F分布的临界值为2.30;在5%的显著性水平 下,临界值为3.0。由此可知在10%的显著性水平下拒绝β6=β=0的假设,表明原模型有 设定偏误问题;而在5%的显著性水平下则不拒绝β6=B7=0的假设,表明原模型没有设定 偏误问题
整理得 1 (1 ) M Y R t t t = − − + + − 1 1 (1 ) (1 ) − − − + M R t t t − − = 1 1 1 (1 ) (1 ) + + − + − − + Y M R R t t t t t − − − 该模型可用来估计并计算出 , , 和 。 (2)在给定的假设条件下,尽管 t 与 Mt 相关,但 t 与模型中出现的任何解释变量都 不相关,因此只是与 M 存在异期相关,所以 OLS 估计是一致的,但却是有偏的估计值。 (3)如果 t t t = + −1 ,则 Mt−1 和 t 相关,因为 Mt−1 与 t−1 相关。所以 OLS 估计 结果有偏且不一致。 3、一个估计某行业 ECO 薪水的回归模型如下 + + + = + + + ceoten comten salary sales mktval profm 4 5 0 1 2 3 ln( ) ln( ) ln( ) arg 其中,salary 为年薪 sales 为公司的销售收入,mktval 为公司的市值,profmarg 为利润占销 售额的百分比,ceoten 为其就任当前公司 CEO 的年数,comten 为其在该公司的年数。一个 有 177 个样本数据集的估计得到 R 2=0.353。若添加 ceoten2 和 comten2 后,R 2=0.375。问:此 模型中是否有函数设定的偏误? 解答: 若添加 ceoten2 和 comten2 后,估计的模型为 + + + + + = + + + 2 7 2 4 5 6 0 1 2 3 ln( ) ln( ) ln( ) arg ceoten comten ceoten comten salary sales mktval profm 如果6、7 是统计上显著不为零的,则有理由认为模型设定是有偏误的。而这一点可以通过 第三章介绍的受约束 F 检验来完成: 2.97 (1 0.375)/(177 8) (0.375 0.353)/ 2 = − − − F = 在 10%的显著性水平下,自由度为(2,)的 F 分布的临界值为 2.30;在 5%的显著性水平 下,临界值为 3.0。由此可知在 10%的显著性水平下拒绝6=7=0的假设,表明原模型有 设定偏误问题;而在 5%的显著性水平下则不拒绝6=7=0的假设,表明原模型没有设定 偏误问题
三、习题 (一)基本知识类题型 5-1.解释下列概念: 1)虚拟变量 5)分布滞后模型 2)虚拟因变量模型 6)自回归模型 7)h检验 4)滞后效应 8)有限最小二乘法 5-2.在建立计量经济模型时,什么时候、为什么要引入虚拟变量? 5-3.举例说明虚拟变量在模型中的作用 5-4.什么是“虚拟变量陷阱”? (二)基本证明与问答类题型 5-5.对包含常数项的季节变量模型运用最小二乘法时,如果模型中引入4个季节虚拟变量, 其估计结 果会出现什么问题? 5-6.滞后外生变量模型和滞后内生变量模型的概念是什么? 5-7.滞后变量模型有哪几种类型?外生变量分布滞后模型使用OLS方法存在哪些问题? 5-8.产生模型设定偏误的主要原因是什么?模型设定偏误的后果以及检验方法有哪些? 5-9.试在消费函数Y=a+BX+E中(以加法形式)引入虚拟变量,用以反映季节因素(淡 旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式 5-10.现有如下估计的利润函数: Y.=221.37+04537X+7863D+00037XD (3578)(8.86)(286 其中:Y、X分别为销售利润和销售收入:D为虚拟变量,旺季时D=1,淡季时D=0 XD=X·D,试分析:(1)季节因素的影响情况: (2)写出模型的等价形式。 5-11.如何确定有限分布滞后模型中的滞后期长度? 5-12.被解释变量对于一个或者多个解释变量反应滞后的原因是什么?给出一些分布滞后模 型的例子
三、习题 (一)基本知识类题型 5-1.解释下列概念: 1) 虚拟变量 2) 虚拟因变量模型 3) 滞后变量 4) 滞后效应 5) 分布滞后模型 6) 自回归模型 7) h 检验 8) 有限最小二乘法 5-2.在建立计量经济模型时,什么时候、为什么要引入虚拟变量? 5-3.举例说明虚拟变量在模型中的作用。 5-4.什么是“虚拟变量陷阱”? (二)基本证明与问答类题型 5-5.对包含常数项的季节变量模型运用最小二乘法时,如果模型中引入 4 个季节虚拟变量, 其估计结 果会出现什么问题? 5-6.滞后外生变量模型和滞后内生变量模型的概念是什么? 5-7.滞后变量模型有哪几种类型?外生变量分布滞后模型使用 OLS 方法存在哪些问题? 5-8.产生模型设定偏误的主要原因是什么?模型设定偏误的后果以及检验方法有哪些? 5-9.试在消费函数 Y = + X + 中(以加法形式)引入虚拟变量,用以反映季节因素(淡、 旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式。 5-10.现有如下估计的利润函数: Yt Xi Di 0037XDi 221.37 0.4537 78.63 0. ˆ = + + + (35.78) (8.86) (2.86) 其中: Y 、 X 分别为销售利润和销售收入; D 为虚拟变量,旺季时 D =1 ,淡季时 D = 0 ; XD= X D ,试分析:(1)季节因素的影响情况; (2)写出模型的等价形式。 5-11.如何确定有限分布滞后模型中的滞后期长度? 5-12.被解释变量对于一个或者多个解释变量反应滞后的原因是什么?给出一些分布滞后模 型的例子