1,参数估计 参数估计一般运用普通最小二乘法(OLS)。参数估计值B为 B=〔区X'X'y (2.2.2) 其中前提条件要求仅X)存在(满足基本假定的第三条)。核结果具有无偏性, 有效性等特点。对于线性回归模型,待估参数的OLS估计等价于极大似然估 计。 参数B(=1,,p)表示x:每变动一个单位、对因变是y的影响程度。其正 负表示作用的方向:B,为正,表明当增大时,y也增大,反之亦然。运用鑫数 的这种实际意义,有助于评判模型的合理性。当所得的参数估计值的符号或范 围与其应有的意义不符时,悦明模型的设定存在问题,如造漏了重要的自变量 或是违背了回归模型的基本假设等等,应考虑新的模型形式。 2,模型检验 模型检验主要包括方程的显著性检验(F检验)和回归系数的显着性检验 (:检验)。F检验主要是针对模型拟合样本的整体效果,也就是选择的所有自变 量对因变量的总体解释力度,回归系数的显著性检验则反陕每一个自变量的合 理性。需要指出,如果模型不满足线性回归模型基本假定条件时,各种检验的 效力都将受到影响甚至于失效。 (1)F检验 检验的零假设为 H。:P0=月1=…=f。=0 SSR/D 检验统计量 F兰 SSE/(n-p-1) (2.2.3) 它在零假设下服从自由度为(p,-P-1)的F分布,其中SSR,SSE的含义见 (2.2.6)。 若F大于临界值F(P,n一p一),则拒绝零假设,认为在显著性水平下,y 对自变量有显著的线性关系,回归方程是显著的,反之则不能拒绝原假设,认 为回归方程不显著。 在EViews中,为了方便用户,给出了拒绝零假设时犯错误(第一类错误 或α错误)的概率,称为收尾概事或相伴概率P。若此概率值低于事先确定的 置信度(如005),则可拒绝零假设,反之不能拒绝。以后涉及的检验,大多 数情况下都不用查表,只需直接查君相件概率即可。 (2)回归系数的显著性检验
检验的零假设为 H。:B,=0,i=,2,…,p 检验统计量 t= i=12....p S(B:) (2.2.4) 它在零假设下服从自由度为n一p-1的t分布,其中S(月,)是估计量户的标 准差。当I小于临界值2(n-p-)时,未通过检验,大于临界值则通过检验。 如果每一个回归系数都通过了t检验,说明模型中的每一个自变量郁是显 著的。未通过显著性检验的系数所对应的变量,应结合实际情况考虑将其剔 除,这是自变量选择的一个最常用的方法。 (3)D.W检验 D.W检验用于检验残差序列的自相关性,目的是验证基本假设2是否成立。 若记P为残差序列的自相关系数,检验假设是 H。:p=0 (即残差序列无序列相关) Durbin和Watson提出D.W统计量为 ee:-1 D.W-i2 兰21-) (2.2.5) 由(2.2.5)式可知,D.W值在0到4之间,如果P比较大,则可拒绝假设 H。,由于D.W值与自变量无关而仅与n和p有关,因此不论数据如何,都可以 得到统一的检验方法。Durbin和Watson给出了在显著水平5%和1%水平、不 同的样本容量口和自变量个数p检验的临界值(见本书附表V)du和d。我们 只希考察计算得到的DW值落入的区间,以决定模型的自相关状态。判别准 则是 若0≤D.W≤d2,序列存在正相关, 若Du<D.W<4-du·序列无自相关, 若4-d2<D.W≤4,序列存在负相关
若落人区间并非上述三个的任一个,则无法判定,此时检验失效。 通常EViews中在建立模型后,可从Equation的估计值输出中找到D.W值, 通过该检验来确定残差序列是否有自相关。一般而言,如果D.W值距离2较 远,就可认为有一定程度自相关存在。 3.模型评价 模型评价主要目的是为了在不同模型之间择优。比如采用线性回归预时 常会遇到:在引人一个新的自变量后模型仍然通过了检验,这时采用哪个模型较 好?从模型简洁的角度看,变量少的要好,但如果减少变量引起误差的明显增 加,自然不是一个好的选择。反过来说,变量多了,不仅模型的研制、使用和 维护的费用会增加,而且由于变量增多,变量本身的观测误差影响y的机会也 会相应增加。因此,需要找到适当的评价方法和评价指标,在综合考虑摸型的 准确性和简洁性的前提下,对模型的优劣给予客观的评价。 (1)样本决定系数R2和修正的R2 把分解式 20,-y-2所-或+20-》 (2.2.6) -1 记为 SST=SSR+SSE 其中,SSR表示x变化引起的y的变化,称作回归平方和,SSE表示不可控制的 随机因素对y的影响,称作残差平方和,它们之和构成总离差平方和(SST)。 记样本决定系数 R2=SSR 2心- (2.2.7)) SST -册 表示总离差平方和中由回归方程可以解释的部分所占的比例。这一比例越大, 回归方程可以解释的部分越多,模型越精确,回归的效果越显著。R是一个介 于0到1之间的数,越接近1说明回归拟合效果越好。一般地,如果R的取值 超过0,8,认为模型的拟合优度比较高。 但是,随着回归模型中自变量个数的增加,而逐渐加大。这往往会让使 用者误认为拟合效果越来越好。为克服R2受自变量个数的影响,引进调整的样 本决定系数F2,亦称为修正的R2
=16- (2.28) 共中是样本容量,k是参数个数。容易看出:缝正的R除具备原指标R2 的特征外,还与参数个数k有关。在其他条件不变的情况下,k越大,越小。 因此,垓指标综合了精度和变量数两个因素,兼顾了精确性和简洁性。2不随 自变量的个数增加而增加,用来判别拟合优度比2更有效。 (2)对数似然值 对数似然值(LogL认elihood,简记为L)是基于极大似然估计法得到的统 计量。·也即对数似然函数所取的最大值(参考文献[7]),在线性回归中有 l-受g2x-受g62-8 (2.2.9) 其中是样本容量,62是未知参数σ2的极大似然估计,与残差有关。 由(22.9)式知,残差越小,L取值越大,因此L取值越大说明模型越精 确。残差的大小和自变量数目有关,变量越多残差越小,因此一般来说变量越 多L越大。 (3)AIC准则 AIC准则是赤池信息淮刚(Akaike Information Criterion)的筒称。该项准 则运用如(2.2.10)式的统计量评价模型的好坏。 AIC=-2L+2k (2.2.10) 为作 其中L是对数似然值,n是观刚值数目,k是被估计的参数个数。AC准则要求 AIC取值越小越好。 容易看出,AIC的大小取决于L和k。k取值越小,AIC值越小:L取值越 大,AIC值越小。k小意味普模型简洁,L大庶味着模型精确。因此AIC和修 正的决定系数类似,在评价模型优劣时兼顾了简洁性和精确性。 (4)SC难则 SC准则是施瓦茨准则(Schwarz Criterion)的简称。垓准则运用如(2.2,11) 式的统计量评价模型。 sc=-2L+l血n (2.2.11) L,n,k的意义同(2.2.10)式。可以看出SC的用法和特点与AIC十分相近。 在使用时,也要求SC值越小越好
表2.1 1950一1987年间美国机动车汽油消费量数据 年份 QMG CAR PMG POP RGNP PGNP 预测值 1950 40617285 49195212 0.272 152271 10904 26.1 44452285 1951 43896887 51948796 0.276 154878 1179.2 27.9 45409590 1952 46428148 53301329 0.287 157553 1226.1 28.3 45380374 1953 49374047 56313281 0.29 160184 1282.1 28.5 48089749 1954 51107135 5822547 0,291 163026 1252.1 29 50522173 】55 54333255 62688792 0.299 165931 1356.7 293 54053345 1956 56022406 65153810 0.31 168903 1383.5 30.3 55560019 1957 57415622 67124904 0.304 171984 1410.2 314 56351814 1958 59154330 68296594 0.305 174882 1384.7 32.1 56779357 1959 61596548 71354420 0.311 177830 1481 32.6 58699598 1960 62811854 73868682 0.308 180671 1517.2 33.2 60602988 1961 63978489 7595215 0.306 183691 1547.9 33.6 61924476 1962 62531373 79173329 0.304 186538 1647.9 34 64235213 1963 64779104 82713717 0.304 189242 1711.6 34.5 67509586 1964 67663848 86301207 0.312 191889 1806.9 5 70401828 1965 70337126 90360721 0.321 194303 1918.5 35.7 73818477 1966 73638812 93962030 0.332 196560 2048.9 36.6 76205453 1967 76139326 96930949 0.337 198712 21003 37.8 78526006 1968 80772657 101039113 0348 200706 2195.4 39.4 81880797 1969 85416084 103562018 0357 202677 2260.7 41.2 83011662 1970 88684050 106807629 0.364 205052 2250.7 43.4 85845938 1971 92194620 111297459 0361 207661 2332 45.6 89494762 1972 95348904 117051638 0388 209896 2465.5 47.5 94525246 1973 99804600 :123811741 0.524 211909 2602.8 50.2 99612827 1974 100212210 127951254 0.572 213854 2564.2 55.1 102437463 1975 102327750 130918918 0.595 215973 2530.9 60.4 103281615 1976 106972740 136333934 0.631 218035 2680.5 63.5 106860941 197m 110023410 141523197 0.657 220239 2822.4 67.3 109811868 1978 113625960 146484336 0.678 222585 3115.2 72.2 109838071 1979 107831220 149422205 0.857 225055 3192.4 78.6 106817046 1980 100856070 153357876 1.191 22T757 3187.1 85.7 104304134 1981 100994040 155907473 1.311 230138 3248.8 100415321 1982 100242870 156993694 1.222 232520 3166 100 99534184 1983 101515260 161017926 1.157 234799 3279.1 103.9 101851757 1984 102603690 163432944 1.129 237001 3489.9 10m.9 99970665 1985 104719230 168743817 1.115 239279 3585.2 1f1.5 104201624 1986 107831220 173255850 0.857 241613 3676.5 114.5 110068332 1987 110467980 177922000 0.897 243915 3847 117.7 111983575 资牝来源:《Econometrics Analysis》