实验三多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。【实验内容】建立美国的生产函数。【例1】根据生产函数理论,生产函数的基本形式为:Y=f(t,L,K,ε)。其中,L、K分别为生产过程中投入的劳动与资金,时间变量1反映技术进步的影响。表3-1列出了美国1929-1967年期间美国的有关统计资料:其中产出Y为总产值(可比价),L、K分别为劳动者人数和固定资产净值(可比价)。表 3-1美国1929-1967年统计资料产出年份劳动投入年份产出资本存量劳动投入资本存量192987.81949189.8173.31949221.3114.9193087.81950328.9172.1165.4228.8124.11931841951351.4239159.1158.2134.51932135.6141.778.31952360.4241.7139.713276.61933141.61953378.9245.2147.4148761934141.81954375.8237.4148.91935153.977.71955406.7154.4245.9158.61936163.579.11956251.6171.5416.3167.11937183172801957422.8251.5171.977.61938173.2161.51958418.4245.1173.11939188.5168.681.41959445.7254.9182.5871891940205.5176.51960457.3259.696.21941236192.41961466.3258.1194.11942257.8205.1104.41962495.3264.6202.31943277.5210.11101963515.5268.5205.41944291.1208.8107.81964544. 1275.4215.91945284.5202.1102.11965579.2285.322519462741966615.6213.497.2297.4236.21947279.9305247.9223.6105.91967631.11131948297.6228.2【实验步骤】一、建立多元线性回归模型(一)建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:1.建立工作文件:CREATE1967A1929YLK2.输入统计资料:DATA3.生成时间变量t:T=@TREND(1928)GENR
实验三 多元回归模型 【实验目的】 掌握建立多元回归模型和比较、筛选模型的方法。 【实验内容】 建立美国的生产函数。 【例 1】根据生产函数理论,生产函数的基本形式为: Y = f (t,L,K, ) 。其中,L、K 分别为生产过程中投入的劳动与资金,时间变量 t 反映技术进步的影响。表 3-1 列出了美国 1929-1967 年期间美国的有关统计资料;其中产出 Y 为总产值(可比价),L、K 分别为劳动 者人数和固定资产净值(可比价)。 表 3-1 美国 1929-1967 年统计资料 年份 产出 劳动投入 资本存量 年份 产出 劳动投入 资本存量 1929 189.8 173.3 87.8 1949 1949 221.3 114.9 1930 172.1 165.4 87.8 1950 328.9 228.8 124.1 1931 159.1 158.2 84 1951 351.4 239 134.5 1932 135.6 141.7 78.3 1952 360.4 241.7 139.7 1933 132 141.6 76.6 1953 378.9 245.2 147.4 1934 141.8 148 76 1954 375.8 237.4 148.9 1935 153.9 154.4 77.7 1955 406.7 245.9 158.6 1936 171.5 163.5 79.1 1956 416.3 251.6 167.1 1937 183 172 80 1957 422.8 251.5 171.9 1938 173.2 161.5 77.6 1958 418.4 245.1 173.1 1939 188.5 168.6 81.4 1959 445.7 254.9 182.5 1940 205.5 176.5 87 1960 457.3 259.6 189 1941 236 192.4 96.2 1961 466.3 258.1 194.1 1942 257.8 205.1 104.4 1962 495.3 264.6 202.3 1943 277.5 210.1 110 1963 515.5 268.5 205.4 1944 291.1 208.8 107.8 1964 544.1 275.4 215.9 1945 284.5 202.1 102.1 1965 579.2 285.3 225 1946 274 213.4 97.2 1966 615.6 297.4 236.2 1947 279.9 223.6 105.9 1967 631.1 305 247.9 1948 297.6 228.2 113 【实验步骤】 一、建立多元线性回归模型 ㈠建立包括时间变量的三元线性回归模型; 在命令窗口依次键入以下命令即可: ⒈建立工作文件: CREATE A 1929 1967 ⒉输入统计资料: DATA Y L K ⒊生成时间变量 t : GENR T=@TREND(1928)
4.建立回归模型:LSYCTLK则生产函数的估计结果及有关信息如图3-1所示。Equation: UNIIILEDForkfile: UNIIILED::UntitledY口回区ViewProcObjectPrintNameFreeze EstimateForecastStatsResidsDependent Variable:YMethod:Least SquaresDate:08/10/11Time:22:37Sample:19291967Includedobservations:39VariableCoefficientStd.Errort-StatisticProb.c-155.268121.66313-7.1673880.0000T0.29290.7383790.6914421.067882K1.5713540.10629014.783700.0000L1.1831300.1585617.4616660.0000R-squared0.995441325.9436Meandependent var0.995050143.0171AdjustedR-squaredS.D.dependentvarS.E.ofregression10.061877.552299Akaikeinfo criterion3543.446Sumsquared residSchwarz criterion7.722920-143.26987.613516Log likelihoodHannan-QuinncriterF-statistic2547.3940.589395Durbin-Watson stat0.000000Prob(F-statistic)图3-1生产函数的估计结果因此,我国国有独立工业企业的生产函数为:(模型1)=-155.2681+0.7384T+1.5714K+1.1831Lt=(-7.1674)(1.0679)(14.7837)(7.4617)R2=0.9954R2=0.9951F=2547.394模型的计算结果表明,美国的劳动力边际产出为1.1831,资金的边际产出为1.5714,技术进步的影响使工业总产值平均每年递增0.7384。回归系数的符号和数值是较为合理的。R2=0.9954,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量t对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的t统计量值为14.7837,表明资金对企业产出的影响是显著的。但是,时间趋势的t统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除1统计量最小的变量(即时间变量)而重新建立模型。建立剔除时间变量的二元线性回归模型:命令:LSYCLK则生产函数的估计结果及有关信息如图3-2所示
⒋建立回归模型: LS Y C T L K 则生产函数的估计结果及有关信息如图 3-1 所示。 图 3-1 生产函数的估计结果 因此,我国国有独立工业企业的生产函数为: y ˆ = -155.2681 + 0.7384T + 1.5714K + 1.1831L (模型 1) t =(-7.1674) (1.0679) (14.7837) (7.4617) 2 R = 0.9954 2 R = 0.9951 F = 2547.394 模型的计算结果表明,美国的劳动力边际产出为 1.1831,资金的边际产出为 1.5714, 技术进步的影响使工业总产值平均每年递增 0.7384。回归系数的符号和数值是较为合理的。 2 R = 0.9954 ,说明模型有很高的拟合优度,F 检验也是高度显著的,说明职工人数 L、资 金 K 和时间变量 t 对工业总产值的总影响是显著的。从图 3-1 看出,解释变量资金 K 的 t 统 计量值为 14.7837,表明资金对企业产出的影响是显著的。但是,时间趋势的 t 统计量值都 较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序, 一般应先剔除 t 统计量最小的变量(即时间变量)而重新建立模型。 ㈡建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K 则生产函数的估计结果及有关信息如图 3-2 所示
Equation:UHTIILEDforkfile:UHIIILED::UntitledIViewProcObjectPrintNameFreezeEstimateForecastStatsResidsDependent Variable:YMethod: Least SquaresDate:08/10/11Time:2251Sample:19291967Includedobservations:39VariableProb.CoefficientStd.Errort-Statisticc-174.214212.45489-13.987610.0000K1.6223200.09515717.048880.0000L1.3069300.00000.10838612.05809325.9436R-squared0.995292Meandependentvar0.995031143.0171Adjusted R-squaredS.D.dependentvarS.E.ofregression10.081477.533079Akaike info criterion7.661045Sum squared resid3658.899Schwarzcriterion-143.89507.578992LoglikelihoodHannan-Quinn criter.F-statistic3805.6810.634824Durbin-Watsonstat0.000000Prob(F-statistic)图3-2剔除时间变量后的估计结果因此,我国国有独立工业企业的生产函数为:=-174.2142+1.6223K+1.3069L(模型2)t=(-13.9876)(17.0488)(12.0581)R2=0.9953R2=0.9950F=3805.681从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为1.2085,资金的边际产出为0.8345。模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。这里,解释变量、常数项的t检验值都比较大,显著性概率都小于0.05,因此模型2较模型1更为合理。建立非线性回归模型一一C-D生产函数。C-D生产函数为:Y=AL"Kβe,对于此类非线性函数,可以采用以下两种方式建立模型。方式1:转化成线性模型进行估计:在模型两端同时取对数,得:Iny=InA+αnL+βnK+?在EViews软件的命令窗口中依次键入以下命令:GENR LNY=log (Y)GENR LNL=log (L)
图 3-2 剔除时间变量后的估计结果 因此,我国国有独立工业企业的生产函数为: y ˆ = -174.2142 + 1.6223K + 1.3069L (模型 2) t =(-13.9876) (17.0488) (12.0581) 2 R = 0.9953 0.9950 2 R = F = 3805.681 从图 3-2 的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为 1.2085, 资金的边际产出为 0.8345。模型 2 的拟合优度较模型 1 并无多大变化,F 检验也是高度显著 的。这里,解释变量、常数项的 t 检验值都比较大,显著性概率都小于 0.05,因此模型 2 较 模型 1 更为合理。 ㈢建立非线性回归模型——C-D 生产函数。 C-D 生产函数为: Y = AL K e ,对于此类非线性函数,可以采用以下两种方式建立 模型。 方式 1:转化成线性模型进行估计; 在模型两端同时取对数,得: ln y = ln A + ln L + ln K + 在 EViews 软件的命令窗口中依次键入以下命令: GENR LNY=log(Y) GENR LNL=log(L)
GENR LNK=log (K)LSLNYLNKCLNL则估计结果如图3-3所示。口回区Equation: EQ03forkfile:UHIIILED::UntitledyView Proc Object Print Name Freeze Estimate Forecast stats ResidsDependentVariable:LNYMethod:LeastSquaresDate:08/10/11Time:23:06Sample:19291967Includedobservations:39Prob.VariableCoefficientStd.Errort-StatisticC0.0000-3.9377140.236999-16.61488LNK0.3838080.0480187.9930350.0000LNL0.00001.4507860.08322817.43137R-squared0.994627Meandependentvar5.6874490.9943290.460959AdjustedR-squaredS.D.dependentvars.E.ofregression0.034714Akaike infocriterion-3.8095420.043382-3.681576Sum squared residSchwarzcriterion77.28607-3.763629Log likelihoodHannan-QuinncriterF-statistic3332181Durbin-Watson stat0.858080Prob(F-statistic)0.000000图3-3线性变换后的C-D生产函数估计结果即可得到C-D生产函数的估计式为:(模型3)lny=-3.9377+1.4508lnL+0.3838lnKt=(-16.6149)(17.4314)(7.9930)R2=0.9946R2=0.99433F=3332.181即:=0.0195L-4508K0.3838从模型3中看出,资本与劳动的产出弹性都大于0,模型的经济意义合理,解释变量都通过了显著性检验。方式2:送代估计非线性模型,送代过程中可以作如下控制:(1)在工作文件窗口中双击序列C,输入参数的初始值:(2)在方程描述框中点击Options,输入精度控制值。控制过程:①参数初值:0,0,0:最大选代次数:500,选代精度:10-3:则生产函数的估计结果如图3-4所示
GENR LNK=log(K) LS LNY C LNL LNK 则估计结果如图 3-3 所示。 图 3-3 线性变换后的 C-D 生产函数估计结果 即可得到 C-D 生产函数的估计式为: ln 3.9377 1.4508ln 0.3838ln y L K ˆ = − + + (模型 3) t =(-16.6149) (17.4314) (7.9930) 2 R = 0.9946 2 R = 0.9943 F = 3332.181 即: 1.4508 0.3838 y L K ˆ = 0.0195 从模型 3 中看出,资本与劳动的产出弹性都大于 0,模型的经济意义合理,解释变量都 通过了显著性检验。 方式 2:迭代估计非线性模型,迭代过程中可以作如下控制: ⑴在工作文件窗口中双击序列 C,输入参数的初始值; ⑵在方程描述框中点击 Options,输入精度控制值。 控制过程: ①参数初值:0,0,0;最大迭代次数:500,迭代精度:10-3; 则生产函数的估计结果如图 3-4 所示
Equation:UNIIILEDorkfile:UNIIILED::Untitled×View Proc ObjectPrint NameFreezeEstimate Forecast Stats ResidsDependent Variable:YMethod:LeastSquaresDate:08/10/11Time:23:38Sample:19291967Includedobservations:39Convergenceachievedafter141iterationsY=C(1)*LAC(2)*K"C(3)CoefficientStd.Errort-StatisticProb.C(1)0.0342030.0107293.1879470.0030C(2)1.2692260.0980510.000012.94458C(3)0.4697390.0477919.8290150.00000.995648325.9436R-squaredMeandependentvarAdjusted R-squared0.995407S.D.dependent var143.01719.6930117.454491S.E.ofregressionAkaike info criterionSum squared resid3382.361Schwarzcriterion7.582457-142.36267.500404Log likelihoodHannan-Quinn criter0.843538Durbin-Watsonstat图3-4生产函数估计结果此时,函数表达式为:= 0.0342LI-2692 K0.4697(模型4)=(3.1879)(12.9446)(9.8290)R2=0.9954R2=0.9956②参数初值:0,0,0:最大送代次数:500;送代精度:10-5:
图 3-4 生产函数估计结果 此时,函数表达式为: 1.2692 0.4697 y L K ˆ = 0.0342 (模型 4) t =(3.1879)(12.9446)(9.8290) 2 R = 0.9956 2 R = 0.9954 ②参数初值:0,0,0;最大迭代次数:500;迭代精度:10-5;