实验三多元线性回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型方法【实验内容】建立我国国有独立核算工业企业生产函数,根据生产函数理论,生产函数的基本形式为:Y=f(t,L,K,s),其中,L,K分别为生产过程中投入的劳动与资金,时间变量t反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料:其中产出Y为工业总产值(可比价),L,K分别为年末职工人数和固定资产净值(可比价)。表3-1我国国有独立核算工业企业统计资料年份职工人数L(万元)固定资产K(亿元)工业总产值Y(亿元)197831392225.703289.18320819793581.262376.34198033343782.172522.81348819813877. 862700.9019824151.2535822902.1919834541.0536323141.7619844946. 1136693350.9519855586.1438153835.7919865931.3639554302.25198740866601.604786.0519887434.0642295251.9019897721.0142735808.7119907949. 5543646365.79199144727071.358634.80199245217757.259705.52199310261.6544988628.774545199410928.669374.34来源:《中国统计年鉴》、《中国工业经济年鉴》
实验三 多元线性回归模型 【实验目的】掌握建立多元回归模型和比较、筛选模型方法. 【实验内容】建立我国国有独立核算工业企业生产函数,根据生产函 数理论,生产函数的基本形式为:Y f (t, L,K, ),其中,L,K 分别为 生产过程中投入的劳动与资金,时间变量 t 反映技术进步的影响。表 3-1 列出了我国 1978-1994 年期间国有独立核算工业企业的有关统计 资料:其中产出 Y 为工业总产值(可比价),L,K 分别为年末职工人 数和固定资产净值(可比价)。 表 3-1 我国国有独立核算工业企业统计资料 年份 工业总产值 Y(亿元) 职工人数 L(万元) 固定资产 K(亿元) 1978 3289.18 3139 2225.70 1979 3581.26 3208 2376.34 1980 3782.17 3334 2522.81 1981 3877.86 3488 2700.90 1982 4151.25 3582 2902.19 1983 4541.05 3632 3141.76 1984 4946.11 3669 3350.95 1985 5586.14 3815 3835.79 1986 5931.36 3955 4302.25 1987 6601.60 4086 4786.05 1988 7434.06 4229 5251.90 1989 7721.01 4273 5808.71 1990 7949.55 4364 6365.79 1991 8634.80 4472 7071.35 1992 9705.52 4521 7757.25 1993 10261.65 4498 8628.77 1994 10928.66 4545 9374.34 来源:《中国统计年鉴》、《中国工业经济年鉴》
【实验步骤】一、建立多元线性回归模型(一)建立包括时间变量的三元线性回归模型:在命令窗口依次键入以下命令:1.建立工作文件:createa197819942.输入统计资料:dateYLK3.生成时间变量t:genrt=@trend(77)(或者直接输入命令:datat)4.建立回归模型:IsYctLK则生成函数的估计结果及有关信息如图3-1所示日Equation:UNTITLED:Workfile:UNTITLED:UntitledV回XView Proc Object Print Name Freeze Estimate Forecast Stats ResidsDependentVariable:YMethod:LeastSquaresDate:10/10/21Time:15:46Sample:19781994Included observations: 17VariableCoefficientStd.Errort-StatisticProb.c0.8051-675.32082682.060-0.251792T77.67893115.67310.6715380.5136L0.6666650.8536260.7809800.4488K0.7764170.1044597.4327450.00006407.249R-squared0.995764Mean dependent var2486.742AdjustedR-squared0.994786S.D.dependent var179.563013.42125S.E.ofregressionAkaike info criterionSum squared resid419157.5Schwarzcriterion13.61730Log likelihood-110.0807Hannan-Quinn criter13.44074F-statistic1018.551Durbin-Watson stat1.5109030.000000Prob(F-statistic)
【实验步骤】 一、建立多元线性回归模型 (一)建立包括时间变量的三元线性回归模型: 在命令窗口依次键入以下命令: 1. 建立工作文件: create a 1978 1994 2. 输入统计资料: date Y L K 3. 生成时间变量 t:genr t=@trend(77) ( 或者直接输入命令:data t ) 4. 建立回归模型: ls Y c t L K 则生成函数的估计结果及有关信息如图 3-1 所示
图3-1我国国有独立核算工业企业生产函数的估计结果因此,我国国有独立工业企业的生产函数为:(模型1)y=-675.32 + 77.6789t +0.6667L+0.7764Kt=(-0.2518)(0.6715)(0.781)(7.4327)R=0.9958R=0.9948F=1018.551模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。回归系数的符号和数值是较为合理的。R2=0.9958,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量t对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的t统计量值为7.433,表资金对企业产出的影响是显著的。但是,模型当中其他变量(包括常数项)的t统计值都比较小,未通过检验。因此需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般先剔除t统计量最小的变量(即时间变量)而重新建立模型。(二)建立剔除时间变量的二元线性回归模型命令:lsycLK则生产函数的估计结果及有关信息如图3-2所示:
图 3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为: y 675.32 77.6789t 0.6667L 0.7764K (模型 1) t ( 0.2518)(0.6715)(0.781)(7.4327) 0.9958 2 R 0.9948 2 R F 1018.551 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际 产出为 0.6667,资金的边际产出为 0.7764,技术进步的影响使工业总 产值平均每年递增 77.68 亿元。回归系数的符号和数值是较为合理的。 0.9958 2 R ,说明模型有很高的拟合优度,F 检验也是高度显著的, 说明职工人数 L、资金 K 和时间变量 t 对工业总产值的总影响是显著 的。 从图 3-1 看出,解释变量资金 K 的 t 统计量值为 7.433,表资金 对企业产出的影响是显著的。但是,模型当中其他变量(包括常数项) 的 t 统计值都比较小,未通过检验。因此需要对以上三元线性回归模 型做适当的调整,按照统计检验程序,一般先剔除 t 统计量最小的变 量(即时间变量)而重新建立模型。 (二)建立剔除时间变量的二元线性回归模型 命令:ls y c L K 则生产函数的估计结果及有关信息如图 3-2 所示:
日Equation:UNTITLED Workfile:UNTITLED:Untitled)口XView Proc Object Print Name Freeze Estimate Forecast Stats ResidsDependent Variable:YMethod:LeastSquaresDate:10/10/21Time:16:09Sample:19781994Includedobservations:17VariableProb.CoefficientStd.Errort-Statisticc0.0111-2387.269816.8895-2.922390LK0.00061.2085320.2730204.4265280.8344960.05742114.532870.0000R-squared6407.2490.995617MeandependentvarAdjustedR-squared0.994990S.D.dependent var2486.742S.E.of regression176.0069Akaike info criterion13.33771433697.813.48475Sum squared residSchwarzcriterion13.35232Log likelihood-110.3705Hannan-Quinncriter1589.9531.481994F-statisticDurbin-Watson statProb(F-statistic)0.000000图3-2剔除时间变量后的估计结果因此,我国国有独立工业企业的生产函数为(模型2)j=-2387.269+1.2085L+0.8345Kt=(-2.9224)(4.4265)(14.5329)R2=0.9956R=0.9950F=1589.953从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为1.2085,资金的边际产出为0.8345,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型2的拟合优度较模型1并无多大变化,F检验也是高度显著的。这里,解释变量、常数项的t检验值都比较大,显著性概率都小于0.05,因此模型2比模型1更为合理
图 3-2 剔除时间变量后的估计结果 因此,我国国有独立工业企业的生产函数为: y 2387.269 1.2085L 0.8345K (模型 2) t ( 2.9224)(4.4265)(14.5329) 0.9956 2 R 0.9950 2 R F 1589.953 从图 3-2 的结果看出,回归系数的符号和数值也是合理的。劳动力边 际产出为 1.2085,资金的边际产出为 0.8345,表明这段时期劳动力投 入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型 2 的拟合优度较模型 1 并无多大变化,F 检验也是高度显著的。这里, 解释变量、常数项的 t 检验值都比较大,显著性概率都小于 0.05,因 此模型 2 比模型 1 更为合理
二、建立非线性回归模型---C-D生产函数(补充部分!!!)C-D生产函数为:Y=ALKe,对于此类非线性函数,可采用以下两种方式建立模型。方式:转化为线性模型进行估计:在模型两端同时取对数,得:Iny=lnA+αlnL+βlnK+在Eviews软件的命令窗口中依次键入以下命令:genr lny = log(y)genr Inl = log(L)genr Ink = log(K)Is Iny c Inl Ink则估计结果如图3-3所示:BEguation:UNTITLED Workfile:UNTITLED:UntitledyX口View Proc Object Print Name Freeze Estimate Forecast Stats ResidsDependent Variable:LNYMethod:LeastSquaresDate:10/10/21Time:16:51Sample:19781994Includedobservations:17VariableCoefficientStd.Errort-StatisticProb.c-1.9512530.26091.665320-1.171698LNL0.6044670.2726972.2166250.0437LNK0.00000.6736580.0723579.3101310.9957538.692837R-squaredMean dependent var0.995147S.D. dependent var0.394921AdjustedR-squared0.027512-4.189602S.E.ofregressionAkaike info criterionSum squared resid0.010597Schwarzcriterion-4.042564Log likelihood38.61162Hannan-Quinn criter.-4.1749861641.4071.338201F-statisticDurbin-Watson statProb(F-statistic)0.000000图3-3线性变换后的C-D生产函数估计结果
二、建立非线性回归模型-C-D 生产函数(补充部分!!!) C-D 生产函数为: Y AL K e , 对于此类非线性函数,可采用以下两种方式建立模型。 方式:转化为线性模型进行估计; 在模型两端同时取对数,得:ln y ln A ln L ln K 在 Eviews 软件的命令窗口中依次键入以下命令: genr lny = log(y) genr lnl = log(L) genr lnk = log(K) ls lny c lnl lnk 则估计结果如图 3-3 所示: 图 3-3 线性变换后的 C-D 生产函数估计结果