实验七虚拟变量【实验目的】掌握虚拟变量的设置方法。【实验内容】、试根据表7-1的1994-2008年我国居民旅游支出与可支配收入的统计资料,建立我国居民旅游支出模型:表 7-1我国居民旅游支出与可支配收入统计资料年份年份旅游支出可支配收入旅游支出可支配收入1994414.73496.22002739.77702.81995464.042832003684.98472.21996534.12004731.84838.99421.61997599.85160.32005737.1104931998607.020065425.1766.411759.51999614.85854.022007906.913785.82000678.662802008849.415780.762001708.36859.6资料来源:据《中国统计年鉴2009》整理计算得到利用虚拟变量进行季节波动预测。表7-2为某市2004-2010年各月的旅游收入,试建立模型预测2011年各季度旅游收入。表7-2为某市2004-2010年各月的旅游收入200420052006200720082009201038第一季度363941434548665053566063第二季度48333638第三季度2830323455第四季度484950515254三、利用表3-1的数据判断美国二战前和二战后的生产力是否不同。【实验步骤】我国居民旅游支出函数1.相关图分析;键入命令:SCATXY,则可支配收入与旅游支出的相关图如7-1所示。由于从1999年实行了“黄金周”,从相关图可以看出,前5个样本点与后10个样本点存在较大差异,因此,为了反映“黄金周”这一定性因素的影响,设置虚拟变量如下:[11999年及以后D=101999以前
实验七 虚拟变量 【实验目的】 掌握虚拟变量的设置方法。 【实验内容】 一、试根据表 7-1 的 1994-2008 年我国居民旅游支出与可支配收入的统计资料,建立我 国居民旅游支出模型; 表 7-1 我国居民旅游支出与可支配收入统计资料 年份 旅游支出 可支配收入 年份 旅游支出 可支配收入 1994 414.7 3496.2 2002 739.7 7702.8 1995 464.0 4283 2003 684.9 8472.2 1996 534.1 4838.9 2004 731.8 9421.6 1997 599.8 5160.3 2005 737.1 10493 1998 607.0 5425.1 2006 766.4 11759.5 1999 614.8 5854.02 2007 906.9 13785.8 2000 678.6 6280 2008 849.4 15780.76 2001 708.3 6859.6 资料来源:据《中国统计年鉴 2009》整理计算得到 二、利用虚拟变量进行季节波动预测。表 7-2 为某市 2004-2010 年各月的旅游收入,试 建立模型预测 2011 年各季度旅游收入。 表 7-2 为某市 2004-2010 年各月的旅游收入 2004 2005 2006 2007 2008 2009 2010 第一季度 36 38 39 41 43 45 48 第二季度 48 50 53 56 60 63 66 第三季度 28 30 32 33 34 36 38 第四季度 48 49 50 51 52 54 55 三、利用表 3-1 的数据判断美国二战前和二战后的生产力是否不同。 【实验步骤】 一、我国居民旅游支出函数 ⒈相关图分析; 键入命令:SCAT X Y,则可支配收入与旅游支出的相关图如 7-1 所示。 由于从 1999 年实行了“黄金周”,从相关图可以看出,前 5 个样本点与后 10 个样本点 存在较大差异,因此,为了反映“黄金周”这一定性因素的影响,设置虚拟变量如下: 1 0 D = 1999年及以后 1999以前
O回区Graph:UHIIILEDForkfile:UHIIILED::UntitlediView Procobject PrintNameAddfext/Line/Shade RemoveTemplate OptionsZoom1,000900-800-700X600-500-o400+4.0008,00012.00016.0000X图7-1我国居民可支配收入与旅游支出相关图2.构造虚拟变量;方式1:使用DATA命令直接输入:方式2:使用SMPL和GENR命令直接定义。DATAD1GENRXD=X*D13.估计虚拟变量模型:LSYCXDIXD再由t检验值判断虚拟变量的引入方式,并写出“黄金周”前后的旅游支出函数。按照以上步骤,虚拟变量模型的估计结果如图7-2所示
图 7-1 我国居民可支配收入与旅游支出相关图 ⒉构造虚拟变量; 方式 1:使用 DATA 命令直接输入; 方式 2:使用 SMPL 和 GENR 命令直接定义。 DATA D1 GENR XD=X*D1 ⒊估计虚拟变量模型: LS Y C X D1 XD 再由 t 检验值判断虚拟变量的引入方式,并写出“黄金周”前后的旅游支出函数。 按照以上步骤,虚拟变量模型的估计结果如图 7-2 所示
Equation:UHIIILEDorkfile:UHIIILED::Untitled-xView Proc Object Print Name Freeze EstimateForecast Stats ResidsDependentVariable:YMethod:LeastSquaresDate:08/13/11Time:15:35Sample:19942008Includedobservations:15Prob.VariableCoefficientStd.Errort-Statisticc26.82713108.08770.2481980.8086x0.1071160.0230404.6491510.0007D1494.8081113.97414.3414080.0012XD0.0041-0.0842800.023314-3.614990669.1667R-squared0.944945Mean dependent var0.929930133.7797AdjustedR-squaredS.D.dependentvarS.E.of regression35.4124010.19518Akaikeinfocriterion13794.4210.38399SumsquaredresidSchwarzcriterion-72.46385Log likelihoodHannan-Quinn criter.10.1931762.933682.421969F-statisticDurbin-Watson statProb(F-statistic)0.000000图7-2我国居民旅游支出函数的估计我国居民旅游支出函数的估计结果为:,=26.8271+0.1071x, +494.8081D,0.0843XD1=(0.2482)(4.6492)(4.3414)(-3.6150)R2=0.9449R2=0.9299F=62.9337虚拟变量的回归系数的t检验都是显著的,且模型的拟合优度很高,说明我国居民旅游支出模型在实行“黄金周”年份前后在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。实行“黄金周”年份前后的旅游支出函数为:“黄金周”前:, = 26.8271+0.1071x,“黄金周”后:,=(26.8271+494.8081)+(0.1071-0.0843)x, =521.6352+0.0228x,二、利用虚拟变量进行季节波动预测1.变量趋势图
图 7-2 我国居民旅游支出函数的估计 我国居民旅游支出函数的估计结果为: ˆ 26.8271 0.1071 494.8081 0.0843 i i i i y x D XD = + + − t = (0.2482)(4.6492) (4.3414) (-3.6150) 2 R =0.9449 2 R =0.9299 F=62.9337 虚拟变量的回归系数的 t 检验都是显著的,且模型的拟合优度很高,说明我国居民旅游 支出模型在实行“黄金周”年份前后在截距和斜率上都存在着明显差异,所以以加法和乘法 方式引入虚拟变量是合理的。实行“黄金周”年份前后的旅游支出函数为: “黄金周”前: ˆ 26.8271 0.1071 i i y x = + “黄金周”后: y x ˆ i i 26.8271 494.8081 0.1071 0.0843 = + + − ( ) ( ) 521.6352 0.0228 i = + x 二、利用虚拟变量进行季节波动预测 1.变量趋势图
口回区Graph:UHIIILEDorkfile:UHIIILED::UntitledView ProcObject Print NameAddText Line/ShadeRemoveTemplate OptionsZoomY7060-MMMW50-MM4030-202004200520062007200820092010图7-3旅游支出的趋势图从该变量趋势图可以看出,旅游支出随着时间的推移有一个递增的趋势,而且有一季节波动。因此,设该旅游支出时间序列模型为:Y=y=a+b*1+$,D1+8,D2+8,D32.生成时间变量和输入虚拟变量数据生成时间变量命令:genrt=@trend(2004.0)生成了时间变量后,再输入虚拟变量数据,数据如表7-3。表7-3时间变量和虚拟变量数据d2t dld2d1d3d3t101500010210016 001301017000400118100500019010610020001701021000180012200900023010100010024101025001101200126100
图 7-3 旅游支出的趋势图 从该变量趋势图可以看出,旅游支出随着时间的推移有一个递增的趋势,而且有一季节 波动。因此,设该旅游支出时间序列模型为: Y= 1 2 3 y a b t D D D = + + + + * 1 2 3 2.生成时间变量和输入虚拟变量数据 生成时间变量命令:genr t=@trend(2004.0) 生成了时间变量后,再输入虚拟变量数据,数据如表 7-3。 表 7-3 时间变量和虚拟变量数据 t d1 d2 d3 t d1 d2 d3 1 0 0 0 15 0 1 0 2 1 0 0 16 0 0 1 3 0 1 0 17 0 0 0 4 0 0 1 18 1 0 0 5 0 0 0 19 0 1 0 6 1 0 0 20 0 0 1 7 0 1 0 21 0 0 0 8 0 0 1 22 1 0 0 9 0 0 0 23 0 1 0 10 1 0 0 24 0 0 1 11 0 1 0 25 0 0 0 12 0 0 1 26 1 0 0
130002701010000142813.估计回归模型:1syctdld2d3,估计结果见图7-3。同回风Equation:UNIITLEDorkfile:UNIIILED::UntitledyView ProcObjectPrintNameFreezeEstimateForecastStats ResidsADependentVariable:YMethod:LeastSquaresDate:08/13/11Time:16:36Sample:2004Q12010Q4Includedobservations:28VariableStd.ErrorProb.Coefficientt-Statisticc35.102680.80301943.713410.0000T0.4866070.03895212.492440.0000D10.8822460.000014.6562516.61243D2-9.4017860.884822-10.625620.0000D38.3973210.8890999.4447570.0000R-squared0.97757745.57143Meandependentvar0.97367710.16322AdjustedR-squaredS.D.dependentvarS.E.ofregression1.648922Akaike info criterion3.99855362.535714.236447Sum squared residSchwarz criterionLog likelihood-50.979754.071280Hannan-QuinncriterF-statistic250.6783Durbin-Watsonstat2.085288Prob(F-statistic)0.000000V图7-3季节变动模型估计结果4.预测下一年的各季度预测值(1)扩充样本区间:expand2004.12011.4(2)将2011年各季度的t值和d1、d2、d3值输入,如2011的第三季度输入(31,0,1,0)。(3)点击回归模型中菜单栏的forcast按钮
13 0 0 0 27 0 1 0 14 1 0 0 28 0 0 1 3.估计回归模型:ls y c t d1 d2 d3,估计结果见图 7-3。 图 7-3 季节变动模型估计结果 4.预测下一年的各季度预测值 (1)扩充样本区间: expand 2004.1 2011.4 (2)将 2011 年各季度的 t 值和 d1、d2、d3 值输入,如 2011 的第三季度输入(31,0,1,0)。 (3)点击回归模型中菜单栏的 forcast 按钮