回归分析案例 —数学建模与系统仿真 主讲:王晓峰 E-mail:xfwang8280126.com
回 归 分 析 案 例 ——数学建模与系统仿真 主讲:王晓峰 E-mail:xfwang828@126.com
统计回归案例 1牙膏的销售量 2软件开发人员的薪金 3酶促反应
统计回归案例 1 牙膏的销售量 2 软件开发人员的薪金 3 酶促反应
1牙膏的销售量 问建立牙膏销售量与价格、广告投入之间的模型; 题预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量、价格、 广告费用,及同期其他厂家同类牙膏的平均售价 销售本公司价其他厂家广告费用价格差销售量 周期格(元)价格(元)(百万元)(元)(百万支) 3.85 3.80 5.50 0.05 738 2 3.75 4.00 6.75 0.25 8.51 ●●鲁 ●● ● 29 3.80 3.85 5.80 0.05 793 30 3.70 4.25 680 0.55 926
1 牙膏的销售量 问 题 建立牙膏销售量与价格、广告投入之间的模型; 预测在不同价格和广告费用下的牙膏销售量. 收集了30个销售周期本公司牙膏销售量、价格、 广告费用,及同期其他厂家同类牙膏的平均售价 . 30 3.70 4.25 6.80 0.55 9.26 29 3.80 3.85 5.80 0.05 7.93 2 3.75 4.00 6.75 0.25 8.51 1 3.85 3.80 5.50 -0.05 7.38 销售量 (百万支) 价格差 (元) 广告费用 (百万元) 其他厂家 价格(元) 本公司价 格(元) 销售 周期
基本模型 y~公司牙膏销售量 x1^其他厂家与本公司价格差 x2~公司广告费用 7.5 -02 04 6 +B1x1+ B2*2+B3*2+e y=B+B,x,+8 y被解释变量(因变量 95 x1,x2解释变量回归变量,自变量 B月1,B2,月3~回归系数 75 ε~随机误差(均值为零的 5.5 正态分布随机变量) +B,x,+ B2 E c
基本模型 y ~公司牙膏销售量 x1 ~其他厂家与本公司价格差 x2 ~公司广告费用 = + + 0 1 1 y x = + + + 2 0 1 2 2 2 y x x 5 5.5 6 6.5 7 7.5 7 7.5 8 8.5 9 9.5 10 x2 y -0.2 0 0.2 0.4 0.6 7 7.5 8 8.5 9 9.5 10 x1 y = + + + + 2 0 1 1 2 2 3 2 y x x x x1 , x2 ~解释变量(回归变量, 自变量) y~被解释变量(因变量) 0 , 1 , 2 , 3 ~回归系数 ~随机误差(均值为零的 正态分布随机变量)
模型求解 MATLAB统计工具箱 y=B+B1x1+B2x2+B3x2+E由数据yx1x2估计B [b ,bint rint, stats]=regress(y, x, alpha) 输入y~n维数据向量输出b~的估计值 x2]-mx4数1ntb的置信区间 据矩阵第列为全向量x残差向量yx a1pha(置信水平,0.05)rint~r的置信区间 参数参数估计值置信区间 17.3244 57282289206 S七ats~ ββ 1.3070 0.682919311检验统计量 -3.6956 749890.,1077 R2, F, P,s2 0.3486 10.03790.65941 R2=0.9054F-829409p<0.001s2=0.0490
模型求解 MATLAB 统计工具箱 [b,bint,r,rint,stats]=regress(y,x,alpha) 输入 x= ~n4数 据矩阵, 第1列为全1向量 [1 ] 2 1 2 2 x x x alpha(置信水平,0.05) = + + + + 2 0 1 1 2 2 3 2 y x x x b~的估计值 bint~b的置信区间 r ~残差向量y-xb rint~r的置信区间 Stats~ 检验统计量 R2 ,F, p,s2 y~n维数据向量 输出 由数据 y,x1 ,x2估计 参数 参数估计值 置信区间 17.3244 [5.7282 28.9206] 1.3070 [0.6829 1.9311 ] -3.6956 [-7.4989 0.1077 ] 0.3486 [0.0379 0.6594 ] R2=0.9054 F=82.9409 p<0.0001 s 2=0.0490 0 1 2 3