第十章 统计回归模型 10.1牙膏的销售量 10.2软件开发人员的薪金 10.3 酶促反应 10.4投资额与国民生产总值和 物价指数 数学建摸
第十章 统计回归模型 10.1 牙膏的销售量 10.2 软件开发人员的薪金 10.3 酶促反应 10.4 投资额与国民生产总值和 物价指数
数学建摸的基本方法 机理分析 测试分析 由于客观事物内部规律的复杂及人们认识程度的限制, 无法分析实际对象内在的因果关系,建立合乎机理规 律的数学模型。 通过对数据的统计分析,找出与数据拟合最好的模型 回归模型是用统计分析方法建立的最常用的一类模型 ·不涉及回归分析的数学原理和方法 通过实例讨论如何选择不同类型的模型 对软件得到的结果进行分析,对模型进行改进 数学建模
回归模型是用统计分析方法建立的最常用的一类模型 数学建模的基本方法 机理分析 测试分析 通过对数据的统计分析,找出与数据拟合最好的模型 • 不涉及回归分析的数学原理和方法 • 通过实例讨论如何选择不同类型的模型 • 对软件得到的结果进行分析,对模型进行改进 由于客观事物内部规律的复杂及人们认识程度的限制, 无法分析实际对象内在的因果关系,建立合乎机理规 律的数学模型
10.1牙膏的销售量 问 建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量、价格、 广告费用,及同期其它厂家同类牙膏的平均售价 销售 本公司价 其它厂家 广告费用 价格差 销售量 周期 格(元) 价格(元) (百万元) (元) (百万支) 1 3.85 3.80 5.50 -0.05 7.38 2 3.75 4.00 6.75 0.25 8.51 0·。 。。 ”。· ……… 29 3.80 3.85 5.80 0.05 7.93 30 3.70 4.25 6.80 0.55 9.26 数学建摸
10.1 牙膏的销售量 问 题 建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量、价格、 广告费用,及同期其它厂家同类牙膏的平均售价 30 3.70 4.25 6.80 0.55 9.26 29 3.80 3.85 5.80 0.05 7.93 2 3.75 4.00 6.75 0.25 8.51 1 3.85 3.80 5.50 -0.05 7.38 销售量 (百万支) 价格差 (元) 广告费用 (百万元) 其它厂家 价格(元) 本公司价 格(元) 销售 周期
基本模型 10 9.5 y~公司牙膏销售量 9 0 00 00 0 x一其它厂家与本公司价格差 8.5 08 x2公司广告费用 7.5 0.2 0 0.2 0.4 0.6 y=B。+阝x1+阝2x2+B3x2+8 三所tBx+ y被解释变量(因变量) 10 9.5 6 x1,x2~解释变量(回归变量,自变量) 9 8.5 0 0 B,B1,B,B回归系数 00 0 0 7.5 0 8随机误差(均值为零的 5 5.5 6 6.5 7.5 正态分布随机变量) =+所
基本模型 y ~公司牙膏销售量 x1 ~其它厂家与本公司价格差 x2 ~公司广告费用 = + + 0 1 1 y x = + + + 2 0 1 2 2 2 y x x 5 5.5 6 6.5 7 7.5 7 7.5 8 8.5 9 9.5 10 x2 y -0.2 0 0.2 0.4 0.6 7 7.5 8 8.5 9 9.5 10 x1 y = + + + + 2 0 1 1 2 2 3 2 y x x x x1 , x2 ~解释变量(回归变量, 自变量) y~被解释变量(因变量) 0 , 1 , 2 , 3 ~回归系数 ~随机误差(均值为零的 正态分布随机变量)
模型求解 MATLAB统计工具箱 B+,+2++6由数据,x1x2估计B [b,bint,r,rint,stats]=regress(y,x,alpha) 输入 y~n维数据向量 输出 b~的估计值 X= [1x,] ~×4数 bint~b的置信区间 据矩阵,第1列为全1向量 x残差向量y-x西 a1pha(置信水平,0.05) rint~r的置信区闻 参数 参数估计值 置信区间 B 17.3244 5.728228.9206 Stats~ 1.3070 I0.6829 1.93111 检验统计量 B2 -3.6956 L-7.49890.10771 R2,F,P F 0.3486 0.03790.65941 数学建 3=0.9054 F=82.9409 p=0.0000
模型求解 MATLAB 统计工具箱 [b,bint,r,rint,stats]=regress(y,x,alpha) 输入 x= ~n4数 据矩阵, 第1列为全1向量 [1 ] 2 1 2 2 x x x alpha(置信水平,0.05) = + + + + 2 0 1 1 2 2 3 2 y x x x b~的估计值 bint~b的置信区间 r ~残差向量y-xb rint~r的置信区间 Stats~ 检验统计量 R2 ,F, p y~n维数据向量 输出 由数据 y,x1 ,x2估计 参数 参数估计值 置信区间 17.3244 [5.7282 28.9206] 1.3070 [0.6829 1.9311 ] -3.6956 [-7.4989 0.1077 ] 0.3486 [0.0379 0.6594 ] R2=0.9054 F=82.9409 p=0.0000 0 1 2 3