最小二乘法是根据随机变量理论值和实 际值的拟合程度估计参数的。 ■线性回归模型的理论值可以用样本回归 直线上点的坐标表示,实际值就是样本 观测数据, ■因此线性回归模型理论值与实际值的拟 合,就是样本回归直线对观测数据的拟 合
16 ◼ 最小二乘法是根据随机变量理论值和实 际值的拟合程度估计参数的。 ◼ 线性回归模型的理论值可以用样本回归 直线上点的坐标表示,实际值就是样本 观测数据, ◼ 因此线性回归模型理论值与实际值的拟 合,就是样本回归直线对观测数据的拟 合
■若两变量线性回归模型为:Y=a+BX+E ■参数估计的思路就是找到能很好拟合样 本数据的样本回归直线,近似模型总体 回归直线y)=a+BX,从而得到a和B 的估计a和b
17 ◼ 若两变量线性回归模型为: ◼ 参数估计的思路就是找到能很好拟合样 本数据的样本回归直线,近似模型总体 回归直线E(Y ) =+ X,从而得到和 的估计a和b。 Y = + X +
判断拟合程度最基本的标准是样本点与 回归直线的偏差e=Y-(a+bX,),称为 “回归残差”或“残差” ■e越小回归直线离样本点越近,如果所 有样本点的回归残差都较小,回归直线 对样本趋势的拟合当然最好 一般采用残差平方和>e2=>-(a+bx 作为判断回归直线对样本数据拟合程度 的标准,残差平方和越小就认为拟合程 度越好
18 ◼ 判断拟合程度最基本的标准是样本点与 回归直线的偏差 ,称为 “回归残差”或“残差” 。 ◼ 越小回归直线离样本点越近,如果所 有样本点的回归残差都较小,回归直线 对样本趋势的拟合当然最好。 ◼ 一般采用残差平方和 = 作为判断回归直线对样本数据拟合程度 的标准,残差平方和越小就认为拟合程 度越好。 ( ) i Yi a bXi e = − + i e ei i 2 − + i Yi a bXi 2 ( )
核心:残差平方和∑e最小。 ∑e2-=∑[Y-(a+b) 0 ab 19
19 核心:残差平方和 ei 最小。 i 2 2 2 ( ) 0 0 i i i i i V e Y a bX V a V b = = − + = =
参数估计值 ∑(-)(X-X)∑Ky b ∑(X,-X) 2-1 =Y-bX
20 参数估计值 2 2 2 ( )( ) ( ) i i i i i i i i i i Y Y X X X Y nXY b X X X nX a Y bX − − − = = − − = −