回归方程 记凤,B分别是参数和B1的点估计,并记 Y为y的条件期望E(YX)的点估计,则由(82-1) 式,有 r=o+B,X (8.2-2) 称(52-2)式为回归方程。并称B,B为回归方程的 回归系数。 对每一x值,由回归方程可以确定一个回归值 分=B0+B1x
16 分别是参数 0 和 1 的点估计, 二. 回归方程 0 1 ˆ , ˆ β β ˆ ˆ ˆ Y = 0 + 1 X Y ˆ i i y β β x 0 1 ˆ ˆ ˆ = + 对每一 xi 值,由回归方程可以确定一个回归值 回归系数。 称(5.2-2) 式为回归方程。 记 为 Y 的条件期望 E( Y|X ) 的点估计,则由(8.2-1) 式, 有 (8.2-2) 并称 0 1 ˆ , ˆ β β 为回归方程的 并记
三.回归模型的参数估计 回归模型中的参数估计,采用的是“最小二乘法”, 其原理如下: Y的各观察值y与回归值之差y-反映了y 与回归直线之间的偏离程度,从而全部观察值与回归值 的残差平方和 Q(,B)=∑(y-y)=∑(-B0-月x)2 反映了全部观察值与回归直线间总的偏离程度 显然,Q的值越小,就说明回归直线对所有样本数据的 拟和程度越好。所谓最小二乘法,就是要使 Q(B,B)为最小。 只要令2=0:2 dB =0,就可求出B,B 17
17 ) ˆ , Q( ˆ 0 1 = − 2 0 1 ) ( ˆ ) ˆ ˆ ( i i Q β , β y y β ˆ 1 。 i y ˆ 就可求出 , ˆ 0 0 ; β ˆ 0 = Q 0 , ˆ 1 = Q 三. 回归模型的参数估计 回归模型中的参数估计,采用的是“最小二乘法”, 其原理如下: Y 的各观察值 yi 与回归值 之差 i i y − y ˆ 反映了 yi 与回归直线之间的偏离程度,从而全部观察值与回归值 的残差平方和 2 0 1 ) ˆ ˆ ( i i = y − β − β x 反映了全部观察值与回归直线间总的偏离程度。 显然,Q 的值越小,就说明回归直线对所有样本数据的 拟和程度越好。所谓最小二乘法,就是要使 为最小。 只要令
最小二乘法原理示意图 要找一条直线,使 ∑(y-)2 min 0
18 。 。 。 。 。 。 。 。 。 。 x y 0 。 。 yi 要找一条直线,使 ( − ˆ ) = min 2 i i y y i y ˆ xi 最小二乘法原理示意图
四.最小二乘估计的性质 可以证明,在满足经典假设的条件下 1.B和B1分别是参数和1的最小方差无偏估计 2.B和月的方差分别为: D(B0)=a[+ ],D(B1) N∑(x1-x) ∑(x1-x) 以上两式说明,回归系数A和B1的估计精度不仅 与a2及样本容量N有关,而且与各x,取值的分散程 度有关。在给定样本容量下,x;的取值越分散,则估 计的方差就越小,即对参数和B1的估计就越精确; 反之估计的精确就差 了解这一点,对指导试验或抽样调查是非常重要的
19 分别是参数 0 和 1 的最小方差无偏估计。 可以证明, ] , ( ) 1 ) [ ˆ ( 2 2 2 0 − = + x x x N D β σ i − = 2 2 1 ( ) ) ˆ ( x x σ D β i 0 1 ˆ ˆ 以上两式说明, β 和 β 2. 的方差分别为: 0 1 ˆ ˆ β 和β 0 1 ˆ 和 ˆ β β 四. 最小二乘估计的性质 在满足经典假设的条件下 1. 回归系数 的估计精度不仅 与 σ 2 及样本容量 N 有关,而且与各 xi取值的分散程 度有关。 在给定样本容量下,xi 的取值越分散,则估 计的方差就越小,即对参数 0 和 1 的估计就越精确; 反之估计的精确就差。 了解这一点,对指导试验或抽样调查是非常重要的
五.回归方程的显著性检验 通过参数估计得到回归方程后,还需要对回归方程进 检验,以确定变量间是否存在显著的线性关系 对一元线性回归模型,如果变量γ与X之间并不存在 线性相关关系,则模型中的一次项系数β1应为0;反之, 则B10 故对一元线性回归模型,要检验的原假设为 10:B1=0 以上检验称为对回归方程的显著性检验,使用的仍然 是方差分析方法 Y的观察值y1,y2…,y之间的差异是由两方面的原因 引起的: (1)解释变量X的取值x1不同; (2)其他因素和试验误差的影响
20 通过参数估计得到回归方程后,还需要对回归方程进 行检验,以确定变量间是否存在显著的线性关系。 对一元线性回归模型,如果变量Y 与 X 之间并不存在 线性相关关系,则模型中的一次项系数1 应为 0;反之, 则 1≠0。 故对一元线性回归模型,要检验的原假设为 H0:1 = 0 以上检验称为对回归方程的显著性检验,使用的仍然 是方差分析方法。 Y 的观察值 y1 , y2 , …, yN之间的差异是由两方面的原因 引起的: (1) 解释变量 X 的取值 xi不同; (2) 其他因素和试验误差的影响。 五. 回归方程的显著性检验