两分法 对于任何数据点(xY,y1=B+B1x+u1 此直线将Yt的总值分成两部分。 第一部分是Y的拟合值或预测值: Y=a+ BX t=1,2 第二部分,et,代表观测点对于回归线的误差,称为拟 合或预测的残差( residuals): 1-Y a-B
16 两分法 . 对于任何数据点 (Xt , Yt ), yt = 0 + 1 xt + ut 此直线将Yt 的总值 分成两部分。 第一部分是Yt的拟合值或预测值 : , t=1,2,……,n 第二部分,et ,代表观测点对于回归线的误差,称为拟 合或预测的残差 (residuals): t=1,2,……,n 即 t=1,2,……,n Yt Xt ˆ ˆ ˆ = + t Yt Yt e = − ˆ t t Xt e Y ˆ = − ˆ − Yt ˆ
辨析四个概念 1真实的统计模型,y,=B0+月1x+m1 计的统计模型,=a+BX+e1 (3)真实的回归直线(PRF),E()=B0+B1x1 (4)估计的回归直线(SRF),y=a+Bx 对于一般的经济问题,通常真实的回归直线是观测不 到的!收集样本的目的就是要对真实的回归直线作估计! SRF是PRF的近似 ?如何估计?即如何使得SRF尽可能接近PRF? 种可能的解释就是:使得估计的直线处于“样本数 据的中心位置”一—“最佳直线
17 辨析四个概念 (1) 真实的统计模型,yt = 0+ 1 xt+ ut (2) 估计的统计模型, + et (3) 真实的回归直线(PRF),E(yt ) = 0+ 1 xt (4) 估计的回归直线(SRF), 对于一般的经济问题,通常真实的回归直线是观测不 到的!收集样本的目的就是要对真实的回归直线作估计! SRF是PRF的近似 ? 如何估计?即如何使得SRF尽可能接近PRF? => 一种可能的解释就是:使得估计的直线处于“样本数 据 的中心位置”--“最佳直线” Yt Xt ˆ ˆ ˆ = + Yt Xt ˆ ˆ ˆ = +
Y=a+ 图几何解释
* * * * * et * * * * * * * * * * * * Y X Xt 图 几何解释 Yt Yt ˆ Y ˆ = ˆ + ˆ X
残差平方和 我们的目标—是使拟合出来的直线在某种意义上是 最佳的,包括线形、位置 直观意义—也就是要求估计直线尽可能地靠近各观 测点,这意味着应使残差总体上尽可能地小。 方法—要做到这一点,就必须用某种方法将每个点 相应的残差加在一起,使其达到最小。 理想的测度—残差平方和,即 ∑e2=>(x1-) 19
19 残差平方和 我们的目标——是使拟合出来的直线在某种意义上是 最佳的,包括线形、位置 直观意义——也就是要求估计直线尽可能地靠近各观 测点,这意味着应使残差总体上尽可能地小。 方法——要做到这一点,就必须用某种方法将每个点 相应的残差加在一起,使其达到最小。 理想的测度——残差平方和,即 2 2 ) ˆ ( t Yt Yt e = −
最小二乘法( Ordinary least squares,.OLs) 最小二乘法就是选择一条直线,使其残差平方和 达到最小值的方法。即选择a和,使得 ∑∑ ∑( (r-a-Bx 达到最小值
20 最小二乘法(Ordinary least squares, OLS) 最小二乘法就是选择一条直线,使其残差平方和 达到最小值的方法。即选择 ˆ 和 ˆ ,使得 = − − = = − 2 2 2 ) ˆ ( ˆ ) ˆ ( t t t t t Y X S e Y Y 达到最小值