王 为了看出它们之间是否有关及存在什么样的关系, 我们在直角坐标系下作出了这些点,从图上可看出随 平甲醛浓度的增加缩醛化度Y也增加且这些点近似 在一条直线附近但又不完全在一条直线上引起这些 平点与直线偏离的原因是由于在生产和测试过程中还 上存在一些不可控的因素它们都在影响着试验结果 这样我们可以把试验结果Y看成由两部分叠加而成 部分是由x的线性函数引起记为a+bx,另一部分是 中由随机因素引起记为,即 Y=a+bx+e 一般假设随机误差NOG)即 YNa+bx, 02) 上或
• 为了看出它们之间是否有关及存在什么样的关系, 我们在直角坐标系下作出了这些点,从图上可看出:随 甲醛浓度x的增加,缩醛化度Y也增加,且这些点近似 在一条直线附近,但又不完全在一条直线上.引起这些 点与直线偏离的原因是由于在生产和测试过程中还 存在一些不可控的因素,它们都在影响着试验结果. • 这样我们可以把试验结果Y看成由两部分叠加而成: 一部分是由x的线性函数引起,记为a+bx;另一部分是 由随机因素引起,记为ε,即 Y=a+bx+ε 一般假设随机误差ε~N(0,σ2 ).即 Y~ N(a+bx,σ2 )
王 在Y=a+bx+ε中x是一般变量它可以精确测量或 可以加以控制Y是可观察其值的随机变量,ε 出N0G)是不可观察的随机变量,ab是未知参数 .为了获得未知参数a的估计,需要进行若干次独 立试验设试验结果为 (x1,Y1),(x2,Y2),…,(xn2Yn) 王.则Y abx+e18r~N(0,02) Y2=a+bx2+8282~N(0,02) Yn=a+bxn+en En-NO, 02) 不这里12相互独立这就是一元线性回归模型 上或
• 在Y=a+bx+ε中,x是一般变量,它可以精确测量或 可以加以控制,Y是可观察其值的随机变量, ε~ N(0,σ2 )是不可观察的随机变量, a,b是未知参数. • 为了获得未知参数a,b的估计,需要进行若干次独 立试验.设试验结果为 (x1 ,Y1 ), (x2 ,Y2 ), ...,(xn ,Yn ) • 则 Y1=a+bx1+ε1 ε1~ N(0,σ2 ) Y2=a+bx2+ε2 ε2~ N(0,σ2 ) Yn=a+bxn+εn εn~ N(0,σ2 ) 这里ε1 ,..., εn相互独立.这就是一元线性回归模型
§12经验公式与最小二乘法 °设给定n个点 (x11).(x2y2) Dn,n 上那么对于平面上任意一条直线4 y=a+bx 我们用数量 Dy(a+bxd] 来刻画点(x3y)到直线l的远近程度(利用解析几何知 不识不难看出,y(a+bx)|的几何意义是点(x沿着 平行于y轴的方向到的最短距离,不是沿着垂直于1 c的方向到的最短距离) 上或
• 设给定n个点 (x1 ,y1 ),(x2 ,y2 ),……,(xn ,yn ) 那么对于平面上任意一条直线l: y=a+bx §1.2 经验公式与最小二乘法 • 我们用数量 [yt -(a+bxt )]2 来刻画点(xt ,yt )到直线l的远近程度(利用解析几何知 识不难看出,|yt -(a+bxt )|的几何意义是点(xt ,yt )沿着 平行于y轴的方向到l的最短距离,而不是沿着垂直于l 的方向到l的最短距离)
王*于是 ∑[y-(a+bx)2 t=1 就定量地描述了直线碾这n个点的总的远近程度 这个量是随着不同的直线而且变化,或是说是随 不同的a与b而变化的也就是说它是ab的二元函 c数记为Qab o(@, b)=>Ly-(a+ bx,) t=1 上或
= − + n t t a bxt y 1 2 [ ( )] 于是 就定量地描述了直线l跟这n个点的总的远近程度. 这个量是随着不同的直线而且变化,或是说是随 不同的a与b而变化的,也就是说它是a,b的二元函 数,记为Q(a,b): = = − + n t t a bxt Q a b y 1 2 ( , ) [ ( )]
于是,要找一条直线使得它总的来看最“接近 这n个点的问题,就转化为以下的问题: 找两个数ab使二元函数Q(a,b)在 a=ab=b 处达到是最小 由于Q(a,b)是n个数的平方和所以使Q(a,b) 牛最小的原则称为平方和最小原则习惯上称为最小 二乘原则根据最小二乘原则找的方法称为最小 二乘法 上或
• 于是,要找一条直线使得它总的来看最“接近 ”这n个点的问题,就转化为以下的问题: . ˆ ˆ, ( , ) ˆ ˆ, 处达到是最小 找两个数 使二元函数 在 a a b b a b Q a b = = . ˆ . ˆ, , ( , ) , ( , ) 二乘法 二乘原则根据最小二乘原则找 的方法称为最小 最小的原则称为平方和最小原则 习惯上称为最小 由于 是 个数的平方和 所以使 a b Q a b n Q a b