第三节相关系数 6 2021/2/20
2021/2/20 6 第三节 相关系数
,线性回归回归系数 在研究实际问题时,会遇到一些相互制 约的量,即它们之间存在一定的联系.这 些联系中有一类是大家所熟悉的函数关 系,即所谓确定性关系.譬如,自由落体 运动中,物体下落的距离s与所需的时间t 的关系为 g 7 2021/2/20
2021/2/20 7 一, 线性回归 回归系数 在研究实际问题时, 会遇到一些相互制 约的量, 即它们之间存在一定的联系. 这 些联系中有一类是大家所熟悉的函数关 系, 即所谓确定性关系. 譬如, 自由落体 运动中, 物体下落的距离s与所需的时间t 的关系为 1 2 2 s gt =
但是,经常还会遇到两个随机变量,它们 并不具有函数关系.例如,一族人的身长 与体重之间就是这样,一般说来,身高者, 体亦重.但这种联系不是确定性的,一个 人的体重并不能完全确定其身高.对于 这样两个随机变量,,希望用的某个 线性函数a+b(a,b都是常数)来近似表达 7当然问题是如何选取ab,使得在某种 含义上近似程度尽可能好. 8 2021/2/20
2021/2/20 8 但是, 经常还会遇到两个随机变量, 它们 并不具有函数关系. 例如, 一族人的身长 与体重之间就是这样, 一般说来, 身高者, 体亦重. 但这种联系不是确定性的, 一个 人的体重并不能完全确定其身高. 对于 这样两个随机变量x,h, 希望用x的某个 线性函数ax+b(a,b都是常数)来近似表达 h. 当然问题是如何选取a,b, 使得在某种 含义上近似程度尽可能好
以a+b近似表达时的均方误差为 E[n-(a2+b)]2 =El(n-En-as-E5+(En-aE5-b)12 E[(n-Em)2+a2(2E2)2+(EaEb)2 2a(n-Ens-E$+2(n-Enen-aEs-b 2a(s-Es(En-aE5-b)] -E(n-En2+aE(S-E52+(en-aE5-b)2 2aE(-En(s-esI 为了表达方便,令 (5,) E[(-Em)-E) ()o() 9 2021/2/20
2021/2/20 9 以ax+b近似表达h时的均方误差为 E[h-(ax+b)]2 =E[(h-Eh)-a(x-Ex)+(Eh-aEx-b)]2 =E[(h-Eh) 2+a 2 (x-Ex) 2+(Eh-aEx-b) 2 -2a(h-Eh)(x-Ex)+2(h-Eh)(Eh-aEx-b) -2a(x-Ex)(Eh-aEx-b)] =E(h-Eh) 2+a 2E(x-Ex) 2+(Eh-aEx-b) 2 -2aE[(h-Eh)(x-Ex)]. 为了表达方便, 令 [( )( )] ( , ) . (1) ( ) ( ) E E E h h x x x h s x s h - - =
Eln(a5+b)]2 E(n-En+ae(s-Es+(En-aEs-b) 2aE[(n}Em)(-E)] p(,7) E[(7-Em)-E) ()a() E[-(a5+b)]=a(m)+ao2() -2ap(,m)(2)o(n)+(E7-aE2-b)2 O a-(5,)Q(m +a2()1-p2(,m+(En-aE+b)2 2021/2/20
2021/2/20 10 E[h-(ax+b)]2 =E(h-Eh) 2+a 2E(x-Ex) 2+(Eh-aEx-b) 2 -2aE[(h-Eh)(x-Ex)]. [( )( )] ( , ) . (1) ( ) ( ) E E E h h x x x h s x s h - - = 2 2 2 2 2 2 2 2 2 2 [ ( )] ( ) ( ) 2 ( , ) ( ) ( ) ( ) ( ) ( ) ( , ) ( ) ( )[1 ( , )] ( ) E a b a a E aE b a E aE b h x s h s x x h s x s h h x s h s x x h s x s h x h h x - + = + - + - - = - + - + - -