5.3协方差与相关系数一、协方差1.定义:对于二维随机变量(X,Y),若E[(X-EX)(Y-EY)存在,则把它称为随机变量X与Y的协方差,记为Cov(X,Y), 即 Cov= E[(X - EX)(Y - EY)] 2.说明:(1) 计算Cov(X,Y)= E(XY)-(EX)(EY)(2)X 与Y相互独立=→Cov(X,Y)=0
5.3 协方差与相关系数 一、协方差 1.定义:对于二维随机变量(X,Y),若E(X − EX)(Y − EY) 存在,则把它称为随机变量 X 与Y 的协方差,记为 Cov(X,Y),即Cov = E(X − EX)(Y − EY)。 2.说明: (1)计算 Cov(X,Y) = E(XY) − (EX)(EY) (2) X 与 Y 相互独立 Cov(X,Y) = 0
3.性质Cov(X,Y)= E[(X- EX)(Y - EY)]设,b是常数,则以下所遇期望和协方差存在时,有1 Cov(a,X) = 0;2 Cov(X,X) = DX;3 Cov(X,Y) = Cov(Y,X);4 Cov(aX,bY) = abCov(X,Y):5 Cov(X + Y,Z) = Cov(X,Z)+Cov(Y,Z)例1设X为一随机变量,其方差为DX,Y=a+bX其中a与b均为常数,求Cov(X,Y)解 Cov(X,Y)= Cov(a +bX,X)= Cov(a,X) + bCov(X,X)= bDX
设a b, , , 是常数 则以下所遇期望和协方差存在时 有 3.性质 1 Cov( , ) 0; a X = 2 Cov( , ) ; X X DX = 3 Cov( , ) Cov( , ); X Y Y X = 4 Cov( , ) Cov( , ); aX bY ab X Y = 5 Cov( , ) Cov( , ) Cov( , ). X Y Z X Z Y Z + = + 例1 设X为一随机变量, 其方差为DX, Y=a+bX, 其中a与b均为常数, 求Cov( X ,Y ). 解 Cov( , ) Cov( , ) X Y a bX X = + = + Cov( , ) Cov( , ) a X b X X = bDX Cov( , ) ( )( ) X Y E X EX Y EY = − −
随机变量的线性逼近与相关系数1.线性逼近:设随机变量x与Y:DX>0,DY>0,若以函数a+bX近似表示Y,以下用误差r=E[Y-a+bX)P来考察这种逼近的好坏程度。推导:r=EY?+α2+b?EX?+2abEX-2aEY-2bE(XY)[r =2a+2bEX-2EY =0[b- Cov(x,n)daDX得AorCov(X,Y)a=EY-bEX-EY=2bEX2+2aEX-2E(XY)=0EXabDXCov(X,Y)Cov(X,Y)DY代入r中,得rmn=PxYDXDYVDXDY则rmin =(1-P)DY
二、随机变量的线性逼近与相关系数 1.线性逼近:设随机变量X 与Y :DX 0, DY 0,若以函数a +bX 近似表示Y ,以下用误差 ( ) 2 r = E Y − a + bX 来考察这种逼近的好坏程 度。 推导: 2 2 2 ( ) 2 2 2 2 r = EY + a + b EX + abEX − aEY − bE XY 令 = + − = = + − = 2 2 2 ( ) 0 2 2 2 0 2 bEX aEX E XY b r a bEX EY a r 得 = − = − = EX DX Cov X Y a EY bEX EY DX Cov X Y b ( , ) ( , ) 代入 r 中,得 DY DX DY Cov X Y r = − 2 min ( , ) 1 令 ( ) DX DY Cov X Y XY , = 则 r (1 XY )DY 2 min = −
Cov(x,y)2. 定义:把上述无量纲的量p=微称为随机变量X与Y的(线性)相关系数。3.相关系数的性质:定理5.3. 1(1)lPx≤1(2)[Pxr|=1存在常数a,b使P(Y=a+bX)=1证明 Pxy =±1rmin =0 3a,b使E[Y-(α+bX)=0- D[Y - (a + bX)]+ (E[Y - (a+ bx) = 0[D[Y - (a +bX)]= 03a,b使E[Y - (a+ bx)]= 0 3a,b使P(Y = a+bX}= 1即X与Y之间以概率1存在着线性关系
2.定义:把上述无量纲的量 ( ) DX DY Cov X Y XY , = 称为随机变量 X 与Y 的(线性)相关系数。 3.相关系数的性质: 定理 5.3.1(1) XY 1 (2) XY =1存在常数a,b使 PY = a + bX=1 证明 XY = 1 r min = 0 , [ ( )] 0 2 a b使E Y − a + bX = ( ) ( ) 0 2 D Y − a + bX + E Y − a + bX = ( ) ( ) − + = − + = 0 0 , E Y a bX D Y a bX a b使 a,b使PY = a + bX=1 即 X 与 Y 之间以概率 1 存在着线性关系
说明:(1)Px刻画了X与Y的(线性)相关性:lpxrl越小,rmin 越大,即X与Y的线性关系较差,反之较好;当Px=0时称X与Y不相关。(2)相互独立与不相关:一般地,X与Y相互独立时一定不相关。但X与Y不相关时不一定相互独立(见例 2)。特殊的,当(X,Y)服从二维正态分布时,X与Y不相关等价于二者相互独立
说明: (1) xy 刻画了 X 与 Y 的(线性)相关性: XY 越 小, min r 越大,即 X 与Y 的线性关系较差,反之较 好;当 xy = 0时称 X 与Y 不相关。 (2)相互独立与不相关:一般地, X 与Y 相互独 立时一定不相关 。但 X 与Y 不相关时不一定相互 独立(见例 2)。特殊的,当(X,Y)服从二维正态分 布时, X 与Y 不相关等价于二者相互独立