第三节协方差及相关系数 一、协方差的定义和性质 二、相关系数的定义和性质
一、协方差的定义和性质 二、相关系数的定义和性质 第三节 协方差及相关系数
一、协方差的定义和性质 1.问题的提出 D(X+Y)=D(X)+DY)+2E{[X-E(X)][Y-E(Y)]} =D(X)+D(Y)+2{E(XY)-E(X)E(Y)} 若随机变量X与Y相互独立,则ELX-E(X)][Y-E(Y)]}=0. 若EX-E(X)][Y-E()小≠0,则X与Y不独立,而 是存在一定关系的
一、协方差的定义和性质 若随机变量 X 与 Y 相互独立,则E X E X Y E Y − − = ( ) ( ) 0 . 若E X E X Y E Y − − ( ) ( ) 0 ,则 X 与 Y 不独立,而 是存在一定关系的。 1. 问题的提出 D X Y ( ) + = + D X D Y ( ) ( )+ − − 2 ( ) ( ) E X E X Y E Y = + D X D Y ( ) ( ) + − 2 ( ) ( ) ( ) E XY E X E Y
D(X+Y)=D(X)+D(Y)+2EX-E(X)IIY-E(Y) 2.定义量E{[X-E(X)[Y-E(Y)}称为随机变量X与 Y的协方差,记为Cov(X,Y), Covariance Cov(X,Y)=E[X-E(X)]Y-E(Y)] 计算公式:Cov(x,Y)-E(Xy)-E(X)E(Y) D(X+Y)=D(X)+D(Y)+2Cov(XY) Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X) 3.性质 (1)Cov(ax,bY)=abCov(X,Y) (2)Cov(X:+X2,Y)=Cov(X,Y)+Cov(X2,Y)
D( ) D( ) D( ) 2Cov( ) X +Y X Y X,Y = + + Cov X,Y Cov Y, X Cov X, X D X ( ) = = ( ), ( ) ( ) 3. 性质 2. 定义 量E X E X Y E Y {[ ( )][ ( )]} − − 称为随机变量 X 与 Y 的协方差,记为Cov( , ) X Y , D X Y ( ) + = + D X D Y ( ) ( ) + − − 2 [ ( )][ ( )] E X E X Y E Y Covariance 即 Cov( , ) ( ) ( ) X Y E X E X Y E Y = − − 计算公式: Cov , ( X Y E XY E X E Y ) = − ( ) ( ) (1 Cov , Cov , ) (aX bY ab X Y ) = ( ) (2) Cov , Cov , Cov , ( X X Y X Y X Y 1 2 1 2 + = + ) ( ) ( )
二、相关系数的定义和性质 1.定义量 Cov(X,Y) 称为随机变量X与Y的相关系数, VD(X)·VDY) 记作Px, 即 Cov(X,Y) Pw-√DXDY) →Cov(X,Y)=PrVD(X)VD(Y)
二、相关系数的定义和性质 Cov( , ) ( ) ( ) = X Y D X D Y XY 即 Cov( , ) ( ) ( ) XY X Y ρ D X D Y = Cov( , ) 1. ( ) ( ) X Y X Y D X D Y 定义 量 称为随机变量 与 的相关系数, XY 记作ρ
2。相关系数的两条性质及含义: 以线性函数α+bX近似表示Y,衡量近似程度 用均方误差:e=E[y-(u+bX]}的大小衡量. 问题:求,b,使e达到最小. e=E[Y-(a+bX)J] =E(Y2)+B2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y), ae=2a+2bE(X)-2EY)=0, 令 B e=2bE(x')-2E(XY)+2E(X)=0 La 好将&-Em-B0袋,4-“0” D(X)
2 2 2 2 = + + − + − E Y b E X a bE XY abE X aE Y ( ) ( ) 2 ( ) 2 ( ) 2 ( ), 2 2 2 ( ) 2 ( ) 0, 2 ( ) 2 ( ) 2 ( ) 0. e a bE X E Y a e bE X E XY aE X b = + − = = − + = 令 解得 0 Cov( , ) . ( ) X Y b D X 0 = Cov( , ) ( ) ( ) ( ) X Y a E Y E X D X = − , 2 e E Y a bX = − + ( ) 以线性函数 a bX Y + 近似表示 ,衡量近似程度. 2 ——用均方误差: e E Y a bX = − + ( ) 的大小衡量. 2. 相关系数的两条性质及含义: 问题:求a b e , ,使 达到最小