§9相关分析与回归分析
§9 相关分析与回归分析
相关分析与回归分析是以概率论与数理统计为基础 迅速发展起来的应用性较强的科学方法,是现代应用统计 学的重要分支,是研究事物间量变规律的科学方法。回归 分析着重在寻找变量之间近似的函数关系,相关分析则不 着重这种关系而致力于寻找一些数量指标,以刻划有关变 量之间关系深浅的程度 变量之间的关系可分为确定性关系和非确定性关系两 类。确定性关系是指非随机变量之间的函数关系,非确定 性关系指随机变量之间或非随机变量与随机变量之间的 统计关系。统计关系包含相关关系和回归关系 统计关系是一种经验关系,并不一定包含着因果关系 有时尽管两个变量之间的统计关系非常密切而且很有启 发性,但决不能确定其间的因果联系,对于因果关系的设想 只能来自统计之外,归根到底是来自某种理论或其它方面
相关分析与回归分析是以概率论与数理统计为基础 迅速发展起来的应用性较强的科学方法, 是现代应用统计 学的重要分支,是研究事物间量变规律的科学方法。回归 分析着重在寻找变量之间近似的函数关系,相关分析则不 着重这种关系,而致力于寻找一些数量指标,以刻划有关变 量之间关系深浅的程度 . 变量之间的关系可分为确定性关系和非确定性关系两 类。确定性关系是指非随机变量之间的函数关系,非确定 性关系指随机变量之间或非随机变量与随机变量之间的 统计关系。统计关系包含相关关系和回归关系。 统计关系是一种经验关系,并不一定包含着因果关系, 有时尽管两个变量之间的统计关系非常密切而且很有启 发性,但决不能确定其间的因果联系,对于因果关系的设想 只能来自统计之外,归根到底是来自某种理论或其它方面
§91相关分析 本节要求掌握相关的概念,样本相关系数的计算及相 关性的检验。 、相关的概念 两个随机变量间的关系与函数关系不同。函数关系是 当变量X取定值x后变量Y一定有唯一确定的值y与之对应。 例如变量x、y都是非随机变量,设y=sin,则当x=π/2, 定取值1。然而,对随机变量X取定值x后,随机变量Y并 没有唯一确定的值与之对应,反之如此。 比如,人的身高与体重是两个随机变量,高度相同的人, 体重可以不尽相同;体重相同的人,其高度也不尽相同。但 般地讲身材较高的人,其体重相应较重;身材较矮的人 则体重较轻。身高与体重这类随机变量间的关系我们称 为相关关系
§9.1 相关分析 本节要求掌握相关的概念,样本相关系数的计算及相 关性的检验。 一、相关的概念 两个随机变量间的关系与函数关系不同。函数关系是 当变量X取定值x后,变量Y一定有唯一确定的值y与之对应。 例如变量x、y都是非随机变量,设y=sinx,则当x=π/2,y 一定取值1。然而,对随机变量X取定值x后,随机变量Y并 没有唯一确定的值与之对应,反之如此。 比如,人的身高与体重是两个随机变量,高度相同的人, 体重可以不尽相同;体重相同的人,其高度也不尽相同。但 一般地讲,身材较高的人,其体重相应较重;身材较矮的人 则体重较轻。身高与体重这类随机变量间的关系,我们称 为相关关系
当总体分布为正态时,相关系数确实是变量之间的相关 性的合理指标,而在非正态情况则只是线性相关程度的 度量。 两个随机变量X和Y之间的相关性,可由其总体相关系 数(或称 Pearson相关系数亦称完全相关系数描述: coV(A,Y ELCX-E(XDOY-E() =axan√x-E(X)Ey=C 其中cow(X,Y)为X,Y的协方差,2=EX-E(X 与G2=E[Y-E(Y)2分别为X和Y的方差
当总体分布为正态时,相关系数确实是变量之间的相关 性的合理指标,而在非正态情况则只是线性相关程度的 度量。 两个随机变量X和Y之间的相关性,可由其总体相关系 数(或称Pearson相关系数,亦称完全相关系数)描述: 其中cov(X,Y)为X,Y的协方差, 与 分别为X和Y的方差。 2 2 [ ( )] [ ( )] cov( , ) [( ( ))( ( ))] E X E X E Y E Y X Y E X E X Y E Y X Y X Y − − − − = = 2 2 E[X E(X)] X = − 2 2 E[Y E(Y)] Y = −
相关系数px是介于1和1之间的值不受X,Y的量纲影响 当pxy>0,X与Y呈正相关; 当xy<0,X与Y呈负相关; 当pxy=0,X与Y呈零相关,即X与Y之间不存在线 性关系。 相关系数的大小反映的是两个变量间线性相关的程度 线性相关系数具有如下性质: (1)坐标平移不改变X与Y的相关系数值,即 ab>0 plak +cbr+d XY (ab≠0) rr ab<0 (2)当Y为随机变量X的任一线性函数时,则x=士1,即 0 p(X,ax +6)= 1a<0
相关系数ρXY是介于–1和1之间的值,不受X,Y的量纲影响. 当ρXY >0 ,X与Y呈正相关; 当ρXY <0,X与Y呈负相关; 当 ρXY =0,X与Y呈零相关,即X与Y之间不存在线 性关系。 相关系数的大小反映的是两个变量间线性相关的程度。 线性相关系数具有如下性质: (1)坐标平移不改变X与Y的相关系数值,即 (2) 当Y为随机变量X的任一线性函数时,则ρXY =±1,即 ( 0) 0 0 ( , ) − + + = ab ab ab aX c bY d XY XY − + = 1 0 1 0 ( , ) a a X aX b