第十三章 回归与相关 第一节直线相关 一、直线相关的概念 直线相关(linear correlation)是描述两个变 量间互依关系的一种统计分析方法。此法又称简 单相关(simple correlation)。此法通过直线相关 系数(linear correlation coefficient)描述两个变量 直线关系的大小和方向。此法要求两个变量服从 双变量正态分布。 吉林大学远程教育学院
2 吉林大学远程教育学院 第十三章 回归与相关 第二节 直线相关 一、直线相关的概念 直线相关(linear correlation)是描述两个变 量间互依关系的一种统计分析方法。此法又称简 单相关(simple correlation)。此法通过直线相关 系数(linear correlation coefficient)描述两个变量 直线关系的大小和方向。此法要求两个变量服从 双变量正态分布
相关系数又称积差相关系数,也称Pearson相 关系数,用r表示。它是说明具有直线送系的两个 变量间相关关系的密切程度和相关方向的指标。 用r的大小表示密切程度,用的正负表示相关方 向。其计算公式为: ∑(X-XY-T) 公式(13.8) V∑(x-)∑(Y-7)2V1xn 相关系数无单位,其取值范围为-1≤≤1。r 值为正表示正相关,为负表示负相关,为零表示 零相关。r-1为完全正相关,r=-1为完全负 吉林大学远程教育学院
3 吉林大学远程教育学院 相关系数又称积差相关系数,也称Pearson相 关系数,用r 表示。它是说明具有直线关系的两个 变量间,相关关系的密切程度和相关方向的指标。 用r 的大小表示密切程度,用r 的正负表示相关方 向。其计算公式为: X X YY X Y l l l X X Y Y X X Y Y r = − − − − = 2 2 ( ) ( ) ( )( ) 公式(13.8) 相关系数无单位,其取值范围为-1≤r≤1。r 值为正表示正相关,为负表示负相关,为零表示 零相关。r = 1为完全正相关,r = -1为完全负
相关。相关系数r的直观含义见下图13-7a、图13 7b。 二、相关系数的计算 例13,4根据例13.1妇女年龄与收缩压的数据计算二者的相 关系数。 1.先根据原始数据绘制散点图,大致判断两变 量之间是否有直线趋势。 本例的散点图见图131,可见年龄与收缩压呈 直线趋势,故可进行直线相关分析。 吉林大学远程教育学院
4 吉林大学远程教育学院 相关。相关系数r 的直观含义见下图13-7a、图13- 7b 。 二、相关系数的计算 例13.4 根据例13.1妇女年龄与收缩压的数据计算二者的相 关系数。 1. 先根据原始数据绘制散点图,大致判断两变 量之间是否有直线趋势。 本例的散点图见图13-1,可见年龄与收缩压呈 直线趋势,故可进行直线相关分析
2.计算相关系数。由前面计算可知: Ix1550.7,1yy=44.04,1广233.7,代入公式13.8) 得相关系数为: 233.7 =0.8943 J1550.7×44.04 三、相关系数的假设检验 前面所求相关系数,是样本相关系数,它实为 总体相关系数p的估计值。我们知道即使X、的 总体相关系数为零,由于抽样误差的存在,样 吉林大学远程教育学院
5 吉林大学远程教育学院 2. 计算相关系数。由前面计算可知: lXX=1550.7,lYY=44.04,lXY=233.7,代入公式(13.8) 得相关系数为: 0.8943 1550.7 44.04 233.7 = = = X X YY X Y l l l r 三、相关系数的假设检验 前面所求相关系数r 是样本相关系数,它实为 总体相关系数ρ 的估计值。我们知道即使X、Y的 总体相关系数ρ为零,由于抽样误差的存在,样
本相关系数,也不一定为零。因此需要对相关系数 r进行假设检验,以此推断X、是否存在直线相关 关系。常用检验,其检验统计量公式如下: r-0 (n-2)r2 S I-r 1- 公式(13.9) n-2 式中S,为样本相关系数的标准误,自由度V=n-2。 例13.5就例13.4求得的r值,检验妇女年龄与收缩压间是 否存在直线相关关系。 吉林大学远程教育学院
6 吉林大学远程教育学院 本相关系数r 也不一定为零。因此需要对相关系数 r 进行假设检验,以此推断X、Y是否存在直线相关 关系。常用t 检验,其检验统计量公式如下: 2 2 2 1 ( 2) 2 1 0 r n r n r r S r t r − − = − − = − = 公式(13.9) 式中Sr 为样本相关系数的标准误,自由度ν=n-2。 例13.5 就例13.4求得的r 值,检验妇女年龄与收缩压间是 否存在直线相关关系