@ 主要内容 掌粗关系的含义、计算方法和应用 第九讲 一元性回归的基本和伊的最小二鼎估方法 回归与相关分析 利用回归方选行 Regression Correlation Analysis 掌温多元能性回归分析的实方法 照什么是相关分析 简甚本概念 是对两个变间的关联〔联系)看度的度量 散点臣 ·相关系数计算公式 相关 ·正相关、负相关、不相关 由于变量的调测量等級不同,相关系数的计算方法也不同 ·相关分析与回归分析 ·决定系败 两个定距变量间的相关系:筒单积距 两个定序变量间的相关系放 邮级〔映)相关 散点图·正相关 篇散点图-负相关
1 Journalism & Communication School 新闻传播学院 回归与相关分析 Regression & Correlation Analysis 第九讲 主讲教师:沈浩 北京广播学院新闻传播学院 副教授 北京广播学院调查统计研究所 副所长 新闻传播学院 2 • 掌握相关系数的含义、计算方法和应用 • 掌握一元线性回归的基本原理和参数的最小二乘估计方法 • 掌握回归方程的显著性检验 • 利用回归方程进行预测 • 掌握多元线性回归分析的基本方法 • 回归诊断和哑变量回归分析 • 用SPSS进行回归分析 主要内容 新闻传播学院 3 什么是相关分析 是对两个变量间的关联(联系)程度的度量 相关系数 由于变量的测量等级不同,相关系数的计算方法也不同。 例如: 两个定距变量间的相关系数:简单积距/person相关系数 两个定序变量间的相关系数:Spearman等级(秩)相关系数 新闻传播学院 4 基本概念 • 散点图 • 相关系数计算公式 • 正相关、负相关、不相关 • 相关分析与回归分析 • 决定系数 • 假设检验-总体相关系数 新闻传播学院 5 ● ● ● ● ● ● ● ● ● ● ● 散点图 - 正相关 X Y 新闻传播学院 6 ● ● ● ● ● ● ● ● ● ● ● 散点图 - 负相关 X Y
散点图-不相关 散点图-不相关 如何度量这种变量之间的关系 简函数关系 在社金现象中,变量之间的关系大数可分为两种 画:查量之网故限一定的画形式形成的一对应关系 变和之有在画美系 且指定,就是唯一定的 函数关系 统计关系 例:aAt 统计关系 线性相关 变量间的直旗美系是变量间联系中录简单岭一种,相美系 两个变量之间存在某种依存关系,但变量Y并不是由 述变量同缄性联系度的 变量X唯一确定的,它们之间没有严格的一对应关 两个变量之间存在最性关系 系,统计上称为相关关系 最性相关 例:数入与禽品的支出的关系 适当的变量变换 谮文成绩与学成的关系 两个变量之闻着存在非能性关系
2 新闻传播学院 7 X Y ● ● ● ● ● ● ● ● ● ● ● 散点图 - 不相关 新闻传播学院 8 ● ● ● ● ● ● ● ● ● ● ● 散点图 - 不相关 ● ● ● ● ● ● ● ● ● ● ● X Y 新闻传播学院 9 如何度量这种变量之间的关系 在社会现象中,变量之间的关系大致可分为两种 函数关系 统计关系 确定的 随机的 新闻传播学院 10 y y y y y y y y y x y 函数关系 函数:变量之间按照一定的函数形式形成的一一对应关系。 变量X和Y之间存在函数关系时: X值一旦被指定,Y值就是唯一确定的 例:Y=10+1.6X Y=SinX Y=X2 Y=1/X Y=1/X Y=ex Y=LnX 新闻传播学院 11 统计关系 两个变量之间存在某种依存关系,但变量Y并不是由 变量X唯一确定的, 它们之间没有严格的一一对应关 系,统计上称为相关关系。 例:收入与食品的消费支出的关系 语文成绩与数学成绩的关系 y y y y y y y y y x y 新闻传播学院 12 线性相关 两个变量之间存在线性关系 线性相关 两个变量之间若存在非线性关系 曲线相关 适当的变量变换 变量间的直线关系是变量间联系中最简单的一种,相关系数就是 描述变量间线性联系程度的度量
相关关系的类型 简单积矩/相关系数 相关关系 度量两个定距测量尺度变量之间的线性关系 样本相关系r 线性相关非线性相关完全相关 正负 正负 体相关系数 样本相关系数r 简相关关系的测度 (相关系数取值及其意义) ∑(x-X0Y-1 ∑(X-x)>-Y) 盒负相美 完金正相美 1≤r≤ +0.5 +1.0 r=0不相关 p>0正相关正相关 r<0负相关弱负相关 篇样本相关系数r的直观意义 相关系数r的直观意义 ∑s的正和负表现了xy>0 y<0 X和没有幼性系时,测点均匀地布在四个象限∑x9=0
3 新闻传播学院 13 相关关系的类型 相关关系 线性相关 非线性相关 正 相 关 正 相 关 负 相 关 负 相 关 完全相关 不相关 新闻传播学院 14 简单积矩/Person相关系数 样本相关系数 r 度量两个定距测量尺度变量之间的线性关系 总体相关系数 ρ 检验 新闻传播学院 15 ∑ ∑ ∑ − − − − ≡ 2 2 ( ) ( ) ( )( ) X X Y Y X X Y Y r 样本相关系数 r -1≤r≤1 r=0 不相关 r>0 正相关 强/弱正相关 r<0 负相关 强/弱负相关 新闻传播学院 16 相关关系的测度 (相关系数取值及其意义) -1.0 -0.5 0 +0.5 +1.0 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 新闻传播学院 17 样本相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● x y Ⅱ Ⅰ Ⅲ Ⅳ xy>0 xy<0 xy>0 xy<0 ∑xy的正和负表现了 X和Y相关的正和负 X和Y没有线性联系时,观测点均匀地散布在四个象限,∑ xy=0 ∑xy= ∑(x-X)(y-Y) 新闻传播学院 18 相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● X Y ● ● ● ● r=0.6 ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ● ● ● ● ● ●
相关系数r的直观意义 相关系数r的直观意义 线性相关一函数关系 篇相关系数r的直观意义 相关系数r的直观意义 r=-0.8 强负相关 相关系数r的直观意义 注意极端情况下的相关 不相关 0.8 异常强相关 相关系数:仅是线性美系的一科度量 不相类并不意味着没有美系
4 新闻传播学院 19 相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● X Y r=1.0 线性相关—函数关系 新闻传播学院 20 相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● X Y r= -1.0 新闻传播学院 21 相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● X Y ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● r = -0.8 强负相关 新闻传播学院 22 相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● X Y ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ● ● r=0 新闻传播学院 23 相关系数 r 的直观意义 ● ● ● ● ● ● ● ● ● ● ● X Y r= 0 ●● ● 不相关 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 相关系数 r 仅是线性关系的一种度量, 不相关并不意味着没有关系。 新闻传播学院 24 注意极端情况下的相关 ● ● ● ● X Y ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● r = 0.8 异常强相关
相关关系的图示 总体相关系数p的检验 本相关系数 总体相关系数 p—(置信区间) 光全正性相关 完全负性精关 非性福关 原假设Hux (X和Y之间没有线性关系 正注相类 负性相快 利用t值检验 总体相关系数的值检验的步骤 加果总体相关系数p=0,样本相关系敷r的抽样 介布随着n的增大来接近子服从于自由度为a2 1.陈述原假设H:p=0〔X和Y没有性相关关系) 的t分布 2.计算t统计量 比较p值<0.05(95%儐度 t(n-2)= 5.对原假设做出判断—拒绝或接受 假相关/共变关系 其它相关系数 教师的工资收入饮料的消量 不同级别的变量要用不同类型的相关系数 各种相关系数的使用范围及计算公式 要儿的身高 时 小树的高度 解释相关系数的意义时一定慎,丁有实际意叉
5 新闻传播学院 25 相关关系的图示 y y y y y y y y y y y y 不相关 y y y y y y y y y 负线性相关 y y y y y y y y y 正线性相关 y y y y y y y y y y y y 非线性相关 y y y y y y y 完全正线性相关 完全负线性相关 y y y y y y y y y 新闻传播学院 26 总体相关系数ρ的检验 样本相关系数 总体相关系数 假设检验 原假设H0:ρ=0 (X和Y之间没有线性关系) r ρ (置信区间) 新闻传播学院 27 利用t 值检验 如果总体相关系数ρ=0,样本相关系数 r 的抽样 分布随着 n 的增大越来越接近于服从于自由度为 n-2 的 t 分布 2 1 ( 2 ) 2 − − − = n r r t n 新闻传播学院 28 总体相关系数的t 值检验的步骤 1. 陈述原假设H0:ρ=0(X和Y没有线性相关关系) 2. 计算 t 统计量 3. 求得 t 的概值 4. 比较p值<0.05 (95%置信度) 5. 对原假设做出判断——拒绝或接受 新闻传播学院 29 假相关/共变关系 教师的工资收入——饮料的消费量 婴儿的身高 时 间 小树的高度 解释相关系数的意义时一定要慎重,要有实际意义。 新闻传播学院 30 各种相关系数的使用范围及计算公式 不同级别的变量要用不同类型的相关系数 其它相关系数