、相关关系分析的主要内容(任务) 相关关系分析的目的在于研究现象之间相互依存关系的形式及密切程度 并用一定的数学形式把这种关系反映出来,为统计估算和预测提供重要的依据和 方法。具体包括: (一)确定经济现象之间是否存在相关关系及相关关系的种类。经济现象间 有无相关关系是能否运用相关关系分析法的前提。确定经济现象之间有无相关关 系的方法有两种:一是作定性判断,它是从经济现象之间的本质联系着手,根据 有关的理论及实践经验进行分析研究来判断的;二是绘制相关图表 (二)确定经济现象之间相关关系的密切程度 当经济现象之间存在相关关系时,就要测定它们之间关系的密切程度,为进 步分析研究问题提供依据。 确定现象之间相关关系密切程度的方法是:绘制相关图和计算相关系数。相 关图对相关关系的密切程度可以得出粗略的判断,而相关系数能从数量上对经济 现象之间的相关程度做出明确的反映 (三)建立经济现象之间数量变动关系的数学方程式(确定相关关系的数学 表达式) 为了测定现象之间数量变化上的一般关系,必须使用函数关系的数学公式作 为相关关系的数学表达式,称为回归方程,用以说明自变量发生变动时,因变量 平均来说会发生多大的变化。 (四)确定因变量估计值误差的程度 根据变量之间变动关系的数学方程式可以计算出各个因变量的估计值,这 些估计值与实际值之间肯定有差异,差异小,表示推算结果的准确度高;差异大, 准确度低。而准确度的高低又关系到回归方程的实用价值。所以相关分析还要测 定因变量估计值和实际值之间差异的大小,用以反映因变量估计值的准确程度。 这种用来反映因变量估计值准确程度的指标叫估计标准误差。 第二节简单直线相关分析 是否存在相关关系 简单直线相关分析内容 相关关系的种类 相关关系的密切程度
6 三、相关关系分析的主要内容(任务) 相关关系分析的目的在于研究现象之间相互依存关系的形式及密切程度, 并用一定的数学形式把这种关系反映出来,为统计估算和预测提供重要的依据和 方法 。具体包括: (一)确定经济现象之间是否存在相关关系及相关关系的种类。经济现象间 有无相关关系是能否运用相关关系分析法的前提。确定经济现象之间有无相关关 系的方法有两种:一是作定性判断,它是从经济现象之间的本质联系着手,根据 有关的理论及实践经验进行分析研究来判断的;二是绘制相关图表。 (二)确定经济现象之间相关关系的密切程度 当经济现象之间存在相关关系时,就要测定它们之间关系的密切程度,为进 一步分析研究问题提供依据。 确定现象之间相关关系密切程度的方法是:绘制相关图和计算相关系数。相 关图对相关关系的密切程度可以得出粗略的判断,而相关系数能从数量上对经济 现象之间的相关程度做出明确的反映。 (三)建立经济现象之间数量变动关系的数学方程式(确定相关关系的数学 表达式) 为了测定现象之间数量变化上的一般关系,必须使用函数关系的数学公式作 为相关关系的数学表达式,称为回归方程,用以说明自变量发生变动时,因变量 平均来说会发生多大的变化。 (四)确定因变量估计值误差的程度 根据变量之间变动关系的数学方程式可以计算出各个因变量的估计值,这 些估计值与实际值之间肯定有差异,差异小,表示推算结果的准确度高;差异大, 准确度低。而准确度的高低又关系到回归方程的实用价值。所以相关分析还要测 定因变量估计值和实际值之间差异的大小,用以反映因变量估计值的准确程度。 这种用来反映因变量估计值准确程度的指标叫估计标准误差。 第二节 简单直线相关分析 简单直线相关分析内容 是否存在相关关系 相关关系的种类 相关关系的密切程度
在进行相关分析时,首先对现象之间是否存在依存关系进行定性分析;其次 利用相关图表粗略地反映相关变量之间依存关系的形式、方向;最后计算相关系 数,准确反映相关变量之间关系的密切程度。 、相关表和相关图 (一)相关表 将相关的两个变量的对应数值按照一定的顺序或规格排列在一张表格上所 形成的统计表。 简单相关表 按照资料是否分组相关表分为 分组相关表 1简单相关表:指资料未经分组,只将一个变量的数值按照从小到大(或时 间)顺序、并配合相应的另一个变量的变量值一一对应排列起来形成的表。其步 骤是 第一、将某一变量的变量值按照一定顺序排列 第二、对应地平行列出另一变量的变量值 例1,为了研究分析机床使用年限和年维修费用之间的关系,可从抽取的12 台机床中取得12对数据,见表2-1。 从表中可以直观地看出,尽管在同样的使用年限下,年维修费用也存在着差 异。但总的来看,随着使用年限的增加,年维修费用也在不断地增加,两者之间 呈现出正相关的关系 表2-1 序号机床使用年限(年)年维修费用(元) 22344 540 520 4 640 740 8 10 556668 900 11 840 12 1080
7 在进行相关分析时,首先对现象之间是否存在依存关系进行定性分析;其次, 利用相关图表粗略地反映相关变量之间依存关系的形式、方向;最后计算相关系 数,准确反映相关变量之间关系的密切程度。 一、相关表和相关图 (一)相关表 将相关的两个变量的对应数值按照一定的顺序或规格排列在一张表格上所 形成的统计表。 按照资料是否分组相关表分为 简单相关表 分组相关表 1.简单相关表:指资料未经分组,只将一个变量的数值按照从小到大(或时 间)顺序、并配合相应的另一个变量的变量值一一对应排列起来形成的表。其步 骤是: 第一、将某一变量的变量值按照一定顺序排列 第二、对应地平行列出另一变量的变量值 例 1,为了研究分析机床使用年限和年维修费用之间的关系,可从抽取的 12 台机床中取得 12 对数据,见表 2-1。 从表中可以直观地看出,尽管在同样的使用年限下,年维修费用也存在着差 异。但总的来看,随着使用年限的增加,年维修费用也在不断地增加,两者之间 呈现出正相关的关系。 表 2-1 序 号 机床使用年限(年) 年维修费用(元) 1 2 400 2 2 540 3 3 520 4 4 640 5 4 740 6 5 600 7 5 800 8 6 700 9 6 760 10 6 900 11 8 840 12 9 1080
例2,某地职工工资总额与城镇储蓄存款余额的相关表,见表2-2。 从表中资料可以看出,随着该地职工工资总额的増加,城镇储蓄存款余额也 呈现出增加的趋势,这说明两个变量之间存在着正相关的关系。 表22 年份「职工工资总额(亿元)城镇储蓄存款余额(亿元) 2002 11.5 2003 12.2 2004 41 13.5 2006 20.3 2007 28.3 合 2分组相关表:是根据分组资料绘制的相关表。 当原始资料很多,简单相关表编制和使用起来很不方便时,这时往往对原始 资料进行分组整理,编制成分组相关表。 根据分组的情况不同,分组相关表分为单变量分组表和双变量分组表。 (1)单变量分组表:在具有相关关系的两个变量中,只对一个变量(自变 量)进行分组,并计算出每组的次数,对应的另一个变量(因变量)不分组,只 计算其平均值,这样制成的表为单变量分组相关表,见表2-3 单变量分组相关表可使资料简化,从而更清析地反映出两变量之间的相关关 系。从表2-3中可以看出,机床使用年限和年维修费用之间存在着正相关的关系。 表2-3 使用年限(年)机床数(台)。平均维修费用(元/年) 2345689 690 700 787 840 1080 12 (2)双变量分组相关表:指在具有相关关系的两个变量中,对两个变量同 时进行分组所形成的统计表。即对自变量和因变量都进行分组所编制的分组相关 表。这种表的形状类似棋盘,故又称为棋盘式相关表,其编制步骤为
8 例 2,某地职工工资总额与城镇储蓄存款余额的相关表,见表 2-2 。 从表中资料可以看出,随着该地职工工资总额的增加,城镇储蓄存款余额也 呈现出增加的趋势,这说明两个变量之间存在着正相关的关系。 表 2-2 年 份 职工工资总额(亿元) 城镇储蓄存款余额(亿元) 2002 40 11.5 2003 40 12.2 2004 41 13.5 2005 43 15.5 2006 47 20.3 2007 52 28.3 合 计 — — 2.分组相关表:是根据分组资料绘制的相关表。 当原始资料很多,简单相关表编制和使用起来很不方便时,这时往往对原始 资料进行分组整理,编制成分组相关表。 根据分组的情况不同,分组相关表分为单变量分组表和双变量分组表。 (1)单变量分组表:在具有相关关系的两个变量中,只对一个变量(自变 量)进行分组,并计算出每组的次数,对应的另一个变量(因变量)不分组,只 计算其平均值,这样制成的表为单变量分组相关表,见表 2-3 。 单变量分组相关表可使资料简化,从而更清析地反映出两变量之间的相关关 系。从表 2-3 中可以看出,机床使用年限和年维修费用之间存在着正相关的关系。 表 2-3 使用年限(年) 机床数(台) 平均维修费用(元/年) 2 2 470 3 1 520 4 2 690 5 2 700 6 3 787 8 1 840 9 1 1080 合 计 12 —— (2)双变量分组相关表:指在具有相关关系的两个变量中,对两个变量同 时进行分组所形成的统计表。即对自变量和因变量都进行分组所编制的分组相关 表。这种表的形状类似棋盘,故又称为棋盘式相关表,其编制步骤为:
①分别确定两个变量分组的组数 ②设计棋盘式表格 ③计算各组的次数并放到相对应的方格之中。 对于上例,若将机床使用年限分为7组,年维修费用也分为7组,可设计一 个7×7的棋盘式方程表,将次数置入方格之中,便形成了双变量分组相关表 一般情况下,自变量的数值放在宾词栏(上端),且数值从左到右按由小到 大的顺序排列;因变量放在表的主词栏(左端),且数值自上而下由大到小的顺 序排列;最后计算各组相对应的次数,并设计两个合计栏,分别表明各个变量分 组的次数分布情况。见表24 由表24可以看出,两个变量之间呈正相关的关系,即机床使用年限越长 年平均维修费用越多。 表2-4 年维修费用 机床使用年限(年) 合计 2345689 1000-1100 900-1000 800-900 700-800 2322 500-600 400-500 合计 2122311 12 (二)相关图 相关图又叫散点图,它是在平面坐标系中(以横轴表示自变量ⅹ,纵轴表示 因变量y),将相关表中两个变量对应值用相关点(散点、坐标点)形式描绘出 来,通过观察相关点的分布情况,大致看出两个变量之间有无相关关系及相关的 类型、密切程度。现将表2-1资料绘制成相关图如图2-1。 从图中可以看出,机床使用年限和年维修费用之间存在着比较密切的 相关关系,而且两者之间的变动趋势基本呈现直线型的
9 ①分别确定两个变量分组的组数 ②设计棋盘式表格 ③计算各组的次数并放到相对应的方格之中。 对于上例,若将机床使用年限分为 7 组,年维修费用也分为 7 组,可设计一 个 7×7 的棋盘式方程表,将次数置入方格之中,便形成了双变量分组相关表。 一般情况下,自变量的数值放在宾词栏(上端),且数值从左到右按由小到 大的顺序排列;因变量放在表的主词栏(左端),且数值自上而下由大到小的顺 序排列;最后计算各组相对应的次数,并设计两个合计栏,分别表明各个变量分 组的次数分布情况。见表 2-4。 由表 2-4 可以看出,两个变量之间呈正相关的关系,即机床使用年限越长, 年平均维修费用越多。 表 2-4 年维修费用 (元) 机床使用年限(年) 合计 2 3 4 5 6 8 9 1000-1100 1 1 900-1000 1 1 800-900 1 1 2 700-800 1 2 3 600-700 1 1 2 500-600 1 1 2 400-500 1 1 合 计 2 1 2 2 3 1 1 12 (二)相关图 相关图又叫散点图,它是在平面坐标系中(以横轴表示自变量 x,纵轴表示 因变量 y),将相关表中两个变量对应值用相关点(散点、坐标点)形式描绘出 来,通过观察相关点的分布情况,大致看出两个变量之间有无相关关系及相关的 类型、密切程度。现将表 2-1 资料绘制成相关图如图 2-1。 从图中可以看出,机床使用年限和年维修费用之间存在着比较密切的 相关关系,而且两者之间的变动趋势基本呈现直线型的
1200 1000 800 年维修费600 200 0246810 使用年限 图2-1 相关系数 (一)相关系数的概念 根据相关图和相关表可以初步判断经济现象之间有无相关关系,以及相关的 趋势和形态。但是,这种直观的判断是粗略的,为了准确反映现象之间相关关系 的密切程度,需要计算相关系数。在各种相关关系中,单相关是最基本的相关关 系,它是复相关的基础,单相关有线性相关和非线性相关两种。而简单线性相关 系数是最基本的,它是计算其它相关系数的基础。这里所说的相关系数指简单线 性相关系数 相关系数:是说明两种现象之间直线相关关系密切程度的统计分析指标。 或:在线性相关条件下,用来说明两个变量之间相关关系密切程度的统计分 析指标 (二)相关系数的一般公式及其剖析 计算相关系数的方法很多,以英国统计学家皮尔逊( Karl Pearson)的积差 法用得最为普遍,其它的如等级相关系数、点双列相关系数、Φ相关系数、偏相 关系数等都是在这个相关系数的基础上推导出来的,用以不同的场合,说明不同 的问题(后面分别介绍)。 积差法相关系数:是通过两个变量与各自平均数的离差的乘积来反映两个 变量之间相关关系的密切程度的。 其基本公式如下: 10
10 0 200 400 600 800 1000 1200 0 2 4 6 8 10 年维修费 使用年限 图 2-1 二、相关系数 (一)相关系数的概念 根据相关图和相关表可以初步判断经济现象之间有无相关关系,以及相关的 趋势和形态。但是,这种直观的判断是粗略的,为了准确反映现象之间相关关系 的密切程度,需要计算相关系数。在各种相关关系中,单相关是最基本的相关关 系,它是复相关的基础,单相关有线性相关和非线性相关两种。而简单线性相关 系数是最基本的,它是计算其它相关系数的基础。这里所说的相关系数指简单线 性相关系数。 相关系数:是说明两种现象之间直线相关关系密切程度的统计分析指标。 或:在线性相关条件下,用来说明两个变量之间相关关系密切程度的统计分 析指标。 (二)相关系数的一般公式及其剖析 计算相关系数的方法很多,以英国统计学家皮尔逊(Karl Pearson)的积差 法用得最为普遍,其它的如等级相关系数、点双列相关系数、 相关系数、偏相 关系数等都是在这个相关系数的基础上推导出来的,用以不同的场合,说明不同 的问题(后面分别介绍)。 积差法相关系数:是通过两个变量与各自平均数的离差的乘积来反映两个 变量之间相关关系的密切程度的。 其基本公式如下: