非常不满意 不满意 口满意 非常满意 图29 环形图 5.线图(Line)。线图是在平面坐标上用折线表现数量变化特征和规律的图形。主要用于显 示连续型变量的次数分布和现象的动态变化。例如,根据表2—7资料绘制成的乙城市家庭对住 房状况的评价线图,如图2.10a)、(b)所示 向上累积户数(户) 户数(户) 3 非常不满意不满意一般满意 非常满意 图2.10(a)乙城市向上累积频数分布图 向下累积户数(户) 300-279 200 180 一户数(户) 4 非常不满意不满意一般满意 非常满意 2.10(b)乙城市向上累计频教分布图 6.散点图( Scatter)。主要用来观察变量间的相关关系,也可显示数量随时间的变化情况 如图2.11所示
26 图 2.9 环形图 5.线图(Line)。线图是在平面坐标上用折线表现数量变化特征和规律的图形。主要用于显 示连续型变量的次数分布和现象的动态变化。例如,根据表2—7资料绘制成的乙城市家庭对住 房状况的评价线图,如图 2.10(a)、(b)所示。 图 2.10(a) 乙城市向上累积频数分布图 2.10(b) 乙城市向上累计频数分布图 6.散点图(Scatter)。主要用来观察变量间的相关关系,也可显示数量随时间的变化情况。 如图 2.11 所示。 向上累积户数(户) 21 120 198 262 300 0 100 200 300 400 1 2 3 4 5 非常不满意 不满意 一般 满意 非常满意 累计户数(户) 户数(户) 8 % 36% 31% 15% 10% 7 % 33% 26% 21% 13% 非常不满意 不满意 一般 满意 非常满意 向下累积户数(户) 300 279 180 102 38 0 200 400 1 2 3 4 5 非常不满意 不满意 一般 满意 非常满意 累积户数(户 户数(户)
50 加牌 今◆° ◆系列 20 50 国内生产总值 图2.11散点图 本章难点 1、抽样调查、重点调查与典型调查的比较: 2、统计调查方案的设计 3、调查对象、调查单位、报告单位的内涵 4、变量数列的内涵与外延; 5、统计分组的方法与技巧 6、各种统计图的灵活应用。 复习思考题 统计数据的来源渠道有哪些? 2、统计数据搜集方案包括哪几项内容? 3、简要解释调査对象、调查单位与报告单位的含义及它们之间的联系。 4、比较三种非全面调查的特点及应用场合 5、何谓统计分组?统计分组应遵循的基本原则是什么? 6、说明组距、组限、组数、全距与组中值的含义及其它们的计算方法。 7、统计整理及其意义 8、品质型数据的显示方法主要有哪些? 9、数值型数据的显示方法主要有哪些? 10、论述统计整理的完整过程。 第三章数据分布特征的描述 (-)教学目的 通过本章的学习,使同学们正确理解各种指标的概念及计算方法,学会运用相应的统计指 标对数据的分布特征进行分析说明 (二)基本要求 使学生熟练掌握数据分布特征的描述方法 三)教学要点 1、集中趋势的测度指标及其计算方法 2、离散趋势的测度指标及其计算方法 3、总体分布的偏度与峰度的测度。 四)教学时数 9—-10课时 五)学习内容 本章共分三节:
27 0 10 20 30 40 50 60 0 10 20 30 40 50 60 70 80 国内生产总值 货运周转量 系列1 图 2.11 散点图 本章难点 1、抽样调查、重点调查与典型调查的比较; 2、统计调查方案的设计; 3、调查对象、调查单位、报告单位的内涵; 4、变量数列的内涵与外延; 5、统计分组的方法与技巧; 6、各种统计图的灵活应用。 复习思考题 1、统计数据的来源渠道有哪些? 2、统计数据搜集方案包括哪几项内容? 3、简要解释调查对象、调查单位与报告单位的含义及它们之间的联系。 4、比较三种非全面调查的特点及应用场合。 5、何谓统计分组?统计分组应遵循的基本原则是什么? 6、说明组距、组限、组数、全距与组中值的含义及其它们的计算方法。 7、统计整理及其意义。 8、品质型数据的显示方法主要有哪些? 9、数值型数据的显示方法主要有哪些? 10、论述统计整理的完整过程。 第三章 数据分布特征的描述 (一)教学目的 通过本章的学习,使同学们正确理解各种指标的概念及计算方法,学会运用相应的统计指 标对数据的分布特征进行分析说明。 (二)基本要求 使学生熟练掌握数据分布特征的描述方法。 (三)教学要点 1、集中趋势的测度指标及其计算方法; 2、离散趋势的测度指标及其计算方法; 3、总体分布的偏度与峰度的测度。 (四)教学时数 9——10 课时 (五)学习内容 本章共分三节:
第一节数据分布集中趋势的测定 定类数据集中趋势的测度—众数 Mode (一)概念要点 众数是指一组数据中出现次数最多的变量值,用表示。从变量分布的角度看,众数是 具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数 据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,也就有多 个众数 1.集中趋势的测度值之 2.出现次数最多的变量值 3.不受极端值的影响 4.可能没有众数或有几个众数 5.主要用于定类数据,也可用于定序数据和数值型数据 众数的不唯一性 无众数原始数据: 10591268 个众数原始数据 659855 多于一个众数原始数据 252828364242 (二)众数的计算 根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即 为众数。对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可 作如下的理解 设众数组的频数为fm,众数前一组的频数为f1,众数后一组的频数为f1°当众数相邻 两组的频数相等时,即∫21=f1,众数组的组中值即为众数:当众数组的前一组的频数多于众 数组后一组的频数时,即f1>f1,则众数会向其前一组靠,众数小于其组中值;当众数组后 组的频数多于众数组前一组的频数时,即f1≤f1,则众数会向其后一组靠,众数大于其组 中值。基于这种思路,借助于几何图形而导出的分组数据众数的计算公式如下 下限公式 M=l+ xd=L+-×d (m-f+() 上限公式 M=U d=U--2×d fm -f)+(m-f (3.2) 式中:L表示众数所在组的下限 U表示众数所在组的上限 d表示众数所在组的组距。 [例3.1]现利用表3.1-1资料计算3000户农民家庭年人均收入的众数
28 第一节 数据分布集中趋势的测定 一、定类数据集中趋势的测度——众数(Mode) (一) 概念要点 众数是指一组数据中出现次数最多的变量值,用 M o 表示。从变量分布的角度看,众数是 具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数 据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,也就有多 个众数。 1.集中趋势的测度值之一 2.出现次数最多的变量值 3.不受极端值的影响 4.可能没有众数或有几个众数 5.主要用于定类数据,也可用于定序数据和数值型数据 众数的不唯一性: 无众数原始数据: 10 5 9 12 6 8 一个众数原始数据: 6 5 9 8 5 5 多于一个众数原始数据: 25 28 28 36 42 42 (二)众数的计算 根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即 为众数。对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可 作如下的理解: 设众数组的频数为 m f ,众数前一组的频数为 −1 f ,众数后一组的频数为 +1 f 。当众数相邻 两组的频数相等时,即 −1 f = +1 f ,众数组的组中值即为众数;当众数组的前一组的频数多于众 数组后一组的频数时,即 −1 f > +1 f ,则众数会向其前一组靠,众数小于其组中值;当众数组后 一组的频数多于众数组前一组的频数时,即 −1 f < +1 f ,则众数会向其后一组靠,众数大于其组 中值。基于这种思路,借助于几何图形而导出的分组数据众数的计算公式如下: 下限公式: 1 1 1 1 1 2 ( ) ( ) m o m m f f M L d L d f f f f − − + − = + = + − + − + (3.1) 上限公式: 1 2 1 1 1 2 ( ) ( ) m o m m f f M U d U d f f f f + − + − = − = − − + − + (3.2) 式中: L 表示众数所在组的下限; U 表示众数所在组的上限; d 表示众数所在组的组距。 [例 3.1] 现利用表 3.1—1 资料计算 3000 户农民家庭年人均收入的众数
表3.1 某地区农民家庭收入资料 按午人均收入分组(元)农民家庭费(户)「向上系计频数向下系计频 S 1000~1200 240 2345678901 1200~1400 480 720 2760 1400~1600 105o l770 1600~1800 1230 1800~2000 2000~2200 2970 2400~2600 从表3.1中的数据可以看出,出现频数最多的是1050,即众数组为14001600这一组 fm=1050,f21=480,f1=60根据(3.1)式可得众数为 1050-480 M=1400+ (1050-480)+(1050-600) =1511.8(元) 利用上述公式计算众数时是假定数据分布具有明显的集中趋势,且众数组的频数在该组内 是均匀分布的,若这些假定不成立,则众数的代表性就会很差。从众数的计算公式可以看出 众数是根据众数组及相邻组的频率分布信息来确定数据中心点位置的,因此,众数是一个位置 代表值,它不受数据中极端值的影响。 定序数据集中趋势的测度—中位数和分位数 (一)概念要点 中位数是将总体各单位标志值按大小顺序排列后,处于中间位置的那个数值 1.集中趋势的测度值之 2.排序后处于中间位置上的值 3.不受极端值的影响 4.主要用于定序数据,也可用数值型数据,但不能用于定类数据 5.各变量值与中位数的离差绝对值之和最小,即 X;=Mn|≡min (二)中位数的计算 根据未分组资料和分组资料都可确定中位数。有三种情况: 1.对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为 x1≤x≤x3≤…≤x 则中位数就可以按下面的方式确定
29 表 3. 1 某地区农民家庭收入资料 从表 3.1 中的数据可以看出,出现频数最多的是 1050,即众数组为 1400—1600 这一组 m f =1050, −1 f =480, +1 f =600,根据(3.1)式可得众数为: 1050 480 1400 200 (1050 480) (1050 600) M o − = + − + − =1511.8(元) 利用上述公式计算众数时是假定数据分布具有明显的集中趋势,且众数组的频数在该组内 是均匀分布的,若这些假定不成立,则众数的代表性就会很差。从众数的计算公式可以看出, 众数是根据众数组及相邻组的频率分布信息来确定数据中心点位置的,因此,众数是一个位置 代表值,它不受数据中极端值的影响。 二、定序数据集中趋势的测度——中位数和分位数 (一)概念要点 中位数是将总体各单位标志值按大小顺序排列后,处于中间位置的那个数值。 1.集中趋势的测度值之一 2.排序后处于中间位置上的值 3.不受极端值的影响 4.主要用于定序数据,也可用数值型数据,但不能用于定类数据 5.各变量值与中位数的离差绝对值之和最小,即 (3.3) (二)中位数的计算 根据未分组资料和分组资料都可确定中位数。有三种情况: 1.对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为: 1 2 3 n x x x x 则中位数就可以按下面的方式确定: min 1 − = = n i Xi M e min 1 − = = n i Xi M e
Me=x1,当n为奇数(3.4) x+x Me)2-,当n为偶数(.5) 2.对于单项式变量数列资料,由于变量值以及序列化,故中位数可以直接按下面的方式确 x2A,当Σ∫为奇数(3.6) Me= 2,当x厂为偶数67 3.对于组距式变量数列,确定中位数也需要分两步进行 (1)从变量数列的累计频数栏中找出第∑∫个单位所在的组,即“中位数组”,该组的 上、下限就规定了中位数的可能取值范围 2)假定在中位数组内的各单位是均匀分布的,就可利用下面的公式计算中位数的近似值: Me-I Me=lt Me Me+l 上面两式分别称作中位数的“下限公式”。式中,S_1是到中位数组前面一组为止 的向上累计频数,SMe+1则是到中位数组后面一组为止的向下累计频数 Me为中位数组的组距。 (三)分倣数 中位数是从中间点将全部数据等分为两部分。与中位数类似的还有四分位数( quartile)
30 Me= 1 2 x n+ ,当 n 为奇数 (3.4) Me= 1 2 2 2 x x n n + + ,当 n 为偶数 (3.5) 2.对于单项式变量数列资料,由于变量值以及序列化,故中位数可以直接按下面的方式确 定: 1 2 x f + ,当 f 为奇数 (3.6) Me= 1 2 2 2 x x f f + + ,当 f 为偶数 (3.7) 3.对于组距式变量数列,确定中位数也需要分两步进行: (1)从变量数列的累计频数栏中找出第 2 f 个单位所在的组,即“中位数组”,该组的 上、下限就规定了中位数的可能取值范围; (2)假定在中位数组内的各单位是均匀分布的,就可利用下面的公式计算中位数的近似值: 1 2 Me Me Me Me f s Me L d f − − = + (3.8) 1 2 Me Me Me Me f s U d f + − = − (3.9) 上面两式分别称作中位数的“下限公式”。式中, Me 1 s − 是到中位数组前面一组为止 的向上累计频数, Me 1 s + 则是到中位数组后面一组为止的向下累计频数; Me d =UMe − LMe 为中位数组的组距。 (三)分位数 中位数是从中间点将全部数据等分为两部分。与中位数类似的还有四分位数(quartile)