第五章分布的数值特征 本章重点 1、算术平均数的计算 2、调和平均数的计算 3、标准差和标准差系数的应用 §1平均指标 统计中的平均数是用以表明数据的集中趋势的指标。它是统计分析中最常用 的一种统计指标。世界各国,特别是欧、美的统计学家都特别重视平均数的意义 和作用。其实,统计分析中的其它分析方法,如离差、相关、回归、指数等,在 某种意义上也含有平均的性质。因此,英国统计学家鲍莱认为统计学可称为“平 均数的科学”。本节要给大家介绍算术平均数、调和平均数、几何平均数、中位 数、众数。 一、算术平均数 (一)计算公式 1、当数据没分组时,直接将各数据相加,用和除以数据个数即可。 称为简单算术平均数。 n 2、当数据分了组时,用加权算术平均数。 Ex.f. Y= 对单项式数列,直接代入即可:对组距式数列,要先求出各组组中值作为各 组的代表值,再进行计算。 例51:某企业100个职工的工资如下表,试计算该企业职工的平均工资 表5-1职工工资统计表 工资(元)x职工人数(人)f组中值x:xf 900以下 10 8958950 900-910 10 90519050 910-920 40 91536600 920-930 30 92527750 930以上 9359350
第五章 分布的数值特征 本 章 重 点 1、算术平均数的计算 2、调和平均数的计算 3、标准差和标准差系数的应用 §1 平 均 指 标 统计中的平均数是用以表明数据的集中趋势的指标。它是统计分析中最常用 的一种统计指标。世界各国,特别是欧、美的统计学家都特别重视平均数的意义 和作用。其实,统计分析中的其它分析方法,如离差、相关、回归、指数等,在 某种意义上也含有平均的性质。因此,英国统计学家鲍莱认为统计学可称为“平 均数的科学”。本节要给大家介绍算术平均数、调和平均数、几何平均数、中位 数、众数。 一、算术平均数 (一)计算公式 1、当数据没分组时,直接将各数据相加,用和除以数据个数即可。 称为简单算术平均数。 n X n i xi = = 1 2、当数据分了组时,用加权算术平均数。 X = = = n i i n i i i f x f 1 1 . . 对单项式数列,直接代入即可;对组距式数列,要先求出各组组中值作为各 组的代表值,再进行计算。 例 51: 某企业 100 个职工的工资如下表,试计算该企业职工的平均工资。 表 5-1 职工工资统计表 工资(元)x 职工人数(人)f 组中值 x xf 900 以下 10 895 8950 900-910 10 905 9050 910-920 40 915 36600 920-930 30 925 27750 930 以上 10 935 9350
解: 立xf:-9170917(元) = 100 (二)影响加权算术平均数的因素 1、看以下三例: 2 表5-2甲乙两班成绩统计表 ①例5-2: 性别平均成绩(分)X人数 甲班乙班(人) 男8075 20 女858020 得各班平均成绩: X-82分 x2=77分 结果:相酮(比重相酮,X不码,则平均数()不同。 ②例5-3: 表5-3甲乙两市场销售统计表 产品价格(元/斤) 成交量(万斤)f X 甲市场乙市场 用 12 1 1.4 丙 15 得各市场平均价格: X甲=1.375元 X2=1.325元 结果:f不同(实质是比重 不同),X相同,则平均数(灭)不同。 ③例5-4: 表5-4甲乙两组年龄统计表 性别平均年龄(岁)人数「 甲组乙组 30 615 女 20 1435 得各组的平均年龄:X甲=23岁 x2=23岁
解: X = = = n i i n i i i f x f 1 1 . . = 100 91700 =917(元) (二)影响加权算术平均数的因素 1、看以下三例: 2、 表 5-2 甲乙两班成绩统计表 ① 例 5-2: 得各班平均成绩: x甲 =82 分 x乙 =77 分 结果:f 相同(比重 f f 相同),X 不同,则平均数( X )不同。 ② 例 5-3: 表 5-3 甲乙两市场销售统计表 产品 价格(元/斤) X 成交量(万斤)f 甲市场 乙市场 甲 1.2 1 2 乙 1.4 2 1 丙 1.5 1 1 得各市场平均价格: x甲 =1.375 元 x乙 =1.325 元 结果:f 不同(实质是比重 f f 不同),X 相同,则平均数( X )不同。 ③ 例 5-4: 表 5-4 甲乙两组年龄统计表 得各组的平均年龄: x甲 =23 岁 x乙 =23 岁 性别 平均成绩(分)X 人数 甲班 乙班 (人)f 男 80 75 30 女 85 80 20 性别 平均年龄(岁) X 人数 f 甲组 乙组 男 30 6 15 女 20 14 35
结果:不同(但是比重克相同,X相同,则平约数(了)相同。 2、从以上三例可得结论:影响加权算术平均数的因素有二,即各组变量值(X) 的大小和各组权数所古比藏()的大小。 3、通过公式变形也可得到以上结论: + ∑f =2x (三)权数的选择 对绝对数求平均数时,频数一般都是权数。但对相对数求平均数时,频数不 一定是权数。见下例: 例5-5某企业25个班组按工人劳动生产率分组资料如下: 表55某企业劳动生产率统计表 工人劳动生产率(件人)生产班组数工人数 50-60 10 150 60-70 100 70-80 70 80-90 30 90以上. 16 求:这25个班组的平均劳动生产率 解:平均劳动生产率=总产量_∑ 总人数∑了 =55*150+65*100+75*70+85*30+95*16 366 =65.77(件/人) 此时,工人数为权数,而生产班组数是频数
结果:f 不同(但是比重 f f 相同),X 相同,则平均数( X )相同。 2、从以上三例可得结论:影响加权算术平均数的因素有二,即各组变量值(X) 的大小和各组权数所占比重( f f )的大小。 3、通过公式变形也可得到以上结论: X = f xf = f x f 1 1 + f x f 2 2 + . + f n x f n =x1. f f 1 +x2. f f 2 + . +xn. f f n =( . ) f f x (三)权数的选择 对绝对数求平均数时,频数一般都是权数。但对相对数求平均数时,频数不 一定是权数。见下例: 例 5-5 某企业 25 个班组按工人劳动生产率分组资料如下: 表 5-5 某企业劳动生产率统计表 工人劳动生产率(件/人) 生产班组数 工人数 50-60 10 150 60-70 7 100 70-80 5 70 80-90 2 30 90 以上 1 16 求:这 25 个班组的平均劳动生产率 解:平均劳动生产率= 总人数 总产量 = f xf = 366 55*150 + 65*100 + 75*70 + 85*30 + 95*16 =65.77(件/人) 此时,工人数为权数 f,而生产班组数是频数
结论:对相对数求平均数时,以该相对数原始公式中的分母资料作权数F。 (四)算术平均数的数学性质 1、各变量值与其均值的离差之和等于零,即∑x,-)=0 2、各变量值与其均值的离差平方和最小,即上(x,一)-最小(min) 3、如果变量X与变量Y之间的关系是Y=abX,其中为常数,则 Y=atbX 二、调和平均数 1、调和平均数是算术平均数的一种变形。 2、己知x的文字公式中的母项()资料时,用加权算术平均数 己知x的文字公式中的子项(m)资料时,用加权调和平均数 三、几何平均数(GM) (一)概令 它是N个单位的变量值的连乘积的N次方根。凡是变量值的连乘积等于总比 率或总速度时,都可使用几何平均数。 (二)计算公式 1、资料未分组时,用简单几何平均数:GM=x 例5-6某厂生产某种零件经过四个车间,各车间合格率依次为95%、92%、90%、 94%,则平均合格率=/95%*92%*90%*94%=92.73% 2、资料分组时,用加权几何平均数:GM=∑x (三)几何平均数也可以看作均值的一种变形,对简单几何平均数两端取对数得: (四)几何平均数是一种具有特殊用途的平均数。在世界各国的政府统计工作中, 主要在两种场合运用几何平均数。一是用于某种比率的平均数,如用于指数分析: 二是用于计算大致具有几何级数关系的一组数字的平均数。如世界各国都用它计 算经济指标的平均发展速度。 四、众数(M 1、它是总体中出现次数最多的变量值。众数在实际中用得较多。比如,制鞋厂 要制造适合大多数人穿的鞋:商店要计算不同时期的购物人次的众数或购物数量 的众数,以合理设置商业网点:修建人行天桥要确定过街人数的众数, 2、对未分组资料和单项式数列,直接找出即可。对组距式数列,先找出众数组
结论:对相对数求平均数时,以该相对数原始公式中的分母资料作权数 F。 (四)算术平均数的数学性质 1、各变量值与其均值的离差之和等于零,即 = − n i i x x 1 ( ) =0 2、各变量值与其均值的离差平方和最小,即 − = n i xi x 1 2 ( ) =最小(min) 3、如果变量 X 与变量 Y 之间的关系是 Yi=a+bXi,其中为常数,则 Y =a+b X 二、调和平均数 1、调和平均数是算术平均数的一种变形。 2、已知 x 的文字公式中的母项(f)资料时,用加权算术平均数 已知 x 的文字公式中的子项(m)资料时,用加权调和平均数 三、几何平均数(GM) (一)概念 它是 N 个单位的变量值的连乘积的 N 次方根。凡是变量值的连乘积等于总比 率或总速度时,都可使用几何平均数。 (二)计算公式 1、资料未分组时,用简单几何平均数 : GM= n x 例 5-6 某厂生产某种零件经过四个车间,各车间合格率依次为 95%、92%、90%、 94%,则 平均合格率= 4 95%*92%*90%*94% =92.73% 2、资料分组时,用加权几何平均数 :GM= f f x (三)几何平均数也可以看作均值的一种变形,对简单几何平均数两端取对数得: (四)几何平均数是一种具有特殊用途的平均数。在世界各国的政府统计工作中, 主要在两种场合运用几何平均数。一是用于某种比率的平均数,如用于指数分析; 二是用于计算大致具有几何级数关系的一组数字的平均数。如世界各国都用它计 算经济指标的平均发展速度。 四、众数(M0) 1、它是总体中出现次数最多的变量值。众数在实际中用得较多。比如,制鞋厂 要制造适合大多数人穿的鞋;商店要计算不同时期的购物人次的众数或购物数量 的众数,以合理设置商业网点;修建人行天桥要确定过街人数的众数。 2、对未分组资料和单项式数列,直接找出即可。对组距式数列,先找出众数组
(次数最多的组),再按公式计算 M0=L+ f-f i,其中,L表众数组的下限、i表众数组的组距、 (f-f)+(-f) £1表众数组之前那一组的次数、1表众数组之后那一组的次数 例5-7:某市某年职工家庭收支的抽样资料如下,求人均月收入的众数。 表3-6某市职工家庭收支表 人均月收入(元)户数 100-200 50 20-300 250 300-400 320 400-500 950 500-600 200 00以上 180 解:众数组为第四组 ff. Mo=L+ 950-320 i=400 (-f)+(-f) (950-320)+(950-200*100=456 3、利用以上公式计算众数时,假定数据分布具有明显的集中趋势,机假定众数 所在组与相邻两组的频数之差反映了数据分布陡峭上升而缓慢下降这一特征,同 时假定众数组的频数在该组内是均匀分布的。 4、众数的特点:是一种位置平均数:无明显集中趋势时,计算众数没有意义。 5、根据各国惯例,众数用得最多的是具有明显偏态分布的数列。 五、中位数(M) 1、处于中间位置的数为中位数。 2、中位数的确定:①资料未分组时,直接找出即可。当奇数个单位时,中位数 所处的位置为(N+1)2:当偶数个单位时,中位数为第N/2个与第(N+1)2 个数的简单算数平均数。 ②资料分组时,先确定中位数所在的组(第∑∫2所在的组),再通过以下公式计 ∑f 算中位数的近似值 Me =L+-2 5二,式中,L为中位数所在组的下 f 限,Sm1为中位数所在组以前各组的累积频数,m为中位数所在组的频数,i为 中位数所在组的组距
(次数最多的组),再按公式计算: M0=L+ i f f f f f f * ( ) ( ) 1 1 1 − + − − + − − , 其中,L 表众数组的下限、i 表众数组的组距、 f-1 表众数组之前那一组的次数、 f+1 表众数组之后那一组的次数。 例 5-7: 某市某年职工家庭收支的抽样资料如下,求人均月收入的众数。 表 3-6 某市职工家庭收支表 人均月收入(元) 户数 100-200 50 200-300 250 300-400 320 400-500 950 500-600 200 600 以上 180 解: 众数组为第四组 M0=L+ i f f f f f f * ( ) ( ) 1 1 1 − + − − + − − =400+ *100 (950 320) (950 200) 950 320 − + − − =445.6 3、利用以上公式计算众数时,假定数据分布具有明显的集中趋势,机假定众数 所在组与相邻两组的频数之差反映了数据分布陡峭上升而缓慢下降这一特征,同 时假定众数组的频数在该组内是均匀分布的。 4、众数的特点:是一种位置平均数;无明显集中趋势时,计算众数没有意义。 5、根据各国惯例,众数用得最多的是具有明显偏态分布的数列。 五、中位数(Me) 1、处于中间位置的数为中位数。 2、中位数的确定:① 资料未分组时,直接找出即可。当奇数个单位时,中位数 所处的位置为(N+1)/2;当偶数个单位时,中位数为第 N/2 个与第(N+1)/2 个数的简单算数平均数。 ②资料分组时,先确定中位数所在的组(第 f /2 所在的组),再通过以下公式计 算中位数的近似值。 Me = i f L f s m m * 2 −1 − + ,式中,L 为中位数所在组的下 限,Sm-1 为中位数所在组以前各组的累积频数,fm 为中位数所在组的频数,i 为 中位数所在组的组距