X=∑XW其中:W;是x;的权数(X;出现的相对次数),即它对平均的 结果起权衡轻重的作用。 显然,如果各组次数完全相等,则f对各组标志值产生同等的影响,它 不再起权衡轻重的作用,这时加权算术平均数就等于前述的简单算术平均 数,所以可把简单算术平均数看作是加权算术平均数的一个特例,即,当各 组的次数f;相等时 f1=f2…=fn=f0 则 ∑Xff∑x∑ X= 如果你所掌握的资料不是单项数列资料,而是组距数列资料时,计算算 术平均数的方法与上述方法基本相同。只是先要计算出各组的组中值 (下限+上限) ,以各组组中值代表该组标志值进行计算。 2 例:某企业工人每月工资分组资料如表(10-2) 表10-2某企业每月工资分组资料 月工资分组组中值(元) 工人人数各组工人工资总额 (f) (元Xf) 50~60 55 550 60~70 10 650 70~80 10 3.400 90~100 合计 100 7.800 以各组的组中值为标志值代人中权算术平均数的公式得: Xf7,800 78(元) 利用组中值计算算术平均数,是以假定各组内的标志值均匀分布为前 提,而计算的结果同实际情况可能会有一些偏差,因此是平均数的近似值。 (二)调和平均数 调和平均数又称“倒数平均数”,它是根据各标志值的倒数来计算的平 均数。具体地说,调和平均数就是各个标志值倒数的算术平均数的倒数。但 计算结果并非是算术平均数的倒数。调和平均数应用并不广泛,统计工作中 往往是把调和平均数的计算形式,作为算术数的变形来使用。 调和平均数也分简单调和平均数和加权调和平均数如以Ⅺ代表调和平 均数,以n代表资料项数,则简单调和平均数的计算公式为:
X XiWi = å 其中:Wi 是 Xi 的权数(Xi 出现的相对次数),即它对平均的 结果起权衡轻重的作用。 显然,如果各组次数完全相等,则f对各组标志值产生同等的影响,它 不再起权衡轻重的作用,这时加权算术平均数就等于前述的简单算术平均 数,所以可把简单算术平均数看作是加权算术平均数的一个特例,即,当各 组的次数 fi 相等时: f f f f X Xf f f X nf X n 1 = 2 = n = 0 = = = å å å å …… 则: 如果你所掌握的资料不是单项数列资料,而是组距数列资料时,计算算 术平均数的方法与上述方法基本相同。只是先要计算出各组的组中值 (下限+上限) 2 ,以各组组中值代表该组标志值进行计算。 例:某企业工人每月工资分组资料如表(10—2): 表 10—2 某企业每月工资分组资料 月工资分组 (元) 组中值(元) ( X ) 工人人数 ( f ) 各组工人工资总额 (元 Xf ) 50 ~ 60 55 10 550 60 ~ 70 65 10 650 70 ~ 80 75 30 2,250 80 ~ 90 85 10 3,400 90 ~ 100 95 10 950 合计 — 100 7,800 以各组的组中值为标志值代人中权算术平均数的公式得: X Xf f = = = å å 7 800 100 78 , (元) 利用组中值计算算术平均数,是以假定各组内的标志值均匀分布为前 提,而计算的结果同实际情况可能会有一些偏差,因此是平均数的近似值。 (二)调和平均数 调和平均数又称“倒数平均数”,它是根据各标志值的倒数来计算的平 均数。具体地说,调和平均数就是各个标志值倒数的算术平均数的倒数。但 计算结果并非是算术平均数的倒数。调和平均数应用并不广泛,统计工作中 往往是把调和平均数的计算形式,作为算术数的变形来使用。 调和平均数也分简单调和平均数和加权调和平均数。如以 Xh 代表调和平 均数,以 n 代表资料项数,则简单调和平均数的计算公式为:
n 即XH (10·3) 例:有三种商品,一种是每千克1.00元,一种是每千克0.80元,一种 是每千克0.50元,现在各买1元,问平均每千克的价格。用上式计算可得 Is XH 071(元/千克) X1008050 显然这个计算结果同实际情况相符合,因为,分别用1元买得第一种 千克,第二种商品1.25千克,第三种商品2千克,3元买4.25千克,平均 每千克为3÷4.25=0.71元。 若设m为权数,则加权调和平均数的计算公式为: Xx2X3"“X ⅹHm1+m2+m3+…+mn 则又n=+m+++mn m 在统计的实际应用中,若已知标志值和标志总量时,则可把上式作为算 术平均数的变形来使用,其变形形式为: Xf Xf mmx ∑ Xf fsX(这里m=Xf) 例:企业本月购进某材料四批,每批价格以及采购金额如表(10-3)所 求这四批材料的平均价格。 平均每千克价格X为: 50.000 =4102(元) m 1219 表10—3企业材料价格和金额资料
1 1 1 1 1 1 1 1 10 3 1 2 1 2 X X X X n XH n X X X n X H h h = + + + = + + = å … 即 … : ( · ) 例:有三种商品,一种是每千克 1.00 元,一种是每千克 0.80 元,一种 是每千克 0.50 元,现在各买 1 元,问平均每千克的价格。用上式计算可得: ls X n X H = = + + = å 1 3 1 1 0 1 0 8 1 0 50 0 71 . . . . (元 / 千克) 显然这个计算结果同实际情况相符合,因为,分别用 1 元买得第一种 1 千克,第二种商品 1.25 千克,第三种商品 2 千克,3 元买 4.25 千克,平均 每千克为 3÷4.25=0.71 元。 若设 m 为权数,则加权调和平均数的计算公式为: 1 1 1 2 2 3 3 1 2 3 1 2 3 1 1 2 2 3 3 1 1 X m X m X m X m X m m m m X m m m m m X m X m X m X m m X H n n n H n n n i i n i i i n = + + + + + + + + = + + + + + + + + = = = å å … … 则 … … 在统计的实际应用中,若已知标志值和标志总量时,则可把上式作为算 术平均数的变形来使用,其变形形式为: X m m X Xf Xf X Xf f X m Xf H = = = = = å å å å å å (这里 ) 例:企业本月购进某材料四批,每批价格以及采购金额如表(10—3)所 示,求这四批材料的平均价格。 平均每千克价格 Xh 为: X mi m X h i i i = = = = = å å 1 4 1 1 4 50 000 1219 4102 , , . (元) 表 10—3 企业材料价格和金额资料
价格(元/千克)采购金额(元)采购量(千克) 第一批 0.000 286 第二批 20.000 第三批 15000 333 第四批 5.000 100 50.000 1219 (三)几何平均数 几何平均数是计算平均比率和平均速度最适用的一种方法。几何平均数 有简单几何平均数和加权几何平均数之分 简单几何平均数是n个标志值连乘积的n次方根,其计算公式为 X 式中:XG代表几何平均数; X代表标志值 n代表标志值的次数; n为连乘的符号。 在用几何平均数法计算平均数时,如果n大于2可采用对数法来计算。 将上式两边同时取对数,可得 log XG=-(log X+log,+A+log- +logXn) log x 所以,几何平均数也称为对数平均数。 几何平均数的加权公式为: ⅹ6=∑fx1f1·x2f2·X1·Xf 式中:X;代表标志值(i=1,2,…,k) f;代表标志值X重复出现的次数(i=1,2,…,k)。 (四)中位数 中位数和前面几种计算的平均数不同,它是一种按其在数列中的特殊位 置而决定的平均数。把总体各单位标志值按大小顺序排列后,处在中点位次 的标志值就是中位数,它将全部标志值分成两个部分,一半标志值比它大, 半标志值比它小,而且比它大的标志值个数和比它小的标志值个数相等 要求得中位数,首先要确定中位数的位次。对于中位数的位次由以下公 式确定。 中位数位次 表10-4某百货公司所属商店处销售额资料
价格(元/千克) X 采购金额(元) m 采购量(千克) m X 第一批 35 10,000 286 第二批 40 20,000 500 第三批 45 15,000 333 第四批 50 5,000 100 合 计 — 50,000 1,219 (三)几何平均数 几何平均数是计算平均比率和平均速度最适用的一种方法。几何平均数 有简单几何平均数和加权几何平均数之分。 简单几何平均数是n个标志值连乘积的n次方根,其计算公式为: XG = n X1·X2·……Xn = n Õ X 式中: XG 代表几何平均数; X 代表标志值; n 代表标志值的次数; п为连乘的符号。 在用几何平均数法计算平均数时,如果 n 大于 2 可采用对数法来计算。 将上式两边同时取对数,可得: log (log log log log ) log X n X x X X n X G = + + + n + n = - å 1 1 1 2 L 1 所以,几何平均数也称为对数平均数。 几何平均数的加权公式为: XG fi X f X f X f X f i k = k k = å 1 1 1· 2 2· 3 3· 式中:Xi 代表标志值(i=1,2,…,k); fi 代表标志值 Xi 重复出现的次数(i=1,2,…,k)。 (四)中位数 中位数和前面几种计算的平均数不同,它是一种按其在数列中的特殊位 置而决定的平均数。把总体各单位标志值按大小顺序排列后,处在中点位次 的标志值就是中位数,它将全部标志值分成两个部分,一半标志值比它大, 一半标志值比它小,而且比它大的标志值个数和比它小的标志值个数相等。 要求得中位数,首先要确定中位数的位次。对于中位数的位次由以下公 式确定。 中位数位次 = n + 1 2 表 10—4 某百货公司所属商店处销售额资料
商店按年销售额分组(万元) 105 80~90 90~100 110~120 120~13 合计 300 f300 按上式,确定中位数的位次为==150。它说明中位数应使这个 数列中各有150个商店的年销售额在其上下。在组距数列中,各组距数值是 按大小顺序排列的。这样,计算各组累计商店数,到第二组止为24+48=72 个,到第三组止为72+105=177个,可见到第三组的累计次数已超过150 个,中位数就在第三组内,即中位数应在年销售额70-80万元的组内 再计算中位数值是分布均匀的。这样,可从中位数在该组内的位次来比 例推算它的近似值。中位数在该组内的位次为150-72=78。它与全组商店 数的比例为78/105=0.743,按该组组距数值80—70=10万元加以推算,则 为0.743×10=7.43(万元)。于是,从中位数所在组的下限加上这个数字: 70+7.43=77.43万元,即为中位数。 中位数的最大特点是:它是序列中间一项或两项的平均数,不受极端值 的影响,所以当一个变量数列中含有特大值与特小值的情况采用中位数较为 适宜。正由于中位数的这一特点,在统计研究中当遇到掌握统计资料不多而 且各标志值之间差异程度较大或频数分布有偏态时,为避免计算标志值所得 的算术平均数偏大或偏小,就可利用中位数来表示现象的一般水平 (五)众数 众数也是一种位置的平均数。众数是指总体单位中,标志值出现次数最 多的那个数值。单项数列中,频数最多组的标志值就是众数。但在组距数列 的条件下,先要确定众数所在组,然后计算以求得近似的众数值。下面仍用 图表ⅥX资料,来说明其计算过程。 由表104可知,年销售额在70-80万元这一组的商店数最多,即为众 数组。为了确定众数的具体数值,可用下限公式或上限公式加以计算。下限 公式为: d 式中:M代表众数 L代表众数组的下限; d1代表众数组次数与上一组次数之差;
商店按年销售额分组(万元) 商 店 数 50 ~ 60 24 60 ~ 70 48 70 ~ 80 105 80 ~ 90 60 90 ~ 100 27 110 ~ 120 21 100 ~ 110 12 120 ~ 130 3 合计 300 按上式,确定中位数的位次为 åf = = 2 300 2 150。它说明中位数应使这个 数列中各有 150 个商店的年销售额在其上下。在组距数列中,各组距数值是 按大小顺序排列的。这样,计算各组累计商店数,到第二组止为 24+48=72 个,到第三组止为 72+105=177 个,可见到第三组的累计次数已超过 150 个,中位数就在第三组内,即中位数应在年销售额 70—80 万元的组内。 再计算中位数值是分布均匀的。这样,可从中位数在该组内的位次来比 例推算它的近似值。中位数在该组内的位次为 150—72=78。它与全组商店 数的比例为 78/105=0.743,按该组组距数值 80—70=10 万元加以推算,则 为 0.743×10=7.43(万元)。于是,从中位数所在组的下限加上这个数字: 70+7.43=77.43 万元,即为中位数。 中位数的最大特点是:它是序列中间一项或两项的平均数,不受极端值 的影响,所以当一个变量数列中含有特大值与特小值的情况采用中位数较为 适宜。正由于中位数的这一特点,在统计研究中当遇到掌握统计资料不多而 且各标志值之间差异程度较大或频数分布有偏态时,为避免计算标志值所得 的算术平均数偏大或偏小,就可利用中位数来表示现象的一般水平。 (五)众数 众数也是一种位置的平均数。众数是指总体单位中,标志值出现次数最 多的那个数值。单项数列中,频数最多组的标志值就是众数。但在组距数列 的条件下,先要确定众数所在组,然后计算以求得近似的众数值。下面仍用 图表 n Õ X 资料,来说明其计算过程。 由表 10—4 可知,年销售额在 70—80 万元这一组的商店数最多,即为众 数组。为了确定众数的具体数值,可用下限公式或上限公式加以计算。下限 公式为: M L d d d i 0 1 1 2 = + + ´ 式中:M0 代表众数; L 代表众数组的下限; d1 代表众数组次数与上一组次数之差;
d2代表众数组次数与下一组次数之差; i代表众数组的组距。 众数的上限公式为: Mo=U 式中:U代表众数组的上限,其他符号含义同前。 众数的计算只适用于单位数较多,且有明显的集中趋势。否则,计算众 数是没有意义的。 、离散趋势的测度 离散趋势的测度,在统计学中也称为标志变异指标,是用来描述数列中 标志值的离散趋势与离散程度的。 常用的标志变异指标有极差,平均差,方差和标准差等。 (一)极差 极差是指一个数列中两个极端值即最大值和最小值之差。计算极差是测 定标志变异程度最简单的方法,根据极差的大小能说明标志值变动范围的大 小,其公式为: 极差≡最大标志值一最小标志值 极差是测定标志变动程度的一种粗略方法。它计算简便,易于理解。但 它只受极端值的影响,测定的结果往往不能反映数据的实际离散程度。 (二)平均差 平均差是各单位标志值对平均数的离差绝对值的平均数。由于各个标志 值对算术平均数的离差有正有负,其和为零,因此须采用离差的绝对值来计 算平均数。平均差公式反映总体各单位标志值对其平均数的平均离差量。平 均差越大,表明标志变异程度越大;反之,则表明标志变异程度越小。 平均差通常用字母A.D.表示,在资料未分组时,计算公式为 ∑X- A D (三)方差和标准差 差对离差采用绝对值,避免了正负离差求和时互相抵消的问题,但绝对 值不便于代数运算,而方差和标准差可弥补这一不足。 方差的公式为 X-X)2 式中:a2为方差; X为变量值; X为算术平均数; n为总体单位数。 将方差开平方,得到的即为标准差,这是为了使变异量单位同数据单位
d2 代表众数组次数与下一组次数之差; i 代表众数组的组距。 众数的上限公式为: M U d d d i 0 2 1 2 = - + ´ 式中:U 代表众数组的上限,其他符号含义同前。 众数的计算只适用于单位数较多,且有明显的集中趋势。否则,计算众 数是没有意义的。 二、离散趋势的测度 离散趋势的测度,在统计学中也称为标志变异指标,是用来描述数列中 标志值的离散趋势与离散程度的。 常用的标志变异指标有极差,平均差,方差和标准差等。 (一)极差 极差是指一个数列中两个极端值即最大值和最小值之差。计算极差是测 定标志变异程度最简单的方法,根据极差的大小能说明标志值变动范围的大 小,其公式为: 极差=最大标志值—最小标志值 极差是测定标志变动程度的一种粗略方法。它计算简便,易于理解。但 它只受极端值的影响,测定的结果往往不能反映数据的实际离散程度。 (二)平均差 平均差是各单位标志值对平均数的离差绝对值的平均数。由于各个标志 值对算术平均数的离差有正有负,其和为零,因此须采用离差的绝对值来计 算平均数。平均差公式反映总体各单位标志值对其平均数的平均离差量。平 均差越大,表明标志变异程度越大;反之,则表明标志变异程度越小。 平均差通常用字母 A. D.表示,在资料未分组时,计算公式为: A D X X N . .= å - (三)方差和标准差 差对离差采用绝对值,避免了正负离差求和时互相抵消的问题,但绝对 值不便于代数运算,而方差和标准差可弥补这一不足。 方差的公式为: s 2 2 = å(X - X) n 式中:s2 为方差; X 为变量值; X为算术平均数; n 为总体单位数。 将方差开平方,得到的即为标准差,这是为了使变异量单位同数据单位