41.2顺序数据:四分位数(例题分析) 甲城市家庭对住房状况评价的频数分布解 Q位置=(300)/4=75 甲城市 回答类别 Q位置=(3×300)/4 户数(户)累计频数 =225 非常不满意 24 24 从累计频数看,Q在“不 不满意 108 132 满意”这一组别中;Q在 一般 93 225 一般”这一组别中 满意 45 270 四分位数为: 非常满意 30 300 QL=不满意 合计 300 QU=-般
4.1.2 顺序数据:四分位数(例题分析) 解: QL位置= (300)/4 =75 QU位置 =(3×300)/4 =225 从累计频数看, QL在“不 满意”这一组别中; QU在 “一般”这一组别中。 四分位数为: QL = 不满意 QU = 一般 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户) 累计频数 非常不满意 不满意 一般 满意 非常满意 24 108 93 45 30 24 132 225 270 300 合计 300 — 16
41.2数值型数据:四分位数(9个数据的算例 【例】:9个家庭的人均月收入数据(4种方法计算) 原始数据:15007507801080850960200012501630 排序:75078085096010801250150016302000 位置:12345 6 个 4位置==2.25 1位置=3×9 =6.75 4 4 Q1=780+(850-780)×0.259=1250+(1500-1250)×0.75 =797.5 1437.5
4.1.2 数值型数据:四分位数 (9个数据的算例) ◼ 【例】:9个家庭的人均月收入数据(4种方法计算) ◼ 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 ◼ 排 序: 750 780 850 960 1080 1250 1500 1630 2000 ◼ 位 置: 1 2 3 4 5 6 7 8 9 6.7 5 4 3 9 2.2 5 位 置 4 9 L 位 置 U = Q = = Q = 797.5 780 (850 780) 0.25 L = Q = + − 1437.5 1250 (1500 1250) 0.7 5 U = Q = + − 17
4.1.3平均数mean) 也称为均值,是集中趋势的最常用测度值。 组数据的均衡点所在 体现了数据的必然性特征; 易受极端值的影响; 有简单平均数和加权平均数之分; 根据总体数据计算的,称为平均数,记为μ;根据样本数 据计算的,称为样本平均数,记为x
4.1.3 平均数(mean) ◼ 也称为均值,是集中趋势的最常用测度值。 ◼ 一组数据的均衡点所在; ◼ 体现了数据的必然性特征; ◼ 易受极端值的影响; ◼ 有简单平均数和加权平均数之分; ◼ 根据总体数据计算的,称为平均数,记为;根据样本数 据计算的,称为样本平均数,记为x 。 x 18
4.1.3平均数一简单平均数( Simple mean) 根据未经分组数据计算的平均数称为简单平均数。 设一组数据为:x1,x2,…,xn(总体数据x ∑x 样本平均数:x x1+x+…+x 总体平均数:4 x1+x2+……+x i=1 N N 19
4.1.3 平均数—简单平均数(Simple mean) ◼ 根据未经分组数据计算的平均数称为简单平均数。 ◼ 设一组数据为:x1 ,x2 ,… ,xn (总体数据xN) ◼ 样本平均数: ◼ 总体平均数: n x n x x x x n i i n = = + + + = 1 2 1 N x N x x x N i i N = = + + + = 1 2 1 19
41.3平均数一加权平均数( Weighted mean) 根据分组数据计算的平均数称为加权平均数。 设各组的组中值为:M4,M2,…,,M 相应的频数为:,,…,f 样才注意:组中值在一定条件下可代表组数据,使用组中值代 表一组数据时有一个必要的假定条件,即各组数据在本组内 呈均匀分布或在组中值两侧呈对成分布,若不符合这一假定 用组中值作为一组数据的代表值会有一定的误差。 总 f1 +f,+……+ N 20
4.1.3 平均数—加权平均数 (Weighted mean) ◼ 根据分组数据计算的平均数称为加权平均数。 ◼ 设各组的组中值为:M1 ,M2 ,… ,Mk ◼ 相应的频数为: f1 , f2 ,… ,fk ◼ 样本加权平均: ◼ 总体加权平均: n M f f f f M f M f M f x k i i i k k k = = + + + + + + = 1 1 2 1 1 2 2 N M f f f f M f M f M f k i i i k k k = = + + + + + + = 1 1 2 1 1 2 2 20 注意:组中值在一定条件下可代表一组数据,使用组中值代 表一组数据时有一个必要的假定条件,即各组数据在本组内 呈均匀分布或在组中值两侧呈对成分布,若不符合这一假定, 用组中值作为一组数据的代表值会有一定的误差