41.1分类数据:众数(mode) 组数据中出现次数最多的变量值,用M。表示 适合于数据量较多时使用 3.不受极端值的影响; 4一组数据可能没有众数或有几个众数; 5.主要用于分类数据,也可用于顺序数据和数值型数据
4.1.1 分类数据:众数(mode) 1. 一组数据中出现次数最多的变量值,用Mo 表示; 2. 适合于数据量较多时使用; 3. 不受极端值的影响; 4. 一组数据可能没有众数或有几个众数; 5. 主要用于分类数据,也可用于顺序数据和数值型数据。 6
众数(不惟一性) 众数:始终是一组数 据分布的最高峰值。 1.无众数 口原始数据:10591268 2.一个众数 口原始数据659855 3.多于一个众数 口原始数据:252828364242
众数(不惟一性) ◼1. 无众数 原始数据: 10 5 9 12 6 8 ◼2. 一个众数 原始数据: 6 5 9 8 5 5 ◼3. 多于一个众数 原始数据: 25 28 28 36 42 42 7 众数:始终是一组数 据分布的最高峰值
分类数据的众数(例题分析) 解: 不同品牌饮料的频数分布 这里的变量为“饮料品牌 饮料品牌频数比例百分比(%) ,这是个分类变量,不 同类型的饮料是变量值。 果汁 6 0.12 12 所调查的50人中,购买碳 矿泉水 100.20 20 酸饮料的人数最多,为15 绿茶 110.22 22 其他 80.16 16 人,占总被调查人数的 碳酸饮料150.30 30 30%,因此众数为“可口 可乐”这一品牌,即 合计 50 1 100 石。=碳酸饮料
分类数据的众数(例题分析) 不同品牌饮料的频数分布 饮料品牌 频数 比例 百分比(%) 果汁 矿泉水 绿茶 其他 碳酸饮料 6 10 11 8 15 0.12 0.20 0.22 0.16 0.30 12 20 22 16 30 合计 50 1 100 解: 这里的变量为“饮料品牌 ” ,这是个分类变量,不 同类型的饮料是变量值。 所调查的50人中,购买碳 酸饮料的人数最多,为15 人 , 占 总 被 调 查 人 数 的 30%,因此众数为“可口 可乐”这一品牌,即 Mo=碳酸饮料 8
顺序数据的众数(例题分析) 甲城市家庭对住房状况评价的频数分布解 甲城市 这里的数据为顺序数据, 回答类别 变量为“回答类别”。 户数(户)百分比(% 非常不满意 24 8 甲城市中对住房表示不满 不满意 108 36 意的户数最多,为108户 一般 93 31 ,因此众数为“不满意 满意 45 15 这一类别,即 非常满意 30 10 M。=不满意 合计 300 100.0
顺序数据的众数 (例题分析) 解: 这里的数据为顺序数据, 变量为“回答类别” 。 甲城市中对住房表示不满 意的户数最多,为108户 ,因此众数为“不满意” 这一类别,即 Mo=不满意 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户) 百分比 (%) 非常不满意 不满意 一般 满意 非常满意 24 108 93 45 30 8 36 31 15 10 合计 300 100.0 9
41.2顺序数据:中位数( median) 排序后处于中间位置上的值。 50% 50o 1.不受极端值的影响; 2.主要用于顺序数据,也可用数值型数据,但不能用于分类数据 3.各变量值与中位数的离差绝对值之和最小,即: X;一e = min 10
4.1.2 顺序数据:中位数(median) ◼ 排序后处于中间位置上的值。 Me 50% 50% 1. 不受极端值的影响; 2. 主要用于顺序数据,也可用数值型数据,但不能用于分类数据; 3. 各变量值与中位数的离差绝对值之和最小,即: 10 min 1 − e = = n i x i M