方差分析的基本思想和原理 (图形分析一散点图) 80 ● 60 40 ●●● 20 0 零售业 旅游业 航空公司 家电制造 不同行业被投诉次数的散点图 行业
10 - 12 作者:贾俊平,中国人民大学统计学院 统计学 STATISTICS (第7版) 方差分析的基本思想和原理 (图形分析—散点图) 零售业 旅游业 航空公司 家电制造
方差分析的基本思想和原理 (图形分析) 1.从散点图上可以看出 ■不同行业被投诉的次数有明显差异 ■同一个行业,不同企业被投诉的次数也明显不同 ·家电制造被投诉的次数较高,航空公司被投诉的次数较 低 2. 行业与被投诉次数之间有一定的关系 如果行业与被投诉次数之间没有关系,那么它们被 投诉的次数应该差不多相同,在散点图上所呈现的 模式也就应该很接近
10 - 13 作者:贾俊平,中国人民大学统计学院 统计学 STATISTICS (第7版) 1. 从散点图上可以看出 n 不同行业被投诉的次数有明显差异 n 同一个行业,不同企业被投诉的次数也明显不同 l 家电制造被投诉的次数较高,航空公司被投诉的次数较 低 2. 行业与被投诉次数之间有一定的关系 n 如果行业与被投诉次数之间没有关系,那么它们被 投诉的次数应该差不多相同,在散点图上所呈现的 模式也就应该很接近 方差分析的基本思想和原理 (图形分析)
方差分析的基本思想和原理 1.散点图观察不能提供充分的证据证明不同行业被 投诉的次数之间有显著差异 ■:这种差异可能是由于抽样的随机性所造成的 2.需要有更准确的方法来检验这种差异是否显著, 也就是进行方差分析 ■所以叫方差分析,因为虽然我们感兴趣的是均值, 但在判断均值之间是否有差异时则需要借助于方差 ·这个名字也表示:它是通过对数据误差来源的分析 判断不同总体的均值是否相等。因此,进行方差分 析时,需要考察数据误差的来源
10 - 14 作者:贾俊平,中国人民大学统计学院 统计学 STATISTICS (第7版) 1. 散点图观察不能提供充分的证据证明不同行业被 投诉的次数之间有显著差异 n 这种差异可能是由于抽样的随机性所造成的 2. 需要有更准确的方法来检验这种差异是否显著, 也就是进行方差分析 n 所以叫方差分析,因为虽然我们感兴趣的是均值, 但在判断均值之间是否有差异时则需要借助于方差 n 这个名字也表示:它是通过对数据误差来源的分析 判断不同总体的均值是否相等。因此,进行方差分 析时,需要考察数据误差的来源 方差分析的基本思想和原理
方差分析的基本思想和原理 (两类误差) 1.随机误差 ·因素的同一水平(总体)下,样本各观察值之间的差异 ·比如,同一行业下不同企业被投诉次数之间的差异 ·这种差异可以看成是随机因素的影响,称为随机误差 2.系统误差 ·因素的不同水平(不同总体)之间观察值的差异 ·比如,不同行业之间的被投诉次数之间的差异 ·这种差异可能是由于抽样的随机性所造成的,也可能 是由于行业本身所造成的,后者所形成的误差是由系 统性因素造成的,称为系统误差
10 - 15 作者:贾俊平,中国人民大学统计学院 统计学 STATISTICS (第7版) 方差分析的基本思想和原理 (两类误差) 1. 随机误差 § 因素的同一水平(总体)下,样本各观察值之间的差异 l 比如,同一行业下不同企业被投诉次数之间的差异 § 这种差异可以看成是随机因素的影响,称为随机误差 2. 系统误差 § 因素的不同水平(不同总体)之间观察值的差异 l 比如,不同行业之间的被投诉次数之间的差异 § 这种差异可能是由于抽样的随机性所造成的,也可能 是由于行业本身所造成的,后者所形成的误差是由系 统性因素造成的,称为系统误差
方差分析的基本思想和原理 (误差平方和一SS) 1.数据的误差用平方和(sum of squares)表示 2.组内平方和(within groups) ·因素的同一水平下数据误差的平方和 ·比如,零售业被投诉次数的误差平方和 ·只包含随机误差 3.组间平方和(between groups) ■因素的不同水平之间数据误差的平方和 。比如,4个行业被投诉次数之间的误差平方和 ·既包括随机误差,也包括系统误差
10 - 16 作者:贾俊平,中国人民大学统计学院 统计学 STATISTICS (第7版) 方差分析的基本思想和原理 (误差平方和—SS) 1. 数据的误差用平方和(sum of squares)表示 2. 组内平方和(within groups) § 因素的同一水平下数据误差的平方和 l 比如,零售业被投诉次数的误差平方和 § 只包含随机误差 3. 组间平方和(between groups) § 因素的不同水平之间数据误差的平方和 l 比如,4个行业被投诉次数之间的误差平方和 § 既包括随机误差,也包括系统误差