二、方差分析的基本思想和原理 90 80 70 ◆零售业 60 50 ■旅游业 40 ▲航空公司 30 20 家电制造业
二、方差分析的基本思想和原理 0 10 20 30 40 50 60 70 80 90 0 2 4 6 8 零售业 旅游业 航空公司 家电制造业
从散点图上可以看出 不同行业被投诉的次数是有明显差异的 >家电制造被投诉的次数较高,航空公司被投诉的次数 较低 同一个行业,不同企业被投诉的次数也明显不同 >零售业被投诉的次数最高6次,最低34次 行业”与“被投诉次数”之间有一定的关系 如果行业与被投诉次数之间没有关系,那么它们被 投诉的次数应该相差不大,在散点图上所呈现的模 )式也就应该很接近
➢ 从散点图上可以看出 – 不同行业被投诉的次数是有明显差异的 ➢家电制造被投诉的次数较高,航空公司被投诉的次数 较低 – 同一个行业,不同企业被投诉的次数也明显不同 ➢零售业被投诉的次数最高66次,最低34次 ➢ “行业”与“被投诉次数”之间有一定的关系 – 如果行业与被投诉次数之间没有关系,那么它们被 投诉的次数应该相差不大,在散点图上所呈现的模 式也就应该很接近
方差分析的基本思想和原理 仅从散点图上观察还不能提供充分的证据证明不同 行业被投诉的次数之间有显著差异 一这种差异也可能是由于抽样的随机性所造成的 需要有更准确的方法来检验这种差异是否显著,也 就是进行方差分析
方差分析的基本思想和原理 ➢ 仅从散点图上观察还不能提供充分的证据证明不同 行业被投诉的次数之间有显著差异 – 这种差异也可能是由于抽样的随机性所造成的 – 需要有更准确的方法来检验这种差异是否显著,也 就是进行方差分析
>之所以叫方差分析,因为虽然我们感兴趣的是均镇 但在判断均值之间是否有差异时则需要借助于方差 这个名字也表示:它是通过对数据误差来源的分析 来判断不同总体的均值是否相等。因此,进行方差 分析时,需要考察数据误差的来源
➢ 之所以叫方差分析,因为虽然我们感兴趣的是均值, 但在判断均值之间是否有差异时则需要借助于方差。 ➢ 这个名字也表示:它是通过对数据误差来源的分析 来判断不同总体的均值是否相等。因此,进行方差 分析时,需要考察数据误差的来源
方差分析中的两类误差 随机误差 因素的同一水平(总体)下,各观测值之间的差异 >比如,同一行业下不同企业被投诉次数是不同的 这种差异可以看成是随机因素的影响,或者说是抽 样的随机性造成的,称为随机误差 2.系统误差 因素的不同水平(总体)下,各观测值之间也存在差 异。这种差异可能是由于抽样的随机性造成的,也 可能是由于行业本身造成的,后者所形成的误差是 由系统性因素造成的,称为系统误差。 >比如,不同行业之间的被投诉次数之间的差异
方差分析中的两类误差 1. 随机误差 – 因素的同一水平(总体)下,各观测值之间的差异 ➢比如,同一行业下不同企业被投诉次数是不同的 – 这种差异可以看成是随机因素的影响,或者说是抽 样的随机性造成的,称为随机误差 2. 系统误差 – 因素的不同水平(总体)下,各观测值之间也存在差 异。这种差异可能是由于抽样的随机性造成的,也 可能是由于行业本身造成的,后者所形成的误差是 由系统性因素造成的,称为系统误差。 ➢比如,不同行业之间的被投诉次数之间的差异