>方差分析就是要比较这两类误差,以检验均值是否 相等。 比较的基础是方差比,也称为均方。 如果系统误差明显地不同于随机误差,则均值就是 不相等的;反之,均值就是相等的。 误差是由两种误差分别占总误差的比例来测度的
➢ 方差分析就是要比较这两类误差,以检验均值是否 相等。 – 比较的基础是方差比,也称为均方。 – 如果系统误差明显地不同于随机误差,则均值就是 不相等的;反之,均值就是相等的。 ➢ 误差是由两种误差分别占总误差的比例来测度的
方差分析中的两类方差 数据的误差用平方和( sum of squares)表示 1.组内误差( within groups) 因素的同一水平(同一个总体)下样本数据的误差 比如,零售业被投诉次数的误差 组内误差只包含随机误差 2.组间误差( between groups) 因素的不同水平(不同总体)下各样本之间的误差 比如,四个行业被投诉次数之间的误差 组间误差既包括随机误差,也包括系统误差
方差分析中的两类方差 ➢ 数据的误差用平方和(sum of squares)表示 1. 组内误差(within groups) – 因素的同一水平(同一个总体)下样本数据的误差 ➢比如,零售业被投诉次数的误差 – 组内误差只包含随机误差 2. 组间误差(between groups) – 因素的不同水平(不同总体)下各样本之间的误差 ➢比如,四个行业被投诉次数之间的误差 – 组间误差既包括随机误差,也包括系统误差
两类误差的比较 >若不同行业对投诉次数没有影响,则组间误差中只 包含随机误差,没有系统误差。这时,组间误差与 组内误差经过平均后的数值就应该很接近,它们的 比值就会接近1。 >若不同行业对投诉次数有影响,组间误差除了包含 随机误差外,还会包含系统误差,这时组间误差平 均后的数值就会大于组内误差平均后的数值,它们 之间的比值就会大于1
两类误差的比较 ➢ 若不同行业对投诉次数没有影响,则组间误差中只 包含随机误差,没有系统误差。这时,组间误差与 组内误差经过平均后的数值就应该很接近,它们的 比值就会接近1。 ➢ 若不同行业对投诉次数有影响,组间误差除了包含 随机误差外,还会包含系统误差,这时组间误差平 均后的数值就会大于组内误差平均后的数值,它们 之间的比值就会大于1
>当这个比值大到某种程度时,就可以说不同水平 间存在着显著差异,也就是自变量对因变量有影响 判断行业对投诉次数是否有显著影响,实际上也就 是检验被投诉次数的差异主要是由什么原因所引起 的 如果这种差异主要是系统误差,说明不同行业对投 诉次数有显著影响 返回61目录
➢ 当这个比值大到某种程度时,就可以说不同水平之 间存在着显著差异,也就是自变量对因变量有影响 – 判断行业对投诉次数是否有显著影响,实际上也就 是检验被投诉次数的差异主要是由什么原因所引起 的。 – 如果这种差异主要是系统误差,说明不同行业对投 诉次数有显著影响
、方差分析的基本假定 1.每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态 分布总体的简单随机样本 比如,每个行业被投诉的次数必须服从正态分布 2.各个总体的方差a2必须相同 各组观测数据是从具有相同方差的总体中抽取的 比如,四个行业被投诉次数的方差都相等 3.观测值是独立的 比如,每个行业被投诉的次数与其他行业被投诉的 次数独立
三、方差分析的基本假定 1. 每个总体都应服从正态分布 – 对于因素的每一个水平,其观察值是来自服从正态 分布总体的简单随机样本 ➢比如,每个行业被投诉的次数必须服从正态分布 2. 各个总体的方差𝜎 2必须相同 – 各组观测数据是从具有相同方差的总体中抽取的 ➢比如,四个行业被投诉次数的方差都相等 3. 观测值是独立的 – 比如,每个行业被投诉的次数与其他行业被投诉的 次数独立