方差分析的基本思想和原理误差平方和SS) 1.数据的误差用平方和( sum of squares)表示 2.组内平方和 within groups) 因素的同一水平下数据误差的平方和 比如,零售业被投诉次数的误差平方和 只包含随机误差 3.组间平方和( between groups) 因素的不同水平之间数据误差的平方和 0比如,4个行业被投诉次数之间的误差平方和 既包括随机误差,也包括系统差
方差分析的基本思想和原理(误差平方和—SS) 1. 数据的误差用平方和(sum of squares)表示 2. 组内平方和(within groups) ▪ 因素的同一水平下数据误差的平方和 比如,零售业被投诉次数的误差平方和 ▪ 只包含随机误差 3. 组间平方和(between groups) ▪ 因素的不同水平之间数据误差的平方和 比如,4个行业被投诉次数之间的误差平方和 ▪ 既包括随机误差,也包括系统误差
方差分析的基本思想和原理均方方差MS) 1.平方和除以相应的自由度 2.若原假设成立,组间均方与组内均方的数值就应该很接近,它们 的比值就会接近1。 3.若原假设不成立,组间均方会大于组内均方,它们之间的比值就 会大于1 4.当这个比值大到某种程度时,就可以说不同水平之间存在着显著 差异,即自变量对因变量有影响。 判断行业对投诉次数是否有显著影响,也就是检验被投诉次数 差异主要是由于什么原因所引起的。如果这种差异主要是系统 差,说明不同行业对投诉次数有显著影响
方差分析的基本思想和原理(均方/方差—MS) 1. 平方和除以相应的自由度 2. 若原假设成立,组间均方与组内均方的数值就应该很接近,它们 的比值就会接近1。 3. 若原假设不成立,组间均方会大于组内均方,它们之间的比值就 会大于1。 4. 当这个比值大到某种程度时,就可以说不同水平之间存在着显著 差异,即自变量对因变量有影响。 ▪ 判断行业对投诉次数是否有显著影响,也就是检验被投诉次数的 差异主要是由于什么原因所引起的。如果这种差异主要是系统误 差,说明不同行业对投诉次数有显著影响
方差分析的基本假定
方差分析的基本假定
方差分析的基本假定 1.每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总 体的简单随机样本。 比如,每个行业被投诉的次数必须服从正态分布 2.各个总体的方差必须相同 各组观察数据是从具有相同方差的正态总体中抽取的。 比如,4个行业被投诉次数的方差都相等。 3.观察值是独立的 比如,每个行业被投诉的次数与其他行业被投诉的次数
方差分析的基本假定 1. 每个总体都应服从正态分布 ▪ 对于因素的每一个水平,其观察值是来自服从正态分布总 体的简单随机样本。 ▪ 比如,每个行业被投诉的次数必须服从正态分布。 2. 各个总体的方差必须相同 ▪ 各组观察数据是从具有相同方差的正态总体中抽取的。 ▪ 比如,4个行业被投诉次数的方差都相等。 3. 观察值是独立的 ▪ 比如,每个行业被投诉的次数与其他行业被投诉的次数独 立
方差分析中的基本假定 1.在上述假定条件下,判断行业对投诉次数是否有显著 影响,实际上也就是检验具有同方差的4个正态总体 的均值是否相等 2.如果4个总体的均值相等,可以期望4个样本的均值也 会很接近 4个样本的均值越接近,推断4个总体均值相等的证据也就 越充分。 样本均值越不同,推断总体均值不同的证据就越充分
方差分析中的基本假定 1. 在上述假定条件下,判断行业对投诉次数是否有显著 影响,实际上也就是检验具有同方差的4个正态总体 的均值是否相等。 2. 如果4个总体的均值相等,可以期望4个样本的均值也 会很接近。 ▪ 4个样本的均值越接近,推断4个总体均值相等的证据也就 越充分。 ▪ 样本均值越不同,推断总体均值不同的证据就越充分