第十三章检验与方差分析 我们前面已经比较系统地讨论了双样本的参数和非参数 检验的问题。现在,我们希望利用一般的方法来检验三个以 上样本的差异,检验法和方差分析法就是解决这方面问题的。 检验法可以对拟合优度和独立性等进行检验,方差分析法则 可以对多个总体均值是否相等进行检验。后者由于通过各组 样本资料之间的方差和组内方差的比较来建立服从F分布的检 验统计量,所以又称F检验。 第一节:拟合优度检验 第二节:无关联性检验 第三节:方差分析 第四节:回归方程与相关系数的检验
第十三章 检验与方差分析 我们前面已经比较系统地讨论了双样本的参数和非参数 检验的问题。现在,我们希望利用一般的方法来检验三个以 上样本的差异, 检验法和方差分析法就是解决这方面问题的。 检验法可以对拟合优度和独立性等进行检验,方差分析法则 可以对多个总体均值是否相等进行检验。后者由于通过各组 样本资料之间的方差和组内方差的比较来建立服从F分布的检 验统计量,所以又称F检验。 第一节:拟合优度检验 第二节:无关联性检验 第三节:方差分析 第四节:回归方程与相关系数的检验 χ 2 χ 2 χ 2
第一节拟合优度检验 运用Z检验、t检验等讨论假设检验的问题,一般要求总体服从正 态分布,或者在大样本条件下可以利用渐近正态分布理论来描述抽 样分布。也就是说,我们都要直接或间接地假定对象总体具有已知 的分布形式,然后对总体的未知参数进行假设检验。如果不知道总 体的分布形式,就无法运用检验法等对总体参数进行假设检验。 于是,这里有一个前面留下来的尚未讨论的问题很重要,就是怎样 检定总体是否具有正态或其他分布形式?拟合优度检验正是就这 问题而言的检验方法
第一节 拟合优度检验 运用Z检验、t检验等讨论假设检验的问题,一般要求总体服从正 态分布,或者在大样本条件下可以利用渐近正态分布理论来描述抽 样分布。也就是说,我们都要直接或间接地假定对象总体具有已知 的分布形式,然后对总体的未知参数进行假设检验。如果不知道总 体的分布形式,就无法运用t检验法等对总体参数进行假设检验。 于是,这里有一个前面留下来的尚未讨论的问题很重要,就是怎样 检定总体是否具有正态或其他分布形式?拟合优度检验正是就这一 问题而言的检验方法
问题的导出 第十 最后一节,我们将累计频数枪验用干绎验分布与 理论分布的比较,实际已经提供了拟合优度检验的一种方 法。x拟合优度检验与累计频数拟合优度检验相对应,在 评估从经验上得到的频数和在一组特定的理论假设下期望 得到的频数之间是否存在显著差异时,是一种更普遍的检 方法 ■现在我们再来看看第七章提到的著名的孟德尔豌豆试验。 根据孟德尔提出的分离规 纯种豌豆杂交后的子二代出 现分化,红花植株与白花植株的数自应为3:1。但由于随 机性观察结果与3:1理论值总有些差距。因此有必要去考 察某一犬小的差距是否已构成否定3:匣理论的充分根据。 这正是我们所讨论的拟合优度检验的问题。解决这类问题 的工具,是卡皮尔逊在1900年发表 篇文章中引进的所 谓x2检验法
◼ 第十一章最后一节,我们将累计频数检验用于经验分布与 理论分布的比较,实际已经提供了拟合优度检验的一种方 法。 拟合优度检验与累计频数拟合优度检验相对应,在 评估从经验上得到的频数和在一组特定的理论假设下期望 得到的频数之间是否存在显著差异时,是一种更普遍的检 验方法。 ◼ 现在我们再来看看第七章提到的著名的孟德尔豌豆试验。 根据孟德尔提出的分离规律,纯种豌豆杂交后的子二代出 现分化,红花植株与白花植株的数目应为3∶1。但由于随 机性,观察结果与3∶1理论值总有些差距。因此有必要去考 察某一大小的差距是否已构成否定3∶l理论的充分根据。 这正是我们所讨论的拟合优度检验的问题。解决这类问题 的工具,是卡·皮尔逊在1900年发表的一篇文章中引进的所 谓 χ 2 检验法。 1.问题的导出 χ 2
2.拟合优度检验(比率拟合检验) 首先把问题表述成一般模式。设一总体包含c种可区别的个体。根据某种 理论或纯粹的假设,第i种个体出现的概率应为某个已知的数Pi(i=1, c),有P>0,∑P=1。这一组概率(理,B3,…,P)就构成 了我们的理论分布。现在在该总体中随机地抽取一个容量为m的样本,发 现其中第/种个体的数目为fi(i=1,2,…,,并有∑f=n我们 要据此检验理论分布。 用概率论的语言可以这样说,设对象总体中随机变量X有c种取值。当X的 取值是x;时,按零假设,其总体分布等于理论分布,即 (x)=P1( 例如,就孟德尔的3:1理论来说,c=2,P(x1)=3/4,P(x2)=1/4。现 在从该总体中随机地抽取一个容量为n的样本,发现其中x1(i=1,2…,c 出现的次数为f1(i=1,2,…,C),并有∑f=n。知道了频数也就知 道了频率,即:x出现的频率为n,并有2n=1 现在我们就是要据此经验分布来检验总体分布等于理论分布的零假设
◼ 首先把问题表述成一般模式。设一总体包含c种可区别的个体。根据某种 理论或纯粹的假设,第i种个体出现的概率应为某个已知的数Pi(i=1, 2,…,c),有Pi>0, =1。这一组概率(P1 ,P3 ,…,Pc)就构成 了我们的理论分布。现在在该总体中随机地抽取一个容量为n的样本,发 现其中第I 种个体的数目为fi (i=1,2,…,c),并有 =n。我们 要据此检验理论分布。 ◼ 用概率论的语言可以这样说,设对象总体中随机变量X有c种取值。当X的 取值是xi时,按零假设,其总体分布等于理论分布,即 P( )=Pi (i=1,2,…,c) 例如,就孟德尔的3∶1理论来说,c=2,P(x1)=3/4, P(x2)=1/4。现 在从该总体中随机地抽取一个容量为n的样本,发现其中xi(i=1,2…,c) 出现的次数为fi(i=1,2,…,c),并有 =n。知道了频数也就知 道了频率,即: 出现的频率为 ,并有 =1。 现在我们就是要据此经验分布来检验总体分布等于理论分布的零假设。 2.拟合优度检验(比率拟合检验) = c i Pi 1 = c i P i 1 = c i i f 1 = c i i f 1 i x i x n f i = c i i n f 1
拟合优度检验如何进行? 关键是确定合适的检验统计量以及该统计量所服从的概率分 布。这里不可避免地要引进某种人为因素,即人们设计出下 面这样的综合性可比指标: L=k(-21)2+k(2-2)+…+k(-P) 其中,R2,…,kc是适当选取的常数。仔细观察不难发现 ,L值大,意味着经验分布与理论分布偏离大;L值小,意味 着经验分布与理论分布偏离小。当在某个选定的水平上,经 验分布显著偏离理论分布,那么对象总体具有某种分布形式 的零假设便被否定
拟合优度检验如何进行? 关键是确定合适的检验统计量以及该统计量所服从的概率分 布。这里不可避免地要引进某种人为因素,即人们设计出下 面这样的综合性可比指标: 其中k1,k2,…,kc是适当选取的常数。仔细观察不难 发现 ,L值大,意味着经验分布与理论分布偏离大;L值小,意味 着经验分布与理论分布偏离小。当在某个选定的水平上,经 验分布显著偏离理论分布,那么对象总体具有某种分布形式 的零假设便被否定