第七章假设检验 推论统计有两个基本内容:①假设检验;②参数估计。有了概率和概率分布 的知识,接下来我们要逐步掌握统计检验的一般步骤。既然按照数学规则得到的 概率都不能用经验方法准确求得,于是,理论概率和经验得到的频率之间肯定存 在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不同。本章我们不仅要引 出二项分布和正态分布这两个著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面 第一节二项分布 二项分布是从著名的贝努里试验中推导而来。所谓贝努里试验,是指只有两 种可能结果的随机试验。在实际问题中,有许多随机现象只包含两个结果,如男 与女,是与非,生与死,同意与不同意,赞成与反对等等。通常,我们把其中比 较关注那个结果称为“成功”,另一个结果则称为“失败”。每当情况如同贝努里 试验,是在相同的条件下重复n次,考虑的是“成功”的概率,且各次试验相互 独立,就可利用与二项分布有关的统计检验。虽然许多分布较之二项分布更实用, 但二项分布简单明了,况且其他概率分布的使用和计算逻辑与之相同。所以要理 解统计检验以及它所涉及的许多新概念,人们几乎都乐意从二项分布的讨论入 1.二项分布的数学形式 从掷硬币的试验入手。假定二项试验由重复抛掷n次硬币组成,已知硬币 面朝上(成功)的概率是p,面朝下(失败)的概率是q(显然有q=1-p)。这样, 对试验结果而言,成功的次数(即硬币面朝上的次数)X是一个离散型随机变量 它的可能取值是0,1,2,3,…,n。而对X的一个具体取值x而言,根据乘法 规则,我们立刻可以就试验结果计算出一种特定排列方式(先x次面朝上,而后 n-x次面朝下)实现的概率,即 ppppqqgg-pxqn-x
第七章 假设检验 推论统计有两个基本内容:①假设检验;②参数估计。有了概率和概率分布 的知识,接下来我们要逐步掌握统计检验的一般步骤。既然按照数学规则得到的 概率都不能用经验方法准确求得,于是,理论概率和经验得到的频率之间肯定存 在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不同。本章我们不仅要引 出二项分布和正态分布这两个著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面。 第一节 二项分布 二项分布是从著名的贝努里试验中推导而来。所谓贝努里试验,是指只有两 种可能结果的随机试验。在实际问题中,有许多随机现象只包含两个结果,如男 与女,是与非,生与死,同意与不同意,赞成与反对等等。通常,我们把其中比 较关注那个结果称为“成功”,另一个结果则称为“失败”。每当情况如同贝努里 试验,是在相同的条件下重复 n 次,考虑的是“成功”的概率,且各次试验相互 独立,就可利用与二项分布有关的统计检验。虽然许多分布较之二项分布更实用, 但二项分布简单明了,况且其他概率分布的使用和计算逻辑与之相同。所以要理 解统计检验以及它所涉及的许多新概念,人们几乎都乐意从二项分布的讨论入 手。 1. 二项分布的数学形式 从掷硬币的试验入手。假定二项试验由重复抛掷 n 次硬币组成,已知硬币 面朝上(成功)的概率是 p,面朝下(失败)的概率是 q (显然有 q=1―p)。这样, 对试验结果而言,成功的次数(即硬币面朝上的次数)X 是一个离散型随机变量, 它的可能取值是 0,1,2,3,…,n。而对 X 的一个具体取值 x 而言,根据乘法 规则,我们立刻可以就试验结果计算出一种特定排列方式(先 x 次面朝上,而后 n―x 次面朝下)实现的概率,即 ppp…pqqq…q=pxqn-x
由于正确解决概率问题,光考虑乘法规则是不够的,还要考虑加法规则,于 是就x次成功和(n-x)次失败这个宏观结果而言所包含的所有排列的方式数, 用符号表示 这样,我们就得到了二项试验中随机变量X的概率分布,即 P( 2.二项分布讨论 ①二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下 n次重复的伯努利试验时,随机变量X共有n+1个取值。二项分布可以用分 布律(见上表)和折线图(见右图)来表示。 ②当P=0.5时二项分布的图形是对称的。 PCr-x)d 0.25 o.2 0.5 g1o1214 3 E(X)=H=np, D(X)=0 2= npq ④二项分布受p和n变化的影响,只要确定了p和n,成功次 数Ⅹ的分布也随之确定。因此,二项分布还可简写作B(x;n,p) ⑤二项分布的概率值除了根据公式直接进行计算外,还可查表求得。 二项分布表的编制方法有两种:一种依据概率分布律P(x)编制(见附表2) 另一种依据分布函数F(x)编制(见附表3)。 (x)=P(X≥x)=∑B(X;n,p)
由于正确解决概率问题,光考虑乘法规则是不够的,还要考虑加法规则,于 是就 x 次成功和(n―x)次失败这个宏观结果而言所包含的所有排列的方式数, 用符号表示 这样,我们就得到了二项试验中随机变量 X 的概率分布,即 2. 二项分布讨论 ① 二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下 n 次重复的伯努利试验时,随机变量 X 共有 n+1 个取值。二项分布可以用分 布律(见上表)和折线图(见右图)来表示。 ②当 P=0.5 时二项分布的图形是对称的。 ③ E(X)=μ=np, D(X)= σ2= npq ④ 二项分布受 p 和 n 变化的影响,只要确定了 p 和 n,成功次 数 X 的分布也随之确定。因此,二项分布还可简写作 B(x; n,p)。 ⑤二项分布的概率值除了根据公式直接进行计算外,还可查表求得。 二项分布表的编制方法有两种:一种依据概率分布律 P(x) 编制(见附表 2); 另一种依据分布函数 F(x) 编制(见附表 3)。 !( )! ! x n x n C x n − = x x n x P X x Cn p q − ( = ) = = = n x F(x) P(X x) B(X;n, p)
[例]某特定社区人口的10%是少数民族,现随机抽取6人,问其中恰好2 人是少数民族的概率是多少? [解]解法一:根据(7.3)式直接计算 P(X=2)=C6p'q =0.0984 214!(10)(10 解法二:根据附表2中纵列n=6和横行p=0.1所对应ⅹ值,可直 接查得B(x:6,0.1)的概率值 B(2;6,0.1)=0.0984 解法三:根据附表3求得 B(2;6,0.1)=F(2)-F(3) 0.1143-0.0159=0.0984 第二节统计检验的基本步骤 二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到概率 分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试验或抽样 调査的结果仅与随机变量可能取值中的一个相联系,那么实际试验或样本调 查对结果的概率分布及前提假设有没有一个检验的问题?具体来讲,对于一 枚硬币被重复抛掷8次的二项试验,经验告诉我们,一共有9种可能的结果, 而且实现这些结果的机会是大不相同的。研究者实际上从来不用经验的方法 求得概率分布,因为通常我们只对一项试验进行一次或几次,抽取样本也是 个或至多不过几个。既然二项分布是按照数学规则得到的,那么对这9种 结果的可能性我们应该作出何种评价呢?如果实际试验(或抽样)得到的结 果偏巧就是先验概率预示的最不可能出现的结果,那么我们是认定纯属巧 合,还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提 假设产生怀疑?更准确地说,在一枚硬币被重复抛掷8次的这个二项试验中, 究竟出现什么结果时,我们应该对二项分布及其前提假设产生怀疑呢?是不 是只要不是得到4次成功4次失败这个最大可能性结果就开始怀疑,还是仅
[例] 某特定社区人口的 10%是少数民族,现随机抽取 6 人,问其中恰好 2 人是少数民族的概率是多少? [解] 解法一:根据(7.3)式直接计算 解法二:根据附表 2 中纵列 n=6 和横行 p=0.1 所对应 x 值,可直 接查得 B(x;6,0.1)的概率值 B (2;6,0.1)=0.0984 解法三:根据附表 3 求得 B (2;6,0.1)=F(2) ―F(3 ) = 0.1143―0.0159=0.0984 第二节 统计检验的基本步骤 二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到概率 分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试验或抽样 调查的结果仅与随机变量可能取值中的一个相联系,那么实际试验或样本调 查对结果的概率分布及前提假设有没有一个检验的问题?具体来讲,对于一 枚硬币被重复抛掷 8 次的二项试验,经验告诉我们,一共有 9 种可能的结果, 而且实现这些结果的机会是大不相同的。研究者实际上从来不用经验的方法 求得概率分布,因为通常我们只对一项试验进行一次或几次,抽取样本也是 一个或至多不过几个。既然二项分布是按照数学规则得到的,那么对这 9 种 结果的可能性我们应该作出何种评价呢?如果实际试验(或抽样)得到的结 果偏巧就是先验概率预示的最不可能出现的结果,那么我们是认定纯属巧 合,还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提 假设产生怀疑?更准确地说,在一枚硬币被重复抛掷 8 次的这个二项试验中, 究竟出现什么结果时,我们应该对二项分布及其前提假设产生怀疑呢?是不 是只要不是得到 4 次成功 4 次失败这个最大可能性结果就开始怀疑,还是仅 0.0984 10 9 10 1 2!4! 6! ( 2) 2 4 2 2 4 6 = P X = = C p q =
当出现8次成功或一次也不成功这两个极端情况时才产生怀疑呢?这就是统 计检验的核心问题 统计检验是指先建立一个关于总体情况的假设,继而抽取一个随机样 本,然后以样本的统计量或者统计性质来检定假设。 大数定理表明:就大量观察而言,事件的发生具有一定的规律性。 根据概率的大小,人们处理的态度和方式很不一样。 在日常生活中,人们往往习惯于把概率很小的事件,当作一次观察中是 极不可能看到的事件。例如,人们出门做事就有可能遇到不测事故,但却很 少人因此而不敢出门。原因是:小概率事件极不可能发生。 统计检验的依据是小概率原理:一是认为小概率事件在一次观察中是极 少出现的;二是如果在一次观察中出现了小概率事件,那么应该否定原有事 件具有小概率的说法或者假设 所有统计检验所包含的步骤: (1)建立假设 (2)求抽样分布 (3)选择显著性水平和否定域 (4)计算检验统计量 (5)判定 1.建立假设 统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结 果,依据描述性统计的方法就足够了。抽样分布则不然,它无法从资料中得到 非利用概率论不可。而不对待概括的总体和使用的抽样程序做某种必要的假设, 这项工作将无法进行。比如通过掷硬币的实验得到二项分布,必须假设:①样本 是随机的,试验中各次抛掷相互独立:②硬币是无偏的(或称是诚实的),即p q=0.5。概括地说,必须首先就研究总体和抽样方案都做出假设,再加上概率论, 我们就可以对各种可能结果做具体的概率陈述了。 2.求抽样分布 在做了必要的假设之后,我们就能用数学推理过程来求抽样分布了。比如在 这一章开头,在硬币重复抛掷n次的理想实验中,我们计算了成功次数为x的宏
当出现 8 次成功或一次也不成功这两个极端情况时才产生怀疑呢?这就是统 计检验的核心问题。 统计检验是指先建立一个关于总体情况的假设,继而抽取一个随机样 本,然后以样本的统计量或者统计性质来检定假设。 大数定理表明:就大量观察而言,事件的发生具有一定的规律性。 根据概率的大小,人们处理的态度和方式很不一样。 在日常生活中,人们往往习惯于把概率很小的事件,当作一次观察中是 极不可能看到的事件。例如,人们出门做事就有可能遇到不测事故,但却很 少人因此而不敢出门。原因是:小概率事件极不可能发生。 统计检验的依据是小概率原理:一是认为小概率事件在一次观察中是极 少出现的;二是如果在一次观察中出现了小概率事件,那么应该否定原有事 件具有小概率的说法或者假设。 所有统计检验所包含的步骤: (1)建立假设 (2)求抽样分布 (3)选择显著性水平和否定域 (4)计算检验统计量 (5)判定 1.建立假设 统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结 果,依据描述性统计的方法就足够了。抽样分布则不然,它无法从资料中得到, 非利用概率论不可。而不对待概括的总体和使用的抽样程序做某种必要的假设, 这项工作将无法进行。比如通过掷硬币的实验得到二项分布,必须假设:①样本 是随机的,试验中各次抛掷相互独立;②硬币是无偏的(或称是诚实的),即 p= q=0.5。概括地说,必须首先就研究总体和抽样方案都做出假设,再加上概率论, 我们就可以对各种可能结果做具体的概率陈述了。 2.求抽样分布 在做了必要的假设之后,我们就能用数学推理过程来求抽样分布了。比如在 这一章开头,在硬币重复抛掷 n 次的理想实验中,我们计算了成功次数为 x 的宏
观结果所具有的概率,得到二项分布。如果前提假设变动了,还可以求出其他形 式的概率分布,如正态分布、泊松分布、卡方分布等等,它们都有特定的方程式。 由于数学上已经取得的成果,实际上统计工作者要做的这项工作往往并不是真的 去求抽样分布的数学形式,而是根据具体需要,确定特定问题的统计检验应该采 用哪种分布的现成的数学用表。 3.选择显著性水平和否定域 (1)否定域 在统计检验中,那些不大可能的结果称为否定域。如果这类结果真的发生了, 我们将否定假设:反之就不否定假设 (2)零假设与备择假设 在统计检验中,通常把被检验的那个假设称为零假设(用符号H表示),并 用它和其他备择假设(用符号H1表示)相对比 (3)两类错误及其关系 在统计检验中,无论是拒绝或者接受原假设,都不可能做到百分之百的正确, 都有一定的错误。第一类错误是,零假设H实际上是正确的,却被否定了。第 二类错误则是,HO实际上是错的,却没有被否定。 遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二 类错误,也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验 而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲, 不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概 率是否定域内各种结果的概率之和。 (4)显著性水平a 被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用α 表示),它决定了否定域的大小。因此,有人也把第一类错误称之α错误。相应 地第二类错误被人称为错误。在原假设成立的条件下,统计检验中所规定的小概 率标准一般取为α=0.05或α=0.01 由α所决定的否定域与接受域之间的分界值被称为临界值,如Z。。如果抽 样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以 和显著性水平的要求一致起来(后面的正态检验就如此)
观结果所具有的概率,得到二项分布。如果前提假设变动了,还可以求出其他形 式的概率分布,如正态分布、泊松分布、卡方分布等等,它们都有特定的方程式。 由于数学上已经取得的成果,实际上统计工作者要做的这项工作往往并不是真的 去求抽样分布的数学形式,而是根据具体需要,确定特定问题的统计检验应该采 用哪种分布的现成的数学用表。 3.选择显著性水平和否定域 (1)否定域 在统计检验中,那些不大可能的结果称为否定域。如果这类结果真的发生了, 我们将否定假设;反之就不否定假设。 (2)零假设与备择假设 在统计检验中,通常把被检验的那个假设称为零假设(用符号 H0 表示),并 用它和其他备择假设(用符号 H1 表示)相对比。 (3)两类错误及其关系 在统计检验中,无论是拒绝或者接受原假设,都不可能做到百分之百的正确, 都有一定的错误。第一类错误是,零假设 H0 实际上是正确的,却被否定了。第 二类错误则是,H0 实际上是错的,却没有被否定。 遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二 类错误,也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验 而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲, 不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概 率是否定域内各种结果的概率之和。 (4)显著性水平α 被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用α 表示),它决定了否定域的大小。因此,有人也把第一类错误称之α错误。相应 地第二类错误被人称为错误。在原假设成立的条件下,统计检验中所规定的小概 率标准一般取为α=0.05 或α=0.01。 由α所决定的否定域与接受域之间的分界值被称为临界值,如 Z a。如果抽 样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以 和显著性水平的要求一致起来(后面的正态检验就如此)