第七讲:假设检验 7.1基本概念和问题的提法 1 7.1.1基本概念 7.1. 2原假设的提法.·· 9 7.1.3检验统计量的选取及假设检验的步骤.11 Previous Next First Last Back Forward 1
第七讲: 假设检验 7.1 基本概念和问题的提法 . . . . . . . . . . . . . 1 7.1.1 基本概念 . . . . . . . . . . . . . . . . 1 7.1.2 原假设的提法 . . . . . . . . . . . . . . 9 7.1.3 检验统计量的选取及假设检验的步骤 . 11 Previous Next First Last Back Forward 1
7.1基本概念和问题的提法 ·(统计)假设:在数理统计中,关于总体分布的概率性质的假 定.例如假设正态总体,二项总体等,或者二项总体中成功概率 p≤0.5等等. 。(统计)检验:使用样本对所作出的假设进行检查的方法和过程。 7.1.1基本概念 假设检验问题就是研究如何根据抽样后获得的样本来检查抽样前 所作假设是否合理, 首先,由一个例子引出一些基本概念。 某厂产品出厂检验规定:每批产品次品率p不超过4%才能出 下Example 厂。现从某批产品10000件中任意抽查12件发现4件次品,问该批 产品能否出厂?若抽得结果是1件次品呢? ⊥Example Previous Next First Last Back Forward
7.1 基本概念和问题的提法 • (统计) 假设: 在数理统计中, 关于总体分布的概率性质的假 定. 例如假设正态总体, 二项总体等, 或者二项总体中成功概率 p ≤ 0.5 等等. • (统计) 检验: 使用样本对所作出的假设进行检查的方法和过程. 7.1.1 基本概念 假设检验问题就是研究如何根据抽样后获得的样本来检查抽样前 所作假设是否合理. 首先, 由一个例子引出一些基本概念. ↑Example 某厂产品出厂检验规定:每批产品次品率 p 不超过 4% 才能出 厂。现从某批产品 10000 件中任意抽查 12 件发现 4 件次品,问该批 产品能否出厂?若抽得结果是 1 件次品呢? ↓Example Previous Next First Last Back Forward 1
解:若以p表示此批产品的次品率,则问该批产品能否出厂等价于 即要检验次品率p是否不超过4%。我们假设“p≤4%”,并记Y为 12件中的次品数,由于总产品数很大,故可以认为Y~B(12,p), 此时当p≤0.04时, P(Y=4) 19 0.0440.96=0.000914 这是一个小概率事件,即当p≤0.04时,12件产品中有4件是次 品的概率不到1/1000,这样的事件在一次试验中几乎是不可能发生 的,但确实发生了(我们观察到了4件次品),因此更倾向于怀疑假设 “p≤0.04”的正确性,即认为它不成立。而由于 P(Y=1) 0.040.9612=0.306 即此时当假设“p≤0.04”成立时,“12个产品中有一个次品”这一 事件的概率最大为0.306,这个事件不是小概率事件。因此我们没有 足够的证据支持原假设不成立这一说法。 Previous Next First Last Back Forward
解: 若以 p 表示此批产品的次品率,则问该批产品能否出厂等价于 即要检验次品率 p 是否不超过 4%。我们假设“p ≤ 4%”,并记 Y 为 12 件中的次品数,由于总产品数很大,故可以认为 Y ∼ B(12, p), 此时当 p ≤ 0.04 时, P(Y = 4) = ( 12 4 ) p 4 q 8 < ( 12 4 ) 0.044 0.968 = 0.000914 这是一个小概率事件,即当 p ≤ 0.04 时,12 件产品中有 4 件是次 品的概率不到 1/1000,这样的事件在一次试验中几乎是不可能发生 的,但确实发生了 (我们观察到了 4 件次品), 因此更倾向于怀疑假设 “p ≤ 0.04”的正确性,即认为它不成立。而由于 P(Y = 1) ≤ ( 12 1 ) 0.041 0.9612 = 0.306 即此时当假设“p ≤ 0.04”成立时,“12 个产品中有一个次品”这一 事件的概率最大为 0.306,这个事件不是小概率事件。因此我们没有 足够的证据支持原假设不成立这一说法。 Previous Next First Last Back Forward 2
某饮料厂在自动流水线上罐装饮料.在正常生产情况下,每瓶饮 下Example 料的容量(单位:毫升)X服从正态分布N(500,10)(由以往的经验 得知).经过一段时间之后,有人觉得每瓶饮料的平均容量减小到490, 于是抽取了9瓶样品,称得它们的平均值为元=492毫升.试问此断 言是否正确?即问平均每瓶饮料的容量仍是500毫升还是变成490 毫升?假定标准差10毫升不变 ⊥Example 在这个问题中, 统计假设:罐装饮料容量X~N(4,10) 问题:根据样本来在“μ=500”和“μ=490”之间作判断. 数理统计中,把它们看成两个假设.习惯上,称前者为原假设或零 假设,记作Ho:后者称为备择假设或对立假设,记作H1或H。·所谓 检验 H0:μ=500←+H1:4=490. Previous Next First Last Back Forward 3
↑Example 某饮料厂在自动流水线上罐装饮料. 在正常生产情况下, 每瓶饮 料的容量 (单位: 毫升) X 服从正态分布 N(500, 102 ) (由以往的经验 得知). 经过一段时间之后, 有人觉得每瓶饮料的平均容量减小到 490, 于是抽取了 9 瓶样品, 称得它们的平均值为 x¯ = 492 毫升. 试问此断 言是否正确? 即问平均每瓶饮料的容量仍是 500 毫升还是变成 490 毫升? 假定标准差 10 毫升不变. ↓Example 在这个问题中, 统计假设: 罐装饮料容量 X ∼ N(µ, 102 ). 问题: 根据样本来在 “µ = 500” 和 “µ = 490” 之间作判断. 数理统计中, 把它们看成两个假设. 习惯上, 称前者为原假设或零 假设, 记作 H0; 后者称为备择假设或对立假设, 记作 H1 或 Ha. 所谓 检验 H0 : µ = 500 ↔ H1 : µ = 490. Previous Next First Last Back Forward 3
就是要根据样本判断究竟是“Ho成立”还是“H1成立”.断言“Ho 成立”称为不能拒绝Ho;断言“H1成立”称为拒绝Ho. 下面讨论如何检验上述假设,即给定一个接受或者拒绝零假设的 准则.设从总体中抽取一个样本X1,·,X,我们可以用极大似然估 计T=(称之为检验统计量)来估计4.由于该估计值接近μ(尤 其是当样本量较大时),故当T的绝对值小的时候有利于H1而不利 于Ho,此时应该拒绝Ho.我们可以事先取定一个常数T,称之为临 界值,当T的取值小于该临界值时拒绝Ho,即样本满足 W={区<} 中时拒绝Ho,称W为拒绝域.即样本的取值落在拒绝域中,就拒绝 Ho,否则不能拒绝之.一个拒绝域就对应于一个检验方法.现在的问 题是T应该取多大?这涉及到两类错误 Previous Next First Last Back Forward 4
就是要根据样本判断究竟是 “H0 成立” 还是 “H1 成立”. 断言 “H0 成立” 称为不能拒绝 H0; 断言 “H1 成立” 称为拒绝 H0. 下面讨论如何检验上述假设, 即给定一个接受或者拒绝零假设的 准则. 设从总体中抽取一个样本 X1, · · · , Xn, 我们可以用极大似然估 计 T = X¯ (称之为检验统计量) 来估计 µ. 由于该估计值接近 µ (尤 其是当样本量较大时), 故当 T 的绝对值小的时候有利于 H1 而不利 于 H0, 此时应该拒绝 H0. 我们可以事先取定一个常数 τ , 称之为临 界值, 当 T 的取值小于该临界值时拒绝 H0, 即样本满足 W = {X < τ ¯ } 中时拒绝 H0, 称 W 为拒绝域. 即样本的取值落在拒绝域中, 就拒绝 H0, 否则不能拒绝之. 一个拒绝域就对应于一个检验方法. 现在的问 题是 τ 应该取多大? 这涉及到两类错误. Previous Next First Last Back Forward 4