第八章假设检验 第一节假设检验的概念 在总体X的分布完全未知,或只知其分布 但不知其参数的情况下,我们对的分布或分 布中的参数作出某种假设,然后根据样本,用 统计分析方法检验这一假设是否合理,从而作 出接受或拒绝这一假设的决定. 一、基本概念 对总体X的分布或分布中的参数提出假设,就称为统计假设, 所提出的假设叫做原假设(或零假设),记为H,对立于原假设的假设 称为备择假设(或对立假设),记为H· 假设检验就是根据样本,适当构造一个统计量,按照某种规则,决定是 接受H(拒绝H1)还是拒绝H(接受H1),所使用的统计量称为检验统计量. 只对总体分布中的参数提出假设进行检验的问题,称为参数检验
第八章 假 设 检 验 第一节 假设检验的概念 在总体X的分布完全未知,或只知其分布 但不知其参数的情况下,我们对X的分布或分 布中的参数作出某种假设,然后根据样本,用 统计分析方法检验这一假设是否合理,从而作 出接受或拒绝这一假设的决定. 一、基本概念 对总体 X 的分布或分布中的参数提出假设,就称为统计假设. 所提出的假设叫做原假设( 或零假设 ),记为 H0,对立于原假设的假设 称为备择假设( 或对立假设 ),记为H1. 假设检验就是根据样本,适当构造一个统计量,按照某种规则,决定是 接受 H0 ( 拒绝H1 )还是拒绝 H0 ( 接受H1 ),所使用的统计量称为检验统计量. 只对总体分布中的参数提出假设进行检验的问题,称为参数检验.
二、两类错误 由于检验法则是依据样本作出的,因此假设 检验的结果可能犯两类错误: 第一类错误:当原假设H为真时,作出的决 定却是拒绝Ho,犯这类错误的概率记为,即 P{拒绝HoH为真}=a. 第二类错误:当原假设H不正确时,作出的决定却是接受Ho,犯这类错 误的概率记为B,即 P{接受HoH不正确}=B· 在确定检验法则时,应尽可能使犯两类错误的概率都较小.但是,一般 说来,当样本容量给定以后,若减少犯某一类错误的概率,则犯另一类错误的 概率往往会增大,要使犯两类错误的概率都减小,只好增大样本容量
二、两类错误 在确定检验法则时,应尽可能使犯两类错误的概率都较小.但是,一般 说来,当样本容量给定以后,若减少犯某一类错误的概率,则犯另一类错误的 概率往往会增大,要使犯两类错误的概率都减小,只好增大样本容量. 由于检验法则是依据样本作出的,因此假设 检验的结果可能犯两类错误: 第一类错误:当原假设H0为真时,作出的决 定却是拒绝H0,犯这类错误的概率记为 ,即 P{拒绝H0 |H0为真}= . 第二类错误:当原假设H0不正确时,作出的决定却是接受H0,犯这类错 误的概率记为 ,即 P{接受H0 |H0不正确} = .
在给定样本容量的情况下,我们总是控 制犯第一类错误的概率,让它小于或等于¤, 而不考虑犯第二类错误的概率.这种检验问 题称为显著性检验问题.数称为显著性水 平.的大小依具体情况确定,通常取 =0.1,0.05,0.01 在对假设进行检验时,常使用某个统计量 T,称为检验统计量. 当检验统计量取某个区域W中的值时,我们就拒绝原假设H,,则称区域 W为拒绝域.拒绝域的边界点称为临界点.当检验统计量在某区域中取值时, 我们就接受H。,则称此区域为接受域:
在给定样本容量的情况下,我们总是控 制犯第一类错误的概率,让它小于或等于 , 而不考虑犯第二类错误的概率.这种检验问 题称为显著性检验问题.数 称为显著性水 平. 的大小依具体情况确定,通常取 =0.1,0.05,0.01. 在对假设进行检验时,常使用某个统计量 T,称为检验统计量. 当检验统计量取某个区域W 中的值时,我们就拒绝原假设H0 ,则称区域 W 为拒绝域.拒绝域的边界点称为临界点.当检验统计量在某区域中取值时, 我们就接受 H0 ,则称此区域为接受域.
例1某车间用一台包装机包装味精,每袋 标准重量为100g,由已往经验知每袋重量的标 准差σ=0.5g保持不变,每隔一定时间需要检 查包装机的工作情况,现抽取9袋,测得它们 的净重为: 99.0,100.2,99.3,99.1,99.6,99.2,99.9,100.1,99.3 假定每袋重量服从正态分布,试问这段时间内包装机的工作是否正常(取 显著性水平a=0.05)? 解设每袋重量X~W(4,0.52),回答包装机的工作是否正常,相当于判断 4=100(=4)是否正确.因此原假设H:4=o=100,备择假设为H14≠100, EH正确条件下u二是一个统计量,~NOD·又因为X是4的 无偏估计,所以X-4|不应该很大,即|X-|大过某个常数时,就应该拒 绝H·拒绝域的形式为 X-Lo
例1 某车间用一台包装机包装味精,每袋 标准重量为100g,由已往经验知每袋重量的标 准差 保持不变,每隔一定时间需要检 查包装机的工作情况,现抽取9 袋,测得它们 的净重为: 99.0,100.2,99.3,99.1,99.6,99.2,99.9,100.1,99.3 假定每袋重量服从正态分布,试问这段时间内包装机的工作是否正常(取 显著性水平 )? = 0.5g = 0.05 解 设每袋重量 ,回答包装机的工作是否正常,相当于判断 是否正确.因此原假设H0: ,备择假设为H1: ~ ( ,0.5 ) 2 X N 100( ) = = 0 = 0 =100 100 , 在 H0 正确条件下 是一个统计量,且 .又因为 是 的 无偏估计,所以 不应该很大,即 大过某个常数时,就应该拒 绝H0.拒绝域的形式为 n X u / 0 − = u ~ N(0,1) X | | X − 0 k n X − / 0 | | X − 0
于是令犯第一类错误的概率为,即 P 查标准正态分布表可得k=a12,于是有 当u区,的取值大于12时就应拒绝H,否则接受 ol/n Ho 现在4,=10,0=0.5,n=9,x=}2x=9.52,u2=1.96, i=1 1u1x-4=19952-101=2.8>196 oIn 0.5/9 所以拒绝Ho,即认为这段时间内包装机的工作不正常
当 的取值大于 时就应拒绝H0,否则接受 H0. 于是令犯第一类错误的概率为 ,即 查标准正态分布表可得 ,于是有 . / | | 0 = − k n X P u / 2 k = . / | | / 2 0 = − u n X P n X u / | | | | 0 − = u / 2 现在 . 所以拒绝H0,即认为这段时间内包装机的工作不正常. 99.52, 1.96, 9 1 100, 0.5, 9, / 2 9 1 0 = = = = = = = u n x x i i = − = n x u / | | | | 0 2.88 1.96 0.5/ 9 | 99.52 100 | = −