第7章 假设检验 在科研、生产和日常生活中,我们常常要对很多问题做出一定的论断或猜测,这就 是假设,而假设需要做出是或非的回答。为此,我们需要安排一些试验,试验的结果与 我们感兴趣的问题有着某种关系,我们可以根据试验的结果对所作出的论断制或猜测制 定判断规则并做出是或非的回答。以上的过程我们称之为假设检验。假设检验为统计推 断的重要内容之一。本章在建立假设检验的有关概念之后,重点介绍正态总体的参数的 检验方法。 7.1假设检验的基本概念 1.统计假设 设总体X的分布函数为F(),F()一般完全或部分未知,对未知的总体分布所作假 设称为一个统计假设。当总体分布的类型已知,对分布的一个或几个未知参数的值作出 假设,或者对总体分布函数的类型或某些特征提出某种假设,这种假设称为待检假设或 零假设,通常用弘表示。事实上,当我们提出了零假设时,也同时给出了另外一个假 设,即提供给我们选择的备择假设,记为H。瓜与H是互不相容的。 在参数模型下,如果总体的分布类型己知,仅是某个参数未知,只要对未知参数作 出假设就可确定总体的分布。这种仅涉及到总体分布的参数的统计假设称为参数假设。 若是对总体的分布类型或某些特征提出假设,这称为非参数假设。 例1手表厂生产的女表表壳,在正常情况下,其直径(单位:mm)服从正态分 布N(20,1)。为了检查该厂某天生产是否正常,对生产过程中的手表表壳随机的抽查 了5只,测的表面直径分别为19,19.5,19,20,20.5。问这天生产是否正常? 由问题的提出可知,我们实际上是要检查这天生产的手表表壳的直径4是否为 20?即提出假设:40=20及备择假设H:40≠20。这样,问题就转化为如何利用 抽查得到的样本去检验零假设μ0=20的真伪。因此,这就需要设置一种检验的规则以 及如何根据规则进行检验作进一步的讨论。 2.检验法则 在确定了待检假设以后,我们必须在与H之间作出抉择,而对一个假设的确定 只有接受和拒绝两种,例如在例1中,如果我们接受,即表示该厂这天的生产是正 常的,如果拒绝H,亦即接受H,则表示该天生产不正常。为此,必须设计一种合 理的法则,根据这一法则,就可利用已得到的样本作出判断。在例1中,由于要检验的 假设涉及总体均值,故容易想到可否借助样本均值x这一统计量来进行判断。这是因
第 第 7 7 章 章 假设检验 假设检验 在科研、生产和日常生活中,我们常常要对很多问题做出一定的论断或猜测,这就 是假设,而假设需要做出是或非的回答。为此,我们需要安排一些试验,试验的结果与 我们感兴趣的问题有着某种关系,我们可以根据试验的结果对所作出的论断制或猜测制 定判断规则并做出是或非的回答。以上的过程我们称之为假设检验。假设检验为统计推 断的重要内容之一。本章在建立假设检验的有关概念之后,重点介绍正态总体的参数的 检验方法。 7 7 . . 1 1 假设检验的基本概念 假设检验的基本概念 假设检验的基本概念 假设检验的基本概念 1.统计假设 设总体 X 的分布函数为 F(x),F(x)一般完全或部分未知,对未知的总体分布所作假 设称为一个统计假设。当总体分布的类型已知,对分布的一个或几个未知参数的值作出 假设,或者对总体分布函数的类型或某些特征提出某种假设,这种假设称为待检假设或 零假设,通常用 H0 表示。事实上,当我们提出了零假设时,也同时给出了另外一个假 设,即提供给我们选择的备择假设,记为 H1。H0 与 H1是互不相容的。 在参数模型下,如果总体的分布类型已知,仅是某个参数未知,只要对未知参数作 出假设就可确定总体的分布。这种仅涉及到总体分布的参数的统计假设称为参数假设。 若是对总体的分布类型或某些特征提出假设,这称为非参数假设。 例 1 手表厂生产的女表表壳,在正常情况下,其直径(单位:mm)服从正态分 布 N(20,1)。为了检查该厂某天生产是否正常,对生产过程中的手表表壳随机的抽查 了 5 只,测的表面直径分别为 19,19.5,19,20,20.5。问这天生产是否正常? 由问题的提出可知,我们实际上是要检查这天生产的手表表壳的直径 是否为 20?即提出假设 H0: 0 = 20 及备择假设 H1: 0 20。这样,问题就转化为如何利用 抽查得到的样本去检验零假设 0 = 20 的真伪。因此,这就需要设置一种检验的规则以 及如何根据规则进行检验作进一步的讨论。 2.检验法则 在确定了待检假设以后,我们必须在 H0与 H1 之间作出抉择,而对一个假设的确定 只有接受和拒绝两种,例如在例 1 中,如果我们接受 H0,即表示该厂这天的生产是正 常的,如果拒绝 H0,亦即接受 H1,则表示该天生产不正常。为此,必须设计一种合 理的法则,根据这一法则,就可利用已得到的样本作出判断。在例 1 中,由于要检验的 假设涉及总体均值,故容易想到可否借助样本均值 x 这一统计量来进行判断。这是因
为x是!的无偏估计,样本均值x的大小在一定的程度上反映了“的大小。因此,当 假设瓜为真时,则观测值x与μ。=20的偏差x-20一般不应太大。如果x-20过分 大,我们就应怀疑假设的正确性并拒绝历。而衡量x-4的大小归结为衡量统 计量 (x-Mol 的大小,在环为真时统计量 x-o-N(01) Gn 基于上面的设想,我们可适当限定一正数人,使得当x满足不等式 x-Hol ≥k ahn 时就拒绝H。反之,若 x-Ho <k Gn 时则接受6。正数k的每一个选择都对应着一个不同的检验法则。 在给定的一个检验法则中,以。表示在此检验法中引起拒绝的所有可能的样本 观察值的集合,并称。为此检验法的拒绝域,而它的余集称为接受域。显然,检验法 与拒绝域是一一对应的。 3.两类错误 我们做出判断的依据是一个样本,由于样本的随机性,我们进行假设检验时不可避 免地出现误判而犯错误,当为真时,仍可能做出拒绝历的判断,这类错误称为犯第 I类错误,也称为“弃真”或“拒真”;也可能在h不真时,却接受h,称为犯第Ⅱ类 错误,也称为“取伪”或“受伪”。犯第一类错误的概率为 P{拒绝为真} 由于在实际中无法排除犯这类错误的可能性,因此,我们自然希望犯第I类错误的概率 控制在一定的限度之内。例如可给定一个较小的正数(0<α<1),并使 P{拒绝为真}≤a α一般称为检验水平。下面我们将作进一步的讨论。 4.水平为au的检验 犯两类错误的大小自然就决定着相应的检验法则的优劣,但在样本容量固定的条件
为 x 是 的无偏估计,样本均值 x 的大小在一定的程度上反映了 的大小。因此,当 假设 H0为真时,则观测值 x 与 0 = 20 的偏差 x -20 一般不应太大。如果 x -20 过分 大,我们就应怀疑假设 H0 的正确性并拒绝 H0。而衡量 x - 0 的大小归结为衡量统 计量 n x 0 的大小,在 H0为真时统计量 ~ (0,1) 0 N n x 基于上面的设想,我们可适当限定一正数 k,使得当 x 满足不等式 n x 0 k 时就拒绝 H0。反之,若 k n x 0 时则接受 H0。正数 k 的每一个选择都对应着一个不同的检验法则。 在给定的一个检验法则中,以0表示在此检验法中引起拒绝 H0 的所有可能的样本 观察值的集合,并称0为此检验法的拒绝域,而它的余集称为接受域。显然,检验法 与拒绝域是一一对应的。 3.两类错误 我们做出判断的依据是一个样本,由于样本的随机性,我们进行假设检验时不可避 免地出现误判而犯错误,当 H0 为真时,仍可能做出拒绝 H0 的判断,这类错误称为犯第 Ⅰ类错误,也称为“弃真”或“拒真” ;也可能在 H0 不真时,却接受 H0,称为犯第Ⅱ类 错误,也称为“取伪”或“受伪”。犯第一类错误的概率为 P{拒绝 H0|为真} 由于在实际中无法排除犯这类错误的可能性,因此,我们自然希望犯第Ⅰ类错误的概率 控制在一定的限度之内。例如可给定一个较小的正数(0< <1),并使 P{拒绝 H0| H0 为真} 一般称为检验水平。下面我们将作进一步的讨论。 4.水平为 的检验 犯两类错误的大小自然就决定着相应的检验法则的优劣,但在样本容量固定的条件
下可以证明犯两类错误的概率不可能同时达到很小。通常6是比较重要的假设,因此 如何犯第I类错误的概率控制在小概率的范围内就显得非常重要。其做法如下:给定 (0<α<I),构造一个检验的拒绝域,使其犯第I类错误的概率不超过a,即P{拒绝% 为真}≤α。例如在例1中,为了检验:4o=20,我们构造了一个统计量 -a. F-20 1/w5 N(0,1) 如果给定a=0.05,并使犯第I类错误的概率最大为a,由此可构造一个拒绝域为: x-Ho 5 并使 x-Ho 这里a2可由标准正态分布表查得-。=a25=1.96 x-20 这时可得拒绝域为 1W5 ≥1.96,即-20≥1.96V5 这种把犯第I类错误的概率控制在不超过给定的α的检验法称为显著性水平为α:的检 验,并称为显著性水平,或简称为水平。 通过上面的例子,我们给出构造检验的一般方法。 例2设K,五,,rn为来自总体的一个样本,r~W(4,o),其中o2已 知,4未知。给定显著性水平为a(0<<1),试构造检验假设为 H。:μ=μ。,H:u≠4(4o为己知) 的水平为a的检验 解考虑μ的无偏估计灭,且知道 F-N(u.i) 当历为真时, X-N(Ho- 于是X的值应落在的附近。所以当为真时,|F-4。取较大值应为小概率事件。由 此选择H的拒绝域为 。={(x,x2,,xn):|x-402 这里k为某待定正常数。 当检验水平为a时,k应满足a=P{《K,X2X,)eXo}
下可以证明犯两类错误的概率不可能同时达到很小。通常 H0 是比较重要的假设,因此 如何犯第Ⅰ类错误的概率控制在小概率的范围内就显得非常重要。其做法如下:给定 (0< <1),构造一个检验的拒绝域,使其犯第Ⅰ类错误的概率不超过,即 P{拒绝 H0| H0 为真} 。例如在例 1 中,为了检验 H0: 0 = 20,我们构造了一个统计量 ~ ( 0 ,1 ) 1 5 0 20 N x n x 如果给定 = 0.05,并使犯第 I 类错误的概率最大为,由此可构造一个拒绝域为: 2 0 1 5 z x 并使 2 0 1 5 z x P 这里 z /2 可由标准正态分布表查得 0.025 1.96 2 z z 这时可得拒绝域为 1.96, 20 1.96 5 1 5 20 : 0 x x 即 这种把犯第Ⅰ类错误的概率控制在不超过给定的 的检验法称为显著性水平为 的检 验,并称 为显著性水平,或简称为水平。 通过上面的例子,我们给出构造检验的一般方法。 例 2 设 X1,X2,…,X n为来自总体 X 的一个样本, X N(,0 2),其中0 2 已 知, 未知。给定显著性水平为(0< <1),试构造检验假设为 H0 : 0 , H1 : 0 ( 0为已知) 的水平为 的检验 解 考虑 的无偏估计 X ,且知道 ~ ( , ). 2 0 n X N 当 H0为真时, ~ ( , ). 2 0 0 n X N 于是 X 的值应落在0 的附近。所以当 H0为真时,| X 0 |取较大值应为小概率事件。由 此选择 H0的拒绝域为 {( , ,..., ) : | | } 0 1 2 0 x x x x k n 这里 k 为某待定正常数。 当检验水平为 时, k 应满足 1 2 0 ( , ,.... ) 0 P X X X X H n
-低游 60 故 k=Za 因此所取得水平为a的拒绝域为N,=,5):-≥2} Goln 由此例可见,统计量下-4或 |X-4I GoAn 在检验的构造过程中起着关键作用,一般称其为检验统计量。我们要求在环为真时, 检验统计量的分布应是确定的(已知)的,且不含任何未知参数。例如在例1中,其检验 统计量为 |-4l-N0,) coAIn 它满足上述要求。故在α=0.05时,拒绝域为 0=x,x):2--20≥52=1.9 GoIVn 1115 由样本算得 F=1.96 代入检验统计量中可得 1F-201=19.6-2015=0.894<2=1.96 1/W5 2 这表明样本值落在接受域内,故应接受,从而认为该天生产的女表表壳可得直径的 均值是20,亦即认为该天的生产是正常的。 例3安装一台新仪器要求元件尺寸的均值保持在原有仪器的水平。已知原有仪器的 元件尺寸均值为3.278cm,均方差为0.002cm。现测量10个新元件,得尺寸数据(单 位:cm)为 3.2773.2813.2783.2783.2863.2793.2783.2813.2793.280. 设元件尺寸服从正态分布。且新、旧元件尺寸分布的方差相同,问新装仪器的元件尺寸 的均值与原有仪器的元件尺寸均值有误显著差别?(取=0.05) 解设元件尺寸r服从正态分布P~W(4,σ),因新旧元件尺寸的方差相同,故σ 2=0.02。由题意知待检假设为 H。:μ=3.278,H1:4≠3.278 由例2可知,水平为a的拒绝域为N,=(任,5,)-≥ GoIn
, | | | | 0 0 0 0 0 0 n k n X P X k P 故 即 0 2 z n k n k z 0 2 因此所取得水平为 的拒绝域为 } / | | {( , ,..., ) : 0 2 0 0 1 2 z n x x x x n 由此例可见,统计量 X 0或 n X 0 0 | | 在检验的构造过程中起着关键作用,一般称其为检验统计量。我们要求在 H0 为真时, 检验统计量的分布应是确定的(已知)的,且不含任何未知参数。例如在例 1 中,其检验 统计量为 ~ (0,1) | | 0 0 N n X 它满足上述要求。故在 =0.05 时,拒绝域为 1.96} 1/ 5 | 20 | / | | {( , ,..., ) : 0 2 0 0 1 2 z x n x x x x n 由样本算得 X 1.96 代入检验统计量中可得 | 19.6 20 | 5 0.8944 1.96 1 5 | 20 | 2 z X 这表明样本值落在接受域内,故应接受 H0,从而认为该天生产的女表表壳可得直径的 均值是 20,亦即认为该天的生产是正常的。 例 3 安装一台新仪器要求元件尺寸的均值保持在原有仪器的水平。已知原有仪器的 元件尺寸均值为 3.278cm,均方差为 0.002cm。现测量 10 个新元件,得尺寸数据(单 位:cm)为 3.277 3.281 3.278 3.278 3.286 3.279 3.278 3.281 3.279 3.280. 设元件尺寸服从正态分布。且新、旧元件尺寸分布的方差相同,问新装仪器的元件尺寸 的均值与原有仪器的元件尺寸均值有误显著差别?(取 =0.05) 解 设元件尺寸 X 服从正态分布 X N(, 2),因新旧元件尺寸的方差相同,故 2=0.02。由题意知待检假设为 H0 : 3.278, H1 : 3.278 由例 2 可知,水平为 的拒绝域为 } / | | {( , ,..., ) : 0 2 0 0 1 2 z n x x x x n
现在=0.05,由例1知 台=5=1.96. 又由样本算得均值为 X=3.2795 且 40=3.278,o2=0.0022,n=10 从而可算得F-_32795-3278 10 =2.37>1.96 o。/Nn 0.02 由于它落在拒绝域。内,故拒绝H,接受H,即认为新旧元件尺寸的均值之间存在显 著差别。 5.假设检验的程序 上面叙述的检验法则具有普遍意义,可用在各种各样的假设检验问题上。由此我们 归结出假设检验的一般步骤: 1.根据题意合理地建立零假设历和设备假设H: 若零假设为H:4=μo,则备择假设H根据实际情况可以有下面三种: H:(I)4≠4。(2)μ<4。(3)4>o 在一般情况下H常选择(1),这时称为双侧检验:若选择(2)或(3)称为单侧检验。 如所考虑总体的均值越大越好时,H可选择(3)。 2.选择适当的检验统计量T; 要求在而为真时,统计量T的分布是确定和己知的: 3.规定检验水平,并由和H确定一个合理的拒绝域(含有待定常数). 4.样由本观测值,计算出统计量To的值: 5.作出判断:若统计量的值To落在拒绝域内,则拒绝,否则接受。 7.2正态总体的参数分布 下面我们讨论正态总体参数的假设检验问题,分单个正态总体与两个正态总体的情 形来讨论。 1.单个总体均值μ的检验 设样本,,,rn来自正态总体X~N(山,σ)。 (1)方差o2己知,检验假设h:4=μ0 这时备择假设H可根据具体问题选择H:()4≠4。(2)u<4。(3)μ> 中的一种。检验统计量取 X-oN0,1) 在给定水平为a时,若备择假设为H:4≠4o,则其拒绝域为
现在 =0.05,由例 1 知 0.025 1.96 . 2 z z 又由样本算得均值为 X 3.2795 且 3.278, 0.002 , 10, 2 2 0 n 从而可算得 10 . 2.37 1.96. 0.02 | | 3.2795 3.278 0 0 n X 由于它落在拒绝域0 内,故拒绝 H0,接受 H1,即认为新旧元件尺寸的均值之间存在显 著差别。 5 5 .假设检验的程序 上面叙述的检验法则具有普遍意义,可用在各种各样的假设检验问题上。由此我们 归结出假设检验的一般步骤: 1. 根据题意合理地建立零假设 H0 和设备假设 H1; 若零假设为 H0: = 0,则备择假设 H1 根据实际情况可以有下面三种: 1 0 0 0 H : (1) (2) (3) 在一般情况下 H1常选择(1),这时称为双侧检验;若选择(2)或(3)称为单侧检验。 如所考虑总体的均值越大越好时,H1可选择(3)。 2. 选择适当的检验统计量 T; 要求在 H0 为真时,统计量 T 的分布是确定和已知的; 3. 规定检验水平,并由 H0 和 H1 确定一个合理的拒绝域(0 含有待定常数). 4. 样由本观测值,计算出统计量 T0 的值; 5. 作出判断:若统计量的值 T0 落在拒绝域内,则拒绝 H0,否则接受 H0。 7.2 7.2 正态总体的参数分布 正态总体的参数分布 正态总体的参数分布 正态总体的参数分布 下面我们讨论正态总体参数的假设检验问题,分单个正态总体与两个正态总体的情 形来讨论。 1.单个总体均值 的检验 设样本 X1,X2,…,X n来自正态总体 X N(, 2)。 (1) 方差 2 已知,检验假设 H0: = 0 这时备择假设 H1 可根据具体问题选择 1 0 0 0 H : (1) (2) (3) 中的一种。检验统计量取 ~ (0,1). 0 N n X u 在给定水平为时,若备择假设为 H1: 0,则其拒绝域为