Lecl1:假设检验(三) 张伟平 2011年4月28日 1一致最优检验与无偏检验 一、引言及定义 设有样本X,它取值于样本空间见,X的分布属于分布族{F,0∈日},日为参数空间. 如S5.1所述,参数0的假设检验问题可以表成如下的一般形式 H0:0∈Θ0←→H1:0∈Θ1, (1.1) 此处日0为参数空间日的非空真子集,日1=日-Θ0 对检验问题(1.1)可用种种不同方法去检验,这就产生不同检验的比较问题,以及在种种意义 下求“最优”检验问题.这与我们在第三章参数估计问题中,在无偏估计中找一致最小方差无偏 估计的问题完全相似.下面首先给出一致最优检验的定义. 定义5.4.1设有检验问题(1.1),令0<a<1,记Φ。为(1.1)的一切水平为a的检验的集合 若p∈Φa,且对任何检验p1∈④a有 B(0)≥Bp,(0),H6∈Θ1 (1.2) 则称p为(1.l)的一个水平为a的一致最优检验(Uniformly Most Powerful Test),简称水平 为a的UMP检验.当p为水平a的UMP检验时,它在限制第一类错误概率不超过a的条件下,总 使第二类错误概率达到最小.因此若以错误概率为衡量检验优劣的唯一量度,且接受限制第一 类错误概率的原则,则UMP检验是最好的检验.不过,UMP检验的存在一般是例外而不常见的, 理由如下:若日1不止包含一个点,则当在其中取两个不同点01和02时,为使B。(0)尽可能大的那 种检验p,不见得同时也能使B(02)大.只有在日o和日1都只包含一点时,UMP检验才存在.这就 是下面Neyman-Pearson(简称NP)引理的内容. 二、Neyman-Pearson引理 定理5.4.1(NP基本引理)设样本X的分布有概率函数f(x,),参数9只有两个可能的 值o和91,考虑下列检验问题 H0:09=00←→H1:0=01, (1.3) 则对任给的0<a<1有
Lec11: bu(n) ‹ï² 2011 c 4 28 F 1 òóÅ`uÜÆu ò!⁄Û9½¬ kX, ßäuòm X , X ©Ÿ·u©Ÿx{Fθ, θ ∈ Θ}, ΘèÎÍòm. X§5.1§„, ÎÍθ buØKå±L§XeòÑ/™ H0 : θ ∈ Θ0 ←→ H1 : θ ∈ Θ1, (1.1) d?Θ0 èÎÍòmΘ öò˝f8, Θ1 = Θ − Θ0. ÈuØK(1.1)å^´´ÿ”ê{u, ˘“)ÿ”u'ØK, ±93´´ø¬ e¶/Å`0uØK. ˘Ü·Ç31nŸÎÍOØK•, 3ÆO•ÈòóÅêÆ OØKÉq. e°ƒkâ—òóÅ`u½¬. ½¬5.4.1 kuØK(1.1),-0 < α < 1, PΦαè(1.1)òÉY²èαu8‹. eϕ ∈ Φα, ÖÈ?¤uϕ1 ∈ Φαk βϕ(θ) ≥ βϕ1 (θ), ∀ θ ∈ Θ1 (1.2) K°ϕè(1.1)òáY²èα òóÅ`u (Uniformly Most Powerful Test), {°Y² èαUMPu. ϕèY²αUMPuû, ß3Åõ1òaÜÿV«ÿáLα^áe, o ¶1aÜÿV«àÅ. œde±ÜÿV«èÔ˛u`çò˛›, Ö…Åõ1ò aÜÿV«K, KUMPu¥Å–u. ÿL, UMPu3òÑ¥~ ÿ~Ñ. ndXe: eΘ1ÿéù¹òá:, K3Ÿ•¸áÿ”:θ1⁄θ2û, è¶βϕ(θ1) ¶åUå@ ´uϕ, ÿÑ”ûèU¶βϕ(θ2)å. êk3Θ0⁄Θ1—êù¹ò:û, UMPu‚3. ˘“ ¥e°Neyman-Pearson({°NP)⁄nSN. !Neyman–Pearson⁄n ½n5.4.1 (NPƒ⁄n) X©ŸkV«ºÍf(x, θ), ÎÍθêk¸áåU äθ0⁄θ1, ƒeuØK H0 : θ = θ0 ←→ H1 : θ = θ1, (1.3) KÈ?â0 < α < 1k
()存在性.对检验问题(1.7)必存在一个检验函数(x)及非负常数c和0≤r≤1,满足条件 (a) 1,当fx,A1)/f(x,o)>c p(x)= r,当f(x,01)/fx,0o)=c (1.4) 0,当f(x,01)/fx,0o)<c (b) Eap(X】=a (1.5) (i)任何满足(1.4)和(1.5)的检验p(x)是检验问题(1.7)的UMP检验. 注5.4.1 1.r.v.X为连续型分布时(1.4)式中的随机化是不必要的.这时取r=0,即(1.4)式变为 p(x)= 「1,当f(x,91)/f(x,o)>c 0,当f(x,01)/f(x,0o)≤c 其中c由Eop(X)=P(f(X,01)/f(X,o)>c|Ho)=a来确定 2.从“似然性”的观点去看NP基本引理是很清楚的:对每个样本X,o和01的“似然度” 分别为f(x,o)和f(x,0).比值f(x,)/f(x,o)愈大,就反映在得到样本X时,9愈像0而 非0o,这样的样本X就愈倾向于否定“H0:0=o”的假设. 证(①)先证明存在性:记随机变量f(X,01)/f(X,0o)的分布函数为 G(y)=P(fX,9)/f(X,o)≤,-o<y<o 则G()具有分布函数的性质:单调、非降、右连续且,四G()=0,G()=1.从而 由0<a<1和G(y)的单调性可知:必存在c使得 G(c-0)≤1-a≤G(c) 如何确定r,分下列三种情形讨论: (a)若G(c)=1-a,则取r=0,这时由(1.4)确定的p(z)满足 E0o [(X)]=P0o(f(X,01)/f(X,0o)>c) =1-P(f(X,8)/f(X,o)≤c=1-Gc)=a. (b)若G(c-0)=1-a,则取r=1,此时由(1.4)定义的p(x)满足 E0olp(X)]=1-P(f(X,01)/f(X,0o)<c) =1-Gc-0)=a. 2
(i) 35. ÈuØK(1.7)73òáuºÍϕ(x) 9öK~Íc⁄0 ≤ r ≤ 1, ˜v^á (a) ϕ(x) = 1, f(x, θ1)/f(x, θ0) > c r, f(x, θ1)/f(x, θ0) = c 0, f(x, θ1)/f(x, θ0) < c (1.4) (b) Eθ0 [ϕ(X)] = α (1.5) (ii) ?¤˜v(1.4)⁄(1.5)uϕ(x)¥uØK(1.7)UMPu. 55.4.1 1. r.v. XèÎY.©Ÿû(1.4)™•ëÅz¥ÿ7á. ˘ûr = 0, =(1.4)™Cè ϕ(x) = ( 1, f(x, θ1)/f(x, θ0) > c 0, f(x, θ1)/f(x, θ0) ≤ c Ÿ•cdEθ0 ϕ(X) = P(f(X, θ1)/f(X, θ0) > c |H0) = α5(½. 2. l/q,50*:wNPƒ⁄n¥ÈòŸ: ÈzáX, θ0⁄θ1/q,›0 ©Oèf(x, θ0)⁄f(x, θ1). 'äf(x, θ1)/f(x, θ0)ïå, “áN3Xû, θïîθ1 öθ0, ˘X“ïñïuƒ½/H0 : θ = θ00b. y (i)ky²35: PëÅC˛f(X, θ1)/f(X, θ0)©ŸºÍè G(y) = P(f(X, θ1)/f(X, θ0) ≤ y), −∞ < y < ∞ KG(y)‰k©ŸºÍ5ü: ¸N!ö¸!mÎYÖ lim y→−∞ G(y) = 0 , limy→∞ G(y) = 1. l d0 < α < 1⁄G(y)¸N5å:73c¶ G(c − 0) ≤ 1 − α ≤ G(c). X¤(½r, ©en´ú/?ÿ: (a) eG(c) = 1 − α, Kr = 0, ˘ûd(1.4)(½ϕ(x)˜v Eθ0 [ϕ(X)] = Pθ0 f(X, θ1) f(X, θ0) > c = 1 − Pθ0 f(X, θ1) f(X, θ0) ≤ c = 1 − G(c) = α. (b) eG(c − 0) = 1 − α, Kr = 1, dûd(1.4)½¬ϕ(x)˜v Eθ0 [ϕ(X)] = 1 − P f(X, θ1) f(X, θ0) < c = 1 − G(c − 0) = α. 2
(c)若G(c-0)<1-a<G(c),则取r=[(1-a)-G(c-0]/IG(c)-G(c-0小,显然,此时 对由(1.4)定义的p(x)有 E0ol(X)]P(f(X,01)f(X,0o)>c)+r.P(f(X,01)f(X,0o)c) =1-ce-0)-cg-Gc-0)+-)-cc-0.(cd-cc-0) G(c)-G(c-0) =1-(1-a)=a. 故存在性证毕。 ()再证由(1.4)和(1.5)定义的p(x)有UMP性质.设p1(x)为检验问题(1.7)的任一水平为a的 检验,我们要证明Ea,[(X)】≥E6,【p1(X)小.为此定义样本空间②上的子集: S+={x:p(x)>P1(x)},S-={x:p(x)<p1(x} 则在S+上有:p(x)>P1(x)≥0,故由(1.4)可知此时 f(x,9) fx,%)≥c 当x∈S-时有:p(x)<p1(x)≤1,因此有p(x)<1,故由(1.7)可知此时必有 袋然≤ 故在S=S+US-上必有 (p(x)-p1(x)(f(x,8)-cf(x,o)≥0 (因为在S+上,两因子皆正,在S-上两因子皆负).因此 ((x)-1(x))(f(x.01)-cf(x.0o)dx .(p(x)-p1(x)(f(x,0)-cf(x,0o)dx≥0, /s+us- 即 ()x.01)dx- pi(x)f(x,01)dx ≥e[-(x)/(x.o)ix-/,(x)F(wx.0)ix (1.6) 由(1.5)知E【p(X】=∫z(x)f(x,6o)dx=a,而p1(x)为检验问题(1.7)的水平为a的任一 检验,故有E【p,(X】≤α,故知(1.6)式右边非负,从而左边也非负,因此有 A(a)=/pxfx)k≥p1xfx81)k=.a, 这就证明了p(x)为(1.7)的水平为a的UMP检验.定理证毕. 例5.4.1设X=(X1,…,Xm)为自正态总体(u,1)中抽取的随机样本,其中μ未知,求假 设检验问题 H0:4=0←→H1:4=41(41>0) 3
(c) eG(c − 0) < 1 − α < G(c), Kr = [(1 − α) − G(c − 0)] [G(c) − G(c − 0)], w,, dû Èd(1.4)½¬ϕ(x)k Eθ0 [ϕ(X)] = P f(X, θ1) f(X, θ0) > c + r · P f(X, θ1) f(X, θ0) = c = 1 − G(c − 0) − (G(c) − G(c − 0)) + (1 − α) − G(c − 0) G(c) − G(c − 0) · (G(c) − G(c − 0)) = 1 − (1 − α) = α. 35y.. (ii)2yd(1.4)⁄(1.5)½¬ϕ(x)kUMP5ü. ϕ1(x) èuØK(1.7)?òY²èα u, ·Çáy²Eθ1 [ϕ(X)] ≥ Eθ1 [ϕ1(X)]. èd½¬òm X ˛f8: S + = {x : ϕ(x) > ϕ1(x)}, S− = {x : ϕ(x) < ϕ1(x)}. K3S +˛k: ϕ(x) > ϕ1(x) ≥ 0, d(1.4)ådû f(x, θ1) f(x, θ0) ≥ c; x ∈ S −ûk: ϕ(x) < ϕ1(x) ≤ 1, œdkϕ(x) < 1, d(1.7)ådû7k f(x, θ1) f(x, θ0) ≤ c. 3S = S + ∪ S −˛7k (ϕ(x) − ϕ1(x))(f(x, θ1) − cf(x, θ0)) ≥ 0 (œè3S +˛, ¸œf, 3S −˛¸œfK) . œd Z X ϕ(x) − ϕ1(x) f(x, θ1) − cf(x, θ0) dx = Z S+∪S− ϕ(x) − ϕ1(x) f(x, θ1) − cf(x, θ0) dx ≥ 0, = Z X ϕ(x)f(x, θ1) dx − Z X ϕ1(x)f(x, θ1)dx ≥ c Z X ϕ(x)f(x, θ0)dx − Z X ϕ1(x)f(x, θ0)dx . (1.6) d(1.5)Eθ0 [ϕ(X)] = R X ϕ(x)f(x, θ0)dx = α, ϕ1(x)èuØK(1.7)Y²èα?ò u, kEθ1 [ϕ1 (X)] ≤ α, (1.6)™m>öK, l Ü>èöK, œdk βϕ(θ1) = Z X ϕ(x)f(x, θ1)dx ≥ Z X ϕ1(x)f(x, θ1)dx = βϕ1 (θ1). ˘“y² ϕ(x)è(1.7)Y²èαUMPu. ½ny.. ~5.4.1 X = (X1, · · · , Xn)ègoNN(µ, 1)•ƒëÅ, Ÿ•µô, ¶b uØK H0 : µ = 0 ←→ H1 : µ = µ1 (µ1 > 0) 3
的水平为a的UMP检验.此处1和a给定. 解由NP引理,先求fo(x)和1(x)的表达式: f6(x)= em{2} f(x)=( s)-emm 似然比可表示为 )=亮=即{-听+ 显然当41>0时,(x)为的增函数,故UMP检验的否定域为 D={X:(X)>c))={X:X>A} 当Ho成立时,~N(0,),故由NP引理可知: P(X AHo)=P(vnX >VnA Ho)=a, 其中√元XN(0,1).由V元A=ua→A=u/V元,即检验水平为a的UMP检验的检验函数为 p(x)= 1,当元>ua/V元, 0, 当≤ua/Wi. 可见(x)与1无关,可见上述检验函数(x)也是检验问题 H0:4=0←→H1:4>0 的水平为a的UMP检验. 注5.4.2此例告诉我们:在某些情况下,如果由NP引理得到的UMP检验不依赖于对立假 设的具体值,则可由此得到一个扩大了的,对立假设为复合假设的检验问题的水平为α的UMP检 验 类似本例可以求得检验问题Ho:4=0←→H1:4<0的检验水平为α的UMP检验. 例5.4.2设X=(X1,·,Xn)为从两点分布b(1,p)中抽取的随机样本,其中p为未知参数. 求检验问题 H0:p=po←→H1:p=p1(P1>Po) 的水平为a的UMP检验.此处po,p1和a给定 解由NP引理,先求fo和f1的表达式: f6(x)=p(x,%)=p话1(1-p%m-1 fi(x)=p(x p1)=(I-p)i 记T(x)=∑1x,似然比 A(x)= p(x,P1) -p1 P(1-p0)]Tx p(x,po) 1-p0 po(1-p1) 4
Y²èαUMPu. d?µ1⁄αâ½. ) dNP⁄n, k¶f0(x)⁄f1(x)Là™: f0(x) = (2π) −n/2 exp ( − 1 2 Xn i=1 x 2 i ) , f1(x) = (2π) −n/2 exp ( − 1 2 Xn i=1 (xi − µ1) 2 ) . q,'åL´è λ(x) = f1(x) f0(x) = exp n − 1 2 nµ2 1 + nµ1x¯ o w,µ1 > 0û, λ(x)èx¯OºÍ, UMPuƒ½çè D = {X : λ(X) > c)} = {X : X > A ¯ } H0§·û, X¯ ∼ N(0, 1 n ), dNP⁄nå: P(X > A ¯ |H0) = P( √ nX >¯ √ nA|H0) = α, Ÿ• √ nX¯ ∼ N(0, 1). d √ nA = uα =⇒ A = uα/ √ n, =uY²èαUMPuuºÍè ϕ(x) = ( 1, x > u ¯ α √ n, 0, x¯ ≤ uα √ n. åÑϕ(x)ܵ1Ã', åÑ˛„uºÍϕ(x)è¥uØK H0 : µ = 0 ←→ H1 : µ > 0 Y²èαUMPu. 55.4.2 d~wä·Ç: 3, ú¹e, XJdNP⁄nUMPuÿù6uÈ·b ‰Nä, Kåddòá*å , È·bèE‹buØKY²èαUMPu . aq~å±¶uØKH0 : µ = 0 ←→ H1 : µ < 0uY²èαUMPu. ~5.4.2 X = (X1, · · · , Xn)èl¸:©Ÿb(1, p)•ƒëÅ, Ÿ•pèôÎÍ. ¶uØK H0 : p = p0 ←→ H1 : p = p1 (p1 > P0) Y²èαUMPu. d?p0, p1⁄αâ½. ) dNP⁄n, k¶f0⁄f1Là™: f0(x) = p(x, p0) = p Pn i=1 xi 0 (1 − p0) n− Pn i=1 xi f1(x) = p(x, p1) = p Pn i=1 xi 1 (1 − p1) n− Pn i=1 xi PT(x) = Pn i=1 xi , q,' λ(x) = p(x, p1) p(x, p0) = 1 − p1 1 − p0 n p1(1 − p0) p0(1 − p1) T(x) . 4
由于p1>po,1-p0>1-p1,因此p1(1-p0)/p0(1-p1)>1,故A(x)关于T(x)单调增.由 于r.u.T(X)服从离散型分布,故需要随机化.由NP引理可知检验函数为 1. 当T(x)>c (x) T, 当T(x)=c C, 当T(x)<c 当Ho成立时T(X)=∑=1X,服从二项分布(n,Po,当a给定时,c由下列不等式确定: 2()-m->a>三((份)-网-=am 取 Q-Q1 r=©61-0n-e 则必有 Epp(X)】=Pp(T(X)>c)+r·P(T(X)=c=a. 因此p(X)为水平为a的UMP检验 由于上述检验函数p(x)与p1无关,故它也是检验问题 H0:p=po←→H1:p>p0 的水平为a的UMP检验 注5.4.3关于随机化检验问题.本例中当出现T(x)=∑1=c时,先做一个具有成功 率为r的Benoullii试验.若该试验成功,则否定Ho;若不然则接受Ho.如r=号则可通过掷一均匀 硬币,规定出现正面为成功.若掷出正面则否定Ho;若不然则接受Ho: 如我们在55.1中所述,对随机化检验分两步走:(句)首先通过试验获得样本观察,()有了样本 后,当样本出现特殊值(如本例中∑1x=c)需随机化时再作一次试验.试验结果为A或A,发 生概率为P(A)=T,若A发生,则拒绝Ho;否则接受Ho 例5.4.3设X=(X1,·,Xn)是来自均匀分布U(0,),0>0的随机样本,求下列检验问 题 Ho:0=00←→H1:0=01(01>00>0) 的水平为a的UMP检验 解服从均匀分布的样本X的密度函数和似然比分别为 1 fx,))=0<u≤4m<, A(x)= f(x,91) ,0<x(m<0 f(x,00) 00, 0<r(m)<61. 故由NP引理,可知水平为a的UMP检验函数有形式 1, p(x) 当x(m)>C 0. 当xm≤c 5
dup1 > p0, 1 − p0 > 1 − p1,œdp1(1 − p0)/p0(1 − p1) > 1, λ(x)'uT(x)¸NO. d ur.v. T(X)—ll—.©Ÿ, IáëÅz. dNP⁄nåuºÍè ϕ(x) = 1, T(x) > c r, T(x) = c c, T(x) < c H0§·ûT(X) = Pn i=1 Xi—l멟b(n, p0), αâ½û, cdeÿ™(½: Xn k=c n k p k 0 (1 − p0) n−k > α > Xn k=c+1 n k p k 0 (1 − p0) n−k = α1. r = α − α1 n c p c 0 (1 − p0) n−c , K7k Ep0 [ϕ(X)] = Pp0 (T(X) > c) + r · Pp0 (T(X) = c) = α. œdϕ(X)èY²èαUMPu. du˛„uºÍϕ(x)Üp1Ã', ßè¥uØK H0 : p = p0 ←→ H1 : p > p0 Y²èαUMPu. 55.4.3 'uëÅzuØK. ~•—yT(x) = Pn i=1 xi = cû, kâòá‰k§ı «èrBenoulli£. eT£§ı, Kƒ½H0; eÿ,K…H0. Xr = 1 2KåœLïò˛! M1, 5½—y°è§ı. eï—°Kƒ½H0; eÿ,K…H0. X·Ç3§5.1•§„, ÈëÅzu©¸⁄r: (i)ƒkœL£º* , (ii)k , —yAœä(X~• Pn i=1 xi = c) IëÅzû2äòg£. £(JèA½A, ¯ u )V«èP(A) = r, eAu), K·˝H0; ƒK…H0. ~5.4.3 X = (X1, · · · , Xn)¥5g˛!©ŸU(0, θ), θ > 0ëÅ, ¶euØ K H0 : θ = θ0 ←→ H1 : θ = θ1 (θ1 > θ0 > 0) Y²èαUMPu. ) —l˛!©ŸXó›ºÍ⁄q,'©Oè f(x, θ) = 1 θ n I[0<x(1)≤x(n)<θ] , λ(x) = f(x, θ1) f(x, θ0) = θ0 θ1 n , 0 < x(n) < θ0 ∞, θ0 < x(n) < θ1. dNP⁄n, åY²èαUMPuºÍk/™ ϕ(x) = ( 1, x(n) > c; 0, x(n) ≤ c. 5