Lec7:区间估计(一):置信区间 张伟平 2011年3月28日 区间估计的基本概念 一、参数的区间估计问题 使用点估计(X)估计9()的缺点是:单从所给出的估计值上,无法看出它的精度有多大.当 然你可以定义某种指标,如估计的均方误差之类去刻画它的精度,但也还是间接的.更直接的方 法是指出了一个误差限d(X),而把估计写成(X)士d(X)的形式.这实际上就是一种区间估计, 即估计g()的取值在(X)-d(X),(X)+d(X)】之内.将其一般化,给出区间估计的下列定义 定义1设有一个参数分布族多={f(x,),0∈日},g()是定义在参数空间日的一个已 知函数,X=(X1,·,Xn)是从分布族中某总体f(x,)中抽取的样本,令g1(X)和2(X)为定 义在样本空间2上,取值在日上的两个统计量,且g1(X)≤2(X),则称随机区间[1(X),2(X)】 为g(g)的一个区间估计(nterval estimation). 根据这个定义,从形式上看,任何一个满足条件1≤2的统计量1,2都可构成g()的一 个区间估计[©1,2].既然一个未知参数的区间估计有很多种,如何从中挑选一个好的区间估计 呢?这就涉及到评价一个区间估计优劣的标准问题.评价一个区间估计优劣的标准有两个要素: 可靠性与精确度(也称精度).可靠性是指待估参数g()被包含在[©1,2]内的可能性有多大.可能 性越大,可靠性越高.精确度可由随机区间的平均长度来度量.长度越短,精确度越高 不言而喻,我们希望所作的区间估计既有高的可靠性,又有高的精确度.但这二者往往是彼 此矛盾的,不可能同时都很高.当样本大小固定时,若精确度提高了,可靠性就降低了:反之,若 可靠度提高了,则精确度就降低了. 如何构造尽可能高的可靠性和高精确度的区间估计呢?通常采用的方法是在保证一定可靠 度的前提下选择精确度尽可能高的区间估计.这就是著名统计学家Neyman提出的一种妥协方 案 当然,如果在应用中人们要求可靠性和精度都很高,则必须加大样本容量,也就是说要多做 一些试验,才可能实现 二、置信区间 为书写简单计,本节以下假定被估计的g()就是9自身,这与一般情况没有原则区别
Lec7: ´mO(ò): ò&´m ‹ï² 2011 c 3 28 F 1 ´mOƒVg ò!ÎÍ´mOØK ¶^:Ogˆ(X)Og(θ)":¥: ¸l§â—Oä˛, Ã{w—ß°›kıå. ,\å±½¬,´çI, XO˛êÿÉaèxß°›, èÑ¥m. çÜê {¥ç— òáÿÅd(X), rO§gˆ(X) ± d(X)/™. ˘¢S˛“¥ò´´mO, =Og(θ) ä3[ˆg(X) − d(X), gˆ(X) + d(X)] ÉS. ÚŸòÑz, â—´mOe½¬. ½¬1 kòáÎÍ©ŸxF = {f(x, θ), θ ∈ Θ}, g(θ) ¥½¬3ÎÍòmΘ òáÆ ºÍ, X = (X1, · · · , Xn) ¥l©Ÿx•,oNf(x, θ) •ƒ, -gˆ1(X) ⁄gˆ2(X) è½ ¬3òmX ˛, ä3Θ ˛¸á⁄O˛, Ögˆ1(X) ≤ gˆ2(X), K°ëÅ´m[ˆg1(X), gˆ2(X)] èg(θ) òá´mO(Interval estimation). ä‚˘á½¬, l/™˛w, ?¤òá˜v^ágˆ1 ≤ gˆ2 ⁄O˛gˆ1, gˆ2 —å§g(θ) ò á´mO[ˆg1, gˆ2]. Q,òáôÎÍ´mOkÈı´, X¤l•]¿òá–´mO Q? ˘“9µdòá´mO`IOØK. µdòá´mO`IOk¸ááÉ: åÇ5ܰ(›(è°°›). åÇ5¥çñÎÍg(θ) ù¹3[ˆg1, gˆ2] SåU5kıå. åU 5å, åÇ5p. °(›ådëÅ´m²˛›5›˛. ›·, °(›p. ÿÛ í, ·ÇF"§ä´mOQkpåÇ5, qkp°(›. ˘ˆ ¥* dgÒ, ÿåU”û—Èp. å½û, e°(›Jp , åÇ5“¸$ ; áÉ, e åÇ›Jp , K°(›“¸$ . X¤E¶åUpåÇ5⁄p°(›´mOQ? œ~Ê^ê{¥3yò½åÇ ›cJe¿J°(›¶åUp´mO. ˘“¥Õ¶⁄OÆ[Neyman J—ò´˛ê Y. ,, XJ3A^•<Çá¶åÇ5⁄°›—Èp, K7L\åN˛, è“¥`áıâ ò £, ‚åU¢y. !ò&´m è÷{¸O, !±eb½Og(θ) “¥θ g, ˘ÜòÑú¹vkK´O.
1.置信度 设X为样本,[©1(X),2(X)】是9的一个区间估计.由于9是未知的,且样本是随机的,我们 不能保证在任何情况下(即对任何具体的样本值),区间[©1,2]必定包含9,而只能以一定的概率 保证它.希望随机区间1,2]包含0的概率P(01≤9≤02)越大越好.这个概率就是我们前面 所说的可靠性,数理统计学上称这个概率为置信度.一般说来,这个概率与0有关,假如一个区间 估计对某个81∈日其置信度大,而对另一个2∈日其置信度小,那么这种区间估计的适应性要 差一些,不能认为是一个好的区间估计.若对参数空间日中的任一9,其置信度都很大,则此种区 间估计就是一种好的区间估计.因此有如下定义 定义2设随机区间©1,2]为参数0的一个区间估计,则称置信度在参数空间日上的下确 界 inf Po(a1≤e≤2) 0∈e 为该区间估计的置信系数(Confidence coef伍cient) 显然,一个区间估计的置信度越大越好.为了计算置信度和置信系数,需要利用统计量的精 确分布或渐近分布.可见抽样分布在评价和构造区间估计中发挥重要作用. 2.精确度 精确度的概念我们在前面已说过.精确度的标准不止一个.这里介绍其中最常见的一个标 准,即随机区间©1,2]的平均长度E(2-9).平均长度越短,精确度越高,这也是符合实际的 一项要求.为说明精确度和置信度及其关系,请看下例, 例1设样本X=(X1,·,Xn)来自正态总体N(4,σ2),其中-0<4<o,o2>0.4 和σ2的估计量分别是样本均值了和样本方差S2=点∑1(化:-X)2,我们用[区-kS引V元,X+ kS/√可作为总体均值μ的区间估计.考虑其置信度和精确度. 解上述区间估计的置信度为 P.(r-kS/V元≤4≤X+kS/Vm=P.(目V(R-)/Sl≤k) =P(IT≤k): 其中T=√元(了-)/S~tn-1,其分布与4无关,因而区间估计的置信系数为P(T|≤k).显然k 越大,区间的置信系数越大,区间就越可靠 由于(n-1)S2/o2~X品-1,所以区间的平均长度为 lk=2kE(s)/V元= 2v2ko I(n/2) Vn(n-1)(n-1)/2) 显然,k越大,区间也越长,也就越不精确」 由此例可以看到,在样本容量给定后,为了提高置信度,需要增加k值,从而放大了区间, 降低了精确度.反过来,为了提高精确度,需要减小k值,从而缩短了区间,降低了置信度.置信 度与精确度互相制约着.如前所述,面对这一矛盾,著名统计学家Neyman建议采取如下方案:在 保证置信系数达到指定要求的前提下,尽可能提高精确度.这一建议导致引入如下置信区间的概 念,由于是Neyman建议的,通常也称置信区间为Neyman置信区间, 2
1. ò&› X è, [ˆθ1(X), ˆθ2(X)] ¥θ òá´mO. duθ ¥ô, Ö¥ëÅ, ·Ç ÿUy3?¤ú¹e(=È?¤‰Nä), ´m[ ˆθ1, ˆθ2] 7½ù¹θ , êU±ò½V« yß. F"ëÅ´m[ ˆθ1, ˆθ2] ù¹θ V«Pθ( ˆθ1 ≤ θ ≤ ˆθ2) å–. ˘áV«“¥·Çc° §`åÇ5, Ín⁄OÆ˛°˘áV«èò&›. òÑ`5, ˘áV«Üθ k', bXòá´m OÈ,áθ1 ∈ Θ Ÿò&›å, È,òáθ2 ∈ Θ Ÿò&›, @o˘´´mO·A5á ò , ÿU@è¥òá–´mO. eÈÎÍòmΘ •?òθ, Ÿò&›—Èå, Kd´´ mO“¥ò´–´mO. œdkXe½¬. ½¬2 ëÅ´m[ ˆθ1, ˆθ2] èÎÍθ òá´mO, K°ò&›3ÎÍòmΘ ˛e( . inf θ∈Θ Pθ ˆθ1 ≤ θ ≤ ˆθ2 èT´mOò&XÍ(Confidence coefficient) w,, òá´mOò&›å–. è Oéò&›⁄ò&XÍ, Iá|^⁄O˛° (©Ÿ½ÏC©Ÿ. åу©Ÿ3µd⁄E´mO•uûáä^. 2. °(› °(›Vg·Ç3c°Æ`L. °(›IOÿéòá. ˘p0Ÿ•Å~ÑòáI O, =ëÅ´m[ ˆθ1, ˆθ2] ²˛›Eθ( ˆθ2 − ˆθ1). ²˛›·, °(›p, ˘è¥Œ‹¢S òëá¶. è`²°(›⁄ò&›9Ÿ'X, ûwe~. ~1 X = (X1, · · · , Xn) 5goNN(µ, σ2 ), Ÿ•−∞ < µ < ∞, σ2 > 0. µ ⁄σ 2 O˛©O¥˛äX¯ ⁄êS 2 = 1 n−1 Pn i=1(Xi−X¯) 2 , ·Ç^[X¯−kS/√ n, X¯+ kS/√ n] äèoN˛äµ ´mO. ƒŸò&›⁄°(›. ) ˛„´mOò&›è Pµ X¯ − kS/√ n ≤ µ ≤ X¯ + kS/√ n = Pµ √ n(X¯ − µ)/S ≤ k = P(|T| ≤ k), Ÿ•T = √ n(X¯ − µ)/S ∼ tn−1, Ÿ©ŸÜµ Ã', œ ´mOò&XÍèP(|T| ≤ k). w,k å, ´mò&XÍå, ´m“åÇ. du(n − 1)S 2/σ2 ∼ χ 2 n−1 , §±´m²˛›è lk = 2kE(s)/ √ n = 2 √ 2kσ Γ(n/2) p n(n − 1) Γ((n − 1)/2) . w,,k å,´mè,è“ÿ°(. dd~å±w, 3N˛n â½, è Jpò&›, IáO\k ä, l òå ´m, ¸$ °(›. áL5, è Jp°(›, Iá~k ä, l †· ´m, ¸$ ò&›. ò& ›Ü°(›pÉõX. Xc§„, °È˘ògÒ, Õ¶⁄OÆ[Neyman ÔÆÊXeêY: 3 yò&XÍàç½á¶cJe, ¶åUJp°(›. ˘òÔÆó⁄\Xeò&´mV g,du¥Neyman ÔÆ, œ~è°ò&´mèNeyman ò&´m. 2
定义3设01(X),02(X)】是参数0的一个区间估计,若对给定的0<a<1,有 P(a1(X)≤6≤2(X)≥1-a,对-切9∈6, 则称[a(X),2(X】是9的置信水平(Confidence level)为1-a的置信区间(Confidence interval) 置信区间有如下频率解释:设a=0.05,则1-a=0.95,若把置信区间[01,2l反复使用 多次,如使用100次,平均大约有95次随机区间©1,2]包含真参数0,大约平均有5次随机区 间[1,2]不包含9.当使用次数充分大时,频率接近于置信系数. 三、置信限 在一些实际问题中,人们感兴趣的有时仅仅是未知参数的置信上限或置信下限.例如一种新 材料的强度,我们关心它最低不少于多少;一个工厂的废品率,我们关心它最高不超过多少等等. 这也是一种区间估计,称之为置信下限或置信上限,定义如下: 定义4设0(X)和(X)是定义在样本空间2上,在参数空间日上取值的两个统计量, 若对给定的0<a<1,有 P(a(X)≤0≥1-a,对-切0e6, P6(9≤u(X)≥1-a,对-切0∈Θ, 则分别称0L(X)和u(X)是0的置信水平为1-a的(单侧)置信下限(Lower confidence limit)和 置信上限(Upper confidence limit).上式左端概率在参数空间日上的下确界分别称为置信下、 上限的置信系数. 显然,对置信下限L而言,若E(©)越大,则置信下限的精确度越高;对置信上限u而言, 若E()越小,其精确度越高. 容易看出,单侧置信上、下限都是置信区间的特例.因此寻求置信区间的方法可以毫不困 难地用来求单侧置信上、下限.单侧置信限与双侧置信限之间存在着一个简单的联系,下述的引 理告诉我们,在有了单侧置信上、下限后,也不难求得置信区间. 引理1设0z(X)和0u(X)分别是参数0的置信水平为1-a1和1-a2的单侧置信下、上 限,且对任何样本X,都有L(X)≤u(X),则[旧L(X),u(X)】是0的置信水平为1-(α1+a2) 的双侧置信区间. 证在引理的假设下,下列三个事件 {a(X≤e≤u(X)},{9<a(X)},{0>u(X)} 是互不相容的,“三个事件之并”为“必然事件”.再考虑到 P(0<az(X)=1-P(z(X)≤0≤a, P(0>u(X)=1-P(0≤(X)≤a2, 因此有 P(a(X)≤6≤iu(X)=1-P(g<(X-PB(0>iu(X)) 3
½¬3 [ ˆθ1(X), ˆθ2(X)] ¥ÎÍθ òá´mO, eÈâ½0 < α < 1, k Pθ ˆθ1(X) ≤ θ ≤ ˆθ2(X) ≥ 1 − α, ÈòÉ θ ∈ Θ, K°[ ˆθ1(X), ˆθ2(X)] ¥θ ò&Y² (Confidence level )è1−α ò&´m (Confidence interval). ò&´mkXe™«)º: α = 0.05, K1 − α = 0.95 , erò&´m [ ˆθ1, ˆθ2] áE¶^ ıg, X¶^100 g, ²˛åk95 gëÅ´m[ ˆθ1, ˆθ2] ù¹˝ÎÍθ , 岞k5 gëÅ´ m[ ˆθ1, ˆθ2] ÿù¹θ . ¶^gÍø©åû, ™«Cuò&XÍ. n!ò&Å 3ò ¢SØK•, <Ça,kû==¥ôÎÍò&˛Å½ò&eÅ. ~Xò´# ·r›, ·Ç'%ßÅ$ÿuı; òáÛÇ¢¨«, ·Ç'%ßÅpÿáLı. ˘è¥ò´´mO, °Éèò&eŽò&˛Å, ½¬Xe: ½¬4 ˆθL(X) ⁄ˆθU (X) ¥½¬3òmX ˛, 3ÎÍòmΘ ˛ä¸á⁄O˛, eÈâ½0 < α < 1 , k Pθ ˆθL(X) ≤ θ ≥ 1 − α, ÈòÉ θ ∈ Θ, Pθ θ ≤ ˆθU (X) ≥ 1 − α, ÈòÉ θ ∈ Θ, K©O°ˆθL(X) ⁄ˆθU (X) ¥θ ò&Y²è1−α (¸˝) ò&eÅ (Lower confidence limit)⁄ ò&˛Å (Upper confidence limit). ˛™Ü‡V«3ÎÍòmΘ ˛e(.©O°èò&e! ˛Åò&XÍ. w,, Èò&eňθL Û, eE( ˆθL) å, Kò&eŰ(›p; Èò&˛ÅˆθU Û, eE( ˆθU ) , Ÿ°(›p. N¥w—, ¸˝ò&˛!eÅ—¥ò&´mA~. œdœ¶ò&´mê{屌ÿ( J/^5¶¸˝ò&˛!eÅ. ¸˝ò&ÅÜV˝ò&ÅÉm3Xòá{¸ÈX, e„⁄ nwä·Ç, 3k ¸˝ò&˛!eÅ, èÿJ¶ò&´m. ⁄n1 ˆθL(X) ⁄ˆθU (X) ©O¥ÎÍθ ò&Y²è1 − α1 ⁄1 − α2 ¸˝ò&e!˛ Å, ÖÈ?¤X, —kˆθL(X) ≤ ˆθU (X) , K[ ˆθL(X), ˆθU (X)] ¥θ ò&Y²è1 − (α1 + α2) V˝ò&´m. y 3⁄nbe, enáØá n ˆθL(X) ≤ θ ≤ ˆθU (X) o , n θ < ˆθL(X) o , n θ > ˆθU (X) o ¥pÿÉN, /náØáÉø0è/7,Øá0. 2ƒ Pθ θ < ˆθL(X) = 1 − Pθ ˆθL(X) ≤ θ ≤ α1 , Pθ θ > ˆθU (X) = 1 − Pθ θ ≤ ˆθU (X) ≤ α2, œdk Pθ ˆθL(X) ≤ θ ≤ ˆθU (X) = 1 − Pθ θ < ˆθL(X) − Pθ θ > ˆθU (X) 3
≥1-(a1+a2) 引理得证, 四、置信域 以上讨论的置信区间和置信上、下限都是假定参数0是一维的,可以将其推广到参数9是k 维(k≥2)的情形,就得如下定义的置信域, 定义5设有一个参数分布族多={f(x,),0∈日},日是参数空间.其中0=(01,·,0x)∈ 日CRk,k≥2.X=(X1,·,Xn)是来自分布族中某总体f(z,)的样本.若S(X)满足 (①)对任一样本X,S(X)是日的一个子集: ()对给定的0<a<1,P(0∈S(X)≥1-a,一切0∈9: 则称S(X)是9的置信水平为1-a的置信域(Confidence region)或置信集,而Pa(9∈S(X) 称为置信系数。 在多维场合,置信域S(X)的形状可以是各种各样的,但实用上只限于一些规则的几何图形 如其各面与坐标平面平行的长方体、球、椭球等.特别当置信集是长方体(其面与坐标平面平 行),则称其为联合置信区间 五、构造区间估计的方法 目前应用最广泛的区间估计的形式是Neyman的置信区间.本章第二节和第三节将介绍这 一方法,这一方法的关键是基于点估计去构造枢轴变量,因此也称为枢轴变量法.另外一种构 造区间估计的重要方法是利用假设检验构造置信区间,它与枢轴变量法同属于一个理论体系, 即Neyman的关于置信区间和假设检验的理论.利用假设检验构造置信区间的方法将在下一章 有专门的一节介绍. 本章的最后两节将介绍区间估计的其它两种方法,即Fser的信仰推断方法和容忍区间和 容忍限。 用Bayes方法求区间估计的内容将放在本书的最后一章介绍. 2 枢轴变量法一正态总体参数的置信区间 一、引言 这个方法的基本要点,就是在参数的点估计基础上,去找它的置信区间.由于点估计是由样 本决定的,是最有可能接近真参数之值.因此,围绕点估计值的区间,包含真参数值的可能性也 就要大一些.请看下面的例子,是如何构造置信区间的, 例1设X=(X1,·,X)是从总体N(4,σ)中抽取的简单随机样本,此处σ2已知,求4 的置信系数为1-α的置信区间和置信上、下限. 4
≥ 1 − (α1 + α2). ⁄ny. o!ò&ç ±˛?ÿò&´m⁄ò&˛!eÅ—¥b½ÎÍθ ¥òë, å±ÚŸÌ2ÎÍθ ¥k ë(k ≥ 2) ú/, “Xe½¬ò&ç. ½¬5 kòáÎÍ©ŸxF = {f(x, θ), θ ∈ Θ}, Θ¥ÎÍòm. Ÿ•θ = (θ1, · · · , θk) ∈ Θ ⊂ Rk, k ≥ 2. X = (X1, · · · , Xn) ¥5g©Ÿx•,oNf(x, θ) . eS(X) ˜v (i) È?òX, S(X) ¥Θ òáf8; (ii)Èâ½0 < α < 1, Pθ θ ∈ S(X) ≥ 1 − α, òÉθ ∈ Θ; K°S(X) ¥θ ò&Y²è1 − α ò&ç(Confidence region) ½ò&8, inf θ∈Θ Pθ θ ∈ S(X) °èò&XÍ. 3ıë|‹, ò&çS(X) /Gå±¥à´à, ¢^˛êÅuò 5KA¤„/, XŸà°ÜãI²°²1êN!•!˝•. AOò&8¥êN(Ÿ°ÜãI²°² 1) , K°ŸèÈ‹ò&´m. !E´mOê{ 8cA^Å2ç´mO/™¥Neyman ò&´m. Ÿ1!⁄1n!Ú0˘ òê{, ˘òê{'Ö¥ƒu:OEÕ¶C˛, œdè°èÕ¶C˛{. , ò´ E´mOáê{¥|^buEò&´m, ßÜÕ¶C˛{”·uòánÿNX, =Neyman 'uò&´m⁄bunÿ. |^buEò&´mê{Ú3eòŸ k;Äò!0. ŸÅ¸!Ú0´mOŸß¸´ê{, =Fisher &̉ê{⁄N=´m⁄ N=Å. ^Bayes ê{¶´mOSNÚò3÷ÅòŸ0. 2 Õ¶C˛{—oNÎÍò&´m ò!⁄Û ˘áê{ƒá:, “¥3ÎÍ:Oƒ:˛, Èßò&´m. du:O¥d ˚½, ¥ÅkåUC˝ÎÍθÉä. œd, å7:Oä´m, ù¹˝ÎÍäåU5è “áåò . ûwe°~f, ¥X¤Eò&´m. ~1 X = (X1, · · · , Xn) ¥loNN(µ, σ2 ) •ƒ{¸ëÅ, d?σ 2 Æ, ¶µ ò&XÍè1 − α ò&´m⁄ò&˛!eÅ. 4
解显然,μ的一个良好的点估计是X=员∑1X,其分布为X~N(山,2/m,将其标准 化得 U=-四N0,1, 其分布与μ无关.由于正态分布的对称性,可得 V(X-四 =1-a 此处u。/2为标准正态分布的上侧a/2分位数.经不等式等价变形,可知 Pu(8-uon<<+on)=1-a. 因此[下-4a2,X+4a/2]为μ的置信系数1-a的置信区间. 由本例可知构造置信区间的步骤如下: 1.找待估参数4的一个良好点估计.此例中这个点估计是T(X)=. 2.构造一个T(X)和μ的函数(T,),使其满足: ()其表达式与待估参数μ有关: ()其分布与待估参数μ无关, 则称随机变量p(T,)为枢轴变量.本例中这一变量即为U=√(下-)/o,它的表达式与μ有 关,但其分布N(0,1)与μ无关.因此U为枢轴变量. 3.对给定的0<a<1,决定两个常数a和b,使得 Pu(a≤p(T,m)≤b)=1-a. 解括号中的不等式得到虹(X)≤4≤u(X),则有 P.(iu(X)≤μ≤w(X)=1-a. 这表明[2z(X),u(X)】]是μ的置信水平为1-a的置信区间. 例4.21中的μ的置信区间[下-ou2/V元,X+au2/V同就是通过上述三个步骤获得的. 其中最关键的步骤是第二步,即构造枢轴变量(T,),这个变量一定和μ的一个良好的点估计有 关这种构造置信区间的方法称为枢轴变量法. 二、单个正态总体参数的置信区间 正态分布N(4,σ)是常用的分布.寻求它的两个参数μ和σ2的置信区间是实际中常遇到的 的问题,下面将分几种情况分别加以讨论.这里总假设X=(X1,·,X)是从正态总体N(山,o) 抽取的简单随机样本.记 m1 =1 即灭和S2分别为样本均值和样本方差
) w,, µ òá˚–:O¥X¯ = 1 n Pn i=1 Xi , Ÿ©ŸèX¯ ∼ N(µ, σ2/n), ÚŸIO z U = √ n(X¯ − µ) σ ∼ N(0, 1), Ÿ©ŸÜµ Ã'. du©ŸÈ°5, å Pµ √ n(X¯ − µ) σ ≤ uα/2 = 1 − α, d?uα/2 èIO©Ÿ˛˝α/2 ©†Í. ²ÿ™dC/, å Pµ X¯ − σ √ n uα/2 < µ < X¯ + σ √ n uα/2 = 1 − α. œd X¯ − √σ n uα/2, X¯ + √σ n uα/2 èµ ò&XÍ1 − α ò&´m. d~åEò&´m⁄½Xe: 1. ÈñÎ͵ òá˚–:O. d~•˘á:O¥T(X) = X¯. 2. EòáT(X) ⁄µ ºÍϕ(T, µ), ¶Ÿ˜v: (i) ŸLà™ÜñÎ͵ k'; (ii) Ÿ©ŸÜñÎ͵ Ã'. K°ëÅC˛ϕ(T, µ) èÕ¶C˛. ~•˘òC˛=èU = √ n(X¯ − µ)/σ, ßLà™Üµ k ', Ÿ©ŸN(0, 1) ܵ Ã'. œdU èÕ¶C˛. 3. Èâ½0 < α < 1, ˚½¸á~Ía ⁄b, ¶ Pµ (a ≤ ϕ(T, µ) ≤ b) = 1 − α. ))“•ÿ™µˆL(X) ≤ µ ≤ µˆU (X) , Kk Pµ (ˆµL(X) ≤ µ ≤ µˆU (X)) = 1 − α. ˘L² µˆL(X), µˆU (X) ¥µ ò&Y²è1 − α ò&´m. ~4.2.1•µ ò&´m X¯ − σuα/2/ √ n, X¯ + σuα/2/ √ n “¥œL˛„ná⁄½º. Ÿ•Å'Ö⁄½¥1⁄, =EÕ¶C˛ϕ(T, µ), ˘áC˛ò½⁄µ òá˚–:Ok '.˘´Eò&´mê{°èÕ¶C˛{. !¸áoNÎÍò&´m ©ŸN(µ, σ2 ) ¥~^©Ÿ. œ¶ß¸áÎ͵ ⁄σ 2 ò&´m¥¢S•~ë ØK, e°Ú©A´ú¹©O\±?ÿ. ˘pobX = (X1, · · · , Xn) ¥loNN(µ, σ2 ) ƒ{¸ëÅ. P X¯ = 1 n Xn i=1 Xi , S2 = 1 n − 1 Xn i=1 (Xi − X¯) 2 , =X¯ ⁄S 2 ©Oè˛ä⁄ê. 5