第二章实验、亏值、距离 §21风险函数之比较 令,为,牙集内的一个σ-域,依照 Blackwell的定义 我们称、上的任何一概率测度集={P:0∈的}为一个实 验,称指标集B为参数空间。要描述Wa1d所谓的统计决策问题, 我们还需要引入一个决策集Z和一个损失函数W,其中W是定 义在6×z上取值于(一∞,+∞]的函数 假设一个统计工作者在样本空间内观察到一个值x,他要 在未知θ的情况下,从决策集z里选取一个决策x.他的取法是 先选定一个在z上的概率测度p,然后依照概率P随机抽样得 到一值.如果所抽到的是x,则他受到的损失为W2(x).因此,当 观察值为x时,他的平均损失为|w()(d),若x是按跟概率 分布P抽出则他的总平均损失为双重积分|We(x)e(dx) Pox) 我们称函数p:x八4为随机化决策程序或决策函数,称双 重积分1)|W(x)p(4r)P(dx)为决策P的风险,这是指以 聊为损失函数而为真值惰况下的风险我们记它为R(6,p), 有时为强调这些函数的关系,我们将R(日,p)记为WpP 为使上述定义有意义,显然需要附加条件,即这些积分必须存 在。为使积分存在,我们假定:对每一个θ值,infW(x)>一0, 令为Z集上使W为z的可测函数的σ-城,p2为上 的概率测度,对每一个B∈,函数p:x八P2(B)是x对、M 的可测函数。最后这个“可测”假定不仅是为了数学处理的方便
第,二童实验、子值、距离 而且是为了反映实际情况。可以想象,在实际工作中,统计工作 者或实验者之所以假设σ-域、,是因为他对、中的事件 d感兴趣并至能判断A是否发生,我们要求x和(B)为 的可测函数,原则上就是要求决策程序φ必须为能从已知的 信息而“执行”的决策程序 Wald的统计决策函数论就是基于上述结构,他的观点是运 用风险函效釆评判和比较各种决策程序之优劣, 现假设有一实验者,在斟酌两个不同的实验方法,记这两实验 为d一{Pa:∈}和 Q:θ∈},这里P是在测度 空间(,,1)上的概率测度,Q。o是测度空间(,、2)上 的概率测度。要注意此处采用的是同一个参效集8.原因是实验 者根据某种已知理论“9”而构造随机模型P∈e,如果他娶采 取另一种方祛做实验 原则上他对基本理论8的认识是不变 的,因此这两个实验的随机模型指标集6应为同一个。举例来说, 假设他要设计个物理实验来估计碳14(C4)的半衰期。他首先 假定碳14原子的寿命具有指数分布,其密度为θ",x>0, 6∈(0,∞).然后来观察n个碳14原子。下一步进行的方法则有 好几种,一种方法是观测在某一给定时间(4)内这n个碳原子 有多少(K)发生分裂、按照上述说明,理论“6”则为X提供一 个概率分布P,另一种实验方法是事先给定某个m(m≤n),然 后来洲量这m个原子分裂所需的总时间Y,一如从前,理论6为 变量Y提供一个概率分布9 对于这两个实验 {Ps6∈6}和 9:∈},我 们能作比较吗?它们的统计性质差异何在?这要看样本的大小 以及选出的t,m值。本书的目的在于讨论般理论,它可以用来 说明以下事实:实验贯与罗也许不能直接比较,但是,如果 所取的值使得EX比m值大许多,则对十在上能获得的 统计结果,我们在d上亦能获得同样好或差不多好的结果.如 果m与EX皆很大,并且丝趋于1,则与罗之差异变得
5 521风险函数之比较 很小。 读者可以取n一103,=2小时及m〓10°的特殊例子来 体会这个问题 至于测定两实验间的距离,我们使用的方法是考察分别在 和上能达到的两个风险函数之差 为此我们来定义一种函数集R(,W).函数集R(“,W) 包含所有具有下列性质的函数r():在实验上存在一个 决策程序p,它的风险函数WpPe对所有的θ暂满足不等式 WpPs≤r(6) 由于数学技巧的缘故,我仔不采用聚(,W)而用宅的逐点 闭包,即在函数逐点收敛意义下的闭包R(啁,W).如果我们假 设 ()所有的P。被同一个σ-有限测度μ控制, (2)只考虑使z为紧集的决策问题,并且,损失函数 W0(x)在z上为下半连续.则R(d,W)自然是一个闭集.至于 实验的及决策空间(z,W)的更一般定义,读者可看L6am [1986 在这些假设下,我们给出下面两个定义 定义1对任意一个损失函数W,0≤W(x)≤1,对每 个r2∈R(,W)和一个g10,1,考虑交集R(,W)∩!≤ 2+郾}。对的亏值( deficiency)8(a,>),是怼全部 W和全部r2使此交集为非空集的最小6值 定义1中所考虑的W是包括所有介于0到1之间的损失函 数W。这当然包括了许多统计问题,即使我们小范围只考满 足上述紧性条件的Z,甚至只考虑Z为有限的情况,它所包插的统 计问题仍然很多(按照 Le Cam[1986]书中给的一般定义;这种 限髓并不影响8(d,所)值). Lehmann[1988认为这个舌值 定义所包括的统计问题实在太多,他的观点当然不无道理,可是我 们无从知道每一个实验者所想要的W,我们采纳这个定义是为顾 念各种不同W的可能性
第二章实验、亏值,距离 下面是实验距离的定义。 定义2两个实验和的距离△(,另)为两亏值 8(,)和8(,)中较大的一个。 包结来说,这介定义的意义是:如果只考虑满足0≤W≤1 的损失函数W,则任何能从两实验之一获得的结果(风险)都能 在△(,)距离范围内从另外一个实验得到 上述距离定义与另外一个距离定义有密以关系,这种关系在 Le Cam[1986]书中总结为第123页上的一个定理,其意义如 下:假定我们做一个实验,在的样本宋间梁里获得一个 观察值x,则我们可应用随机化方法,按照的测度空间(多, 82)上的一个概率分布K2(y)在样本空间里构造一个观 察值Y,而使Y的分布接近于原来里设的分布Q.所谓 接近是根据如下的距离定义:令KP。为一测度,其定义为 (KP)(A)一K:(A)P(dx),f∈,1, 定义测度Q和KP之间的距离为 lQe-KP。l-sup|f4Q-|fdKP。, 这里f为任意满足丨f≤1的2可测函数,刘在相当弱的条 件之下,可以证明亏值(,)就是 inf sup. ge- KPel 这里的inf是对所有的随机化概率K和所们K的极限来取,(证 明见 Le car[1986J) 我们将称此处所用的范数 l=sup{fam:|升|≤ 为L1范数,它的另一个名称为总变差范数( total variation nom).L1-范数具有特殊的统计意义:1-1P…是检验 P对?的两类错误概率和之极小值.因此,(,)≤8的意
§2,2似然比。 Black well表达式 义就是t只要损失函数W取值于[0,1j中,则对上的任何风 险函数,我们都能生8范围内,在d上找到一个同样好的风险函 数,并且,在实验a完成后,运用随机化K,在2e误差范围内 能重新构造出中的分布Q 在上面,我们称△为“距离”,其实它只是一个伪距离因为两 个很不同的实验和扩之间的距离△(,)可能是零 因此,若△(,)一0,我们称d和所为等价或有相同类 型,在实验类型的空间上,Δ变成了距离 我们相信读者不难体会到△具有确定的统计意义。虽然如 Lehmann所说在△定义下的决策问题集是稍许大了些,但是每 个从事实验设计的人皆知道,要选出一个使每个人都赞成的决 策问题子集不是一件容易的事 在下内,我们将讨论△的另一面,证明距离△与许多统计工作 者爱用的似然比分布有密切关系 §22似然比, Black wel!表达式 本节假设参数空间6为含有个元素的有限集 现考虑实验d-{Pe:6∈},其中P6为测度空间〔 )上的概率,令S一∑P.因为S控制每个P,因此存 e∈e 在拉冬-尼可丁密度f~dP我们可以算出f在x∈身的 ds 值。这些密度值可用一个维向量来表示 (x)〓{fe(x):0∈6},(x)∈的 不失一般性,可以假设fa(x)≥0,∑f(x)-1.令 U()-{a-【-6∈6]:≥0,∑4 为华单纯形,则“(x)是U(6)中的一点,S经变换x~(x)