统计量 当总体协差阵2未知时,用样本协差阵S代替∑则上段的 统计量变为 T2=n(-u)'s(x-u (1.47) 或 T2=n(n-1)(x-p)A-(x-p 称为霍太林( Hotelling)统计量,简称T2统计量,它是一元t统计 量的推广。一元统计中总体为N(a,d2),则 a-a x-) )2)(x-a)~F(1,n-1) T2有准确的分布,T2~T,m-1 可以证明(〔1〕) F 1)p(n-1)p (X-H)'S(X-u)F(p (1.49) 或 7 (1.50) 四、W统计量 设总体为N(μ,∑),未知,2已知,X1,…,X,为样本,似然 函数为 L(,∑)=(2x)-|EexP(2(X,-p)∑(X- u的极大似然估计为样本均值,即p=X。 21
L(万,∑)=maxL(u,)=(2x)-|x1-exp{-4∑(x:-x) ∑(X,一X)} 由矩阵迹的性质 ∑(x.-xyx。1(X-x)=r(∑(x,-xyx(X-X)) 〔∑(X一X)(Xx =tr(AEo )=tr(20 'A) 因此1(X,2)=(2x)222xp{-r(。A)}(151) 若,∑未知,其极大似然估计分别为=,E=A,由此可 推得 1(X,S)=mx(42)=(2x)¥1xxp(-2ur(A) (1.52) 而 (∑1A)=tr(nAA) nl)=np 从而 L(X,)=(2r)当-2exp{-m (1.53) 设 L(X, 2o) 则 d= szo1expf-ntr(22)+nP (1.54) 两边取对数乘(-2)得 W=-2lnk=n{ln(|∑/2|)+tr(ΣE1)一p}(1 用S=A代入得 W=-2n=tr(A∑1)+n{pnn-lnAΣ1-p(1.56) 已证明n→+∞时,W趋向于x2x+/2分布 如果样本容量不大,(1.56)式中的n可用n-1代替,λ记为 λ·,w记为L,则 22
InA'=tr(AS)+(n-1)pIn(n-1)-In FAE (1.57) 当n→+∞时,L也趋向于xpt2分布3。 五、广义方差 设总体为N(μ,∑),样本协差阵为S,则其行列式|S|称为 义方差 已经证明2广义方差可以表示为一串独立的ⅹ2变量的乘积, 即 S|=|--;4 A (1.58) S|的概率密度函数可以求得,但很烦杂,用处不大,但由 (1.58)式可以求出S的各阶矩。 ESI CE(Xe E(x: B) 由于 E(X-;) 22F +2r-i 22 r(。+r) 2 p 所以 ESIr (1.59) (n-1) 由此可求得|S的期望值与方差 ESI n-1
D(S1)=E|S|2-(ESi)2=|E|2 (n-1)(n Ⅱ(x-i+2)-I(n-i) (1.61) 对(1.58)式取对数得 y=ln|S|=△nx2-+ln||-pn(n-1)(1.62) 即y=ln|S是同型相互独立的随机变量lnx2的和,设 E(lnx2-;)=a;i=1,2,…p D(lnx-)=62i=1,2,…,p, E(y)=E(In||)=2a; +In E-pIn(n-1) 则 D(y)=D(In S)=2b 可以推想由中心极限定理,当n→+∞时 Inx In S-E(InS)) D(In S[ b 的概率分布逼近标准正态分布N(0.1)4,由此知,对充分大的n, 有近似公式 In s-N(ElnS, D(InS)) (1.64) 或a|S~N(∑a+n2|-pn(n-1),∑切(1.65) 由于a1,6的表达式很复杂,实用中常用样本来估计E(n|S), D(ln|S)。如对S有m组独立的观测值S1,S2,……,Sm;y=ln|S ,则y;=ln|S,| 1 In S: (1.66) 是E(lnS|)的无偏估计, (1.67) ·24·
是D(ln|S|)的无偏估计,由此ln|S的近似分布为 In S|N(, S) 笫六节多元随机变量正态性检验 在处理多元质量控制问题时,总是假定随机向量服从多元正 态分布。下面介绍的一种正态性检验方法是由 Mardia5)在1970 年提出来的,它利用同一元正态性检验相类似的两个多元统计量 多元偏度b,和多元峰度b2,进行统计检验,方法简单易行。 定义 b [(X-X)'S-4(x,-x)] (1.69) 在.=1∑[x,-xys(x,-X) (1.70) 式(1.69)式(1.70)中,下标p表示讨论的对象是p元随机变量, n表示样本含量,,表示样本序号。 Mardia证明了,对于大样本,存在以下两个近似分布: b1,/6 pp-1)(p+2)/6 (1.71) b2,p-p(P十2) ~N(0,1 1.72) √8p(p+2)/m 于是构成以下假设检验: H:未知分布为正态分布(偏度和峰度可信) H1未知分布不为正态分布(偏度、峰度不可信) 按给定的样本资料算出b,p、b2,,取一定的显著水平a,便可 以对H、H1作出判断。偏度是单侧检验,如果b1,过大,则拒绝原 假设;峰度是双侧检验,如果b2,过小或过大,则拒绝原假设。 如果经检验,总体不服从正态分布,通常有两种处理办法:(1) 当子组含量n较大时,对总体非正态性影响可以忽略不计;(2)当