定矩阵。 对于一般的多元总体,样本均值及A也可作为其总体均值 u和协差阵E的估计量,即 F=X, 2=+A 象一元统计中一样,多元总体参数估计也有许多评定好坏的 标准,如无偏性,相合性(一致性),有效性等由于多元统计中估计 的参数往往是一组值,因此有关的定义在这里要有所改动。 1.无偏性 该O是一组未知参数,B=(X1,…,Xn)是一组随机变量(不含 未知常数),如果E()=8,即B中相应分量是0中相应分量的无 偏估计,则称b为0的无偏估计量。 例如:设总体均值=(A1,…,)未知,协方差阵Σ=(a,)未 知,设X,=(xn;…,x1)'i=1,2,…,n为一样本,由定理4知, X E(x1) E(X) ECo S A〃1-1x)(X2-X)′=(S) E(S)=E(S2)=(o,)=E 因此,X是H的无偏估计,样本协差阵S是总体协差阵E的无偏估 计。因此可得 F=X, 2=S (1.43) 本书中即采用上式进行估值 2.相合性 设B是6的估计量(,0都含K个分量),如果对的每个分 16
量与相应的0的分量0(i=1,2,…,K)使下式成立 P(|0-.|<e)=1 i=1 K 其中E>0是任意数,这时称是0的相合估计 可以证明样本均值x,样本协差阵Σ都是相合估计。因此对 充分大的n值,用ⅹ近似μ,用S近似Σ效果好。 有效性 设是的无偏估计,如果对0的一切无偏估计B都使下式 成立。 D(0)≤D(0) 即B的协差阵小于b的协差阵,(即D(B)D(O)还是非负定矩 阵),则称3为的有效估计。 可以证明对多元正态总体N(,2,X是的有效估计,S是 E的有效估计 例1.2设某产品有3个指标需严格控制,今从中抽取25个 样品,得数据如表1-1 表1-1 No 1.421.1062.701 14 4.7034.0814.016 2.6652.07963.307 2.152C.8164.409 2.8722.2885.368 16 3.0894.104}2.891 4 3.2633.1771.751 2.9552.8535.372 4、071 2.1815.904 8 2.5081.3923.488 1.9414.0271.986 19 .3831.9863.001 1.4320.9172.980 20 1.1532.3352.292 0.5331.581|2.436213.5682.1703.006 9.5471.8603.458 22 1.7270.9762.219 2.76 3.776 3.791 3.682 3.282 24 5.2722.9032.090 406|3.075 3.3713.6252.582 13 2.0742.273]1.045 求该总体均值与协差阵E的无偏估计 17
3.004 X X r 2.453 3.184 2=s=(S:) S (r-x1)2 (x:2-x (x,3-x3)2 S (x汝-3k)(x;-x)k≠l,k、l=1,2、3 代入上述数据得 3.1520.1140.576 E=S=0.1141.105 0.148 0.576-0.1481.382 因S为对称矩阵,计算S时只求上三角矩阵或下三角矩阵即可得 到S。 第五节多元统计中常用的 统计量及其分布 在一元统计中常用的有v统计量t统计量、2统计量及F统 计量。它们都是由正态总体样本导出。设总体X~N(a,a2),X、S2 分别为样本均值与样本方差,则 X-a d巳知,= n~N(0,1) 未知,= √n~t(n-1) 已知,x2=∑(x,-X)2 ~x2(n-1) 若S、S2分别是来自总体N(a1,02),N(a,a2)的样本方差,样本 容量分别为m、n,则 ·18·
F(m-1,n-1) 这些统计量在一元统计中起着非常重要的作用。多元统计中 所用的统计量是由它们发展而来的。在多元情形,上述统计量中的 X2,,a,都是向量形式,其导出的统计量a、tX2也都是向量形式, 因此需化成数量才能利用。改写上面的统计量可得到启发 n(X (X-a)=n(X-a)o(X-a L2=n(X-a)S-2(X-a)=n(X-a)'s(X-a 这时u2~x2(1),2~F(1,n-1),与·元统计中方差a2、样本方差 S2相当的多元统计中的量为总体协差阵Σ与样本协差阵S。由此 可想到,相应统计量为 X-a)∑-1(X-a) n(x-a)'S(X-a) 其中K、a都是p维向量,下面讨论这两个统计量的分布 马氏距离 设p元总体X=(x1,…;x)的均值为μ,协差阵为E>0 D2=(Xu)Σ1(X-) (].4 D称为样本点X到均值(中心)的 Mahalanobis距离,简称马氏 距离,记为D(X,)。 丙x>0,存在A>0,及Σ=AA,∑=A,Σ2=A-,A=A 设 Y=A(X-H D=(X-)∑-(X-)=〔A-(X-)(A-(X-u) YY=△y2 从最后等式看出,马氏距离相当于y坐标下的欧氏距离。因此,马 氏距离满足距离的三条公理,即对任意三样品X、y、Z, ①D(X,Y)≥0,只有X=Y时等号成立 ②对称性,D(X,)=D(Y,X) ③三角不等式 19
D(X,Y)≤D(X,Z)十D(Z,Y) 实际上统计中的马氏距离还有一些优点,即与变量的测量单 位无关,且在任何可逆变换下其值不变。 二、D2的分布 设X~N(,E)。马氏距离D有如下性质。 定理5D2=(X-)(X-)~X(p (1.45) 证明:X~N,(,Σ),其密度函数为 f(X)=12| 。、ep(2(X-)x(x-4)} 因∑>0,∑=(∑)2,1=(2-+)2,令Y=-(X-4), X=22Y十p 雅可比 <x1, a(v 在此变换下Y的密度函数 g(Y)=f(X)|/=2 exp Yy)2Ii=II-Ie-25i (√2x) 2 所以y1,…,y,独立同N(01)分布,从而 D'=(X-F'E(X 由x2定义知,D2=(X-p(X-4)~x2(p)。 推论:X~N(u,∑),X为样本均值,样本容量为n,则 D2=n(x-p)1(X-y)~x2(p) (1.46) 证明:X1,…,Xn独立同N(M,∑)分布,则 ∑ 由此 (X-u)y(2|(x-1D)~x2(p) 化简即得 n(X-山)Σ1(x-)~x2(p) 20