例1.1p=2,X=(x1,x2)u=E(X)=(1P2) rong -ro, 其中d,a分别为x1,x2的方差,为x1,x2的相关系数,则二元正 态分布密度函数为 f(x1,x2)= 2丌 (1-r2) 2r(x1-H1)(x2-P2), 定理2.设X~N(,2),如果Y=AX+b,则 Y-N(Au+6,A2A) 证明:{参见[1]} 该定理说明,多元正态分布的线性变换还是多元正态分布的 、中心极限定理 下面介绍多元统计分析中大样本情形下常用到的一个极限定 理,它类似于概率论中的中心极限定理,但形式有些变化,这是一 元情形的推 先介绍向量不等式 设X=(x1,…,x),Y=(y,…,y),如果对每个i=1,…p, 都有x;≤y,则记X≤Y 定理3(多维分布中心极限定理)设X1,X2,…,Xn…是p维 独立同分布的随机向量序列,E(X)==(m,…,p),D(X)=∑ i=1,2,…,而且Σ为正定矩阵,设Y=(y;…,y)为任意实向量, 圳有 limP((n2)(X1+x2+…+Xn-n)≤y) xp dt,(1.29)
若令x,=1∑x,上式可改写为 imP(2+(.一≤Y)= (1.30) 证明:从略 利用中心极限定理,当n充分大时,可以有下述近似公式 (2)2(X。-)~N2(0,D 由定理3当n相当大时使得渐近式 或 X1+X2+…+Xn~N(nu,n2) (1.32) (1.31),(1.32)二式在多元统计大样本理论中是很有用的公式 第三节样本矩 在一元统计中样本均值与样本方差起着重要作用,在多元统 计中有类似的量,也起着十分重要的作用 元统计中设(X1,X2,…,X)为样本, 样本均值X=1∑x 样本方差S2 (X;X) ∑x2-n 在多元统计中设研究的总体有p个指标,总体为X=(x1,x2, ,x:)′。对该总体独立地重复进行n次观测或抽样,得n个样品 x.=(x1,x1,…,x,),=1,2,……,n。则x1,X2…,X称为一个样 本或子样。把样本写成矩阵形式为
…1p 该矩阵又称数据矩阵或资料矩阵。本书中我们讨论的样本在绝大 多数情形下是独立的,即X1,X2∵…,K独立同分布,这时我们简 称样本或子样。当X1,…,X。相依时,称为相依样本或子样 引入下述定义 1.34) 称为样本均值,它依然是p维向量,令 则 X=(T1,x A=乙(X:--x)(X,x 称为离差矩阵,它是p×p阶方阵。 S (X-X)(X-X) A 称为样本的协方差矩阵,简称样本协差阵。 为书写简单,样本、均值、协差阵等表示式象一元统计中一样, 有时也指样本的观测值,这从上下行文可以看出。 样本均值与样本协差阵具有下述性质。 定理4如果总体X的均值E(X)=μ存在,协方差矩阵 D(X)=2也存在,X为样本均值,S为样本协差阵,则 (1)E(X)=D(X)=2 (2)E(S)=2 13
证明:(1)E(X)=E(∑x)=1∑E(X,)=1∑ u==H D(x)=D1∑x2Dx)=习xx (2)A=2(X,-X)(X1-X) 〔(X-)-(X一p))(X:-4)-(X-p)〕 (X;-p)(X-4)-n(X-)(X-p)(1.37) E(A)=E[∑(X1-p)(X;p))-nE(X一p)(X-p ∑E(x-以(X:-p)-nE(X4)(X-p3 D(X)-nD(X) z=(n-1)E 从而有 E(S)=E-1 E(A)=2 象一元统计中一样还可以证明,当n→+∞时;样本均值、样 本协差阵以概率1趋向于总体的均值与协差阵。 第四节多元正态总体的均值 与协差阵估计 象在一元统计中一样,在多元统计中也有许多估值方法;例 如,矩估计,极大似然估计,贝叶斯估计等,我们这里只限于讨论总 体均值与协差阵的估计问题。多元统计中的估计是针对一组参数 进行的,即对均值=(A,……,p)有户个参数,对协差阵E= 14
(a,)有p×p个参数。这里我们先介绍关于多元正态总体极大似 然估计方法,然后对估计的标准作些讨论。 设X1,XB,…,X。是来自多元正态总体N(,2)的样本,E 未知,则n个样品的联合密度函数为 ∑(-2 L(4E) p (√2x)P 2|-2 exp (X,-p)2(x:-u)}(1.38) L(u、2称为似然函数。使似然函数L(和,2达到极大值的,称 为a与E的极大似然估计,即 L(2)==maxL(M,2)。 因Inx是x的严格单调函数,求L(μ,E)的极大值等价于求 lnl(μ,Σ)的极大值,对L(μ,2取对数, InL(u, 2 亏np (X41)E1(X;-p 为使上式取得最大值,只要使第二项第三项取得最大值即可 可以证明 X (1.40) 当H已知时 X;-)(x;-4) (1.41) 当未知时, 丘=1∑(X1-X)(X,-X) 1 (1.42) 因我们限定多元正态分布的协差阵∑为正矩阵,因此E的估 值也必须是正定的。A是正定阵的充分必要条件是n>p,即样本 容量大于维数,这时尽管A是随机矩阵,但以概率1保证A为正 15