目录第五章数理统计的基本概念及抽样分布185.4三大分布一x2t,F分布及正态总体样本均值和样本方差的分布185.4.1×2分布13$5.4.2t布F分布485.4.3$5.4.4正态总体样本均值和样本方差的分布6几个重要推论6$5.4.535.5总结8i
8 ¹ 1ÊÙ ênÚOÄVg9ĩ٠1 §5.4 n©Ù—χ 2 , t, F©Ù9oNþÚ©Ù . . . . . . 1 §5.4.1 χ 2©Ù . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 §5.4.2 t©Ù . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 §5.4.3 F©Ù . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 §5.4.4 oNþÚ©Ù . . . . . . . . . . . . . . . . . . 6 §5.4.5 AíØ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 §5.5 o( . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 i
第五章数理统计的基本概念及抽样分布85.4三大分布一x2,t,F分布及正态总体样本均值和样本方差的分布能求出抽样分布的确切而且具有简单表达式的情形并不多,一般都较难.所幸的是,在总体分布为正态情形,许多重要统计量的抽样分布可以求得,这些多与下面讨论的三种分布有密切关系.这三个分布在后面几章中有重要应用85.4.1x2分布≥x2,则称X是自由度为n的x?变量,定义5.4.1.设X1,X2,...,Xni.i.d.~N(0,1),令X=)i=1其分布称为自由度为n的×2分布,记为X~x设随机变量X是自由度为n的x2随机变量,则其概率密度函数为r号-le-,>0,22(号)gn(c) =(5.4.1)0,≤0注5.4.1.若记I(α,入)表示形状参数为α、刻度参数为入的Gamma分布,其密度函数如下尚aa-1e-z, >0,p(r;Q,>) =10≤0.则自由度为n的x?分布与Gamma分布的关系为:X=x?~I(n/2,1/2).我们也可以利2用这一关系给出x2分布的定义:“若随机变量X的概率密度函数为r(n/2,1/2),则称X为服从自由度为n的x2分布”x的密度函数gm(c)形状如图5.4.1x密度函数的支撑集(即使密度函数为正的自变量的集合)为(0,+oo),由图5.4.1可见当自由度n越大,x2的密度曲线越趋于对称,n越小,曲线越不对称.当n=1,2时曲线是单调下降趋于0.当n>3时曲线有单峰,从0开始先单调上升,在一定位置达到峰值,然后单下降趋向于01
1ÊÙ ênÚOÄVg9ĩ٠§5.4 n©Ù—χ 2 , t, F©Ù9oNþÚ©Ù U¦ÑÄ©Ù( äk{üLª/¿Øõ,ÑJ. ¤3´,3 oN©Ù/, NõÚOþĩٱ¦,ù õe¡?Øn« ©Ùk'X. ùn©Ù3¡AÙ¥kA^. §5.4.1 χ 2©Ù ½Â 5.4.1. X1, X2, · · · , Xn i.i.d. ∼ N(0, 1),-X = Pn i=1 X2 i ,K¡X´gdÝnχ 2Cþ, ٩١gdÝnχ 2©Ù, PX ∼ χ 2 n . ÅCþX´gdÝnχ 2ÅCþ, KÙVÇݼê gn(x) = 1 2 n 2 Γ( n 2 ) x n 2 −1 e − x 2 , x > 0, 0, x ≤ 0. (5.4.1) 5 5.4.1. ePΓ(α, λ)L«/Gëêα!ÝëêλGamma©Ù, ÙݼêXe p(x; α, λ) = ( λ α Γ(α) x α−1 e −λx, x > 0, 0, x ≤ 0. KgdÝnχ 2©ÙGamma©Ù'X: X = Pn i=1 X2 i ∼ Γ(n/2, 1/2). ·±| ^ù'XÑχ 2©Ù½Â: “eÅCþXVÇݼêΓ(n/2, 1/2), K¡X ÑlgdÝnχ 2©Ù”. χ 2 nݼêgn(x)/GXã5.4.1 . χ 2 nݼê| 8(=¦Ý¼êgCþ8Ü)(0, +∞), dã5.4.1 gdÝn, χ 2 n ݪué¡, n, Øé¡. n = 1, 2´ üNeüªu0. n ≥ 3kü¸, l0m©küNþ, 3½ ¸, , üeüªu0. 1
1g,(x)20n=1S1On=481=10n=20S00510152025303540图5.4.1x的密度函数gn(a)形状图个g(x)-X(α)X图5.4.2x的上侧分位数若X~xn,记P(X>c)=α,则c=x(α)称为x分布的上侧α分位数,如图5.4.2所示当α和n给定时可查表求出(α))之值,如x(0.01)=23.209,x(0.05)=12.592等X2变量具有下列性质:(1)设随机变量X~x则有E(X)=n,Var(X)=2n.(2)设Z1~X,Z2~X,且Z和Z2独立,则Z1+Z2~X1+n2我们从X?分布的定义出发给出一个简单证明:由定义Z1=X?+..+X2,此处X1,X2,***,Xni.i.d.~N(0,1),同理Z2=Xn1+1+..+X2+n2,此处Xni+1,Xni+2,**,Xni+n i.i.d.~N(0,1),2
5 10 15 20 25 30 35 40 0.05 0.1 0.15 0.2 gn(x) x n = 1 n = 4 n = 10 n = 20 ã 5.4.1 χ 2 nݼêgn(x)/Gã α χn 2 (α) x gn(x) ã 5.4.2 χ 2 nþýα© ê eX ∼ χ 2 n ,PP(X > c) = α, Kc = χ 2 n (α)¡χ 2 n©Ùþýα© ê,Xã5.4.2¤«. αÚn½L¦Ñχ 2 n (α), Xχ 2 10(0.01) = 23.209, χ2 5 (0.05) = 12.592. χ 2Cþäke5: (1) ÅCþX ∼ χ 2 nKkE(X) = n, V ar(X) = 2n. (2) Z1 ∼ χ 2 n1 , Z2 ∼ χ 2 n2 , Z1ÚZ2Õá, KZ1 + Z2 ∼ χ 2 n1+n2 . ·lX2©Ù½ÂÑuÑ{üy²: d½ÂZ1 = X2 1 + · · · + X2 n1 , d? X1, X2, · · · , Xn1 i.i.d. ∼ N(0, 1), ÓnZ2 = X2 n1+1 + · · · + X2 n1+n2 , d? Xn1+1, Xn1+2, · · · , Xn1+n2 i.i.d. ∼ N(0, 1), 2
再由Z,和Z2的独立性可知Xi,X2,...,Xn,Xn+1,...,Xn+ni.i.d.~N(o,1)因此Z+ + Z2 = X+.+ X2 + X1+1 +..+ X2n1+n2按定义即有Zi+Z2~x1+n2$5.4.2t分布定义5.4.2.设随机变量X~N(0,1),Y~x,且X和Y独立,则称T=VY/n为自由为n的t变量,其分布称为由为n的t分布,记为T~tn.设随机变量T~tn,则其密度函数为nt!r(")tn(r) = T(%) Vn元(5.4.2)1-188n.个t(x)N(0, 1)(t-(x)ot1o(x)t(0)t(x)20-4-3-2-10123图5.4.3tn的密度函数tn(c)形状图tn的密度函数与标准正态分布N(0,1)密度很相似,它们都是关于原点对称,单峰偶函数,在a=0处达到极大.但tn的峰值低于N(0,1)的峰值,tn的密度函数尾部都要比N(0,1)的两侧尾部粗一些.如图5.4.3所示.容易证明:limtn(a)=(c),此处(a)是N(0,1)变量的密度函数3
2dZ1ÚZ2Õá5 X1, X2, · · · , Xn1 , Xn1+1, · · · , Xn1+n2 i.i.d. ∼ N(0, 1). Ïd Z1 + Z2 = X2 1 + · · · + X2 n1 + X2 n1+1 + · · · + X2 n1+n2 . U½Â=kZ1 + Z2 ∼ χ 2 n1+n2 . §5.4.2 t©Ù ½Â 5.4.2. ÅCþX ∼ N(0, 1), Y ∼ χ 2 n , XÚY Õá, K¡ T = X p Y /n gdntCþ, ٩١dnt©Ù,PT ∼ tn. ÅCþT ∼ tn,KÙݼê tn(x) = Γ(n+1 2 ) Γ(n 2 ) √ nπ 1 + x 2 n − n+1 2 , −∞ < x < ∞ (5.4.2) −4 −3 −2 −1 0 1 2 3 4 0.1 0.2 0.3 0.4 x tn(x) N(0, 1)(t∞(x)) t10(x) t5(x) t1(x) ã 5.4.3 tnݼêtn(x)/Gã tnݼêIO©ÙN(0, 1)Ýéq, §Ñ´'u:é¡, ü¸ó¼ ê, 3x = 0?4. tn¸$uN(0, 1)¸, tnݼêÜÑ'N(0, 1) üýÜo . Xã5.4.3¤«. N´y²: limn→∞ tn(x) = ϕ(x),d?ϕ(x)´N(0, 1)Cþ ݼê. 3
^t;(x)α/2al2/1ta(a/2)ta(a/2)图5.4.4tn的双侧α分位数若T~tn,记P(T>c)=α,则c=tn(α/2)为自由度为n的t分布的双侧α分位数(如图5.4.4所示).当给定α时,tn(α),tn(α/2)等可通过查表求出.例如t12(0.05)=1.782,tg(0.025)=2.262等t分布是英国统计学家W.S.Gosset在1908年以笔名Student发表的论文中提出的,故后人称为“学生氏(Student)分布”或“t分布”t变量具有下列的性质:(1)若随机变量T~tn,则当n≥2时,E(T)=0.当n≥3时,Var(T)=n=2(2)当n→αo时,t变量的极限分布为N(0,1)$5.4.3F分布定义5.4.3.设随机变量X~×m,Y~X2且X和Y独立,则称F=X/mY/n为自由度分别是m和n的F变量,其分布称为自由度分别是m和n的F分布,记为F~Fm,n:若随机变量Z~Fm.n,则其密度函数为r(mtn)mn-1(n+mr)-",>0,(岁)F(岁)(5.4.3)fm,n(r) =(0,其它.自由度为m,n的F分布的密度函数如图5.4.5.注意F分布的自由度m和n是有顺序的,当m≠n时若将自由度m和n的顺序颠倒一下,得到的是两个不同的F分布.图5.4.5中4
x t n(x) α 2 α 2 − tn(α 2) tn(α 2) ã 5.4.4 tnVýα© ê eT ∼ tn,PP(|T| > c) = α,Kc = tn(α/2)gdÝnt©ÙVýα© ê(X ã5.4.4¤«). ½α, tn(α), tn(α/2)ÏLL¦Ñ. ~Xt12(0.05) = 1.782, t9(0.025) = 2.262. t©Ù´=IÚOÆ[W.S. Gosset 31908c±)¶Student uLØ©¥JÑ, <¡“Æ)¼(Student)©Ù” ½“t©Ù”. tCþäke5: (1)eÅCþT ∼ tn,Kn ≥ 2, E(T) = 0. n ≥ 3, V ar(T) = n n−2 . (2)n → ∞, tCþ4©ÙN(0, 1). §5.4.3 F©Ù ½Â 5.4.3. ÅCþX ∼ χ 2 m, Y ∼ χ 2 n , XÚY Õá,K¡ F = X/m Y /n gdÝ©O´mÚnFCþ, ٩١gdÝ©O´mÚnF©Ù, PF ∼ Fm,n. eÅCþZ ∼ Fm,n, KÙݼê fm,n(x) = Γ( m+n 2 ) Γ( n 2 )Γ( m 2 )m m 2 n n 2 x m 2 −1 (n + mx) − m+n 2 , x > 0, 0, Ù§. (5.4.3) gdÝm, nF©ÙݼêXã5.4.5 . 5¿F©ÙgdÝmÚn´k^S , m 6= neògdÝmÚn^S6e, ´üØÓF©Ù. ã5.4.5¥ 4