2004年清华大学考研辅导班(暑期班)讲义一一概率统计 第六讲样本与抽样分布 内容提要 (1)基本概念(样本,样本联合分布函数,经验分布函数,统计量 三大抽样分布(X分布,t分布,F分布的定义性质,分位点) (2)正态总体常见统计量的分布(单总体,双总体) 典型问题 问题1:样本的联合分布函数与经验分布函数 问题2:计算统计量的分布及其数字特征 问题3:计算统计量的相关概率或反求其样本容量 典型例题 例6.1.选择题: (1)设X12X2,…,Xn为取自总体X的一个样本,则X1,X2,…,Xn必满足 (A)独立但分布不同(B)分布相同但不相互独立 (C)独立同分布 (D)不能确定 (2)设X1,X2,…,Xn为取自总体x~N(O2)的一个样本,其中,未 知,则下面不是统计量的是 (A) X (B) X (C)-(X,-X (D) (3)设H1,H2…,Xn为取自总体X~N(02)的一个样本,记 F=mX-),则 S (A)Y~x(n-1)(B)Y~t(n-1) (C)Y~F(n-1,1)(D)Y~F(1,n-1) (4)设H1,X2,…,Xn为取自总体X~N(,a2)的一个样本,X为样本均 (A)E(X2-S2)=12-a2(B)E(X2+S2)=2+a 2004年7月叶俊编
2004 年清华大学考研辅导班(暑期班)讲义——概率统计 第六讲 样本与抽样分布 内容提要 (1)基本概念(样本,样本联合分布函数,经验分布函数,统计量) 三大抽样分布( 分布,t 分布,F 分布的定义性质,分位点) 2 χ (2)正态总体常见统计量的分布(单总体,双总体) 典型问题 问题 1: 样本的联合分布函数与经验分布函数 问题 2: 计算统计量的分布及其数字特征 问题 3: 计算统计量的相关概率或反求其样本容量 典型例题 例 6.1. 选择题: (1)设 X1, X2 ,L, Xn为取自总体 X 的一个样本,则 X1, X2 ,L, Xn必满足 (A)独立但分布不同 (B)分布相同但不相互独立 (C)独立同分布 (D)不能确定 (2)设 为取自总体 的一个样本,其中 未 知, 则下面不是统计量的是 X X Xn , , , 1 2 L ~ ( , ) 2 X N µ σ 2 µ,σ (A) Xi (B) X (C) ∑ = − n i Xi X n 1 3 ( ) 1 (D) ∑ = − n i Xi n 1 2 ( ) 1 µ ( 3 ) 设 X1, X2 ,L, Xn 为取自总体 ~ ( , ) 的一个样本,记 2 X N µ σ 2 ( ) S X Y n − µ = , 则 (A) ~ ( 1) (B) 2 Y χ n − Y ~ t(n −1) (C)Y ~ F(n −1,1) (D)Y ~ F(1, n −1) (4)设 X1, X2 ,L, Xn为取自总体 ~ ( , ) 的一个样本, 2 X N µ σ X 为样本均 值,则 (A) 2 2 2 2 E(X − S ) = µ −σ (B) 2 2 2 2 E(X + S ) = µ +σ 2004 年 7 月 叶俊 编 1
2004年清华大学考研辅导班(暑期班)讲义一一概率统计 (C)E(X2-S2)= (D)E(x2-S2)=+a2 (5)设X1,X2,…,X100是总体X~N(4)的一个样本,若已知 Y=a+b~N(0,1),则 (A)a=-5.b=5 (B)a=5,b=5 (C)a=3,b=- (D)a=-3,b=3 例62.填空题: (1)设随机变量x服从均值为0(4>0)的指数分布,且其上25%分 位点为00,则2= (2)设X1,X2,…,X6为取自总体X~N(A,4)的一个样本,则 D(S2)= (3)设X12X2…Xn为取自总体x~N(,a2)的一个样本,则 X-3服从 分布 (4)设总体X服从正态分布N(0,22),而X12X2,…,Xn是来自总体X的简单 随机样本则随机变量Y=2+…+x2 服从 分布 2(X1+…+X3) (5)设X1,X2,X5为取自总体X~N(0,a2)的一个样本,若 a(X1+X2) 服从t分布,则 x32+X2+X2 例63.设某商店一小时内到达的顾客数X服从参数为2的 Poisson分布, X1,X2,…,X1o是来自总体X的简单随机样本 (1)求(X1,X2…,X10)的联合分布律 (2)求X的分布律 例64.设总体X和y同服从N(0,32)分布,而X1,X2…,X,和Y1,H2,…, 2004年7月叶俊编
2004 年清华大学考研辅导班(暑期班)讲义——概率统计 (C) 2 2 2 E(X − S ) = µ −σ (D) 2 2 2 E(X − S ) = µ +σ ( 5 ) 设 X1, X2 ,L, X100 是总体 X ~ N(1,4) 的一个样本,若已知 Y = aX + b ~ N(0,1), 则 (A)a = −5,b = 5 (B)a = 5,b = 5 (C) 5 1 5 1 a = ,b = − (D) 5 1 5 1 a = − ,b = 例 6.2. 填空题: (1)设随机变量 X 服从均值为 ( 0) 1000 λ > λ 的指数分布,且其上 25%分 位点为 3 1000 ,则λ = . ( 2 ) 设 X1, X2 ,L, X6 为取自总体 X ~ N(µ,4) 的一个样本 , 则 ( ) = 2 D S . ( 3 ) 设 X1, X2 ,L, Xn 为取自总体 ~ ( , ) 的一个样本,则 2 X N µ σ 2 ( ) σ − µ = X Y n 服从 分布. (4)设总体 X 服从正态分布 (0,2 ),而 是来自总体 2 N X X Xn , , , 1 2 L X 的简单 随机样本, 则随机变量 2( ) 2 15 2 11 2 10 2 1 X X X X Y + + + + = L L 服从 分布. ( 5 ) 设 X1, X2 ,L, X5 为取自总体 ~ (0, ) 的一个样本,若 2 X N σ 2 5 2 4 2 3 1 2 ( ) X X X a X X + + + 服从 t 分布,则 a = . 例 6.3. 设某商店一小时内到达的顾客数 X 服从参数为 2 的 Poisson 分布, 是来自总体 X 的简单随机样本. 1 2 10 X , X ,L, X (1) 求( , , , ) 的联合分布律; X1 X2 L X10 (2) 求 X 的分布律. 例 6.4. 设总体 X 和 Y 同服从 (0,3 )分布, 而 和Y 2 N 1 2 9 X , X ,L, X 1 2 9 ,Y ,L,Y 2004 年 7 月 叶俊 编 2
2004年清华大学考研辅导班(暑期班)讲义 率统计 分别是取自总体X和Y的两个独立简单随机样本,试证:统计量 X1+X,+…+X +Y+…+Y 例65.设H1,X2,…,Xn1是正态总体的简单样本,设X=∑X和 (1)试求(n-1)(X1-)2/∑(X1-)2]的分布 (2)试求~Xmn-1 的分布 n+1 例66.设X1,X2,…,X。和1,12,…,Y分别是取自两个独立的正态总体 N(A1,2)和N(2,a2)的随机样本,a和B是两个实数,试求 Z c(X-1)+f(Y-/2) 的概率分布.其中X,S2n和 (m-1)Sim+(n-1)S2 +n-2 F,S2,分别是两个总体的样本均值和样本方差 例67设X1,X2,X3,X4是来自正态总体N(0.4)的简单样本,记 Y=(X1-2X2)2+(3X3-4X)2 则EY和DX 例68.设H1X2,…Xn为取自总体X~N(,2)的一个样本,求样本的二 阶原点矩的期望与方差 例69.设X1,H2…,H2是总体X~N(O,a2)的一个样本,求概率 ∑X t(16)) X 2004年7月叶俊编
2004 年清华大学考研辅导班(暑期班)讲义——概率统计 分别是取自总体 X 和 Y 的两个独立简单随机样本 , 试 证 : 统计量 ~ (9) 2 9 2 9 2 9 1 2 9 t Y Y Y X X X z + + + + + + = L L 例 6.5. 设 X1, X2 ,L, Xn+1 是正态总体的简单样本,设 ∑ = = n i Xi n X 1 1 和 =2 Sn ∑( ) = − n i X i X n 1 1 2 (1)试求( 1)( ) [ ( ) ] 2 2 2 1 ∑ = − − − n i n X µ Xi µ 的分布. (2) 试求 1 n+1 1 + − − n n S X X n 的分布. 例 6.6. 设 和 分别是取自两个独立的正态总体 和 的随机样本 , 1 2 9 X , X ,L, X 1 2 9 Y ,Y ,L,Y ( , ) 2 N µ1 σ ( , ) 2 N µ 2 σ α 和 β 是两个实数 , 试 求 m n m n m S n S X Y Z m n 2 2 2 2 2 1 1 2 2 ( 1) ( 1) ( ) ( ) α β α µ β µ + + − − + − − + − = 的概率分布 . 其 中 2 1 , m X S 和 2 2 , n Y S 分别是两个总体的样本均值和样本方差. 例 6.7. 设 X1, X2 , X3 , X4 是来自正态总体 N(0,4)的简单样本, 记 2 3 4 2 1 2 (3 4 ) 100 1 ( 2 ) 20 1 Y = X − X + X − X 则 EY 和 DX . 例 6.8. 设 为取自总体 的一个样本,求样本的二 阶原点矩的期望与方差. X X Xn , , , 1 2 L ~ ( , ) 2 X N µ σ 例 6.9. 设 X1, X2 ,L, X26 是总体 ~ (0, ) 的一个样本,求概率 2 X N σ ( (16)) 26 11 2 10 1 αt X X P j j i i ≤ ∑ ∑ = = 2004 年 7 月 叶俊 编 3
2004年清华大学考研辅导班(暑期班)讲义一一概率统计 例610.设X1,X2,…,H是总体X~N(0,a2)的一个样本,试确定σ的值, 使P(1<X<3)为最大 例6.设X1,X2…,Hn为取自总体X~N(,2)的一个样本,X为样本 均值,要使E(X-)2≤0.1成立,则样本容量n至少应取多少? 例612.设总体X服从N(a,4)分布,Y服从N(b,4)分布,而X12X2,…,X9和 1,Y2…,H6分别是来自X和Y的两个独立的随机样本,记 W=∑(X1-X)2,W2=∑(X1-y)2 其中 X=->X,Y 16 (1)求常数C使P(-b)∠C)=09, (2)求P(0709<2<6038) W 第七讲参数估计 内容提要 (1)点估计(矩估计,极大似然估计) (2)估计量的评选标准(无偏性,有效性,一致性 (3)区间估计(枢轴变量法 (4)正态总体参数的置信区间(双侧,单侧) 典型问题 问题1:求矩估计与极大似然估计 问题2:估计量评选标准的讨论 问题3:求參数的区间估计 置信区间的一般求法(枢轴变量法) (1)先找一个与要估计的参数6(或g())有关的统计量T,一般是一良好的点估计 (MLE 2004年7月叶俊编
2004 年清华大学考研辅导班(暑期班)讲义——概率统计 例 6.10. 设 X1, X2 ,L, X9 是总体 ~ (0, )的一个样本,试确定 2 X N σ σ 的值, 使 P(1 < X < 3)为最大. 例 6.11. 设 X1, X2 ,L, Xn为取自总体 ~ ( ,2 ) 的一个样本, 2 X N µ X 为样本 均值,要使 ( ) 0.1 2 E X − µ ≤ 成立,则样本容量 n 至少应取多少? 例6.12. 设总体X服从 N(a,4) 分布,Y服从 N(b,4)分布, 而 和 分别是来自 X 和 Y 的两个独立的随机样本 , 记 1 2 9 X , X ,L, X 1 2 16 Y ,Y ,L,Y ∑ = = − 9 1 2 1 ( ) i W Xi X , ∑ = = − 16 1 2 2 ( ) j W Yi Y , 其 中 ∑ = = 9 9 1 1 i X Xi , ∑ = = 16 16 1 1 i Y Xi (1) 求常数 C, 使 ) 0.9 | | ( 2 < = − C W Y b P ; (2) 求 (0.709 6.038) 1 2 < < W W P 第七讲 参数估计 内容提要 (1)点估计(矩估计,极大似然估计) (2)估计量的评选标准(无偏性,有效性,一致性) (3)区间估计(枢轴变量法) (4)正态总体参数的置信区间(双侧,单侧) 典型问题 问题 1: 求矩估计与极大似然估计 问题 2: 估计量评选标准的讨论 问题 3: 求参数的区间估计 置信区间的一般求法(枢轴变量法): (1) 先找一个与要估计的参数θ (或 g(θ ) )有关的统计量 T ,一般是一良好的点估计 (MLE); 2004 年 7 月 叶俊 编 4
2004年清华大学考研辅导班(暑期班)讲义一一概率统计 (2)寻找一样本X1,X2,…,Xn的函数,即找出T和(或g(O))的某一函数: Z=Z(X,, X b)≡Z(T,6) 它只含待估参数和样本,不含其它未知参数,并且Z的分布(或渐近分布)G已知, 且不依赖于任何未知参数(也不依赖于待估参数θ)(称Z为枢轴变量) (3)对于给定的置信度1-a,定出两常数a,b,使得 P(a≤Z(X1,X2,…Xn,)≤b)=1 般a,b选用分布(或渐近分布)G的上1-一和上一分位点 (4)若能从a≤Z(X1,X2…,Xn,)≤b,得到等价的不等式 61(X1,X2,…,Xn)≤≤62(X1,X2…,Xn) (或6(X1,X2…,Xn)≤g()≤O2(X1,X2…,Xn) 那么1,O2](或[1,021就是0(或g(O))的一个置信度为1-a的置信区间 注:〖双侧置信区间与单侧置信区间的对照〗 典型例题 例71设总体X的概率分布为 X 0220(1-0) 1-26 其中6(0<6<-是未知参数,利用总体X的如下样本值 求θ的矩估计值和最大似然估计值 例72设总体X的分布律为P(X=A)=1 k=0,1,…,N,其中N为未 知的正整数,又X1,X2…,Xn为取自总体X的一个样本,试求N的最大似然 估计 例73设总体X的密度函数为 0≤x≤1 其他 2004年7月叶俊编
2004 年清华大学考研辅导班(暑期班)讲义——概率统计 (2) 寻找一样本 X1 , X 2 ,L, X n 的函数,即找出 T 和θ (或 g(θ ) )的某一函数: ( , , , , ) ( , ) Z = Z X1 X 2 L X n θ ≡ Z T θ 它只含待估参数和样本,不含其它未知参数,并且 Z 的分布(或渐近分布)G 已知, 且不依赖于任何未知参数(也不依赖于待估参数θ )(称 Z 为枢轴变量); (3) 对于给定的置信度1−α ,定出两常数 a,b,使得 P(a ≤ Z(X1 , X 2 ,L, X n ,θ ) ≤ b) = 1−α 一般 a,b 选用分布(或渐近分布)G 的上 2 1 α − 和上 2 α 分位点; (4) 若能从 a ≤ Z(X1 , X 2 ,L, X n ,θ ) ≤ b ,得到等价的不等式 ( , , , ) ( , , , ) θ 1 X1 X 2 L X n ≤ θ ≤ θ 2 X1 X 2 L X n ( , , , )) ~ ( , , , ) ( ) ~ (或θ1 X1 X2 L Xn ≤ g θ ≤ θ 2 X1 X2 L Xn 那么[ , ] θ1 θ 2 ]) ~ , ~ ( [ 或 θ 1 θ 2 就是θ (或 g(θ ) )的一个置信度为1−α 的置信区间. 注:〖双侧置信区间与单侧置信区间的对照〗 典型例题 例 7.1 设总体 X 的概率分布为 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ θ 2θ (1−θ ) θ 1− 2θ 0 1 2 3 ~ 2 2 X 其中 ) 2 1 θ (0 < θ < 是未知参数,利用总体 X 的如下样本值 3,1,3,0,3,1,2,3, 求θ 的矩估计值和最大似然估计值. 例 7.2 设总体 X 的分布律为 k N N P X k , 0,1, , 1 1 ( ) = L + = = ,其中 N 为未 知的正整数,又 为取自总体 X 的一个样本,试求 N 的最大似然 估计。 X X Xn , , , 1 2 L 例 7.3 设总体 X 的密度函数为 ⎩ ⎨ ⎧ ≤ ≤ = − 0 其他 0 1 ( ) 1 x x f x θ θ 2004 年 7 月 叶俊 编 5