S- 1 2, 三、顺序统计量 定义2(化,X2:,X,)是总体X的一个样本,(,2,,x,)是一个样 本观察值,将它由小到大的顺序排列,得到xS2≤xw,取xo作为X的 观测值,由此得到的统计量XX2,,X称为样本(X1,X,…,X,)的 组顺序统计量,X称为第个顺序统计量或第项.统计量 X(m+)2 当n=2m+1 2 (X(m)+Xm+)),当n=2m R,=Xm一X1 分别称为样本中位数和样本极差. 样本均值、顺序统计量的首项及末项、样本中位数描述了样本在数轴上 的大致位置;样本方差与样本极差描述了样本的分散程度
= − − = n i i x x n s 1 2 ( ) 1 1 = = n i k k i x n a 1 1 = = − n i k k i x x n b 1 ( ) 1 , , . 三、顺序统计量 定义2 (X1,X2,…,Xn )是总体X的一个样本,(x1,x2,…,xn )是一个样 本观察值,将它由小到大的顺序排列,得到x(1)≤x(2)≤…≤x(n) ,取x(i)作为X(i)的 观测值,由此得到的统计量X(1),X(2),…,X(n)称为样本(X1,X2,…,Xn )的 一组顺序统计量,X(i)称为第i个顺序统计量或第i项.统计量 Rn= x(n)-x(1) 分别称为样本中位数和样本极差. 样本均值、顺序统计量的首项及末项、样本中位数描述了样本在数轴上 的大致位置;样本方差与样本极差描述了样本的分散程度. + = = + = + + X X n m X n m X m m m ( ) , 2 2 1 , 2 1 ~ ( ) ( 1) ( 1) 当 当
第三节样本分布函数与频率直方图 一、样本分布函数 样本能够反映总体X的信息,总体的分布函 数Fx)是否能由样本来“表示”?回答是肯定的, 我们用下面介绍的样本函数来近似表示总体X的 分布函数, 定义 设xx2,xm是总体X的顺序统计量的一组观察值,对于任 意的实数x,定义函数 0 x<x02 F (x)= 之 x0)≤x<x+),i=1,2,…,n-1 x≥X(m) 称F,x)为总体X的样本分布函数(或经验分布函 数)
第三节 样本分布函数与频率直方图 一、样本分布函数 样本能够反映总体X的信息,总体X的分布函 数F(x)是否能由样本来“表示”?回答是肯定的, 我们用下面介绍的样本函数来近似表示总体X的 分布函数. 定义 设x(1),x(2),…,x(n)是总体X的顺序统计量的一组观察值,对于任 意的实数x,定义函数 = − = + 1, . , , 1, 2, , 1; 0, ; ( ) ( ) ( ) ( 1) (1) n n i i x x x x x i n n i x x F x 称Fn (x)为总体X的样本分布函数(或经验分布函 数).
样本分布函数F,x)不仅与样本容量n有关, 还与所得到的样本观察值有关,故它是随机变 量.F,(x)的图形(图6-1)呈跳跃上升的台阶状,在 x)?X2)?,xm中的不重复的值处,跳跃高度 为二;在重复1次的值处,跳跃高度为·图 n n 6-1中的曲线是总体X的理论分布函数Fx)的图 形. F(x 工(+1) x(1)x(2) Ox(i) 图61
样本分布函数Fn (x)不仅与样本容量 n 有关, 还与所得到的样本观察值有关,故它是随机变 量.Fn (x)的图形(图6-1)呈跳跃上升的台阶状, 在 x(1),x(2),…,x(n)中的不重复的值处,跳跃高度 为 ;在重复 l 次的值处,跳跃高度为 .图 6-1中的曲线是总体 X 的理论分布函数 F(x) 的图 形. n l n 1 图6-1
样本分布函数F,(x)具有以下性质: 1°0Fx)1; 2°F(x)是单调不减函数: 3°F(x)是处处右连续的. 对于样本观察值(x1,2,,x),为了求其对应的样本分布函数F(x) 之值,只须将这n个值中小于或等x的个数除以样本容量n即可.对于给定 的x,F,(x)是n次重复独立试验中事件{X≤x}出现的频率,而理论分布函数 Fx)是事件{X≤x}发生的概率,由伯努利定理知,对任意给定的正数ε,有 lim P{F(x)-F(x))=1, 即F,x)按概率收敛于Fx).进一步还有如下结论. 定理(格利文科W.Glivenko)定理) 设总体X的分布函数为Fx),样本 分布函数F,(x),则对于任何实数x,有 P(lim sup F(x)-F(x)=0)=1. -00<X<+0 证明从略。 以上结论是我们用样本去推断总体的依据
样本分布函数Fn (x)具有以下性质: 1°0≤Fn (x)≤1; 2°Fn (x)是单调不减函数; 3°Fn (x)是处处右连续的. 对于样本观察值(x1,x2,…,xn ),为了求其对应的样本分布函数Fn (x) 之值,只须将这n 个值中小于或等 x 的个数除以样本容量n 即可.对于给定 的x,Fn (x)是 n 次重复独立试验中事件{X≤x} 出现的频率,而理论分布函数 F(x)是事件{X≤x}发生的概率,由伯努利定理知,对任意给定的正数ε,有 , 即Fn (x)按概率收敛于F(x).进一步还有如下结论. lim {| ( ) − ( )| }=1 → P F x F x n n 定理 (格利文科(W. Glivenko)定理) 设总体X的分布函数为F(x), 样本 分布函数Fn (x),则对于任何实数x,有 . 证明从略. 以上结论是我们用样本去推断总体的依据. {lim sup | ( ) − ( )|= 0}=1 → − + P F x F x n x n
二、频率直方图 如果说样本分布函数是通过随机样本对总 体分布函数的反映,那么下面介绍的频率直方 图就是样本对总体概率密度函数的反映(假设总 体是连续随机变量): 依据总体X的一个样本观察值(x1,x2,.,x,)画直方图的一般步骤如下: 1°找出x1,2,,x,中的最小值x与最大值xm 2°选择常数a、b(ab2xm),在区间[a,b内插入k-1个分点; a=t<t1t2<.<4k-1<tFb. 用来对样本观察值进行分组.为了方便,可将区间[a,b]分成k等分,此时组 距是 =4--发2,l,2无 b-a 组数k要选择适当.一般地说,当20≤≤100时,取k为5~10;当>100时, 取k为10~15.通常取t,比样本观察值精度高一位
二、频率直方图 如果说样本分布函数是通过随机样本对总 体分布函数的反映,那么下面介绍的频率直方 图就是样本对总体概率密度函数的反映(假设总 体是连续随机变量). 依据总体 X 的一个样本观察值(x1,x2,…,xn )画直方图的一般步骤如下: 1°找出x1,x2,…,xn中的最小值x(1)与最大值x(n). 2°选择常数a、b(a≤x(1),b≥x(n) ),在区间[a,b]内插入k-1个分点; a=t 0<t 1<t 2<…<t k-1<t k=b. 用来对样本观察值进行分组.为了方便,可将区间[a,b]分成k 等分,此时组 距是 i=1,2,…,k. 组数 k 要选择适当.一般地说,当20≤n≤100时,取k 为 5~10;当n>100时, 取 k 为10~15.通常取t i 比样本观察值精度高一位. , 1 k b a t t t i i − = − − =