第三节未知分布的估计设所研究的总体为X,其中X的概率分布未知。我们的问题是怎样通过取自X的样本:(Xg, X2..., Xn)来估计总体X的概率分布
第三节 未知分布的估计 •1 设所研究的总体为X,其中X的概率 分布未知。我们的问题是怎样通过取 自X的样本: (x1 , x2 ,., xn ) 来估计总体X的概率分布
一、分布列的估计设总体X是一离散型随机变量,分布列为:XX2... Xn(PP2..Pn..其中p,未知,(Xi,X2… X,)为取自总体X的一个样本,(x,x2,x,)为样本值。统计x,X2,x,中等于x,的个数μu,就是事件[X=x}在n次独立重复试验中出现的频数根据伯努利大数定律,当n充分大时有:P, = P(X =x)~μn这样,我们就得到了X分布列的一种估计例:略2
•2 一、分布列的估计 1 2 1 2 1 2 1 2 1 2 . . . . , ,., ) , ,., ) , ,., , ( ) n n i n n n i i i i i i i x x x p p p p X X X X x x x x x x x X x n n p P X x n X 设总体X是一离散型随机变量,分布列为: 其中 未知,( 为取自总体 的一个样本, ( 为样本值。统计 中等于 的个数 就是事件 在 次独立重复试验中出现的频数, 根据伯努利大数定律,当 充分大时有: 这样,我们就得到了 分布列的一种估计。 例:略
密度函数的估计二、1.直方图设x,x2……,x,是一组数据,为了掌握它变化的规律性,我们对它加以整理。首先选取a,b两数,使得a适当小于min(x,x2…x),b适当大于 max(i,x2.,x), 并用分点 (t :a=to<ti <,.,<tm =b)将区间[a,b)分成m个小区间([ti-,t,);i =1,2,.,m];然后统计x,X2,.,x,落入[t-1,t)内的个数μ,。我们把每个小区间内的数据称为一组,这样整个数据被分成了m组。作0,x<a,uf,(x) =ti-1 ≤x<t,,i =1,2,..,m,n△t,[0,x≥b, 3
•3 二、密度函数的估计 1.直方图 1 2 1 2 1 2 0 1 1 1 2 1 , ,., , min , ,., , max , ,., , : ,., , , ; 1, 2,., ; , ,., , n n n i m i i n i i i x x x a b a x x x b x x x t a t t t b a b m t t i m x x x t t 设 是一组数据,为了掌握它变化的规律性,我们 对它加以整理。 首先选取 两数,使得 适当小于 适当 大于 并用分点 将区 间 分成 个小区间 然后统计 落入 内的个数 。我们把每个小区间内的数据称为一组 1 0, , ( ) , , 1, 2,., , 0, , i n i i i m x a f x t x t i m n t x b , 这样整个数据被分成了 组。 作
绘出f.(x)的图形。由于f.(x)的图形呈直方形(如下图),因此称其图形为直方图。直方图可以使得杂乱无章的原始数据呈现出一定的规律性,从而对数据的全貌、数据的分布特征以及差异、波动趋势有一个比较清楚的了解,因此直方图是数据处理中一种常用的方法。在教育统计学中,我们经常利用它来了解或掌握学生的成绩、年龄、身高等结构98热90注:在做直方图时,分组问题需注意,数组的多少往往影响着直方图在反映数据分布上的效应,所以数组不能过多,也不能过少
•4 ( ) ( ) n n 绘出 f x f x 的图形。由于 的图形呈直方形(如下图),因此称 其图形为直方图。 直方图可以使得杂乱无章的原始数据呈现出一定的规律性,从而对 数据的全貌、数据的分布特征以及差异、波动趋势有一个比较清楚的了 解,因此直方图是数据处理中一种常用的方法。在教育统计学中,我们 经常利用它来了解或掌握学生的成绩、年龄、身高等结构。 注:在做直方图时,分组问题需注意,数组的多少往往影响着直 方图在反映数据分布上的效应,所以数组不能过多,也不能过少
2.直方图在密度函数估计中的应用设X,X,,X,)为取自总体X的一个样本,(x,x2…,x)是样本值,作出:对于x,x2,..,x,[0,x<a,uif,(x) :-ti-i ≤x<ti, i=1,2..,m,n△t,10,x≥b,在这里μ,可以看成事件(ti-≤X<t)在n次独立重复试验中出现的频数,根据伯努利大数定律,当n充分大时有P(t.- ≤ X <t)=f" f(x)dx ~ ln
•5 2.直方图在密度函数估计中的应用 1 1 2 1 2 1 2 1 1 1 , ,., ) , ,., ) , ,., 0, , ( ) , , 1, 2,., , 0, , = ( ) i n n n i n i i i i i i i i t X X X X x x x x x x x a f x t x t i m n t x b t X t n n P t X t f x dx 设( 为取自总体 的一个样本,( 是样本值, 对于 ,作出: 在这里 可以看成事件 在 次独立重复试验中出现的频数,根 据伯努利大数定律,当 充分大时有 ( ) i t i n