分布。 例:袋里有a只白球,b只黑球,现随机抽取一只,问是白球的概率为 多少? 若作X=1表示抽到的是白球,X=0表示抽到的是黑球,那么随便机变 量X服从二点分布,它的概率分布是: P{X=l=、a PIX=O a+b a+b 通常二点分布的形式是 P{X=l}=p(0<p<1(p是参数) P{X=0}=1-p 二点分布的数学期望为P,方差为p(1-P)。 (四)二项分布 二项分布是从著名的伯努里试验过程中推导出来的。取名为伯努里试验 是为了纪念在概率论方面作出显著贡献的瑞士数学家雅各布·伯努里。伯努 里试验是一系列试验,若干伯努里试验排列成伯努里过程。 每次试验只有两种可能结果,一是成功的结果,另一是失败的结果,两 种结果互相对立。若把成功的概率记为P,失败的概率则记为q=1-P。如射 击手打靶,每次打靶可能命中,也可能未命中,命中概率P为0.7则未命中 的概率为1-P=1-0.7=0.3。在历次试验中其概率值保持不变 任何一次特定的试验,其结果不受其他各次试验结果的影响,即互相独 立。 n次伯努里试验中,成功的次数是一个随机变量,它可能是0,1,2, n次。该随机变量服从的分布就是二项分布。记作X~B(n,p) 例:投掷一枚不匀称的分币,其出现正面的概率为P(P≠1/2),独立 地重复三次,求其中恰有二次出现正面的概率。 根据题意,记Ai=“第i次出现正面”(i=1,2,3),独立重 复试验3次,全部可能结果有8种,其中恰有2次出现正面有 A1A2A3、A1A2A3、A1A2A3三种互不相容的。概率都是P(1-p),故: P{恰有2次出现正面} P(A,A,A3)+P(A,A2A3)+P(AA,A,) =p2(1-p)+p2(1-p)+p2(1-p) 3p2(1-p)=Clp2(1-p) 如重复投掷四次,恰有2次出现正面的概率为,一般地,二项分布B(n,p) 的概率分布为: P(X=k)=Cpq"(k=0,1,2,A,n) 由于P(x=k),k=0,1,2…n,是二项式(q+py)n的展开式中yk 前的系数,二项分布由此而得名。二项分布的数学期望为np方差为npq 为了使用方便,人们编制了二项分布表,表中对不同的n及p给出了相应的 概率
分布。 例:袋里有 a 只白球,b 只黑球,现随机抽取一只,问是白球的概率为 多少? 若作 X=1 表示抽到的是白球,X=0 表示抽到的是黑球,那么随便机变 量 X 服从二点分布,它的概率分布是: P X a a b P X b a b { = } = , { } + = = + 1 0 通常二点分布的形式是: P X p p p P X p { } ( ( ) { } = = < < = = - 1 0 1 0 1 是参数 二点分布的数学期望为 P,方差为 p(1-P)。 (四)二项分布 二项分布是从著名的伯努里试验过程中推导出来的。取名为伯努里试验 是为了纪念在概率论方面作出显著贡献的瑞士数学家雅各布·伯努里。伯努 里试验是一系列试验,若干伯努里试验排列成伯努里过程。 每次试验只有两种可能结果,一是成功的结果,另一是失败的结果,两 种结果互相对立。若把成功的概率记为 P,失败的概率则记为 q=1-P。如射 击手打靶,每次打靶可能命中,也可能未命中,命中概率 P 为 0.7 则未命中 的概率为 1-P=1-0.7=0.3。在历次试验中其概率值保持不变。 任何一次特定的试验,其结果不受其他各次试验结果的影响,即互相独 立。 n 次伯努里试验中,成功的次数是一个随机变量,它可能是 0,1,2,……, n 次。该随机变量服从的分布就是二项分布。记作 X~B(n,p)。 例:投掷一枚不匀称的分币,其出现正面的概率为 P(P≠1/2),独立 地重复三次,求其中恰有二次出现正面的概率。 根据题意,记 Ai=“第 i 次出现正面”(i=1,2,3),独立重 复试验 3 次,全部可能结果有 8 种,其中恰有 2 次出现正面有: A1A2 A3、A1A2A3、A1A2A3三种互不相容的。概率都是 P 2(1-p),故: P{ 2 } ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 恰有 次出现正面 = + + = - + - + - = - = - P A A A P A A A P A A A p p p p p p p p C p p 1 2 3 1 2 3 1 2 3 2 2 2 2 3 2 2 1 1 1 3 1 1 如重复投掷四次,恰有 2 次出现正面的概率为,一般地,二项分布 B(n,p) 的概率分布为: P X k Cn p q k n k k n k ( = ) = ( = , , , , ) - 01 2 L 由于 P(x=k),k=0,1,2…n,是二项式(q+py)n的展开式中 y k 前的系数,二项分布由此而得名。二项分布的数学期望为np方差为 npq。 为了使用方便,人们编制了二项分布表,表中对不同的n及p给出了相应的 概率
(五)泊松分布 如随机变量ⅹ的概率分布如下: Pix=k kI (k=0,1,2,AA,x>0) 则称ⅹ服从泊松分布。泊松分布的特点是数学期望和方差都是入 希腊字母λ称为泊松分布的参数,它等于一个随机事件在某时间或空间 范围内平均发生的次数。k表示随机事件在某个区间内发生的次数。记号e 是常数2.71828。 经济生活中服从泊松分布的随机变量很多。如:工厂里的事故发生次数; 到标本商店买货物的顾客人数;细纱断头数;布匹疵点数;稀有事件,如洪 水爆发,飞机失事等。 (六)超几何分布 超几何分布应用是非常广泛的。由于在伯努里试验中,具有指定特征的 事件发生的概率P始终保持不变,也就是说,二项分布描述的是回置抽取。 但是在实际情况中,较多的是采用不回置抽取。故抽取过程中P就要发生变 化,此时就要用到超几何分布 一般来说,如果有同类产品共N个,其中有M个次品。现从中随机取出 n个(假定n≤NM),则这n个产品中所含的次品数X是一个离散型随机变 量,其概率分布为超几何分布。超几何分布的公式为 P(X=k)= (k=0,1,2,Amin(M,n) 其中,N-M是总体产品中的合格品,n-k是从产品中抽取的合格品。 三、连续型随机变量的概率分布 (一)连续型随机变量 个随机变量如能够在一个数值区间内取任何值,则此变量就是连续型 随机变量。由于连续型随机变量的取值不能—一列岀,因此不能象离散型随 机变量那样把随机变量的取值及其概率用列表的形式描述,而要用连续函数 的形式描述。满足下列两个条件的函数f(x)作连续型随机变量X的概率密 度函数 f(x)≥0 方差为:」(x)dx=1 对f(x)的积分F(x)称作概率分布函数 F(x)=」f(x) 实用上,常把连续型随机变量Ⅹ的概率密度函数f(x)和概率分布函数 F(x),统称为随机变量Ⅹ的概率分布。 连续型随机变量Ⅹ在某个值域区间(a,b)或[a,b]内取值的概率, 等于概率密度函数f(x)的曲线与x轴以及由x轴上a和b两点引出的两条 垂线所围成的面积,就是求如下的积分
(五)泊松分布 如随机变量x的概率分布如下: P x k k k { } e k ! = = ( = , , , , > ) l - l l 01 2 L L 0 则称x服从泊松分布。泊松分布的特点是数学期望和方差都是λ。 希腊字母λ称为泊松分布的参数,它等于一个随机事件在某时间或空间 范围内平均发生的次数。k表示随机事件在某个区间内发生的次数。记号e 是常数 2.71828。 经济生活中服从泊松分布的随机变量很多。如:工厂里的事故发生次数; 到标本商店买货物的顾客人数;细纱断头数;布匹疵点数;稀有事件,如洪 水爆发,飞机失事等。 (六)超几何分布 超几何分布应用是非常广泛的。由于在伯努里试验中,具有指定特征的 事件发生的概率 P 始终保持不变,也就是说,二项分布描述的是回置抽取。 但是在实际情况中,较多的是采用不回置抽取。故抽取过程中 P 就要发生变 化,此时就要用到超几何分布。 一般来说,如果有同类产品共 N 个,其中有 M 个次品。现从中随机取出 n 个(假定 n≤N—M),则这n 个产品中所含的次品数 X 是一个离散型随机变 量,其概率分布为超几何分布。超几何分布的公式为: P X k C C C k M n m k N M n k N n ( = ) = ( = , , , min( , )) - · - 01 2 L 其中,N-M 是总体产品中的合格品,n-k 是从产品中抽取的合格品。 三、连续型随机变量的概率分布 (一)连续型随机变量 一个随机变量如能够在一个数值区间内取任何值,则此变量就是连续型 随机变量。由于连续型随机变量的取值不能一一列出,因此不能象离散型随 机变量那样把随机变量的取值及其概率用列表的形式描述,而要用连续函数 的形式描述。满足下列两个条件的函数 f(x)作连续型随机变量 X 的概率密 度函数: f(x)≥ ① 方差为 ② 对 的积分 称作概率分布函数 ③ 0 : ( ) 1 ( ) ( ) : ( ) ( ) x dx f x F x F x f x dx x -¥ ¥ -¥ ò ò = = 实用上,常把连续型随机变量 X 的概率密度函数 f(x)和概率分布函数 F(x),统称为随机变量 X 的概率分布。 连续型随机变量 X 在某个值域区间(a,b)或[a,b]内取值的概率, 等于概率密度函数 f(x)的曲线与 x 轴以及由 x 轴上 a 和 b 两点引出的两条 垂线所围成的面积,就是求如下的积分:
P(a≤x≤b)=」f(x)dx=F(b)-F(a) 如上式指出的,f(x)在X的整个值域上的积分为1,也就是说,整个 概率密度函数f(x)曲线下的面积等于1。 设Ⅹ为连续型随机变量,其概率密度函数为f(x),则X的数学期望为: E(x)-oof(x)d 方差为 D(X=EAlX-E(X Ix= E(X)- f(x)dx 下面介绍几种常见的连续型随机变量的概率分布:均匀分布、指数分布 和正态分布。其中正态分布是统计学最重要的分布。 (二)均匀分布 如果随机变量X的概率密度函数为 ≤x≤b 1←0其他 则称X服从[a,b]上的均匀分布,记作X~R[a,b],它的均值为 a9,m12,分布函数为 X-a F(x)=b-a a<x< 均匀分布的意义是:X取值于[a,b]中任一小区间[c,d]的概率与 该小区间的长度(dc)成正比,而与小区间的具体位置无关。 (三)指数分布 如果随机变量X的概率密度函数为: 当x≥0 f(x) (λ>0) 当x<0 则称x服从参数为λ的指数分布。简化作x~E(λ)它的均值为λ-1,方差 为入2。1/λ常称为平均寿命,ex常称为可靠度。指数分布的分布函数为
P a x b f x dx F b F a a b ( £ £ ) = ( ) = ( ) - ( ) ò ④ 如上式指出的,f(x)在 X 的整个值域上的积分为 1,也就是说,整个 概率密度函数 f(x)曲线下的面积等于 1。 设 X 为连续型随机变量,其概率密度函数为 f(x),则 X 的数学期望为: E x f x dx x ( ) - ¥ ( ) ¥ ò ⑤ 方差为: D X E{[X E X x E X f x dx ( ) ( )] } [ ( )] ( ) = - = = -¥ ¥ ò 2 2 ⑥ 下面介绍几种常见的连续型随机变量的概率分布:均匀分布、指数分布 和正态分布。其中正态分布是统计学最重要的分布。 (二)均匀分布 如果随机变量 X 的概率密度函数为: f x b a a x b ( ) = - £ £ ¬ ì í ï ï î ï ï ü ý ï ï þ ï ï 1 0 1 0 其他 则称 X 服从[a,b]上的均匀分布,记作 X~R[a,b],它的均值为 a + b 2 ,方差为 (b - a) 2 12 ,分布函数为: F x x a x a b a ( ) = a x b £ - - < < ì í ï ï î ï ï 0 ⑦ 均匀分布的意义是:X 取值于[a,b]中任一小区间[c,d]的概率与 该小区间的长度(d—c)成正比,而与小区间的具体位置无关。 (三)指数分布 如果随机变量 X 的概率密度函数为: f x e x x x ( ) = ( ) ³ > < ì í ï î ï - l l l 当 当 0 0 0 0 则称x服从参数为λ的指数分布。简化作x~E(λ)它的均值为λ-1,方差 为λ-2。1/λ常称为平均寿命,e -lx 常称为可靠度。指数分布的分布函数为:
当x≤0时 F(x)= (四)正态分布 如果随机变量ⅹ的概率密度函数为: 1 x-厂 f(x)= (-∞<X<+∞) 则称X服从正态分布,记作X~N(μ,σ2),其中μ是分布的数学期望, 2是分布的方差 正态分布的概率密度函数f(x)具有下列性质: 1.在直角坐标系内f(x)的图形呈钟形,以x=μ为对称轴,呈左右 对称 2在x=以处,f(x)取最大值,如印)=h=;x越远离μ,f x)的极大值f(μ)=f(以)-√2π可知,σ越小时,曲绕越陡峭;σ越 大时,曲线越平缓(见图10-7)。反之,如果6为固定,改变μ的值,则f (x)的图形沿着x轴平行移动,而曲线的形状不改变(见图10-8) 图表10—7 图表10 正态分布的分布函数为: x-μ F(X) 正态分布是由德·莫阿弗尔(A. de mo iver,1667~1752)于1933年首 先发表的,是概率论中最重要的一种分布,也是最常见的一种分布。例如, 测量误差的分布;炮弹弹头落点的分布;人的生理尺寸、特征、身长、体重 等的分布都为正态分布。 一般说来,若影响某一数量值的随机因素很多,而各因素所起的作用不 太大,则这个指标就服从正态分布。许多分布可用正态分布上来近似,另 些分布可以通过正态分布来导出。 正态分布是一个分布族。对应于不同的参数μ和σ,会产生不同的正态 分布。参数μ=0,2=1的正态分布称为标准正态分布。当随机变量x服 从标准正态分布时,就记作ⅹ~n(0,1),其密度函数为 e √22 分布函数是
F x x e x x ( ) = £ - > ì í î - 0 0 1 0 当 时 l 当 时 (四)正态分布 如果随机变量x的概率密度函数为: f x e X x ( ) ( ) ( ) = -¥ < < +¥ - - 1 2 2 2 2 ps m s 则称 X 服从正态分布,记作 X~N(μ,s 2),其中μ是分布的数学期望, s 2 是分布的方差。 正态分布的概率密度函数 f(x)具有下列性质: 1.在直角坐标系内f(x)的图形呈钟形,以x=μ为对称轴,呈左右 对称。 2.在x=μ处,f(x)取最大值,如 f(m) ps = 1 2 ;x 越远离μ,f (x)的极大值f(μ)= f(m) ps = 1 2 可知,s越小时,曲绕越陡峭;s越 大时,曲线越平缓(见图 10—7)。反之,如果б为固定,改变μ的值,则 f (x)的图形沿着 x 轴平行移动,而曲线的形状不改变(见图 10—8)。 图表 10—7 图表 10—8 正态分布的分布函数为: F x e dx x x ( ) ( ) = - - -¥ ò 1 2 2 2 2 ps m s ⑧ 正态分布是由德·莫阿弗尔(A.de Moiver,1667~1752)于 1933 年首 先发表的,是概率论中最重要的一种分布,也是最常见的一种分布。例如, 测量误差的分布;炮弹弹头落点的分布;人的生理尺寸、特征、身长、体重 等的分布都为正态分布。 一般说来,若影响某一数量值的随机因素很多,而各因素所起的作用不 太大,则这个指标就服从正态分布。许多分布可用正态分布上来近似,另一 些分布可以通过正态分布来导出。 正态分布是一个分布族。对应于不同的参数μ和σ,会产生不同的正态 分布。参数μ=0,σ2=1 的正态分布称为标准正态分布。当随机变量x服 从标准正态分布时,就记作x~n(0,1),其密度函数为: f x e x ( ) = - 1 2 2 2 p ⑨ 分布函数是: F X X e x x dx ( ) = ( ) = - -¥ f ò p 1 2 2 2
⑩式积分的数值为图10-9所示的阴影部分面积。 图10-9中(X)是X的函数,已制成的中(X)的函数值表。要求标准 正态分布的分布函数值时只需要查表即可由于标准正态分布是以X=0为中 心轴的对称分布,并注意到分布曲线同横轴所包围的面积是常数1,可知φ (X)有以下性质 φ(—X)=1—φ(X) 四、统计量及其分布 (一)统计量 抽样就是从所研究的对象中随机取出其中一部分来观察,由此而获取有 关总体的信息。所谓总体就是研究某现象的客体,它包含了各个个体。例如, 研究某批灯泡的质量,每只灯泡是个体,所有灯泡组成的全体就是一个总体。 在抽样中,被抽取的部分个体,称为总体的一个样本,样本中个体的数量称 为样本容量。样本中的数值(x1,x2,…,xn)称为样本观察值。 抽样的目的是通过取得的样本,对总体分布中某些未知因素作出推断。 样本能否很好地反映总体的信息,与抽样方法有关。这里介绍一种称为“简 单随机抽样”的方法,其要求为:(1)总体总每个个体被抽中的概率均等; (2)样本中每个个体取值并不影响其他个体取值。 由简单随机抽样所得的样本称为简单随机样本。当总体容量较小时,只 有回置抽样才能得到简单随机样本。当总体容量很大或所抽的样本容量在总 体中所占比例较小时,不回置抽样也可得到较理想的简单随机样本。后面我 们所说的样本都是简单随机样本。 在抽样中,可以用样本的平均数、比率、标准差等综合指标来描述样本 的特征,这些指标称为统计量。由于样本是随机抽取的,对于每一个特定的 样本,统计量都有一个相应的数值。可见统计量是一个随机变量,其取值随 机本的不同而不同。统计量既然是个随机变量,就有其取值的概率分布。统 计量的概率分布通常又称为抽样分布。 (二)样本平均数的分布 如果从正态分布总体 σ2)中随机抽取样本,则样本平均数的分 布有如下结论:(1)样本平均数x的分布仍然是正态分布;(2)样本平均 数x的分布的期望值μ-等于总体的平均数μ;(3)样本平均数x分布的方差 σ32等于总体的方差除以样本容量即σ2。这些结论对正态分布总体进行推断 时经常要用到。 若从非正态分布总体中抽样,那么样本平均数的抽样分布性质又如何 呢?可运用上曾讨论过的中心极限定理来分析。 没有一总体,其均值μ、方差σ2为有限数值,如从该总体中抽取容量为 n的样本,则当样本容量很大时,根据中心极限定量白样本算出的平均数ⅹ 的抽样分布将近似服从平均值为u方差为2/n的正态分布。 这就是说,只要取大样本(容量不小于30),即使从非正态分布总体中 抽样,利用中心极限定理能得到和从正态分布总体抽样时近似相同的结果
⑩式积分的数值为图 10—9 所示的阴影部分面积。 图 10—9ф(X)是 X 的函数,已制成的ф(X)的函数值表。要求标准 正态分布的分布函数值时只需要查表即可。由于标准正态分布是以 X=0 为中 心轴的对称分布,并注意到分布曲线同横轴所包围的面积是常数 1,可知φ (X)有以下性质: φ(-X)=1-φ(X) 四、统计量及其分布 (一)统计量 抽样就是从所研究的对象中随机取出其中一部分来观察,由此而获取有 关总体的信息。所谓总体就是研究某现象的客体,它包含了各个个体。例如, 研究某批灯泡的质量,每只灯泡是个体,所有灯泡组成的全体就是一个总体。 在抽样中,被抽取的部分个体,称为总体的一个样本,样本中个体的数量称 为样本容量。样本中的数值(x1,x2,…,xn)称为样本观察值。 抽样的目的是通过取得的样本,对总体分布中某些未知因素作出推断。 样本能否很好地反映总体的信息,与抽样方法有关。这里介绍一种称为“简 单随机抽样”的方法,其要求为:(1)总体总每个个体被抽中的概率均等; (2)样本中每个个体取值并不影响其他个体取值。 由简单随机抽样所得的样本称为简单随机样本。当总体容量较小时,只 有回置抽样才能得到简单随机样本。当总体容量很大或所抽的样本容量在总 体中所占比例较小时,不回置抽样也可得到较理想的简单随机样本。后面我 们所说的样本都是简单随机样本。 在抽样中,可以用样本的平均数、比率、标准差等综合指标来描述样本 的特征,这些指标称为统计量。由于样本是随机抽取的,对于每一个特定的 样本,统计量都有一个相应的数值。可见统计量是一个随机变量,其取值随 机本的不同而不同。统计量既然是个随机变量,就有其取值的概率分布。统 计量的概率分布通常又称为抽样分布。 (二)样本平均数的分布 如果从正态分布总体 N(μ,s 2)中随机抽取样本,则样本平均数的分 布有如下结论:(1)样本平均数 x的分布仍然是正态分布;(2)样本平均 数 x的分布的期望值mx 等于总体的平均数μ;(3)样本平均数x分布的方差 sx -2 等于总体的方差除以样本容量即sx -2 。这些结论对正态分布总体进行推断 时经常要用到。 若从非正态分布总体中抽样,那么样本平均数的抽样分布性质又如何 呢?可运用上曾讨论过的中心极限定理来分析。 没有一总体,其均值μ、方差s 2 为有限数值,如从该总体中抽取容量为 n 的样本,则当样本容量很大时,根据中心极限定量白样本算出的平均数 x 的抽样分布将近似服从平均值为μ方差为s 2 /n 的正态分布。 这就是说,只要取大样本(容量不小于 30),即使从非正态分布总体中 抽样,利用中心极限定理能得到和从正态分布总体抽样时近似相同的结果。 —