第四章理论分布与抽样分布 第一节事件和概率的基本概念 事件 我们把试验作为一个广泛的术语,包括科学试验、调查和观察。例如抛一枚硬币观察 落地后哪一面向上和在一袋种子中取出一粒测定其能否发芽等都可看做是一次试验。显然 这样的试验可以在相同的条件下重复进行,每次试验可能的结果有多个 1、随机事件:把一次试验所有可能的结果都称为事件 次试验中必然要发生的结果称为必然事件 次试验必然不发生的结果称为不可能事件 次试验中可能发生也可能不发生的结果则称为随机事件 虽然在一次试验中随机事件能否出现很难预料,但如果多次重复同一试验,随机事件 的出现与否却是有规律的。 2、互斥事件:如果事件A和事件B不同时发生,称A和B互斥事件。 3、对立事件:事件A和事件B是互斥的,但必发生其中一,就称事件B为事件A的 对立事件,记B为A 4、独立事件:事件A与事件B的发生与否各自彼此无关,称事件A与事件B是相互 独立的 例:如同时播下两粒种子,第一粒种子的发芽与否与第二粒种子是否发芽是无关的 因此这两粒种子的发芽与否是相互独立的 、概率 1、随机事件的发生规律必须通过大量的试验观察才能得到。试验次数与随机事件A 发生次数的比值称为事件A的频率( frequency)。表41是一批棉花种子发芽试验的结果, 从中可以看出随着种子粒数(试验次数)的增加,发芽的频率稳定在060左右。 频率的稳定性揭示了随机事件发生的规律性。频率稳定在较大数值表明该事件发生的 可能性较大,稳定在较小数值表明该事件发生的可能性较小。我们定义:设事件A在n次 试验中出现了m次,随着n的增加事件A出现的频率一所稳定趋近的数值p为事件概记 为P(4)=p 由于频率总是介于0和1之间,因此概率也必然介于0和1之间,即0≤p 许多情况下p很难准确获得。通常以n充分大时事件A出现的频率作为它的概率的估 计值,即p=n (42) 例如表41棉花种子发芽的概率(发芽率)可用n为500时的频率来估计,即p=060
1 第四章 理论分布与抽样分布 第一节 事件和概率的基本概念 一、事件 我们把试验作为一个广泛的术语,包括科学试验、调查和观察。例如抛一枚硬币观察 落地后哪一面向上和在一袋种子中取出一粒测定其能否发芽等都可看做是一次试验。显然 这样的试验可以在相同的条件下重复进行,每次试验可能的结果有多个。 1、随机事件:把一次试验所有可能的结果都称为事件。 一次试验中必然要发生的结果称为必然事件。 一次试验必然不发生的结果称为不可能事件。 一次试验中可能发生也可能不发生的结果则称为随机事件。 虽然在一次试验中随机事件能否出现很难预料,但如果多次重复同一试验,随机事件 的出现与否却是有规律的。 2、互斥事件:如果事件 A 和事件 B 不同时发生,称 A 和 B 互斥事件。 3、对立事件:事件 A 和事件 B 是互斥的,但必发生其中一,就称事件 B 为事件 A 的 对立事件,记 B 为 A 。 4、独立事件:事件 A 与事件 B 的发生与否各自彼此无关,称事件 A 与事件 B 是相互 独立的。 例:如同时播下两粒种子,第一粒种子的发芽与否与第二粒种子是否发芽是无关的, 因此这两粒种子的发芽与否是相互独立的。 二、概率 1、随机事件的发生规律必须通过大量的试验观察才能得到。试验次数与随机事件 A 发生次数的比值称为事件 A 的频率(frequency)。表 4.1 是一批棉花种子发芽试验的结果, 从中可以看出随着种子粒数(试验次数)的增加,发芽的频率稳定在 0.60 左右。 频率的稳定性揭示了随机事件发生的规律性。频率稳定在较大数值表明该事件发生的 可能性较大,稳定在较小数值表明该事件发生的可能性较小。我们定义:设事件 A 在 n 次 试验中出现了 m 次,随着 n 的增加事件 A 出现的频率 m n 所稳定趋近的数值 p 为事件概记 为 P(A)=p (4.1) 由于频率总是介于 0 和 1 之间,因此概率也必然介于 0 和 1 之间,即 0≤p≤1。 许多情况下 p 很难准确获得。通常以 n 充分大时事件 A 出现的频率作为它的概率的估 计值,即 p m n = (4.2) 例如表4.1棉花种子发芽的概率(发芽率)可用n 为500时的频率来估计,即 p = 0.60
通过频率计算估计的概率称为统计概率或经验概率 2、另一些情况下p可以准确求出。第一种情况是试验可能的结果数是有限的,且每 种结果的出现是互斥和等可能的。此时, P= P(A) 事件A包含的结果数 4.3) 试验所有可能的结果数 例如,在0,1,……,9中随机抽取一个数字有10种可能的结果,每个数字被抽取 的机会相等且互斥。设A为抽取的数字≤3,则它包含了0,1,2和3四种结果,因此 P=P(A) 04。这样计算求得的概率称为古典概率 3、另一种情况是根据已知的概率分布理论来计算概率,这样求得的概率称为理论概 率。本章后面有关二项分布和正态分布的概率计算均属此类 概率的计算法则 1、互斥事件的概率法则(加法定理) 如果事件A和事件B互斥,概率各为P(A)和P(B),那么它们的和事件的概率为: P(4+B)=P(A)+P(B) (4.5) 2、对立事件的概率法则 如果事件A的概率为P(A),那么其对立事件的概率为: P(A)=1-P(A) (46) 2、对立事件的概率法则乘法定理 随机事件A和B的积事件的概率为 P(AB)=P(A)P(BA) 其中P(B/A)称为条件概率,意为在事件A已发生的条件下事件B发生的概率 特殊地,如果A和B相互独立,那么B的发生与否与A无关,即P(BA)=P(B),所 P(AB)=P(A)P(B) (4.8) 概率的加法定理和乘法定理都适用于多个随机事件的概率计算。 〔例4.1)一口袋中装有6个球,其中红球2个,白球4个。从口袋中随机取球2次 每次取1个。考虑两种情况:(1)第一次取球观其颜色后放回袋中,这叫放回抽样;(2) 第一次取球后不放回袋中,这叫不放回抽样。试就这两种情况分别求2个都是白球和至少 有1个白球的概率。 本题属古典概率计算。设A为第一次是白球,B为第二次是白球。2次都是白球是A 和B的积,至少有1个白球是A和B的和。第一次取球有6种等可能且互斥的结果,其中 4种是白球,因此 42 P 对于放回抽样,第二次取球与第一次无关,结果与第一次一样,所以
2 通过频率计算估计的概率称为统计概率或经验概率。 2、另一些情况下 p 可以准确求出。第一种情况是试验可能的结果数是有限的,且每 一种结果的出现是互斥和等可能的。此时, p= P(A)= 事件 A 包含的结果数 (4.3) 试验所有可能的结果数 例如,在 0,1,……,9 中随机抽取一个数字有 10 种可能的结果,每个数字被抽取 的机会相等且互斥。设 A 为抽取的数字≤3,则它包含了 0,1,2 和 3 四种结果,因此 p = P(A) = = . 4 10 0 4 。这样计算求得的概率称为古典概率。 3、另一种情况是根据已知的概率分布理论来计算概率,这样求得的概率称为理论概 率。本章后面有关二项分布和正态分布的概率计算均属此类。 三、概率的计算法则 1、 互斥事件的概率法则(加法定理) 如果事件 A 和事件 B 互斥,概率各为 P(A)和 P(B),那么它们的和事件的概率为: P(A+B)=P(A)+P(B) (4.5) 2、对立事件的概率法则 如果事件 A 的概率为 P(A),那么其对立事件的概率为: P( A )=1-P(A) (4.6) 2、 对立事件的概率法则乘法定理 随机事件 A 和 B 的积事件的概率为 P(AB)=P(A)P(B/A) (4.7) 其中 P(B/A)称为条件概率,意为在事件 A 已发生的条件下事件 B 发生的概率。 特殊地,如果 A 和 B 相互独立,那么 B 的发生与否与 A 无关,即 P(B/A) =P(B),所 以, P(AB)=P(A)P(B) (4.8) 概率的加法定理和乘法定理都适用于多个随机事件的概率计算。 〔例4. 1〕一口袋中装有 6 个球,其中红球 2 个,白球 4 个。从口袋中随机取球 2 次, 每次取 1 个。考虑两种情况:(1)第一次取球观其颜色后放回袋中,这叫放回抽样;(2) 第一次取球后不放回袋中,这叫不放回抽样。试就这两种情况分别求 2 个都是白球和至少 有 1 个白球的概率。 本题属古典概率计算。设 A 为第一次是白球,B 为第二次是白球。2 次都是白球是 A 和 B 的积,至少有 1 个白球是 A 和 B 的和。第一次取球有 6 种等可能且互斥的结果,其中 4 种是白球,因此, P( A) = = 4 6 2 3 对于放回抽样,第二次取球与第一次无关,结果与第一次一样,所以
P 224 P(AB)=÷ 222 (4+B)=3+3-3x3=9 对于不放回抽样,在第一次已取得白球的条件下,第二次有5种等可能且互斥的取法 其中3种是白球,所以 P(B/A= P(4B)=3×5=5 232313 P(A+B) 353515 第二节随机变数及其分布 随机变数 许多试验的结果用数值来表示,例如人的身高和作物的产量等,但重复试验得到的数 值不完全相同,也就是说试验结果不是一个确定的数值而是一个变数( variable)。每次试 验中此变数到底是多少受偶然因素的影响,不能事先确定。这种随偶然因素而变化的变数 称为随机变数( random variable)。在试验之前随机变数是一个不确定的量,有许多可能 的取值。但在试验中只有其中的一个可能取值得到了实现。这种实现了的取值称为观察值 ( observed value),观察值是一个确定的数值 有些试验的结果本身不是数值,但可将其数量化后用数值来表示,因此也是随机变数 例如,一粒种子的发芽试验有发芽和不发芽两种可能的结果,如用1代表发芽,0代表不 发芽,试验结果就是一个有0和1两种可能取值的随机变数 如果随机变数只有有限个可能的取值,并在试验中以确定的概率来取这些数值,就称 它为间断性( internal)随机变数。质量性状和计数的数量性状的试验结果常常是间断性随 机变数。如果随机变数可能的取值充满一个区间,并且试验结果落在任意区间内的概率是 确定的,就称它为连续性( continuous)随机变数。计量性状的试验结果通常是连续性随 机变数 、随机变数的概率分布 随机变数可能的取值或取值区间的概率反映了随机变数的统计规律性,称为概率分布 ( probability distribution)。间断性随杋变数一般用概率分布列来表示这种规律性。设随机
3 P B P AB P A B ( ) ( ) ( ) = = = + = + − = 2 3 2 3 2 3 4 9 2 3 2 3 2 3 2 3 8 9 对于不放回抽样,在第一次已取得白球的条件下,第二次有 5 种等可能且互斥的取法, 其中 3 种是白球,所以 P B A P AB P A B ( / ) ( ) ( ) = = = + = + − = 3 5 2 3 3 5 2 5 2 3 3 5 2 3 3 5 13 15 第二节 随机变数及其分布 一、 随机变数 许多试验的结果用数值来表示,例如人的身高和作物的产量等,但重复试验得到的数 值不完全相同,也就是说试验结果不是一个确定的数值而是一个变数(variable)。每次试 验中此变数到底是多少受偶然因素的影响,不能事先确定。这种随偶然因素而变化的变数 称为随机变数(random variable)。在试验之前随机变数是一个不确定的量,有许多可能 的取值。但在试验中只有其中的一个可能取值得到了实现。这种实现了的取值称为观察值 (observed value),观察值是一个确定的数值。 有些试验的结果本身不是数值,但可将其数量化后用数值来表示,因此也是随机变数。 例如,一粒种子的发芽试验有发芽和不发芽两种可能的结果,如用 1 代表发芽,0 代表不 发芽,试验结果就是一个有 0 和 1 两种可能取值的随机变数。 如果随机变数只有有限个可能的取值,并在试验中以确定的概率来取这些数值,就称 它为间断性(internal)随机变数。质量性状和计数的数量性状的试验结果常常是间断性随 机变数。如果随机变数可能的取值充满一个区间,并且试验结果落在任意区间内的概率是 确定的,就称它为连续性(continuous)随机变数。计量性状的试验结果通常是连续性随 机变数。 二、随机变数的概率分布 随机变数可能的取值或取值区间的概率反映了随机变数的统计规律性,称为概率分布 (probability distribution)。间断性随机变数一般用概率分布列来表示这种规律性。设随机
变数X可能的取值为x,x,…,x,每个取值对应的概率P(X=x)为p,p 其概率分布列见表42。其中F(x)=P(K≤x)称间断性随机变数的概率累积函数 表42间断性随机变数的概率分布列 P(X 连续性随机变数一般用概率密度函数x)和概率累积函数F(x)来表示其概率分布规律 F(x)=」f(x)d (49) 无论间断性还是连续性随机变数的概率累积函数都具有如下性质: 1、非降性如果x<x2,则 F(x1)≤F(x2) (4.10) 2、因为x不可能小于-∞,所以 FO (411) 3、因为x必然小于∞,所以 (412) 、随机变数的数字特征 反映随机变数分布特点的特征数主要有数学期望和方差 1、数学期望 随机变数的数学期望( expectation)就是它的总体平均数,记为=E(X)。对于间 断性随机变数 H=∑ (4.13) 对于连续性随机变数 u=xf(x) (4.14) 随机变数的数学期望具有下列性质: (1)常数的数学期望等于常数本身,即 E(c) (4.15) 2)常数与随机变数乘积的数学期望为该常数与该随机变数数学期望的乘积 E(CX)=cE(X) (4.16) (3)随机变数之和的数学期望等于各自的数学期望之和,即 E(H+1)=E(1)+E(Y) (4.17) (4)独立随机变数之积的数学期望等于各自的数学期望之积,即 E(x)=E()E(1) (4.18) (5)离均差的数学期望为零,即 E(X-)=0 (419) 方差
4 变数 X 可能的取值为 x1,x2,……,xk,每个取值对应的概率 P(X=xi)为 p1,p2,……,pk, 其概率分布列见表 4.2。其中 F(xi)=P(X≤xi)称间断性随机变数的概率累积函数。 表 4.2 间断性随机变数的概率分布列 XI x1 x2 …… xk P(X=xi) p1 p2 …… pk F(xi) p1 p1+p2 …… 1 连续性随机变数一般用概率密度函数 f(x)和概率累积函数 F(x)来表示其概率分布规律 F x f x dx x ( ) = ( ) (4.9) 无论间断性还是连续性随机变数的概率累积函数都具有如下性质: 1、 非降性 如果 x1<x2,则 F(x1)≤F(x2) (4.10) 2、 因为 x 不可能小于-∞,所以 F(-∞)=0 (4.11) 3、 因为 x 必然小于∞,所以 F(∞)=1 (4.12) 三、随机变数的数字特征 反映随机变数分布特点的特征数主要有数学期望和方差。 1、 数学期望 随机变数的数学期望(expectation)就是它的总体平均数,记为 = E(X) 。对于间 断性随机变数 = p xi i (4.13) 对于连续性随机变数 = xf (x)dx (4.14) 随机变数的数学期望具有下列性质: (1) 常数的数学期望等于常数本身,即 E(c)=c (4.15) (2) 常数与随机变数乘积的数学期望为该常数与该随机变数数学期望的乘积 E(cX)= c E(X) (4.16) (3) 随机变数之和的数学期望等于各自的数学期望之和,即 E(X+Y)=E(X)+E(Y) (4.17) (4) 独立随机变数之积的数学期望等于各自的数学期望之积,即 E(XY)=E(X)E(Y) (4.18) (5) 离均差的数学期望为零,即 E(X − ) = 0 (4.19) 2、 方差
随机变数的方差记为σ2=D(X)=EI(X-A)2]。对于间断性随机变数 a2=∑p(x2-)2 对于连续性随机变数 02=cx-u)'/(x)dr (4.21) 随机变数的方差具有如下性质: (1)常数的方差为零,即 D(C)=0 (4.22) (2)常数与随机变数之积的方差为 D(cr=cD(X (423) (3)独立随机变数之和或差的方差等于各自的方差之和,即 D(x±Y)=D(h+D(Y (4.24) 例4.2)甲乙两工人一天中出现次品的概率分布列见表43。如两人的日产量相同, 问谁的技术较好和谁的技术稳定? 表43甲乙两人出现次品的概率分布列 工人 技术好坏和稳定与否可由出现次品的数学期望和方差来反映。对于甲和乙分别有 E(甲)=04×0+0.3×1+0.2×2+0.1×3=1 D(甲)=0.4×(0-1)2+0.3×(1-1)2+0.2×(2-1)2+0.1×(3-1)2=1 E(乙)=0.3×0+0.5×1+0.2×2+0×3=0.9 D(乙)=0.3×(0-0.9)2+0.5×(1-0.9)2+0.2×(2-0.9)2=049 据此得出的结论是乙的技术较好且稳定。 随机变数的数学期望和方差与样本的平均数和方差是不同的概念。前者是根据概率分 布计算出来的理论值,与试验实际进行与否无关。后者是根据样本观察值计算出来的统计 数,而观察值只有在试验之后才能得到
5 随机变数的方差记为 ( ) [( ) ] 2 2 = D X = E X − 。对于间断性随机变数 = − 2 2 ( ) i i p x (4.20) 对于连续性随机变数 = (x − ) f (x)dx 2 2 (4.21) 随机变数的方差具有如下性质: (1) 常数的方差为零,即 D(c)=0 (4.22) (2) 常数与随机变数之积的方差为 D(cX)=c 2D(X) (4.23) (3) 独立随机变数之和或差的方差等于各自的方差之和,即 D(X±Y)=D(X)+D(Y) (4.24) 〔例4. 2〕甲乙两工人一天中出现次品的概率分布列见表 4.3。如两人的日产量相同, 问谁的技术较好和谁的技术稳定? 表 4.3 甲乙两人出现次品的概率分布列 工人 甲 乙 xi 0 1 2 3 0 1 2 3 P(X=xi) 0.4 0.3 0.2 0.1 0.3 0.5 0.2 0 技术好坏和稳定与否可由出现次品的数学期望和方差来反映。对于甲和乙分别有 E(甲)=0.4×0+0.3×1+0.2×2+0.1×3=1 D(甲)=0.4×(0-1)2+0.3×(1-1)2+0.2×(2-1)2+0.1×(3-1)2=1 E(乙)=0.3×0+0.5×1+0.2×2+0×3=0.9 D(乙)=0.3×(0-0.9)2+0.5×(1-0.9)2+0.2×(2-0.9)2=0.49 据此得出的结论是乙的技术较好且稳定。 随机变数的数学期望和方差与样本的平均数和方差是不同的概念。前者是根据概率分 布计算出来的理论值,与试验实际进行与否无关。后者是根据样本观察值计算出来的统计 数,而观察值只有在试验之后才能得到