《生物统计》 绪言 在人们的实践活动中,常常会遇到类似下面的一些问题,如:一种新的疫苗,如何判 断它是否有效?吸烟会不会使得肺癌的机会增加?如何抽检几百或几千人来估计某种病的 流行程度?某批产品中合格品究竟有多少?该不该报废?如何消耗最少的资源和人力来得 到我们所需要的某种信息?某种实验方法,或饲料配方,有没有明显改进?……等等。 这一类问题的共同特点,就是人们只能得到他所关心的事情的不完全信息,或者是单 个实验的结果有某种不确定性。例如为了知道产品合格与否或它的使用寿命,我们常常需要 对它作破坏性检验,此时我们显然不能把所有的产品都检验一下,而只能满足于对少数几个 样品的抽检。这样获得的信息显然是不完全的:再比如要检验疫苗的有效性,但一般来说, 接种过疫苗的动物不一定全不发病,而未接种的也不会全发病。那么发病与不发病的差别究 竟到多大时我们才能认为接种是有效的呢?同时,即使我们采用完全一样的实验条件再次进 行实验,发病与不发病的动物数量也会有所变化,这说明类似实验的结果具有某种内在的不 确定性。要想在这种情况下正确判定疫苗的有效性,就涉及了我们如何评价一些并不确定的 实验结果的问题。 要从这样一些问题中得出科学的,可靠的结论,就必须依靠统计学。有人干脆给统计 学下了这样的定义:“统计学就是从不完全的信息里取得准确知识的一系列技巧”,这个定义 还是有一定道理的 另外,当必须根据有限的,不完全的信息作出决策时(例如决定一批产品是出厂还是 报废,某种新药是否有效等等),统计学可以提供一种方法,使我们不仅能做出合理的决策 而且知道所冒风险的大小,并帮助我们把可能的损失减至最小 其次,如何花费最小代价取得所关心的信息,也是统计学的一大课题(实验设计)。 不注意这一点可能使辛辛苦苦的工作成为一种浪费。 生物学是一门实验科学。不管你从事的是生物学的哪一个分枝,都不可能完全脱离实 验,只进行逻辑推理。而实验所得到的结果几乎无例外地都带有或多或少的不确定性,即实 验误差。在这种情况下不用统计学要想得到正确的结论是不可能的。可以毫不夸张地说,作 为一个实验科学工作者,离开了统计学就寸步难行。希望大家通过这门课程的学习,能够掌 握常用的统计方法,尤其是它们的条件,适用范围、优缺点等,从而能够应用它们去解决实 践中遇到的问题。 第一章概率论基础 §1.1随机现象与统计规律性 概率论是研究随机现象的数量规律的数学分枝 所谓随机现象,就是在基本条件不变的情况下,各次实验或观察会得到不同的结果的现 象,而且这一结果是不能准确预料的。 例:血球计数,昆虫密度调查,某一时刻车间中开动的车床数,优秀选手射击弹着分布,抽 样时某一样品合格与否等等。 必然现象(或不可能事件)则是指在一定条件下必然会发生(或不发生)的事件,也可 称为决定性事件。 例:早晨太阳从东方升起,水向低处流,万有引力,标准大气压,纯水100℃沸腾等等
《生物统计》 绪言 在人们的实践活动中,常常会遇到类似下面的一些问题,如:一种新的疫苗,如何判 断它是否有效?吸烟会不会使得肺癌的机会增加?如何抽检几百或几千人来估计某种病的 流行程度?某批产品中合格品究竟有多少?该不该报废?如何消耗最少的资源和人力来得 到我们所需要的某种信息?某种实验方法,或饲料配方,有没有明显改进?……等等。 这一类问题的共同特点,就是人们只能得到他所关心的事情的不完全信息,或者是单 个实验的结果有某种不确定性。例如为了知道产品合格与否或它的使用寿命,我们常常需要 对它作破坏性检验,此时我们显然不能把所有的产品都检验一下,而只能满足于对少数几个 样品的抽检。这样获得的信息显然是不完全的;再比如要检验疫苗的有效性,但一般来说, 接种过疫苗的动物不一定全不发病,而未接种的也不会全发病。那么发病与不发病的差别究 竟到多大时我们才能认为接种是有效的呢?同时,即使我们采用完全一样的实验条件再次进 行实验,发病与不发病的动物数量也会有所变化,这说明类似实验的结果具有某种内在的不 确定性。要想在这种情况下正确判定疫苗的有效性,就涉及了我们如何评价一些并不确定的 实验结果的问题。 要从这样一些问题中得出科学的,可靠的结论,就必须依靠统计学。有人干脆给统计 学下了这样的定义:“统计学就是从不完全的信息里取得准确知识的一系列技巧”,这个定义 还是有一定道理的。 另外,当必须根据有限的,不完全的信息作出决策时(例如决定一批产品是出厂还是 报废,某种新药是否有效等等),统计学可以提供一种方法,使我们不仅能做出合理的决策, 而且知道所冒风险的大小,并帮助我们把可能的损失减至最小。 其次,如何花费最小代价取得所关心的信息,也是统计学的一大课题(实验设计)。 不注意这一点可能使辛辛苦苦的工作成为一种浪费。 生物学是一门实验科学。不管你从事的是生物学的哪一个分枝,都不可能完全脱离实 验,只进行逻辑推理。而实验所得到的结果几乎无例外地都带有或多或少的不确定性,即实 验误差。在这种情况下不用统计学要想得到正确的结论是不可能的。可以毫不夸张地说,作 为一个实验科学工作者,离开了统计学就寸步难行。希望大家通过这门课程的学习,能够掌 握常用的统计方法,尤其是它们的条件,适用范围、优缺点等,从而能够应用它们去解决实 践中遇到的问题。 第一章 概率论基础 §1.1 随机现象与统计规律性 一、概率论是研究随机现象的数量规律的数学分枝 所谓随机现象,就是在基本条件不变的情况下,各次实验或观察会得到不同的结果的现 象,而且这一结果是不能准确预料的。 例:血球计数,昆虫密度调查,某一时刻车间中开动的车床数,优秀选手射击弹着分布,抽 样时某一样品合格与否等等。 必然现象(或不可能事件)则是指在一定条件下必然会发生(或不发生)的事件,也可 称为决定性事件。 例:早晨太阳从东方升起,水向低处流,万有引力,标准大气压,纯水 100℃沸腾等等
大部分科学实验的结果都属于随机事件,分析它们就需要概率的知识,如 例1.1试验两种不同饲料配方对鸡增重的影响。饲养五周后,增重如下: 配方1(x):1.49kg,1.36kg,1.50kg,1.65kg,1.27kg,1.45kg,1.38kg,1.52kg,1.40kg 配方2(y):1.25kg,1.50kg,1.33kg,1.45kg,1.27kg,1.32kg,1.60kg,1.41kg,1.30kg 1.52k x=1436kg,j=1.392kg 在例1中,x=1436kg,j=1.392kg,我们是否可以说配方1比配方2好呢?也许 有同学会说:“x>j,当然就说明配方1好啦。”实际问题却不是这样简单。由于鸡的个体 差异等都会影响实验的结果,因此上述实验中包含着一些无法排除的随机误差。在这种情况 下,我们怎么能判断x与j之间的差异是随机误差造成的,还是配方1真的优于配方2?或 者换句话说,x与j的差异大到何种程度,我们就可以较有把握地说配方1真的优于配方2? 要科学地回答这一类的问题,靠我们以前学过的数学知识是解决不了的,必须依靠统计学的 知识。由于吃同一种饲料的一组鸡的生活条件基本上是一致的,它们之间的差异应该是随机 误差大小的一种估计,因此我们可以把上述两组鸡之间的差异与组内的差异作一下比较,如 果组间差异明显大于组内的差异,则认为配方1比配方2好;否则就只能认为这两种配方差 不多。根据这样的统计学理论,我们只能认为这两个配方间没有明显差异,原因是它们组内 差异比较大,说明随机因素的影响很大,平均数间的差异可能是随机因素引起的。 例1.2如果数据变成 配方1(x):1.40kg,142kg,1.50kg1.39kg,1.46kg,1.45kg1.5lkg,1.44kg,14lkg 1.38kg 配方2(y):1.38kg,1.41kg,1.3kg1.0kg136kg,13kg142kg,1.38kg1.37kg, 1.4lkg x=14365kg,y=1.391kg 此时两组数据的平均值变化不大,直观上结果应与上题相同,但统计结论却完全变了, 变为应该认为配方1明显优于配方2。这是因为组内差距变小了,x与y之间的差别不能仅 用随机因素的影响来解释。 从上述例子可看出,没有概率论的知识就不能对实验结果作出科学的,有说服力的结论。 频率稳定性 随机事件的结果一般是不可预料的,那又如何研究呢?个别随机事件(结果)在一次实 验或观察中可以出现或不出现,但在大量实验中,它出现的次数与总实验次数之比常常是非 常稳定的。这种现象称为频率稳定性,正是随机事件内在规律性的反映 例1.3掷币实验: 实验者掷币次数正面次数频率 蒲丰 4040 2048 05069 0.5016 皮尔逊|24000 12012 0.5005 从上述实验结果可知,随着投掷次数的增加,正面出现的次数越来越接近一个常数:0.5 这一实验的结果很好地反映了多次重复的随机实验中的频率稳定性。 直观上,我们用一个数P(A)来表示随机事件A发生可能性的大小,P(A)就称为A的 概率。一般来说,当实验次数N越来越大,直至趋于无穷时,频率也会逐渐趋近于概率。 §1.2样本空间与事件
大部分科学实验的结果都属于随机事件,分析它们就需要概率的知识,如: 例1.1 试验两种不同饲料配方对鸡增重的影响。饲养五周后,增重如下: 配方 1(x):1.49kg, 1.36kg, 1.50kg, 1.65kg, 1.27kg,1.45kg, 1.38kg, 1.52kg, 1.40kg; 配方 2(y):1.25kg, 1.50kg, 1.33kg, 1.45kg, 1.27kg, 1.32kg, 1.60kg, 1.41kg, 1.30kg, 1.52kg。 x = 1.436kg, y = 1.392kg 在例 1 中, x = 1.436kg, y = 1.392kg ,我们是否可以说配方 1 比配方 2 好呢?也许 有同学会说:“ x y ,当然就说明配方 1 好啦。”实际问题却不是这样简单。由于鸡的个体 差异等都会影响实验的结果,因此上述实验中包含着一些无法排除的随机误差。在这种情况 下,我们怎么能判断 x 与 y 之间的差异是随机误差造成的,还是配方 1 真的优于配方 2?或 者换句话说, x 与 y 的差异大到何种程度,我们就可以较有把握地说配方1真的优于配方2? 要科学地回答这一类的问题,靠我们以前学过的数学知识是解决不了的,必须依靠统计学的 知识。由于吃同一种饲料的一组鸡的生活条件基本上是一致的,它们之间的差异应该是随机 误差大小的一种估计,因此我们可以把上述两组鸡之间的差异与组内的差异作一下比较,如 果组间差异明显大于组内的差异,则认为配方 1 比配方 2 好;否则就只能认为这两种配方差 不多。根据这样的统计学理论,我们只能认为这两个配方间没有明显差异,原因是它们组内 差异比较大,说明随机因素的影响很大,平均数间的差异可能是随机因素引起的。 例 1.2 如果数据变成 配方 1(x):1.40kg, 1.42kg, 1.50kg, 1.39kg, 1.46kg,1.45kg, 1.51kg, 1.44kg, 1.41kg, 1.38kg; 配方 2 (y):1.38kg, 1.41kg, 1.35kg, 1.50kg, 1.36kg, 1.33kg, 1.42kg, 1.38kg, 1.37kg, 1.41kg x = 1.4365kg, y = 1.391kg 此时两组数据的平均值变化不大,直观上结果应与上题相同,但统计结论却完全变了, 变为应该认为配方 1 明显优于配方 2。这是因为组内差距变小了,x 与 y 之间的差别不能仅 用随机因素的影响来解释。 从上述例子可看出,没有概率论的知识就不能对实验结果作出科学的,有说服力的结论。 二、频率稳定性 随机事件的结果一般是不可预料的,那又如何研究呢?个别随机事件(结果)在一次实 验或观察中可以出现或不出现,但在大量实验中,它出现的次数与总实验次数之比常常是非 常稳定的。这种现象称为频率稳定性,正是随机事件内在规律性的反映。 例 1.3 掷币实验: 实验者 掷币次数 正面次数 频率 蒲丰 4040 2048 0.5069 皮尔逊 12000 6019 0.5016 皮尔逊 24000 12012 0.5005 从上述实验结果可知,随着投掷次数的增加,正面出现的次数越来越接近一个常数:0.5。 这一实验的结果很好地反映了多次重复的随机实验中的频率稳定性。 直观上,我们用一个数 P(A) 来表示随机事件 A 发生可能性的大小,P(A) 就称为 A 的 概率。一般来说,当实验次数 N 越来越大,直至趋于无穷时,频率也会逐渐趋近于概率。 §1.2 样本空间与事件
我们假定试验或观察可在相同的条件下重复进行。这是因为一次随机实验的结果不可预 料,我们主要依靠频率稳定性来研究随机现象的内在规律,因此不可重复的实验对统计学来 说是没有多少意义的。 、样本空间的概念 定义:在一组固定的条件下所进行的试验或观察,其可能出现的结果称为样本点,一般用a 表示。全体样本点的所构成的集合称为样本空间,一般用Q表示。 例1.4投一个硬币:={正},{反}:9={正,反} 投二个硬币:={正正},{正反},{反正},板反反}:9={正正,正反,反正,反反} 样本点和样本空间是严格依赖于我们的实验设计的,不同的实验设计可能有不同的样本 点和样本空间。每一个最基本、最简单的结果称为一个样本点,所有可能的样本点构成样本 空间,而部分样本点的集合则构成了事件。 定义:样本点的集合称为事件 显然有:必然事件:9;不可能事件:Φ。 注意:上述定义不严格,如果Ω中有不可列个样本点,则不能把Ω的一切子集都看成事件, 否则无法在其上定义概率。关于这些问题的详细讨论超出了本课程的范围 二、事件间的关系:设A、B均为事件,则它们可能有以下关系 包含:若A发生,则B必然发生,此时称A包含于B,或B包含A。记为:AcB,或B→A 例:{正正}c{两币相同} 相等:若A→B,且BA,则称A与B相等,记为A=B 例:{反反}={正面不出现} 对立:由所有不包含在A中的样本点所组成的事件称为A的逆事件,或A的对立事件,记为 A。(也可称为“非A”) 例:{两币相同}={正反,反正}={两币不同} 显然A逆的逆等于A,即A=A。 、事件的运算 已知事件A,B,我们可以通过它们构成一些新的事件: 交:同时属于A及B的样本点的集合。记为:A∩B或AB,此时A与B同时发生 若A∩B=Φ,则称A与B互不相容。样本点一定是互不相容的 并:至少属于A或B中一个的全体样本点的集合,记为AUB 此时可能A,B都发生,也可能只发生一个 若A∩B=Φ,则可把并称为和,且记为A+B 注意:在集合论的运算中,和只是并的特例,要明确它们的不同,原因是:在集合论中,同 个元素只能计算一次,所以一个集合中不能有两个相同的元素。 差:包含在A中且不包含在B中的样本点的集合。记为A-B。 注意:这是三种运算中唯一不满足交换律的运算 显然:A-B=AB,AUA=9,A∩A=Φ,A=9-A venn图:用图解的方法表示集合间的关系。如: *一个无穷 中由之则为 为不可列集。详细讨 论可参见有关测度论的书籍
我们假定试验或观察可在相同的条件下重复进行。这是因为一次随机实验的结果不可预 料,我们主要依靠频率稳定性来研究随机现象的内在规律,因此不可重复的实验对统计学来 说是没有多少意义的。 一、样本空间的概念 定义:在一组固定的条件下所进行的试验或观察, 其可能出现的结果称为样本点,一般用ω 表示。全体样本点的所构成的集合称为样本空间,一般用Ω表示。 例 1.4 投一个硬币:ω={正},{反};Ω={正,反} 投二个硬币:ω={正正},{正反},{反正},{反反}; Ω={正正,正反,反正,反反} 样本点和样本空间是严格依赖于我们的实验设计的,不同的实验设计可能有不同的样本 点和样本空间。每一个最基本、最简单的结果称为一个样本点,所有可能的样本点构成样本 空间,而部分样本点的集合则构成了事件。 定义:样本点的集合称为事件。 显然有:必然事件:Ω;不可能事件:Φ。 注意:上述定义不严格,如果Ω中有不可列个样本点,则不能把Ω的一切子集都看成事件, 否则无法在其上定义概率。关于这些问题的详细讨论超出了本课程的范围。 二、事件间的关系:设 A、B 均为事件,则它们可能有以下关系: 包含:若 A 发生,则 B 必然发生,此时称 A 包含于 B,或 B 包含 A。记为:A B,或 B A。 例:{正正} {两币相同} 相等:若 A B,且 B A,则称 A 与 B 相等,记为 A=B。 例:{反反}={正面不出现} 对立:由所有不包含在 A 中的样本点所组成的事件称为 A 的逆事件,或 A 的对立事件,记为 A 。(也可称为“非 A”) 例:{ 两币相同 }={正反,反正}={两币不同} 显然 A 逆的逆等于 A, 即 A =A。 三、事件的运算 已知事件 A,B,我们可以通过它们构成一些新的事件: 交:同时属于 A 及 B 的样本点的集合。记为:A B 或 AB,此时 A 与 B 同时发生。 若 A B=Ф,则称 A 与 B 互不相容。样本点一定是互不相容的。 并:至少属于 A 或 B 中一个的全体样本点的集合,记为 A B。 此时可能 A,B 都发生,也可能只发生一个。 若 A B=Ф,则可把并称为和,且记为 A+B。 注意:在集合论的运算中,和只是并的特例,要明确它们的不同,原因是:在集合论中,同 一个元素只能计算一次,所以一个集合中不能有两个相同的元素。 差:包含在 A 中且不包含在 B 中的样本点的集合。记为 A-B。 注意:这是三种运算中唯一不满足交换律的运算。 显然: A− B = AB , A A = , A A = , A = − A Venn 图:用图解的方法表示集合间的关系。如: 一个无穷集合,若它的元素可与自然数集建立一一对应,则称其为可列集,否则称为不可列集。详细讨 论可参见有关测度论的书籍
B A B 相离 相交 包含 图1.两集合A、B的三种关系 显然两事件A与B的关系只有上述三种,这种图解的方法对我们搞清事件间的关系是 很有好处的 运算顺序:1.逆,2.交,3.并或差。 运算规律: (1)交换律:AUB=BUA,A∩B=B∩A (2)结合律:(AUB)UC=AU(BUC),(AB)C=A(BC) (3)分配律:(AUB)∩C=(A∩C)U(B∩C),(A∩B)UC=(AUC)∩(BUC) (4)德莫根( De morgan)定理: AUB=A∩B,A∩B=AUB 对于n个事件,甚至对可列个事件,上述定理仍成立,可写为: A A=∩An 注意:上述集合论运算规律与算数运算的规律很相似。若把并比作算术加法,把交比作算术 乘法,则交换律与结合律是相同的。但分配律有差异:集合论运算中除有交对并的分配律 外,还有并对交的分配律,而后者在算术运算中是不成立的。这种差异同样来自于集合运 算的规定:在集合中,同一元素只能计算一次而不能够重复计算。 例1.5A,B,C是三个事件,请用运算式表示下列事件: (1)A发生,B与C不发生:ABC,或A一B一C,或A-(BUC) (2)A与B都发生而C不发生:ABC,或AB一C,或AB-AB (3)至少发生一个: AUBUC (4)恰好发生一个:ABC+ABC+ABC (5)恰好发生二个:ABC+ABC+ABC §13概率 古典概型 从17世纪中叶,人们就开始研究随机现象,当时这种兴趣或需要主要是由赌博引起的,因 此人们首先注意的是这样一类随机事件:它们只有有限个可能的结果,即只有有限个样本点, 同时这些样本点出现的可能性相等。这样的概率空间称为古典概型。由于样本点是等可能的, 很自然地,人们就把事件A的概率定义为A所包含的样本点数与样本点总数的比值,即 P(4)=m。4包含的样本点数A的有利场合数 样本点总数 样本点总数 显然这样的定义同时也给出了概率的计算方法,这种方法今天还有着广泛的用途,尤其是在 产品的抽样检查方面。这样建立起来的概率有如下的性质 (1)对任意事件A,P(A)≥0(非负性) (2)P(9)=1(规范性)
A B A B A B 相离 相交 包含 图 1. 两集合 A、B 的三种关系。 显然两事件 A 与 B 的关系只有上述三种,这种图解的方法对我们搞清事件间的关系是 很有好处的。 运算顺序:1. 逆,2. 交,3. 并或差。 运算规律: (1)交换律:AUB=BUA,A∩B=B∩A (2)结合律:(AUB)UC=AU(BUC),(AB)C=A(BC) (3)分配律:(AUB)∩C=(A∩C)U(B∩C),(A∩B)UC=(AUC)∩(BUC) (4)德莫根(De Morgan)定理: AUB = A B, A B = AUB 对于 n 个事件,甚至对可列个事件,上述定理仍成立,可写为: i i Ai = Ai, i i Ai = Ai 注意:上述集合论运算规律与算数运算的规律很相似。若把并比作算术加法,把交比作算术 乘法,则交换律与结合律是相同的。但分配律有差异:集合论运算中除有交对并的分配律 外,还有并对交的分配律,而后者在算术运算中是不成立的。这种差异同样来自于集合运 算的规定:在集合中,同一元素只能计算一次而不能够重复计算。 例 1.5 A,B,C 是三个事件,请用运算式表示下列事件: (1)A 发生,B 与 C 不发生: ABC ,或 A―B―C,或A-(BUC) (2)A 与 B 都发生而 C 不发生: ABC ,或 AB―C,或 AB―ABC (3)至少发生一个:AUBUC (4)恰好发生一个: ABC + ABC + ABC (5)恰好发生二个: ABC + ABC + ABC §1.3 概率 一、古典概型 从 17 世纪中叶,人们就开始研究随机现象,当时这种兴趣或需要主要是由赌博引起的,因 此人们首先注意的是这样一类随机事件:它们只有有限个可能的结果,即只有有限个样本点, 同时这些样本点出现的可能性相等。这样的概率空间称为古典概型。由于样本点是等可能的, 很自然地,人们就把事件 A 的概率定义为 A 所包含的样本点数与样本点总数的比值,即 样本点总数 的有利场合数 样本点总数 A包含的样本点数 A n m P(A) = = = 显然这样的定义同时也给出了概率的计算方法,这种方法今天还有着广泛的用途,尤其是在 产品的抽样检查方面。这样建立起来的概率有如下的性质: (1)对任意事件 A,P(A)≥0 (非负性) (2)P(Ω)=1 (规范性)
(3)若A1,A2,…,An两两互不相容,则: P(A1+A2+…+An)=P(A1)+P(A)+…+P(An)(可加性) 注意:上述可加性称为有限可加性。它主要适用于样本空间只包含有限个样本点的情况。如 果样本空间含有无穷多个样本点,则上述可加性也应推广为可列可加性(或称完全可加性 即:若A1,A2,…An,…互不相容,则 例1.6五个身高不同的人,随机站成一排,问恰好是按身高顺序排列的可能性有多大? 解:五个人随机排列,则排法共有5!种。有利场合则为从高到矮,或从矮到高,共两种 因此所求概率为 P=3=120 例1.7100块集成电路中混有5块次品。任取20块检测,问至多发现一块次品的概率为多 大 解:样本空间:C130 有利场合:20块样品中没有次品:C3 20块样品中有一块次品:C·C5 例1.810个同样的球,编号为1-10,从中任取三个,求恰有一个球编号小于5,一个球等 于5,另一个大于5的概率 解:样本空间:C 10×9×8 =120 2×3 有利场合:C4C1·C5=4×5=20 ∴P=20/120=1/6 例19设有n个球,每个可以的等概率落入N个格子之一中,(N>n),求: (1)指定的n个格中各有一球的概率 (2)任意n个格中各有一球的概率。 解:由于每个球落入各个格中的可能都相等,这是古典概型。每个球有N种可能的位置, 因此n个球在N个格中共有N种落法。即样本空间共有N个样本点 第一问的有利场合为n个球的全排列,即n!,因此P1=n!/N 第二问中选定n个格,共有CN种选法,因此有利场合为CN·n,即 P Nn=MN"·(N-n)
(3)若 A1,A2,…,An 两两互不相容,则: ( ) ( ) ( ) ( ) P A1 + A2 ++ An = P A1 + P A2 ++ P An (可加性) 注意:上述可加性称为有限可加性。它主要适用于样本空间只包含有限个样本点的情况。如 果样本空间含有无穷多个样本点,则上述可加性也应推广为可列可加性(或称完全可加性), 即:若 A1,A2,… An,…互不相容,则 = = = 1 1 ( ) i i i P Ai P A 例 1.6 五个身高不同的人,随机站成一排,问恰好是按身高顺序排列的可能性有多大? 解:五个人随机排列,则排法共有 5!种。有利场合则为从高到矮,或从矮到高,共两种。 因此所求概率为: 60 1 120 2 5! P = 2 = = 例 1.7 100 块集成电路中混有 5 块次品。任取 20 块检测,问至多发现一块次品的概率为多 大? 解:样本空间: 20 C100 有利场合:20 块样品中没有次品: 20 C95 20 块样品中有一块次品: 1 5 19 C95 C ∴ ( ) 20 100 1 5 19 95 20 95 C C C C P + = 例 1.8 10 个同样的球,编号为 1—10,从中任取三个,求恰有一个球编号小于 5,一个球等 于 5,另一个大于 5 的概率。 解:样本空间: 120 2 3 3 10 9 8 10 = C = 有利场合: 4 5 20 1 5 1 1 1 C4 C C = = ∴ P = 20/120=1/6 例 1.9 设有 n 个球,每个可以 N 1 的等概率落入 N 个格子之一中,(N>n),求: (1)指定的 n 个格中各有一球的概率; (2)任意 n 个格中各有一球的概率。 解:由于每个球落入各个格中的可能都相等,这是古典概型。每个球有 N 种可能的位置, 因此 n 个球在 N 个格中共有 Nn 种落法。即样本空间共有 Nn 个样本点。 第一问的有利场合为 n 个球的全排列,即 n!,因此 P1 = n!/ Nn 第二问中选定 n 个格,共有 n CN 种选法,因此有利场合为 C n! n N ,即 !/( ( )!) ! 2 N N N n N C n P n n n N = − =