0081第1章事件的概率 该试验必须能在同样条件下大量次数重复施行,以便我们有可能观察该事件的 频率 读者恐怕已注意到上述定义中的不足之处,即频率只是概率的估计而非概 率本身,形式上可以用下面的说法来解决这个困难,把事件E的概率定义为具 有如下性质的一个数P:当把试验重复时,E的频率在p的附近摆动,且当重复 次数增大时,这个摆动愈来愈小,或者干脆说:概率就是当试验次数无限增大时 频率的极限.要这样做,就必须回答下述问题:你怎样去证明具有上述性质的数 p存在,抑或卫的存在只是一个假定? 依本书作者的观点,“概率的统计定义”的重要性,不在于它提供了一种定义 概率的方法一它实际上没有提供这种方法,因为你永远不可能依据这个定义 确切地定出任何一个事件的概率,其重要性在于两点:一是提供了一种估计概率 的方法,这在上文已谈到了,这种应用很多,例如在人口的抽样调查中,根据抽样 的一小部分人去估计全部人口的文盲比例:在工业生产中,依据抽取的一些产品 的检验去估计产品的废品率;在医学上依据积累的资料去估计某种疾病的死亡 率,等等,二是它提供了一种检验理论正确与否的准则,设想根据一定的理论,假 定等等算出了某事件A的概率为,这个理论或假定是否与实际相符,我们并无 把握.于是我们可诉诸试验,即进行大量重复的试验以观察事件A的频率m/n 若m/n与p接近,则认为试验结果支持了有关理论;若相去较远,则认为理论 可能有误.这类问题属于数理统计学的一个重要分支一假设检验,将在本书第 5章中讨论 1.1.5概率的公理化定义 数学上所说的“公理”,就是一些不加证明而承认的前提,这些前提规定了所 讨论的对象的一些基本关系和所满足的条件,然后以之为基础,推演出所讨论的 对象的进一步的内容.几何学就是一个典型的例子 成功地将概率论实现公理化的是现代的前苏联大数学家柯尔莫哥洛夫,时 间在1933年.值得赞赏的不止在于他实现了概率论的公理化,还在于他提出的 公理为数很少且极为简单,而在这么一个基础上建立起了概率论的宏伟的大厦。 在第1.1.2段中我们曾指出:事件是与试验相连的,试验有许多可能的结果, 每个结果叫做一个基本事件,与此相应,在柯氏的公理体系中引进一个抽象的集合 2,其元素,称为基本事件.我们又曾指出:一个事件是由若干基本事件构成的,如 在掷骰子的试验中,“掷出素数点”这个事件由2,3,5这三个基本事件构成,与此相
1.2古典概率计算|009 应,在柯氏公理体系中考虑由2的子集(包括?本身及空集)构成的一个集类 今.罗不必包括的一切可能的子集,且必须满足某种我们在此不必仔细说明的条 件,今中的每个成员就称为“事件”事件有概率,其大小随事件而异,换句话说,概 率是事件的函数.与此相应,在柯氏公理体系中,引进了一个定义在罗上的函数P 对等中任一成员A,P(A)的值理解为事件A的概率,柯氏公理体系对这个函数P 加上了几条要求(即公理):①0≤P(A)≤1.对亨中任何成员A,这相应于要求概 率在0与1之间.②P(0)=1,P(②)=0.这相应于说必然事件有概率1,不可能事 件有概率0.③加法公理.这一条将在1.3节中解释。 我们举一个简单例子来说明柯氏公理的实现,还是拿那个“掷骰子”的例子 在本例中,集合2={1,2,3,4,5,6),由6个元素构成,反映掷骰子试验的6个基 本结果,作为,在本例中包含?的一切可能的子集,故事一共有64个成员,至 于概率函数P的定义,则要考虑骰子的具体情况,若骰子是均匀的正立方体,则 P定义为 P(A)=A中所含点数/6. 若骰子非均匀,则每面出现的概率P1,.,P6可不同,这时,先定出上面这6个 数,然后对每个A,把其中所含点相应的P值加起来作为P(A)例如,若A {2,3,5},则P(A)=p2+p3+ps 由这个例子我们也看出:柯氏公理只是界定了概率这个概念所必须满足的 些一般性质,它没有也不可能解决在特定场合下如何定出概率的问题,拿后 例子而言,如何以足够的精确度定出P1,·,P6,那是要做大量艰苦的工作的.柯 氏公理的意义在于它为一种普遍而严格的数学化概率理论奠定了基础.例如,刚 才讨论过的这个例子可用于任何一个只有6个基本结果的试验,而无需过问这 个试验是掷骰子或其他,这就是数学的抽象化.正如我们可说1+2=3,而不必 要去讨论一只牛加二只牛等于三只牛之类的东西, 1.2古典概率计算 1.2.1排列组合的几个简单公式 按公式(1.1),古典概率计算归结为计算两个数M和N.这种计算大多涉及
010|第1章事件的概率 排列组合.二者的区别在于,排列要计较次序而组合不计较:ab和ba是不同的 排列,但是是相同的组合 (1)n个相异物件取,(1≤r≤n)个的不同排列总数,为 P=t(n-1)(n-2).(n-r+1). (2.1) 因为,从n个中取出排列中的第1个,有n种取法;在剩下的n-1个中取 出一个,作为排列中的第2个,有n-1种取法;.最后,在剩下的n一r+1个 中取出一个作为排列中的第r个,有n一,+1种取法,因此,不同的取法数目为 n,n-1,.,n-r+1这r个数之积,从而得出公式(2.1). 例如,从a,b,c,d这4个字母中取2个做排列,有4×3=12种 ab,ba,ac,ca,ad,da,bc,cb,bd,db,cd,dc. 特别地,若n=r,由(2.1)式得1 P:=r(r-1).1=rI (2.2) r!读为“r阶乘”,是前,个自然数之积:人们常约定把0!作为1.当r不是非负 整数时,记号「!没有意义. (2)n个相异物件取r(1≤r≤n)个的不同组合总数,为 c5=片Fm n (2.3) 因为每一个包含T个物件的组合,可以产生T!个不同的排列,故排列数应 为组合数的!倍,由此得出公式(2.3).C:常称为组合系数 例如,从a,b,c,d这4个字母中取2个做组合,有41/(2!21)=6种,即 ab,ac,ad,bc,bd,cd. 在有些书籍中,把记号C写为C:.C?的一个更通用的记号是(?)我们 今后将用()取代C当r=0时,按01=1的约定,由(2.3)式算出(6)=1.这 可看作一个约定,对组合系数,另一常用的约定是:按公式率项古。 ()=n(n-1(n-r+1/r 只要「为非负整数,n不论为任何实数,都有意义,故n可不必限制为自然数 例如,按上式,有
1.2古典橱率计算1011 (,=-1-2(-1n=(-1 (3)与二项式展开的关系.组合系数()又常称为二项式系数,因为它出现 在下面熟知的二项式展开的公式中: (2.4) 这个公式的证明很简单:因为(a+b)"=(a+b)·(a+b).(a+b),为了产生 abm这一项,在这n个a+b中,要从其中的i个取出a,另n-i个取出b.从 n个中取出i个的不同取法为(”)这也就是ab~这一项的系数,)1公 利用这个关系式(2.4),可得出许多有用的组合公式.例如,在(2.4)式中令 a=b=1,得 0)+().+(0)=2 令a=-1,b=1,则得 另一个有用的公式是 1(2.5) 它是由恒等式(1+x)m+”=(1+x)m(1+x)#即 m=(( 比较两边的x项的系数得到的。 (4)n个相异物件分成k堆,各堆物件数分别为,.,「k的分法是 n/(r1I.r). (2.6)
012|第1章事件的概率 此处,1,「都是非负整数,其和为n,又这里要计较堆的次序,就是说,若有 5个物体a,b,c,d,e分成3堆,则(ac),(d),(be)和(be),(ac),(d)应算做两 种不同分法 证明很简单:先从用个中取出,个作为第1堆,取法有()种,在余下的 。-7个中取出个作为第2准,取法有”,”种以此类鉴得到金部不同 的分法为 利用公式(2.3),并注意n1一.-r-1=r,即得(2.6)式. (2.6)式常称为多项式系数,因为它是(x1+.+x)”的展开式中 x11.x'这一项的系数 1.2.2古典概率计算举例 例2.1一批产品共N个,其中废品有M个.现从中随机(或者说随意)取 出n个,问“其中恰好有m个废品”这个事件E的概率是多少? 按121复所法,从N个产品中取出元个,不同的取法有()片所消随 机”发防套”家是指这()中取法有等可能任这是古宾复率定义可以使用的 前提,所以,从实际的角度而言,问题在于怎样保证抽取的方法能满足等可能性 这个要求,以下各例中,“随机”一词也都是作这种理解。 使事件E发生的取法,或者说“有利”于事件E的取法,计算如下:从M个 废品中取m个,取法有M种:从其余N一M个合格品中取nm个,取法有 (信)种故有利于事件E的聚法共有的)(信然*按公式D,用中 件E的概率为 (2.7)