1.3事件的运算、条件概率与独立性|023 义上说,任何概率都是条件概率,因为我们是在一定的试验之下去考虑事件的概 率的,而试验即规定有条件,在概率论中,决定试验的那些基础条件被看做已定 不变的,如果不再加入其他条件或假定,则算出的概率就叫做“无条件概率”,就 是通常所说的概率,当说到“条件概率”时,总是指另外附加的条件,其形式总可 归结为“已知某事件发生了” 例如,考虑掷一个骰子的实验.这里,骰子必须为均匀的正立方体,抛掷要有 足够的高度等要求,是这个试验的固有规定,不作为附加条件,考虑三个事件 A:“掷出素数点”;B:“掷出奇数点”;C:“掷出偶数点”,有 A=(2,3,5),B=1,3,5},C=2,4,6}. (3.5) 于是,算出A的(无条件)概率为3/6=1/2.现若附加上“已知B发生”,则可能 情况只有三种:1,3,5,其中两种有利于A发生,故在这个条件下,A的条件概 率,记为P(AB),等于2/3.同样,在给定事件C发生的条件下,A的条件概率 为P(AC)=1/3. 让我们在古典概率的模式下来分析一般的情况.设一试验有N个等可能的 结果,事件A,B分别包含其M个和M2个结果,它们有M个是公共的,这就 是事件AB所包含的试验结果数.若已给定B发生,则我们的考虑由起先的N 个可能结果局限到现在的M?个,其中只有M1个试验结果使事件A发生,故一 个合理的条件概率定义,应把P(AB)取为M2/M2.但事 M2/M2=(M2/N)/(M2/N)=P(AB)/P(B), 由此得出如下的一般定义: 定义3.1设有两个事件A,B,而P(B)≠0,则“在给定B发生的条件下A 的条件概率”,记为P(AB),定义为 P(A B)=P(AB)/P(B). (3.6) 当P(B)=0时,公式(3.6)无意义.在高等概率论中,也要考虑P(AB)当 P(B)=0时的定义问题,那要牵涉到高深的数学,超出本书范围之外.在后面我 们也会和个别这种情况打交道,那可以用极限的方法去处理。 公式(3.6)是条件概率的一般定义,但在计算条件概率时,并不一定要用它 有时,直接从加人条件后改变了的情况去算,更为方便.举一个例子, 例3.1掷三个均匀骰子,已知第一粒骰子掷出么(事件B).问“掷出点数 之和不小于10”这个事件A的条件概率是多少?
0241第1章事件的概率 既然第一粒骰子已坐定了1,则在这一条件下,为使事件A发生,第二、三粒 骰子掷出点数之和不能小于9.这一情况有10种,即36,63,45,54,46,64,55 56,65,66.这里,“36”表示第二、三粒骰子分别掷出3和6,其余类推,这样,得出 P(A|B)=10/36=5/18. 此题若直接用公式(3.6)计算,则比上述解法复杂一些,读者可一试,以证明 结果一致。 1.3.7事件的独立性,概率乘法定理 设有两个事件A,B,A的无条件概率P(A)与其在给定B发生之下的条件 概率P(A|B),一般是有差异的.这反映了这两个事件之间存在着一些关联.例 如,若P(A|B)>P(A),则B的发生使A发生的可能性增大了,即B促进了A 的发生 反之,若P(A)=P(AB),则B的发生与否对A发生的可能性毫无影 响·.这时,在概率论上就称A,B两事件独立,而由(3.6)式得出 P(AB)=P(A)P(B). (3.7) 拿此式来刻画独立性,比用P(A)=P(A|B)更好,因(3.7)式不受P(B)是否为 0的制约(当P(B)为0时(3.7)式必成立).因此,我们取如下的定义: 定义3.2两个事件A,B若满足(3.7)式,则称A,B独立. 定理3.2两独立事件A,B的积AB的概率P(AB)等于其各自概率的积 P(A)P(B) 这个定理就是(3.7)式,它称为“概率的乘法定理”,其实,它就是独立性的定 义,我们之所以又将它重复列出并标为一个定理,就是因为这个事实极其重要, 在实际问题中,我们并不常用(3.7)式去判断两个事件A,B是否独立,而 是相反:从事件的实际角度去分析判断其不应有关联,因而是独立的,然后就可 以用(3.7)式.例如,两个工人分别在两台机床上进行生产,彼此各不相干,则 各自是否生产出废品或多少废品这类事件应是独立的,一城市中两个相距较 远的地段是否出交通事故,一个人的收入与其姓氏笔画,这类事凭常识推想, 这样说应补充:由P(A)行P(AB)推出P(A)P(AB),B为B的对立事件,事实 上,由P(A)=P(AB)及(3.6)式知P(AB)=P(A)P(B),因为 A=AB+AB,且AB,AB互 ,知P(A)=PA)-PAB)=PA)-P(AP(B)=P(ADIP(B)P(A)P(B故 P(AI B)=P(AB)/P(B)=P(A)
1.3事件的运算、条件概率与独立性|025 认定为独立的. 由此可知,两个事件有独立性多半是在下述情况之下产生的:有两个试验 E,和E2,其试验结果(各有许多)分别记之以e和e2:考虑一个“大”试验E,它 由E1,E2两部分构成(故E常称为复合试验),可记为E=(E,E2),其结果可 记为(e1,e2).在试验E中的一个事件,即是牵涉到(e1,e2)的某一个陈述(见 11.2段),如果A,A2是两个事件,A1只牵涉e:而A2只牵涉e2,则当两个 试验结果彼此不影响时,A1,A2会有独立性.可以举一个具体例子.设试验E, 为掷一个均匀骰子,其试验结果e1有6个:12,6.试验E2为掷一个硬币,其 结果e2有两个:“正”和“反”.定义两事件A:,A2: A,=(掷出1点》,A:={掷出正面} 这两个事件可看成同一试验E下的两个事件,E=(E,E2},它包含12个可能 结果 (1,正),(1,反),(2,正),(2,反),.,(6,正),(6,反) 事件A,包含两个可能结果,即{(1,正),(1,反),而A:则包含6个可能结果 {(1,正),(2,正)·,(6,正)}.通过这种方式,我们把两个看来不相干的事件A 和A2统一在一个试验E之下,而其独立性就好理解了一即掷骰子和掷硬币 彼此不影响而已这种把若干个不相干的试验统一起来的做法,看起来好像纯粹 是一种形式,但在理论上有其方便之处 如果试验的内容真是单一的,那么,在这种试验下两事件独立是较少出现的例 外.因为两个事件既然都依赖同一批结果,彼此必定会有影响.掷两个均匀骰子,以 A:记“点数和为i的倍数”(i=2,3,5).通过用(3.7)式验证可知,A2与A,独立, 但这非一般性质,比如,A2与A,就不独立.对这种“单一”性试验,(3.7)式作为验 证独立性的工具,还是有用的.有时,未经周到考虑的直观也可能引人歧途。 例3.2再考虑例3.1.记B=(至少有一个骰子掷出1},而把事件A定义为 A=(三个骰子掷出的点数中至少有两个一样(即不全相异),问A,B是否独立? 初一看使人倾向于相信A,B独立,理由如下:知道B发生,即知道掷出的 点中有1,对A而言,似与知道掷出的点中有2(或3,4,5,6都可以)一样,故1 这个数并不相对地更有利于或更不利于A发生·经过计算发现不然:A,B并不 独立,这一点看来有些难以理解,但是,如按下述分析,则可以信服:考虑B,若B 发生,则三个骰子都不出现么.这样,它们都只有5种可能性(2,3,4,5,6),比不
0261第1章事件的概率 知B发生时可能取的点数1,2,3,4,5,6少了一个,在5个数中拿3个(每个可重 复拿),其有两个一样的可能性,自应比在6个数中拿3个时有两个一样的可能 性要大一些.这个分析指出应有P(A)<P(AB),由此推出P(A)>P(A|B) (见习题15),A,B不独立, 多个事件独立性的定义,就是两个事件情况的直接推广 定义3.3设A:,A2,.为有限或无限个事件,如果从其中任意取出有限个 A1A2.,An,都成立 P(A,A,.A)=P(A)P(A,).P(An), (3.8) 则称事件A1,A2,.相互独立,或简称独立, 这个定义与由条件概率出发的定义是等价的,后者是说,对任何互不相同的 i1,i2,.,im,有 P(A1A2.An)=P(A). (3.9) 即任意事件A发生的可能性大小,不受其他事件发生的影响.这更接近于独立 性的原义.但是,(3.9)式的左边依赖于P(A,.A,。)>0,否则无意义,而(3.8) 式就没有这个问题.另外,定理3.2后面说的那段话当然也适用于多个事件的情 形:多个事件的独立性往往产生于由多个试验构成的复合试验中,每个事件只与 其中一个试验有关 由独立性定义立即得出下面的概率乘法定理: 定理3.3若干个独立事件A1,·,A。之积的概率,等于各事件概率的 乘积。 P(A,.A。)=P(A1).P(A.). (3.10) 乘法定理的作用与加法定理一样,把复杂事件的概率的计算归结为更简单 的事件的概率的计算,这当然要有条件:相加是互斥,相乘是独立 由独立性定义可得到下面两条重要推论: 系3.2独立事件的任一部分也独立 例如,A,B,C,D四事件相互独立,则A,C,或A,B,D等,都是独立的 这一点由独立性的定义可直接推出.更进一步可推广为:由独立事件决定的 事件也独立.举例来说,若事件A1,A。相互独立,则以下三个事件 B1=A+A:,B2=A3A,Bs-As As (3.11) 也独立,这在直观上很显然,但证明起来很麻烦,因为可以产生的事件很多,在下
1.3事件的运算、条件概率与独立性|027 章中我们将指出另外的考虑方法(见第2章例3.7). 如果把B,改为A4AA。,则B2,B就不一定独立了,理由也很明显:二者 都与A。有关,因而彼此也就有了关系. 系3.3若一列事件A1,A2,.相互独立,则将其中任一部分改为对立事件 时,所得事件列仍为相互独立, 例如,若A,A2,A,相互独立,则A1,A2,Aa,或A1,A2,A3,或A1,A2,A 等,都是互相独立的. 这一点从直观上也很显然,且对两个事件的情况,已在24页的脚注中做过 证明.让我们再看一个三个事件的例子,比如,要证A1,A2,Aa独立,要对其验 证(3.8)式,其中有P(A1A2A)=P(A)P(A:)P(A).为此,注意到 A2A3=AA2A:+A1A2A3, 且右边两事件互斥,如 P(A:A:A:)=P(A2A3)-P() =P(A2)P(A)-P(A:AzA).(3.12) 再利用A1A2=A1A2A:+A1A:A:,得 P(AA2 A3)=P(A:A2)-P(AA:A:) P(A)P(A2)-P(A)P(A2)P(A3) =P(A1)P(A2)(1-P(Aa) =P(A1)P(A2)P(A2). 以此代人(3.12)式,得 P(AA2A3)=P(A2)P(A:)-P(A)P(A2)P(A3) =(1-P(A,))P(A2)P(A) =P(A1)P(A2)P(A). 明所欲证.可以看出:当涉及众多的事件时,这么处理会很冗长,但并无任何实质 困难(可使用数学归纳法,对所含对立事件个数进行归纳) 除了相互独立之外,还有所谓“两两独立”的概念。一些事件A1,A2,.,如 果其中任意两个都独立,则称它们两两独立·由相互独立必推出两两独立,反过 来不一定对.从数学上,这无非是说:由(3.8)式对m=2及任何i1≠i2成立,不 必能推出该式当m>2时也成立,下面是一个简单的例子