第一章事件与概率 字母空格E 0.20.100.0720.0650.0630.0590.050.0540.05 0.040.030.0290.023L0.02410.02240.02 频率0.0140.010.0100.0080.0030.0020 字母使用频率的研究,对于打字机键盘的设计(在方便的地方安排使用频率较高的字 母键)、印刷铅字的铸造(使用频率高的应铸得多些)、信息的编码(常用字母用较短的码) 密码的破译等等方面都是十分有用的 对于一个随机事件来说,它发生可能性大小的度量是由它自身决定的,并且是客观存 在的.就好比一根木棒有长度,一块土地有面积一样,概率是随机事件发生可能性大小的度 量,是随机事件自身的一个属性.一个根本的问题是,对一个给定的随机事件,它发生可能 性大小的度量一一概率,究竟是多大呢?在前面的例子中,因为已经知道了盒子中的白球 和黑球都是5个,才得以断定p(O1)=1/2.如果不知道盒子中的白球数和黑球数呢?在引言 中已经提到,实践告诉我们,如果反复多次地从盒子中取球(取后放回搅匀),随着试验次数 n的增大,比值会逐渐稳定到1/2(n表示出现白球的次数),记 出现的次数 W试验总次数m(o) 称fn(O1)为事件ω1在n次试验中出现的频率.频率当然也在一定程度上反映了发生可能 性的大小.尽管每作一串(n次)试验,所得到的频率∫n(O1)可以各不相同,但是只要n相当 大,fn(1)与P(O1)是会非常“靠近”的.因此概率是可以通过频率来“测量”的,或者 说频率是概率的一个近似.在前述摸球的例子中,即使事先并不知道盒子中黑球和白球的 比例数(这时概率虽然不知道,但它是客观存在的),经过反复多次的试验后,如果频率 f∫n(o1)逐渐稳定到1/2,那么我们就可以判断盒子中的白球数和黑球数是相等的,进一步 即可得到p(1)=1/2这个结论这件事情其实质与测量长度和面积一样的平常,给定一根 木棒,谁都不怀疑它有自身的“客观”的长度,长度是多少?我们可以用尺或仪器去测量 不论尺或仪器多么精确,测得的数值总是稳定在木棒真实的“长度”值的附近.事实上,人 们也是把测量所得的值当作真实的“长度”.这个类比不仅帮助我们去理解概率和频率之 间的内在关系,而且还启示了更深刻的事实:概率与长度、面积等变量一样,应该具有“测 度”的性质.这个问题请读者先思考一下,然后让我们慢慢地来解释 、频率和概率的性质
第一章 事件与概率 ·8 · 字母 空格 E T O A N I R S 频率 0.2 0.105 0.072 0.0654 0.063 0.059 0.055 0.054 0.052 字母 H D L C F U M P Y 频率 0.047 0.035 0.029 0.023 0.0225 0.0225 0.021 0.0175 0.012 字母 W G B V K X J Q Z 频率 0.012 0.011 0.0105 0.008 0.003 0.002 0.001 0.001 0.001 字母使用频率的研究,对于打字机键盘的设计(在方便的地方安排使用频率较高的字 母键)、印刷铅字的铸造(使用频率高的应铸得多些)、信息的编码(常用字母用较短的码)、 密码的破译等等方面都是十分有用的. 对于一个随机事件来说,它发生可能性大小的度量是由它自身决定的,并且是客观存 在的.就好比一根木棒有长度,一块土地有面积一样,概率是随机事件发生可能性大小的度 量,是随机事件自身的一个属性.一个根本的问题是,对一个给定的随机事件,它发生可能 性大小的度量—一概率,究竟是多大呢?在前面的例子中,因为已经知道了盒子中的白球 和黑球都是5个,才得以断定 ( ) p 1 =1/2.如果不知道盒子中的白球数和黑球数呢?在引言 中已经提到,实践告诉我们,如果反复多次地从盒子中取球(取后放回搅匀),随着试验次数 n 的增大,比值 n n白 会逐渐稳定到 1/2(n 白表示出现白球的次数),记 n n白 = 试验总次数 出现1的次数 = ( ) n 1 f 称 ( ) n 1 f 为事件ω1 在 n 次试验中出现的频率.频率当然也在一定程度上反映了发生可能 性的大小.尽管每作—串(n 次)试验,所得到的频率 ( ) n 1 f 可以各不相同,但是只要 n 相当 大, ( ) n 1 f 与 ( ) p 1 是会非常“靠近”的.因此概率是可以通过频率来“测量”的,或者 说频率是概率的一个近似.在前述摸球的例子中,即使事先并不知道盒子中黑球和白球的 比例数(这时概率虽然不知道,但它是客观存在的),经过反复多次的试验后,如果频率 ( ) n 1 f 逐渐稳定到 1/2,那么我们就可以判断盒子中的白球数和黑球数是相等的,进一步 即可得到 ( ) p 1 =1/2 这个结论.这件事情其实质与测量长度和面积—样的平常,给定一根 木棒,谁都不怀疑它有自身的“客观”的长度,长度是多少?我们可以用尺或仪器去测量, 不论尺或仪器多么精确,测得的数值总是稳定在木棒真实的“长度”值的附近.事实上,人 们也是把测量所得的值当作真实的“长度”.这个类比不仅帮助我们去理解概率和频率之 间的内在关系,而且还启示了更深刻的事实:概率与长度、面积等变量一样,应该具有“测 度”的性质.这个问题请读者先思考一下,然后让我们慢慢地来解释. 二、频率和概率的性质:
第一章事件与概率 1.频率的性质 现在让我们比较仔细地考察一下频率.如果随机事件A在n次反复试验中发生了n自 次,称 f (A)= 为A的频率.易知频率具有下述性质 (1).非负性:即fn(A)≥0 (2).规范性,即若9是必然事件,则∫n(2)=1 (3).有限可加性:即若A、B互不相容(即AB=Φ),则 f(AUB)=(A)+, (B) 这三条性质的论证是很直观的,因为 (1).n4≥0,所以_≥0 (2).是必然事件,所以n=n,从而=1: (3).若AUB发生,意味着A、B中至少发生其中之一,又因为A与B互不相容(即不能 同时发生),所以AUB发生的次数一定是A发生次数与B发生次数之和,即nB=n4+nB 从而有 f(AUB)=f(A)+f(B) 成立 频率还具有一些别的性质,但是这三条性质是最基本的,其它的性质可以由它们推 出.作为练习,读者不妨自己验证下述几个性质: (1)不可能事件的频率为零,即fn(Φ)=0; (2)若ACB,则fn(A)≤fn(B),由此还可推得对任一事件A,有fn(4)≤1 (3)对有限个两两不相容事件(即任意两个事件互不相容),频率具有可加性.即若AA Φ(1≤i,j≤m,i≠j),则 U4=∑()
第一章 事件与概率 ·9· 1.频率的性质: 现在让我们比较仔细地考察一下频率.如果随机事件 A 在 n 次反复试验中发生了 n 白 次,称 f (A) n = n n白 为 A 的频率.易知频率具有下述性质. (1).非负性:即 f (A) n ≥0; (2).规范性,即若Ω是必然事件,则 () n f =1; (3).有限可加性:即若 A、B 互不相容(即 AB=Φ),则 f (A B) n = f (A) n 十 f (B) n 这三条性质的论证是很直观的,因为 (1). A n ≥0,所以 n nA ≥0; (2). Ω是必然事件,所以 n = n ,从而 n n =1; (3). 若 A∪B 发生,意味着 A、B 中至少发生其中之一,又因为 A 与 B 互不相容(即不能 同时发生),所以A∪B发生的次数一定是A发生次数与B发生次数之和,即 nAB = nA + nB , 从而有 f (A B) n = f (A) n 十 f (B) n 成立. 频率还具有一些别的性质,但是这三条性质是最基本的,其它的性质可以由它们推 出.作为练习,读者不妨自己验证下述几个性质: (1) 不可能事件的频率为零,即 () n f =0; (2) 若 A⊂B,则 f (A) n ≤ f (B) n ,由此还可推得对任一事件 A,有 f (A) n ≤1; (3) 对有限个两两不相容事件(即任意两个事件互不相容),频率具有可加性.即若AiAj= Φ(1≤i,j≤m,i≠j),则 ( ) = = = n i n i n i f n Ai f A 1 1
第一章事件与概率 2.概率的性质 因为频率的本质就是概率,因而我们有理由要求频率的这些性质也是概率所应该具有 的.因为对每一个随机事件A,都有一个概率P(A)与之对应,而在§1中我们已经知道事件 是一个布尔代数,所以概P实质上是在布尔代数上有定义的一个(集合)函数因为中 元素是集合),它应该具有下述性质 (1).非负性:P(A)≥0,对A∈字 (2).规范性:P(Ω)=1:; (3).有限可加性:若A1∈字,i=1,2,…,n,且AA=中(i≠j),则 14=∑(4) 由此可知,给定一个随机试验,也就确定了一个样本空间Ω,事件域F和概率P,其中F是 个布尔代数,P是定义在F上的一个非负的、规范的有限可加集函数,这样一来,对随机 试验这样的一个直观对象,我们就可以用“数学化”的语言来描述它们了 §13古典概型 教学目的要求: 通过本节的学习使学生在复习巩固排列组合的基础上掌握古典概型的定义和计算公 式并能灵活运用它们解决实际问题 教材分析: 1.概括分析:古典概型在概率论中占有相当重要的地位,早在古代就引起了人们的 注意.它的内容比较简单,应用却很广泛,深入考察古典概率问题,有助于我们直观地理解 概率论的一些基本概念,合理地解决产品质量控制等实际问题.因此,掌握古典概率问题的 解法,对于学好概率论具有十分重要的意义.本节首先给出古典概型的定义,然后在复习排 列组合的基础上通过实例讲述古典概型问题的解法,达到灵活运用定义与公式的目的 教学重点:古典概型的定义与公式及古典概型问题的解法 3.教学难点:古典概型问题的解法及古典概型定义与公式的灵活运用 教学过程: 在§2中已经提到,一个随机试验,数学上是用样本空间Ω,事件域F和概率P来描述 的.对一个随机事件A,如何寻求它的概率P(A)是概率论的一个基本的课题.我们先讨论 类最简单的随机试验 古典概型的定义与计算公式: 1.古典概型的定义 有一类最简单的随机试验,它具有下述特征: (1)样本空间的元素(即基本事件)只有有限个.不妨设为n个,并记它们为o1、o2
第一章 事件与概率 ·10 · 2. 概率的性质: 因为频率的本质就是概率,因而我们有理由要求频率的这些性质也是概率所应该具有 的.因为对每一个随机事件 A,都有一个概率 P(A)与之对应,而在§1 中我们已经知道事件 域ℱ 是一个布尔代数,所以概 P 实质上是在布尔代数上有定义的一个(集合)函数(因为ℱ 中 的元素是集合),它应该具有下述性质: (1).非负性:P(A)≥0,对 A∈ℱ ; (2).规范性:P(Ω)=1; (3).有限可加性:若 Ai∈ℱ ,i=1,2,…,n,且 AiAj=Φ(i≠j),则 ( ) = = = n i n i n i P Ai f A 1 1 由此可知,给定一个随机试验,也就确定了一个样本空间Ω,事件域 ℱ 和概率 P,其中 ℱ 是 一个布尔代数,P 是定义在 ℱ 上的一个非负的、规范的有限可加集函数,这样一来,对随机 试验这样的一个直观对象,我们就可以用“数学化”的语言来描述它们了. §1.3 古典概型 教学目的要求: 通过本节的学习,使学生在复习巩固排列组合的基础上掌握古典概型的定义和计算公 式,并能灵活运用它们解决实际问题. 教 材 分 析 : 1.概括分析:古典概型在概率论中占有相当重要的地位,早在古代就引起了人们的 注意.它的内容比较简单,应用却很广泛,深入考察古典概率问题,有助于我们直观地理解 概率论的一些基本概念,合理地解决产品质量控制等实际问题.因此,掌握古典概率问题的 解法,对于学好概率论具有十分重要的意义.本节首先给出古典概型的定义,然后在复习排 列组合的基础上通过实例讲述古典概型问题的解法,达到灵活运用定义与公式的目的. 2.教学重点:古典概型的定义与公式及古典概型问题的解法. 3.教学难点:古典概型问题的解法及古典概型定义与公式的灵活运用. 教 学 过 程 : 在§2 中已经提到,一个随机试验,数学上是用样本空间Ω,事件域 ℱ 和概率 P 来描述 的.对一个随机事件 A,如何寻求它的概率 P(A)是概率论的一个基本的课题. 我们先讨论 一类最简单的随机试验. 一、古典概型的定义与计算公式: 1.古典概型的定义: 有一类最简单的随机试验,它具有下述特征: (1) 样本空间的元素(即基本事件)只有有限个.不妨设为 n 个,并记它们为ω1、ω2、…
第一章事件与概率 (2)每个基本事件出现的可能性是相等的,即有P(u)=P(u2)=…P(u) 这种等可能的数学模型曾经是概率论发展初期的主要研究对象,通常就称这种数学模 型为古典概型.它在概率论中有很重要的地位,一方面,因为它比较简单,许多概念既直观 而又容易理解,另一方面,它又概括了许多实际问题,有很广泛的应用. 2.古典概型的计算公式 对上述的古典概型,它的样本空间Ω={ω1、ω2、…、ωn},事件域字为9的所有子集的 全体.这时,连同Φ、9在内,中含有2个事件,并且从概率的有限可加性知 1=P(9)=P(u1)+P(u2)+…+P(u) 于是 P(o1)=P(o2)=…=P(on)=1/n 对任意一个随机事件A∈T,如果A是k个基本事件的和,即 A=o,Uo,U…Uo,, kA中所含的基本事件数A的有利事件数 P(A)= 基本事件总数 基本事件总数 (A中所含的基本事件数,习惯上常常称为是A的有利事件数),不难验证,上述的概率P( 的确具有非负性、规范性和有限可加性 事实上,古典概型的大部分问题都能形象化地用摸球模型来描述.以后我们经常研究 摸球模型,意义即在于此 前节例1.1及其有关概率的计算是古典概型的一个例子,但并不是所有古典概型的事 件的概率计算都这么容易.事实上,古典概型中许多概率的计算相当困难而富有技巧,计算 的要点是给定样本点,并计算它的总数,而后再计算有利场合的数目.在这些计算中,经常 要用到一些排列与组合公式 、基本的组合分析公式 1.全部组合分析公式的推导基于下列两条原理:乘法原理与加法原理.为说明这两条 原理,请读者和我们一起参加一个智力游戏 王经理从上海去北京参加一个商品展销会,但途中还要到 天津去处理一件业务.从上海到天津可以坐飞机,也可以坐火 车,还可以坐船;从天津到北京则只有火车与汽车两种交通工 具可用.请问王经理从上海到北京一共有几种走法? 图2.1的图(a)是上述问题的忠实描绘.把它重新表示为(b),使我们一目了然地知道, 口王经理共有6种走法.这样一种表示方法是具有启发性的,它 告诉我们,对于同类问题可有一个通用的计算方法 把上海一天津,再从天津一北京看作相继进行的两个过程, 分别记为A与A.一般地,假设完成过程A共有n1种方法(在 我们的游戏中m=3),完成A2共有n种方法(本例中n2=2),那
第一章 事件与概率 ·11· ωn. (2)每个基本事件出现的可能性是相等的,即有 P(ω1)=P(ω2)=…P(ωn) 这种等可能的数学模型曾经是概率论发展初期的主要研究对象,通常就称这种数学模 型为古典概型.它在概率论中有很重要的地位,一方面,因为它比较简单,许多概念既直观 而又容易理解,另一方面,它又概括了许多实际问题,有很广泛的应用. 2.古典概型的计算公式: 对上述的古典概型,它的样本空间Ω={ω1、ω2、…、ωn},事件域ℱ 为Ω的所有子集的 全体.这时,连同Φ、Ω在内, ℱ 中含有 2 n 个事件,并且从概率的有限可加性知: 1=P(Ω)=P(ω1)+P(ω2)+…+P(ωn) 于是 P(ω1)=P(ω2)=…=P(ωn)=1/n 对任意一个随机事件 A∈ℱ,如果 A 是 k 个基本事件的和,即 A= k i i i 1 2 , 则 基本事件总数 的有利事件数 基本事件总数 A中所含的基本事件数 A n k P(A) = = = (A 中所含的基本事件数,习惯上常常称为是 A 的有利事件数),不难验证,上述的概率 P(·) 的确具有非负性、规范性和有限可加性. 事实上,古典概型的大部分问题都能形象化地用摸球模型来描述.以后我们经常研究 摸球模型,意义即在于此. 前节例 1.1 及其有关概率的计算是古典概型的一个例子,但并不是所有古典概型的事 件的概率计算都这么容易.事实上,古典概型中许多概率的计算相当困难而富有技巧,计算 的要点是给定样本点,并计算它的总数,而后再计算有利场合的数目.在这些计算中,经常 要用到一些排列与组合公式. 二、基本的组合分析公式 1.全部组合分析公式的推导基于下列两条原理:乘法原理与加法原理.为说明这两条 原理,请读者和我们一起参加一个智力游戏. 王经理从上海去北京参加一个商品展销会,但途中还要到 天津去处理一件业务.从上海到天津可以坐飞机,也可以坐火 车,还可以坐船;从天津到北京则只有火车与汽车两种交通工 具可用.请问王经理从上海到北京一共有几种走法? 图 2.1 的图(a)是上述问题的忠实描绘.把它重新表示为(b),使我们一目了然地知道, 王经理共有 6 种走法.这样一种表示方法是具有启发性的,它 告诉我们,对于同类问题可有一个通用的计算方法. 把上海—天津,再从天津—北京看作相继进行的两个过程, 分别记为 A1 与 A2.一般地,假设完成过程 A1 共有 n1 种方法(在 我们的游戏中 n1=3),完成 A2 共有 n2 种方法(本例中 n2=2),那
第一章事件与概率 末,完成整个过程一共有n×n2种方法(这里3×2=6).这就是所谓的乘法原理 现在把游戏的条件稍微改变一下.假定因时间关系,王经理只能去北京和天津中的 地,而从上海直接去北京可以有铁路与民航两种走法,此时王经理的走法一共有多少种 直接采用类似图2.1(b)的表示方法,便知此时共有5种走 法,如图2.2所示.现在不同的是,两个过程不是相继的而是并 行的.因此在计算中不能用乘法,只能用加法.这样,进行过程 图2.3加族原理图示 A1或A2的方法一共有n1+n2种.这就是加法原理 容易知道,这两条原理可以推广到多个过程的情况.利用上述原理,可以导出排列与组 合的公式 所谓排列,是从共有n个元素的总体中取出r个来进行有顺序的放置(或者说有顺序地 取出r个元素) 这时既要虑到取出的元素也要顾及其取出顺序.这种排列可分为两类:第一种是有放 回的选取,这时每次选取都是在全体元素中进行,同一元素可被重复选中;另一种是不放回 选取,这时一个元素一旦被取出便立刻从总体中除去,因此每个元素至多被选中一次,在后 种情况,必有r≤n (1)在有放回选取中,从n个元素中取出r个元素进行排列,这种排列称为有重复的排 列,其总数共有n种 (2)在不放回选取中,从n个元素中取出r个元素进行排列,其总数为 An=n(n-1)(n-2)…(n-r+1) 这种排列称为选排列.特别当r=n时,称为全排列 (3)n个元素的全排列数为Pn=n(n-1)…3·2·1=n! 3.组合 (1)从n个元素中取出r个元素而不考虑其顺序,称为组合,其总数为 n A 1) 这里是二项展开式的系数,(a+b)= a'b (2)若r1+r2+…+n=n,把n个不同的元素分成k个部分,第一部分r1个,第二部分r2 个,……,第k部分r个,则不同的分法有 r1!r2
第一章 事件与概率 ·12 · 末,完成整个过程一共有 n1×n2 种方法(这里 3×2=6).这就是所谓的乘法原理. 现在把游戏的条件稍微改变一下.假定因时间关系,王经理只能去北京和天津中的一 地,而从上海直接去北京可以有铁路与民航两种走法,此时王经理的走法一共有多少种 呢? 直接采用类似图 2.1(b)的表示方法,便知此时共有 5 种走 法,如图 2.2 所示.现在不同的是,两个过程不是相继的而是并 行的.因此在计算中不能用乘法,只能用加法.这样,进行过程 A1 或 A2 的方法一共有 n1+n2 种.这就是加法原理. 容易知道,这两条原理可以推广到多个过程的情况.利用上述原理,可以导出排列与组 合的公式. 2.排列: 所谓排列,是从共有 n 个元素的总体中取出 r 个来进行有顺序的放置(或者说有顺序地 取出 r 个元素). 这时既要虑到取出的元素也要顾及其取出顺序.这种排列可分为两类:第一种是有放 回的选取,这时每次选取都是在全体元素中进行,同一元素可被重复选中;另一种是不放回 选取,这时一个元素一旦被取出便立刻从总体中除去,因此每个元素至多被选中一次,在后 一种情况,必有 r≤n. (1)在有放回选取中,从 n 个元素中取出 r 个元素进行排列,这种排列称为有重复的排 列,其总数共有 n r 种. (2)在不放回选取中,从 n 个元素中取出 r 个元素进行排列,其总数为 r An =n(n-1)(n-2)…(n-r+1) 这种排列称为选排列.特别当 r=n 时,称为全排列. (3)n 个元素的全排列数为 Pn=n(n-1)…3·2·1=n! 3.组合: (1)从 n 个元素中取出 r 个元素而不考虑其顺序,称为组合,其总数为: !( )! ! ! ( 1) ( 1) ! r n r n r n n n r r A r n C r r n n − = − − + = = = 这里 r n 是二项展开式的系数,(a+b)n == − n r r n r a b r n 0 (2)若 r1+r2+…+rk=n,把 n 个不同的元素分成 k 个部分,第一部分 r1 个,第二部分 r2 个,……,第 k 部分 rk 个,则不同的分法有: ! ! ! ! 1 2 k r r r n