1.1概率是什么1003 个概念有广泛的生活基础.我们几乎无时不在估计种种情况出现的可能性,而不 同的人很少能在“客观”的基础上达成一致.②这可能反映认识主体的一种倾向 性,而有其社会意义,例如,若问“三年后经济形势会得到根本改善”的可能性大 小怎样,则不同经济状况、社会地位以至政治倾向的人,会做出有差异的估计.就 个别估计而言,可能谈不上多大道理;但从总体而言,则反映了社会上广大群众 对长远发展的信心如何,对社会学家乃至决策者来说,这是很有用的资料.③在 涉及(经济和其他的)利益得失的决策问题中,处于不同地位和掌握信息多少不 同的人,对某事件可能性的大小要参照这些情况及可能的后果去做衡量,适合于 某人的决策,例如风险较小的决策,不必适合于另一个人,因对他而言,这一决策 可能风险太大.因此,主观概率这个概念也有其实用基础.事实上,许多决策都难 免要包含个人判断的成分,而这就是主观概率, 1.1.2试验与事件 前面我们已经提到了“事件”这个名词.事件是什么?在通常的意义下,它往 往是指一种已发生的情况,例如某某空难事件,1941年日本偷袭珍珠港的事件 之类,在概率论中则不然,事件不是指已发生了的情况,而是指某种(或某些)情 况的“陈述”,它可能发生,也可能不发生,发生与否,要到有关的“试验”有了结果 以后才能知晓 拿前例而言,事件A“陈述”了这样一种情况:下午6时前不会下雨.我们当 然并未说这已经发生了,它是否发生,要等试验结果,这个试验,就是对到下午⑥ 时前的天气情况进行观察. 推而广之,我们就不难明白:在概率论中,“事件”一词的一般含义是这样的 (1)有一个明确界定的试验.“试验”一词,有人为、主动的意思,而像上例那 样,人只处在被动地位,只是记录而并不干预气象过程·这类情况一般称为“观 察”,在统计学中,这一分别有时有实际含义,但对目前的讨论不重要,可以把“试 验”一词理解为包含了观察, (2)这个试验的全部可能结果,是在试验前就明确的,拿上例来说,试验的 全部可能结果只有两个:其一是A,另一是A={今天下午6时前会下雨},为此, 可把这个试验写为(A,A).不必等到试验完成(不必到下午6时)就知道:非A 即A,必居其一,又如,投掷一个赌博用的骰子这个试验,虽无法预卜其结果如 何,但总不外乎是“出现1点”,.,“出现6点”这6个可能结果之一,因而不妨 把这个试验简记为(1,2,.,6)
0041第1章事件的根率 在不少情况下,我们不能确切知道一个试验的全部可能结果,但可以知道它 不超出某个范围,这时,也可以用这个范围来作为该试验的全部可能结果,如在 前例中,若我们感兴趣的不止在于下午6时前是否下雨,而需要记录下午6时前 的降雨量(如以毫米为单位),则试验结果将是非负实数x,我们无法确定x的可 能取值的确定范围,但可以把这个范围取为[0,©),它,总能包含一切可能的试验 结果.尽管我们明知某些结果,如x>10000,是不会出现的.我们甚至可以把这 个范围取为(一∞,∞)也无妨.这里就有了一定的数学抽象,它可以带来很大的 方便,这一点在以后会更清楚, (3)我们有一个明确的陈述,这个陈述界定了试验的全部可能结果中一个 确定的部分·这个陈述,或者说一个确定的部分,就叫做一个事件.如在下雨的例 中,A是全部可能结果(A,A)中确定的一部分,在掷骰子的例中,我们可以定义 许多事件,例如: E,={掷出偶数点)=(2,4,6), E2=(掷出素数点}=(2,3,5), Ea=〈掷出3的倍数点}=(3,6), 等等,它们分别明确地界定了全部试验结果的集合(1,2,6)中的一个相应的 部分 如果我们现在把试验做一次,即把这个骰子投掷一次,则当投掷结果为2 或为4,或为6时,我们说事件E,“发生了”,不然就说事件E,“不发生”.因此,我 们也可以说:事件是与试验结果有关的一个命题,其正确与否取决于试验结果 如何 在概率论上,有时把单一的试验结果称为一个“基本事件”这样,一个或一 些基本事件并在一起,就构成一个事件,而基本事件本身也是事件,在掷骰子的 例中,有1,2,.,6等6个基本事件.事件E2则由2,3,5这三个基本事件并成 设想你处在这样一种情况:投掷一个骰子,若出现素数点,你将中奖,则在骰 子投掷之前你会这样想:我能否中奖,取决于机遇.因此,在概率论中,常称事件 为“随机事件”或“偶然事件”,“随机”的意思无非是说,事件是否在某次试验中发 生,取决于机遇.其极端情况是“必然事件”(在试验中必然发生的事情,例如,〈掷 一个骰子,其出现点数不超过6)和“不可能事件”(在试验中不可能发生的事 件).这两种情况已无机遇可言,但为方便计,不妨把它们视为随机事件的特例, 正如在微积分中,常数可视为变量的特例
1.1概率是什么005 可以把必然事件和不可能事件分别等同于概率为1和概率为0的事件,从 严格的理论角度而言,这二者有所区别,但这种区别并无实际的重要性 本段讲的概念虽很浅显,但是很重要,特别提醒读者区别“事件”一词的日常 及在概率论中的不同含义, 1.1.3古典概率 承接上一段,假定某个试验有有限个可能的结果e1,e2,·,ew.假定从该试 验的条件及实施方法上去分析,我们找不到任何理由认为其中某一个结果,例如 e:,比任一其他结果,例如e,更具有优势(即更倾向于易发生),则我们只好认 为,所有结果e1,.ew在试验中有同等可能的出现机会,即1/N的出现机会 常常把这样的试验结果称为“等可能的” 拿掷骰子的例子而言,如果:①骰子质料绝对均匀:②骰子是绝对的正六 面体:③掷骰子时离地面有充分的高度,则一般人都会同意,其各面出现的机会 应为等可能.当然,在现实生活中这只能是一种近似,何况,在骰子上刻上点数也 会影响其对称性, 在“等可能性”概念的基础上,很自然地引进古典概率的定义: 定义1.1设一个试验有N个等可能的结果,而事件E恰包含其中的M个 结果,则事件E的概率,记为P(E),定义为 P(E)M/N. (1.1) 本定义所根据的理由很显然,按前面的分析,由等可能性的含义,每个结果 的概率同为1/N.今事件E包含M个结果,其概率理应为1/N的M倍,即 M/N.古典概率是“客观”的,因为,如果等可能性是基于客观事实(例如在骰子 绝对均匀且为严格正六面体时)而非出于主观设想,则看来除按(1.1)式外,别无 其他的合理定义法,因此,在等可能性的前提下,(1.1)式应为大家所公认这样 关键就在于保证这个等可能性成立无误,在开奖时要设计适当的方法并设置公 证人,这些措施都是为了保证所用方法导致等可能的结果 设有一个坛子,其中包含N个大小和质地完全一样的球,M个为白球, N-M个为黑球.将这N个球彻底扰乱,蒙上眼睛,从中抽出一个.则人们都能 接受:“抽到白球”这个事件的概率,应取为M/N.这个“坛子模型”看起来简单, 却很有用:它是在一切概率的讨论中,唯一的一个易于用形象的方法加以体现的 情况,日常习用的按“抽签”来保证机会均等的做法,就是基于这一模型,有了这
0061第1章事件的概率 一模型,我们可以把一些难于理解的概率形象化起来而获得感性认识,如在“下 雨”那个例子中,说乙估计事件A的概率为0.2,这听起来不甚了然和不好理解 但如乙说“我认为A发生的机会,正如在4黑球1白球中,抽出白球的机会”,则 人们就感到顿时领悟了他的意思 古典概率的计算主要基于排列组合,将在下一节举一些例子来说明.这个名 称的来由是远自16世纪以来,就有一些学者研究了使用骰子等赌具进行赌博所 引起的“机会大小”的问题,由此结晶出概率论的一些最基本的概念,如用(1.1) 式定义的概率(赌博中各种结果自应公认为等可能的)及数学期望(见下一章) 等.其中一个著名的问题是“分赌本问题”,在下面已简化了的例中,我们来看看 使用古典概率的概念,如何使这个问题达到一个公正的解决, 例1.1甲、乙两人赌技相同,各出赌注500元,约定:谁先胜三局,则谁拿 走全部1000元.现已赌了三局,甲二胜一负,而因故要中止赌博,问这1000元 要如何分,才算公平? 平均分对甲欠公平,全归甲则对乙欠公平,合理的分法是按一定比例而甲 拿大头.一种看来可以接受的方法是按已胜局数分,即甲拿2/3,乙拿1/3.仔 细分析,发现这不合理,道理如下:设想继续赌两局,则结果无非以下四种情况 之一 甲甲,甲乙,乙甲,乙乙, (1.2) 其中“甲乙”表示第一局甲胜、第二局乙胜,其余类推.把已赌过的三局与(1.2)中 这四个结果结合(即甲、乙赌完五局),我们看出:对前三个结果都是甲先胜三局 因而得1000元,只在最后一个结果才由乙得1000元,在赌技相同的条件下 (1.2)中的四个结果应有等可能性.因此,甲,乙最终获胜的可能性大小之比为 3:1.全部赌本应按这个比例分,即甲分750元,乙分250元,才算公正合理. 这个例子颇给人启发,即表面上看来简单自然的东西,经过深人一层的分析 而揭示了其不合理之处,这个例子还和重要的“数学期望”的概念相关,见第 2章 古典概率的局限性很显然:它只能用于全部试验结果为有限个,且等可能性 成立的情况.但在某些情况下,这个概念可稍稍引申到试验结果有无限多个的情 况,这就是所谓“几何概率”.举一个例子 例1.2甲、乙二人约定1点到2点之间在某处碰头,约定先到者等候10分 钟即离去,设想甲,乙二人各自随意地在1~2点之间选一个时刻到达该处,问
1.1概率是什么1007 “甲、乙二人能碰上”这个事件E的概率是多少? 以1点作原点,分钟为单位,把甲、乙到达时间x,y构成的点(x,y)标在直 角坐标系上,则图1.1中的正方形OABC内每个点都是一个可能的试验结果, 而这个正方形就是全部可能的结果之集.“甲、乙二人 各自随意地在1一2点之间选一个时刻到达该处” 语,可以理解为“这个正方形内任一点都是等可能 60 的”,按约定,只有在点(x,y)落在图中的多边形 OFGBHI内时,事件E才发生,因正方形内包含无限 多个点,古典概率定义的(1.1)式无法使用.于是,我 10 60 们把“等可能性”这个概念按本问题的特点引申一下: 正方形内同样的面积有同样的概率,全正方形的面积 图1.1 为60=3600,而容易算出上述多边形的面积为1100.按上述引申了的原则,算 出事件E的概率为P(E)=1100/3600=11/36. 这样算出的概率称为“几何概率”,因它是基于几何图形的面积、体积、长度 等而算出的.就本例而言,重要之点在于把等可能性解释或引申为“等面积,等概 率”,其他一些可用几何概率处理的问题,都需要做类似的引申.在某些较复杂的 问题中,几种引申看来都可接受,由此可算出不同的结果,这并无矛盾可言,因为 每一种不同的引申,意味着对“等可能性”的含义做不同的解释,问题在于哪一种 解释最符合你的问题的实际含义 1.1.4概率的统计定义 从实用的角度看,概率的统计定义无非是一种通过实验去估计事件概率的 方法.拿“掷骰子”这个例子来说,若骰子并非质地均匀的正方体,则投掷时各面 出现的概率不必相同,这时,“出现么”这个事件E,的概率有多大,已无法仅通 过一种理论的考虑来确定,但我们可以做实验:反复地将这个骰子投掷大量的次 数,例如n次,若在这n次投掷中么共出现m1次,则称m1/n是E,这个事件在 这n次试验(每次投掷算作一次试验)中的“频率”.概率的统计定义的要旨是 说,就拿这个频率m1/n作为事件E,的概率P(E:)的估计.这个概念的直观背 景很简单:一个事件出现的可能性大小,应由在多次重复试验中其出现的频繁程 度去刻画 一般的情况与此毫无区别,只需在上文的叙述中,把“掷骰子”改换成某个 般的试验,而把“出现么”这个事件E,改换成某个指定的事件即可,要点在于: