第一章古典概型和概率空间 例62(敏感问题调查) ·例6.2(敏感问题调查)在调査家庭暴力(或婚外恋、服用兴奋剂、吸 毒等敏感问题)所占家庭的比例p时,被调查者往往不愿回答真相,这 使得调查数据失真. 为得到实际的p同时又不侵犯个人隐私,调查人员将袋中放入比例是 P的红球和比例是q=1-p的白球 ·被调查者在袋中任取一球窥视后放回,并承诺取得红球就讲真话,取到 白球就讲假话 被调査者只需在匿名调查表中选“是”(有家庭暴力)或“否”,然后将 表放入投票箱 ·没人能知道被调查者是否讲真话和回答的是什么.如果声称有家庭暴 力的家庭比例是p1,求真正有家庭暴力的比例p 解对任选的一个家庭,用B表示回答“是”,用A表示实际“是” 利用全概率公式得到 P1=P(B)(回答“是”) =P(BJA)P(A)+ P(BLA)P(A) P(A)+90(1-P(A) (P(BA)即讲真话概率,P(BA等于讲假话概率) =ppo+ go(1-p)=go+(po -go)p 于是只要p0≠q,则 P=P(4)=-9 实际问题中,P1是未知的,需要经过调查得到假定调查了n个家庭 其中有k个家庭回答“是”,则可以用1=k/n估计P1,于是可以用 P= p1-90 估计p
26 第一章 古典概型和概率空间 例 6.2(敏感问题调查) • 例 6.2 (敏感问题调查) 在调查家庭暴力 (或婚外恋、服用兴奋剂、吸 毒等敏感问题) 所占家庭的比例 p 时, 被调查者往往不愿回答真相, 这 使得调查数据失真. • 为得到实际的 p 同时又不侵犯个人隐私, 调查人员将袋中放入比例是 p0 的红球和比例是 q0 = 1 − p0 的白球. • 被调查者在袋中任取一球窥视后放回, 并承诺取得红球就讲真话, 取到 白球就讲假话. • 被调查者只需在匿名调查表中选“是”(有家庭暴力) 或“否”,然后将 表放入投票箱. • 没人能知道被调查者是否讲真话和回答的是什么. 如果声称有家庭暴 力的家庭比例是 p1, 求真正有家庭暴力的比例 p. • 解 对任选的一个家庭, 用 B 表示回答“是”, 用 A 表示实际“是”. 利用全概率公式得到 p1 =P(B) (回答 “是”) =P(B|A)P(A) + P(B|A)P(A) =p0P(A) + q0(1 − P(A)) ( P(B|A) 即讲真话概率, P(B|A) 等于讲假话概率) =pp0 + q0(1 − p) = q0 + (p0 − q0)p. • 于是只要 p0 ̸= q0, 则 p = P(A) = p1 − q0 p0 − q0 . • 实际问题中, p1 是未知的, 需要经过调查得到. 假定调查了 n 个家庭, 其中有 k 个家庭回答“是”, 则可以用 pˆ1 = k/n 估计 p1, 于是可以用 pˆ = pˆ1 − q0 p0 − q0 估计 p
1.6全概率公式与 BAYES公式 如果袋中装有30个红球,50个白球,调查了320个家庭,其中有195 个家庭回答“是”,则 D=3/8,o=5/8, 1=195/ 195/320-5/8 6.25% 3/8-5/8 ·可以证明|Po-φo|越大,得到的结论越可靠.但是o-qo太大时,调 查方案不易让被调查者接受 例6.3(赌徒破产模型 ·例6.3(赌徒破产模型)甲有本金α元,决心再贏b元停止赌博.设 甲每局赢的概率是p=1/2,每局输贏都是一元钱,甲输光后停止赌博, 求甲输光的概率q(a). 解用A表示甲第一局赢,用Bk表示甲有本金k元时最后输光 由题意,q(0)=1,q(a+b)=0,并且 q(k)=P(BK P(A)P(BK A)+P(A)P(BkA) P(Bk+1)+P(Bk-1) qk+1)+q(k-1) ·于是有2q(k)=q(k+1)+q(k-1) 从而得到 q(k+1)-q(k)=q(k)-q(k-1)=…=q(1)-q(0)=q(1)-1 上式两边对k=n-1,n-2,…,0求和后得到 q(n)-1=n(q(1)-1) (6.3) 取n=a+b,得到 0-1=(a+b)(q(1)-1),q(1)-1=-1/(a+b
1.6 全概率公式与 BAYES 公式 27 • 如果袋中装有 30 个红球,50 个白球,调查了 320 个家庭,其中有 195 个家庭回答“是”,则 p0 = 3/8, q0 = 5/8, pˆ1 = 195/320, pˆ = 195/320 − 5/8 3/8 − 5/8 = 6.25%. • 可以证明 |p0 − q0| 越大, 得到的结论越可靠. 但是 |p0 − q0| 太大时, 调 查方案不易让被调查者接受. 例 6.3(赌徒破产模型) • 例 6.3 (赌徒破产模型) 甲有本金 a 元, 决心再赢 b 元停止赌博. 设 甲每局赢的概率是 p = 1/2, 每局输赢都是一元钱, 甲输光后停止赌博, 求甲输光的概率 q(a). • 解 用 A 表示甲第一局赢, 用 Bk 表示甲有本金 k 元时最后输光. • 由题意, q(0) = 1, q(a + b) = 0, 并且 q(k) =P(Bk) =P(A)P(Bk|A) + P(A)P(Bk|A) = 1 2 P(Bk+1) + 1 2 P(Bk−1) = 1 2 q(k + 1) + 1 2 q(k − 1). • 于是有 2q(k) = q(k + 1) + q(k − 1). • 从而得到 q(k + 1) − q(k) = q(k) − q(k − 1) = · · · = q(1) − q(0) = q(1) − 1. • 上式两边对 k = n − 1, n − 2, · · · , 0 求和后得到, q(n) − 1 = n(q(1) − 1). (6.3) • 取 n = a + b, 得到 0 − 1 = (a + b)(q(1) − 1), q(1) − 1 = −1/(a + b)
第一章古典概型和概率空间 最后由(6.3)得到 (a)=1+a(q(1)-1)=1 +66+ ·(6.4)说明,当甲的本金α有限,则贪心b越大,输光的概率越大,如果 一直赌下去(b→∞),必定输光 16.2 Bayes公式 es公式 ·定理6.,2( Bayes公式)如果事件A1,A2,…,An互不相容,Bc U=14y,则P(B)>0时,有 P(41 i)P(BI P(AB)=> P(A)(BA),Issn (6.5) 证明由条件概率公式和全概率公式得到 P(A,IB) P(A, B) P(A,)P(B A,) P(B) P(AP(B Ai 1≤j≤ 值得指出的是,分子总是分母中的一项 ·当A1,A2,…,An是完备事件组,P(B)>0时,(6.5)成立 · Bayes公式也可以推广到可列个事件的情况(见习题1.21) 最常用到的 Bayes公式是当P(B)>0, P(4|B P(A)P(BJA) P(A)P(BA)+P(A)P(BI 例64(疾病普查问题) 例6.4(疾病普査问题)一种新方法对某种特定疾病的诊断准确率是 90%(有病被正确诊断和没病被正确诊断的概率都是90%).如果群体 中这种病的发病率是0.1%,甲在身体普查中被诊断患病,问甲的确患 病的概率是多少? 解设A=甲患病,B=甲被诊断有病 根据题意,P(A)=0001 P(BA)=0.9,P(B|A)=0.1
28 第一章 古典概型和概率空间 • 最后由 (6.3) 得到: q(a) = 1 + a(q(1) − 1) = 1 − a a + b = b b + a . (6.4) • (6.4) 说明, 当甲的本金 a 有限, 则贪心 b 越大, 输光的概率越大, 如果 一直赌下去 (b → ∞), 必定输光. 1.6.2 Bayes 公式 Bayes 公式 • 定理 6.2(Bayes 公式) 如果事件 A1, A2, · · · , An 互不相容, B ⊂ ∪n j=1Aj , 则 P(B) > 0 时, 有 P(Aj |B) = P(Aj )P(B|Aj ) ∑n i=1 P(Ai)P(B|Ai) , 1 ≤ j ≤ n. (6.5) • 证明 由条件概率公式和全概率公式得到 P(Aj |B) = P(AjB) P(B) = P(Aj )P(B|Aj ) ∑n i=1 P(Ai)P(B|Ai) , 1 ≤ j ≤ n. • 值得指出的是, 分子总是分母中的一项. • 当 A1, A2, · · · , An 是完备事件组, P(B) > 0 时, (6.5) 成立. • Bayes 公式也可以推广到可列个事件的情况 (见习题 1.21). • 最常用到的 Bayes 公式是当 P(B) > 0, P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) . (6.6) 例 6.4(疾病普查问题) • 例 6.4 (疾病普查问题) 一种新方法对某种特定疾病的诊断准确率是 90%( 有病被正确诊断和没病被正确诊断的概率都是 90%). 如果群体 中这种病的发病率是 0.1% , 甲在身体普查中被诊断患病, 问甲的确患 病的概率是多少? • 解 设 A= 甲患病, B = 甲被诊断有病. • 根据题意, P(A) = 0.001, P(B|A) = 0.9, P(B|A) = 0.1
1.6全概率公式与 BAYES公式 ·于是,用公式(6.6)得到 P(A)P(BJA) P(AB)P(A)P(BIA)+P(A)P(BA) 0.001×0.9 0.001×0.9+0.999×0.1 =0.0089< 9+999 没有病的概率P(④B)=0.9911>99% 造成这个结果的原因是发病率较低和诊断的准确性不够高. 如果甲复查时又被诊断有病,则他的确有病的概率将增加到7.5%. 如果人群的发病率不变,诊断的准确率提高到99%,可以计算出 P(4|B)=9.02 例65(吸烟与肺癌问题) ·例6.5(吸烟与肺癌问题)1950年某地区曾对50-60岁的男性公民 进行调查.肺癌病人中吸烟的比例是99.7%,无肺癌人中吸烟的比例是 95.8%.如果整个人群的发病率是p=10-4,求吸烟人群中的肺癌发病 率和不吸烟人群中的肺癌发病率 解引入A=有肺癌,B=吸烟,则 P P(BA)=9979 P(BA)=958% 利用公式(6.6)得到: P(AB) P(A)P(BJA) P(A)(B A)+ P(A)P(BJA) 10-4×99.7% 7%+(1-10-4)×9 1.0407×10-4 P(AB)= P(AP(BA) P(A)P(BLA)+ P(A)P(B A) 10-4×(1-997%)+(1-10-)×(1-95.8%)
1.6 全概率公式与 BAYES 公式 29 • 于是, 用公式 (6.6) 得到 P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) = 0.001 × 0.9 0.001 × 0.9 + 0.999 × 0.1 = 9 9 + 999 = 0.0089 < 1%. • 没有病的概率 P(A|B) = 0.9911 > 99%. • 造成这个结果的原因是发病率较低和诊断的准确性不够高. • 如果甲复查时又被诊断有病, 则他的确有病的概率将增加到 7.5%. • 如果人群的发病率不变, 诊断的准确率提高到 99%, 可以计算出 P(A|B) = 9.02%. 例 6.5(吸烟与肺癌问题) • 例 6.5 (吸烟与肺癌问题) 1950 年某地区曾对 50-60 岁的男性公民 进行调查. 肺癌病人中吸烟的比例是 99.7%, 无肺癌人中吸烟的比例是 95.8%. 如果整个人群的发病率是 p = 10−4 , 求吸烟人群中的肺癌发病 率和不吸烟人群中的肺癌发病率. • 解 引入 A = 有肺癌, B = 吸烟, 则 P(A) =10−4 , P(B|A) =99.7%, P(B|A) =95.8%. • 利用公式 (6.6) 得到: P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) = 10−4 × 99.7% 10−4 × 99.7% + (1 − 10−4) × 95.8% =1.0407 × 10−4 . P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) = 10−4 × (1 − 99.7%) 10−4 × (1 − 99.7%) + (1 − 10−4) × (1 − 95.8%) =7.1438 × 10−6
第一章古典概型和概率空间 于是 吸烟人群的发病率=P(AB)=14.57 不吸烟人群的发病率P(A|B) 结论:吸烟人群的肺癌发病率是不吸烟人群的肺癌发病率的14.57倍. 例66(肇事车判定) 例6.6某城市夏利牌出租车占85%,富康牌出租车占15%.这两种 出租车都是红色,富康出租车略大一些,每辆车肇事的概率相同 ·在一次出租车的交通肇事逃逸案件中,有证人指证富康车肇事.为了确 定是否富康车肇事,在肇事地点和相似的能见度下警方对证人辨别出 租车的能力进行了测验,发现证人正确识别富康车的概率是90%,正确 识别夏利车的概率是80% 如果证人没有撒谎,求富康车肇事的概率 解:用A表示证人看见富康车肇事,用B表示富康车肇事,则B表 示夏利车肇事,并且 P(B)=0.15,P(A|B)=0.9,P(AB)=1-0.8 ·要求的概率是P(B|A).用 Bayes公式得到 P(AB)P(B) P(BA) P(AJB)P(B)+ P(AB)P(B) 0.9×0.15 0.9×0.15+(1-0.8)×0.85 =44.26% 这个概率看起来很小,但是在没有证人的情况下,富康车肇事的概率更 小,是15% 17概率与频率 概率与频率 ·古典概型只对等可能的情况定义了概率,为了能够描述更复杂的试验, 很多学者使用概率的频率定义
30 第一章 古典概型和概率空间 • 于是, 吸烟人群的发病率 不吸烟人群的发病率 = P(A|B) P(A|B) = 14.57. • 结论: 吸烟人群的肺癌发病率是不吸烟人群的肺癌发病率的 14.57 倍. 例 6.6(肇事车判定) • 例 6.6 某城市夏利牌出租车占 85%, 富康牌出租车占 15%. 这两种 出租车都是红色, 富康出租车略大一些, 每辆车肇事的概率相同. • 在一次出租车的交通肇事逃逸案件中, 有证人指证富康车肇事. 为了确 定是否富康车肇事, 在肇事地点和相似的能见度下警方对证人辨别出 租车的能力进行了测验, 发现证人正确识别富康车的概率是 90%, 正确 识别夏利车的概率是 80%. • 如果证人没有撒谎, 求富康车肇事的概率. • 解: 用 A 表示证人看见富康车肇事, 用 B 表示富康车肇事, 则 B 表 示夏利车肇事, 并且 • P(B) = 0.15, P(A|B) = 0.9, P(A|B) = 1 − 0.8. • 要求的概率是 P(B|A). 用 Bayes 公式得到 P(B|A) = P(A|B)P(B) P(A|B)P(B) + P(A|B)P(B) = 0.9 × 0.15 0.9 × 0.15 + (1 − 0.8) × 0.85 =44.26%. • 这个概率看起来很小, 但是在没有证人的情况下, 富康车肇事的概率更 小, 是 15%. 1.7 概率与频率 概率与频率 • 古典概型只对等可能的情况定义了概率, 为了能够描述更复杂的试验, 很多学者使用概率的频率定义