26第一章古典概型和概率空间例6.2(敏感问题调查)。例6.2(敏感问题调查)在调查家庭暴力(或婚外恋、服用兴奋剂、吸毒等敏感问题)所占家庭的比例p时,被调查者往往不愿回答真相,这使得调查数据失真·为得到实际的p同时又不侵犯个人隐私,调查人员将袋中放入比例是Po的红球和比例是qo=1-po的白球.·被调查者在袋中任取一球窥视后放回,并承诺取得红球就讲真话,取到白球就讲假话·被调查者只需在匿名调查表中选“是”(有家庭暴力或“否”,然后将表放入投票箱.·没人能知道被调查者是否讲真话和回答的是什么如果声称有家庭暴力的家庭比例是P1,求真正有家庭暴力的比例p.·解对任选的一个家庭,用B表示回答“是”,用A表示实际“是”利用全概率公式得到P1=P(B)(回答“是")=P(B|A)P(A)+P(B|A)P(A)=poP(A) + qo(1 - P(A)(P(BA)即讲真话概率,PBA)等于讲假话概率)=ppo+ qo(1 -p)= qo+ (po-qo)p·于是只要po≠Qo,则p= P(A) = P1 - %po -qo·实际问题中,P1是未知的,需要经过调查得到.假定调查了n个家庭,其中有k个家庭回答“是”,则可以用pi=k/n估计pi,于是可以用p1 - qoP=po- qo估计p
26 第一章 古典概型和概率空间 例 6.2(敏感问题调查) • 例 6.2 (敏感问题调查) 在调查家庭暴力 (或婚外恋、服用兴奋剂、吸 毒等敏感问题) 所占家庭的比例 p 时, 被调查者往往不愿回答真相, 这 使得调查数据失真. • 为得到实际的 p 同时又不侵犯个人隐私, 调查人员将袋中放入比例是 p0 的红球和比例是 q0 = 1 − p0 的白球. • 被调查者在袋中任取一球窥视后放回, 并承诺取得红球就讲真话, 取到 白球就讲假话. • 被调查者只需在匿名调查表中选“是”(有家庭暴力) 或“否”,然后将 表放入投票箱. • 没人能知道被调查者是否讲真话和回答的是什么. 如果声称有家庭暴 力的家庭比例是 p1, 求真正有家庭暴力的比例 p. • 解 对任选的一个家庭, 用 B 表示回答“是”, 用 A 表示实际“是”. 利用全概率公式得到 p1 =P(B) (回答 “是”) =P(B|A)P(A) + P(B|A)P(A) =p0P(A) + q0(1 − P(A)) ( P(B|A) 即讲真话概率, P(B|A) 等于讲假话概率) =pp0 + q0(1 − p) = q0 + (p0 − q0)p. • 于是只要 p0 ̸= q0, 则 p = P(A) = p1 − q0 p0 − q0 . • 实际问题中, p1 是未知的, 需要经过调查得到. 假定调查了 n 个家庭, 其中有 k 个家庭回答“是”, 则可以用 pˆ1 = k/n 估计 p1, 于是可以用 pˆ = pˆ1 − q0 p0 − q0 估计 p
1.6全概率公式与BAYES公式27。如果袋中装有30个红球,50个白球,调查了320个家庭,其中有195个家庭回答“是”,则Po=3/8,qo=5/8,pi=195/320,195/320-5/8=6.25%p=3/8-5/8·可以证明|po一qol越大,得到的结论越可靠。但是[Po一qol太大时,调查方案不易让被调查者接受,例6.3(赌徒破产模型):例6.3(赌徒破产模型)甲有本金α元,决心再赢6元停止赌博.设甲每局赢的概率是p=1/2,每局输赢都是一元钱,甲输光后停止赌博,求甲输光的概率q(a)·解用A表示甲第一局赢,用B表示甲有本金k元时最后输光.由题意,g(0)=1, g(α+b)=0,并且q(k) =P(Bk)=P(A)P(B|A) + P(A)P(B|A)1.= P(Bk+1) +P(Bk-1)2R12(# + 1)+ g( - 1).于是有2g(k)=q(k+1)+q(k-1)·从而得到q(k + 1) - q(k) = q(k) - q(k - 1) = = q(1) - q(0) = q(1) - 1.上式两边对k=n-1,n-2..0求和后得到,(6.3)q(n) - 1 = n(g(1) - 1)..取n=a+b,得到0 - 1 = (a + b)(g(1) - 1), q(1) - 1 = -1/(a + b)
1.6 全概率公式与 BAYES 公式 27 • 如果袋中装有 30 个红球,50 个白球,调查了 320 个家庭,其中有 195 个家庭回答“是”,则 p0 = 3/8, q0 = 5/8, pˆ1 = 195/320, pˆ = 195/320 − 5/8 3/8 − 5/8 = 6.25%. • 可以证明 |p0 − q0| 越大, 得到的结论越可靠. 但是 |p0 − q0| 太大时, 调 查方案不易让被调查者接受. 例 6.3(赌徒破产模型) • 例 6.3 (赌徒破产模型) 甲有本金 a 元, 决心再赢 b 元停止赌博. 设 甲每局赢的概率是 p = 1/2, 每局输赢都是一元钱, 甲输光后停止赌博, 求甲输光的概率 q(a). • 解 用 A 表示甲第一局赢, 用 Bk 表示甲有本金 k 元时最后输光. • 由题意, q(0) = 1, q(a + b) = 0, 并且 q(k) =P(Bk) =P(A)P(Bk|A) + P(A)P(Bk|A) = 1 2 P(Bk+1) + 1 2 P(Bk−1) = 1 2 q(k + 1) + 1 2 q(k − 1). • 于是有 2q(k) = q(k + 1) + q(k − 1). • 从而得到 q(k + 1) − q(k) = q(k) − q(k − 1) = · · · = q(1) − q(0) = q(1) − 1. • 上式两边对 k = n − 1, n − 2, · · · , 0 求和后得到, q(n) − 1 = n(q(1) − 1). (6.3) • 取 n = a + b, 得到 0 − 1 = (a + b)(q(1) − 1), q(1) − 1 = −1/(a + b)
28第一章古典概型和概率空间·最后由(6.3)得到:baq(a) = 1 +a(g(1) - 1) = 1 -(6.4)a+b=b+a·(6.4)说明,当甲的本金a有限,则贪心b越大,输光的概率越大,如果一直赌下去(6一→80),必定输光1.6.2Bayes公式Bayes公式·定理6.2(Bayes公式)如果事件A1,A2,An互不相容,BCU'=A,则P(B)>0时,有P(A,)P(B|A,)(6.5)P(A;|B) =l≤j<n.E-I P(A.)P(BIA) 由条件概率公式和全概率公式得到·证明P(A,B)P(A)P(B|A))P(A,(B) =1≤j≤n.-P(A.)P(BA.)P(B)·值得指出的是,分子总是分母中的一项·当A1,A2,..·,An是完备事件组,P(B)>0时,(6.5)成立.:Bayes公式也可以推广到可列个事件的情况(见习题1.21)·最常用到的Bayes公式是当P(B)>0,P(A)P(B|A)(6.6)P(A|B) = :P(A)P(B|A) + P(A)P(B|A)例6.4(疾病普查问题)·例6.4(疾病普查问题)一种新方法对某种特定疾病的诊断准确率是90%(有病被正确诊断和没病被正确诊断的概率都是90%).如果群体中这种病的发病率是0.1%,甲在身体普查中被诊断患病,问甲的确患病的概率是多少?·解设A=甲患病,B=甲被诊断有病·根据题意,P(A)=0.001P(B|A) = 0.9, P(BA) = 0.1
28 第一章 古典概型和概率空间 • 最后由 (6.3) 得到: q(a) = 1 + a(q(1) − 1) = 1 − a a + b = b b + a . (6.4) • (6.4) 说明, 当甲的本金 a 有限, 则贪心 b 越大, 输光的概率越大, 如果 一直赌下去 (b → ∞), 必定输光. 1.6.2 Bayes 公式 Bayes 公式 • 定理 6.2(Bayes 公式) 如果事件 A1, A2, · · · , An 互不相容, B ⊂ ∪n j=1Aj , 则 P(B) > 0 时, 有 P(Aj |B) = P(Aj )P(B|Aj ) ∑n i=1 P(Ai)P(B|Ai) , 1 ≤ j ≤ n. (6.5) • 证明 由条件概率公式和全概率公式得到 P(Aj |B) = P(AjB) P(B) = P(Aj )P(B|Aj ) ∑n i=1 P(Ai)P(B|Ai) , 1 ≤ j ≤ n. • 值得指出的是, 分子总是分母中的一项. • 当 A1, A2, · · · , An 是完备事件组, P(B) > 0 时, (6.5) 成立. • Bayes 公式也可以推广到可列个事件的情况 (见习题 1.21). • 最常用到的 Bayes 公式是当 P(B) > 0, P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) . (6.6) 例 6.4(疾病普查问题) • 例 6.4 (疾病普查问题) 一种新方法对某种特定疾病的诊断准确率是 90%( 有病被正确诊断和没病被正确诊断的概率都是 90%). 如果群体 中这种病的发病率是 0.1% , 甲在身体普查中被诊断患病, 问甲的确患 病的概率是多少? • 解 设 A= 甲患病, B = 甲被诊断有病. • 根据题意, P(A) = 0.001, P(B|A) = 0.9, P(B|A) = 0.1
291.6全概率公式与BAYES公式·于是,用公式(6.6)得到P(A)P(BA)P(A|B) =P(A)P(B|A) + P(A)P(B|A)0.001×0.90.001×0.9+0.999×0.19=0.0089<1%.9+999:没有病的概率P(A|B)=0.9911>99%。造成这个结果的原因是发病率较低和诊断的准确性不够高·如果甲复查时又被诊断有病,则他的确有病的概率将增加到7.5%.·如果人群的发病率不变,诊断的准确率提高到99%,可以计算出P(A|B) =9.02%.例6.5(吸烟与肺癌问题)·例6.5(吸烟与肺癌问题)1950年某地区曾对50-60岁的男性公民进行调查.肺癌病人中吸烟的比例是99.7%,无肺癌人中吸烟的比例是95.8%.如果整个人群的发病率是p=10-4,求吸烟人群中的肺癌发病率和不吸烟人群中的肺癌发病率,·解引入A=有肺癌,B=吸烟,则P(A) =10-4,P(B|A)=99.7%,P(B|A)=95.8%.·利用公式(6.6)得到:P(A)P(B|A)P(A|B) =P(A)P(B|A) + P(A)P(B|A)10-4 × 99.7%104 × 99.7% + (1 104) × 95.8%=1.0407×10-4P(A)P(B|A)P(A|B) =P(A)P(B|A) + P(A)P(B|A)10-4× (1-99.7%)10-4 × (1 99.7%) + (1 104) × (1 95.8%)=7.1438×10-6
1.6 全概率公式与 BAYES 公式 29 • 于是, 用公式 (6.6) 得到 P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) = 0.001 × 0.9 0.001 × 0.9 + 0.999 × 0.1 = 9 9 + 999 = 0.0089 < 1%. • 没有病的概率 P(A|B) = 0.9911 > 99%. • 造成这个结果的原因是发病率较低和诊断的准确性不够高. • 如果甲复查时又被诊断有病, 则他的确有病的概率将增加到 7.5%. • 如果人群的发病率不变, 诊断的准确率提高到 99%, 可以计算出 P(A|B) = 9.02%. 例 6.5(吸烟与肺癌问题) • 例 6.5 (吸烟与肺癌问题) 1950 年某地区曾对 50-60 岁的男性公民 进行调查. 肺癌病人中吸烟的比例是 99.7%, 无肺癌人中吸烟的比例是 95.8%. 如果整个人群的发病率是 p = 10−4 , 求吸烟人群中的肺癌发病 率和不吸烟人群中的肺癌发病率. • 解 引入 A = 有肺癌, B = 吸烟, 则 P(A) =10−4 , P(B|A) =99.7%, P(B|A) =95.8%. • 利用公式 (6.6) 得到: P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) = 10−4 × 99.7% 10−4 × 99.7% + (1 − 10−4) × 95.8% =1.0407 × 10−4 . P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(A)P(B|A) = 10−4 × (1 − 99.7%) 10−4 × (1 − 99.7%) + (1 − 10−4) × (1 − 95.8%) =7.1438 × 10−6
30第一章古典概型和概率空间·于是,吸烟人群的发病率P(A|B)= 14.57.不吸烟人群的发病率P(A|B)·结论:吸烟人群的肺癌发病率是不吸烟人群的肺癌发病率的14.57倍例6.6(肇事车判定)·例6.6某城市夏利牌出租车占85%,富康牌出租车占15%.这两种出租车都是红色,富康出租车略大一些,每辆车肇事的概率相同·在一次出租车的交通肇事逃逸案件中,有证人指证富康车肇事,为了确定是否富康车肇事,在肇事地点和相似的能见度下警方对证人辨别出租车的能力进行了测验,发现证人正确识别富康车的概率是90%,正确识别夏利车的概率是80%·如果证人没有撒谎,求富康车肇事的概率·解:用A表示证人看见富康车肇事,用B表示富康车肇事,则B表示夏利车肇事,并且.P(B) = 0.15, P(A|B) = 0.9, P(A|B) = 1 - 0.8要求的概率是P(BA).用Bayes公式得到P(A|B)P(B)P(BIA) =P(A|B)P(B) + P(AB)P(B)0.9×0.150.9×0.15+(10.8)×0.85=44.26%·这个概率看起来很小,但是在没有证人的情况下,富康车肇事的概率更小,是15%1.7概率与频率概率与频率·古典概型只对等可能的情况定义了概率,为了能够描述更复杂的试验,很多学者使用概率的频率定义
30 第一章 古典概型和概率空间 • 于是, 吸烟人群的发病率 不吸烟人群的发病率 = P(A|B) P(A|B) = 14.57. • 结论: 吸烟人群的肺癌发病率是不吸烟人群的肺癌发病率的 14.57 倍. 例 6.6(肇事车判定) • 例 6.6 某城市夏利牌出租车占 85%, 富康牌出租车占 15%. 这两种 出租车都是红色, 富康出租车略大一些, 每辆车肇事的概率相同. • 在一次出租车的交通肇事逃逸案件中, 有证人指证富康车肇事. 为了确 定是否富康车肇事, 在肇事地点和相似的能见度下警方对证人辨别出 租车的能力进行了测验, 发现证人正确识别富康车的概率是 90%, 正确 识别夏利车的概率是 80%. • 如果证人没有撒谎, 求富康车肇事的概率. • 解: 用 A 表示证人看见富康车肇事, 用 B 表示富康车肇事, 则 B 表 示夏利车肇事, 并且 • P(B) = 0.15, P(A|B) = 0.9, P(A|B) = 1 − 0.8. • 要求的概率是 P(B|A). 用 Bayes 公式得到 P(B|A) = P(A|B)P(B) P(A|B)P(B) + P(A|B)P(B) = 0.9 × 0.15 0.9 × 0.15 + (1 − 0.8) × 0.85 =44.26%. • 这个概率看起来很小, 但是在没有证人的情况下, 富康车肇事的概率更 小, 是 15%. 1.7 概率与频率 概率与频率 • 古典概型只对等可能的情况定义了概率, 为了能够描述更复杂的试验, 很多学者使用概率的频率定义