所以 P(X=k 穆德和格雷比尔著的《统计学导论》给出了 Poisson分布的如下推导 假定体积为V的液体包含有一个大数目N的微生物.再假定微生物没有群居的本能, 它们能够在液体的任何部分出现,且在体积相等的部分出现的机会相同现在我们取体 积为D的微量液体在显微镜下观察,问在这微量液体中将发现α个微生物的概率是什么? 我们假定V远远大于D.由于假定了这些微生物是以一致的概率在液体中到处散布,因 此任何一个微生物在D中出现的概率都是D/V.再由于假定了微生物没有群居的本能, 所以一个微生物在D中的出现,不会影响另一个微生物在D中的出现与否.因此微生物 中有x个在D中出现的概率就是 1 (22.5) 在这里我们还假定微生物是如此之小,拥挤的问题可以忽略不考虑,即N个微生物所占 据的部分对于体积D来说是微不足道 在(2.25)中令V和N趋向于无穷,且微生物的密度N/V=d保持常数.将(225)式改 写成如下形式 N(N-1)(N-2)(N-x+1)/ND ND rInr (1-)(1-3…)(1-)(D)2(1-) 当N变成无限时其极限为 e-D(dd)/a 令Dd=A,则(2.2.6)和(2.2.4)的形式相同.这一推导过程还证明了A是x的平均数,因为所 考察的一部分体积D乘以整个的密度d就给出了在D中所预计的平均数目 当N很大,p很小且Np趋于一个极限时, Poisson分布是二项分布的一个很好的近似 而在N未知时, Poisson分布更显得有用.我们有下面的定理 定理2.2.1.在m重 Bernoulli试验中,以n代表事件A在试验中出现的概率,它与试验总 数n有关.如果mpn→A,则当n→∞时, 4(1-p2n (227) 17
¤± X∞ k=0 P(X = k) = 1. ;ÚX'Í5ÚOÆØ6Ñ Poisson©ÙXeí. b½NÈV N¹kê8N)Ô. 2b½)Ôvk+ØU, §U 3N?ÛÜ©Ñy§ 3NÈÜ©ÑyŬÓ. y3·N ÈDþN3wºe* §¯3ùþN¥òuyx)ÔVÇ´oº ·b½V uD. dub½ ù )Ô´±VÇ3N¥?ÑÙ§Ï d?Û)Ô3D¥ÑyVÇÑ´D/V . 2dub½ )Ôvk+ØU§ ¤±)Ô3D¥Ñy§Ø¬K,)Ô3D¥ÑyÄ. Ïd)Ô ¥kx3D¥ÑyVÇÒ´ N x D V x 1 − D V N−x . (2.2.5) 3ùp·b½)Ô´Xd, P@¯K±ÑØÄ, =N)Ô¤Ó âÜ©éuNÈD5`´Øv. 3(2.2.5)¥-V ÚNªuá, )ÔÝN/V = d±~ê. ò(2.2.5)ªU ¤Xe/ªµ N(N − 1)(N − 2)...(N − x + 1) x!Nx ND V x 1 − ND NV N−x = 1 − 1 N 1 − 2 N ... 1 − x−1 N (Dd) x 1 − Dd N N−x x! . NC¤ÃÙ4 e −Dd(Dd) x /x! (2.2.6) -Dd = λ§K(2.2.6)Ú(2.2.4)/ªÓ. ùíL§y² λ´x²þê§Ï¤ Ü©NÈD¦±ÝdÒÑ 3D¥¤ýO²þê8. Né§pé N pªu4§Poisson©Ù´©ÙéÐCq. 3N§Poisson©Ùwk^. ·ke¡½n. ½n 2.2.1. 3nBernoulliÁ¥, ±pnL¯A3Á¥ÑyVÇ, §Áo ênk'. XJnpn → λ, Kn → ∞, n k p k n (1 − pn) n−k → λ k k! e −λ . (2.2.7) 17
例221.现在需要100个符合规格的元件从市场上买的该元件有废品率001.考虑到有 废品存在,我们准备买100+a个元件使得从中可以挑出100个符合规格的元件.我们要求 在这100+a个元件中至少有100个符合规格的元件的概率不小于0.95.问a至少要多大? 解:令 A={在100a个元件中至少有100个符合规格的元件} 假定各元件是否合格是独立的以X记在100+a个元件中的废品数.则x服从n=100+a 和p=0.01的二项分布,且 P(4)=∑ 100+a (0.01)(0.9 100+a-i 上式中的概率很难计算.由于100+a较大而001较小,且(100+a)(0.01)=1+0.01a≈1, 我们以入=1的Poso分布来近似上述概率.因而 当a=0,1,2,3时,上式右边分别为0.368,0.736,0.920和0.981.故取a=3已够了 224离散的均匀分布 设随机变量x取值a1,a2,…,an,且有 P(X=ak)=-,k=1 (228) 则称X服从离散的均匀分布 可以看出,离散的均匀分布正是古典概型的抽象 §23连续型随机变量 离散随机变量只取有限个或可数无限个值,而连续型随机变量取不可数个值.这就 决定了不能用描述离散型随机变量的办法来刻划连续型随机变量. 考虑一个例子.假定步枪射手瞄准靶子在固定的位置进行一系列的射击.令X是命 中点与过靶心垂线的水平偏离值,设X取值-5cm,5cmX是一个连续随机变量 为了计算x落在某区间的概率,将5,5分为长为1厘米的小区间.对于每个小区间, 以落在这个小区间的弹孔数除以弹孔总数得到落在这个区间的弹孔的相对频数.设总 弹孔数为100.我们得到下表
~ 2.2.1. y3I100ÎÜ5. l½|þïTk¢¬Ç0.01. Äk ¢¬3, ·Oï100 +a¦l¥±]Ñ100ÎÜ5. ·¦ 3ù100 + a¥k100ÎÜ5VÇØu0.95. ¯aõ? ): - A = {3100 + a¥k100ÎÜ5}. b½´ÄÜ´Õá. ±XP3 100+a ¥¢¬ê. KXÑl n = 100+a Ú p = 0.01 ©Ù, P(A) = Xa i=1 100 + a i (0.01)i (0.99)100+a−i . þª¥VÇéJO. du 100 +a 0.01 , (100 +a)(0.01) = 1 + 0.01a ≈ 1, ·±λ = 1Poisson©Ù5CqþãVÇ. Ï P(A) = Xa i=1 e −1 /i!. a = 0, 1, 2, 3, þªm>©O 0.368, 0.736, 0.920 Ú 0.981. a = 3 ® . §2.2.4 lÑþ!©Ù ÅCþXa1, a2, ..., an, k P(X = ak) = 1 n , k = 1, ..., n. (2.2.8) K¡XÑllÑþ!©Ù. ±wÑ, lÑþ!©Ù´;V.Ä. §2.3 ëY.ÅCþ lÑÅCþk½êç ëY.ÅCþØê. ùÒ û½ ØU^£ãlÑ.ÅCþ{5yëY.ÅCþ. Ä~f. b½ÚläOqf3½ ?1XÂ. -X´· ¥:Lq%RY² l§X[−5cm, 5cm]. X´ëYÅCþ. OXá3,«mVǧò[−5, 5]©1f«m. éuz«m§ ±á3ù«mêØ±oêá3ù«méªê. o ê100. ·eLµ 18
区间弹孔数相对频数 1 0.01 -3,-216 0.13 24 0.24 [1 0.16 2,3 7 0.07 4,5 0.02 上表可以用下图来表示 图231弹孔位点分布图 我们注意每个矩形的底等于1,高为该矩形的区间所对应的相对频数,所以面积为 相对频数全部矩形的面积是1.对于[-55的任一子区间,我们可以根据上图估计弹孔 落在该子区间的概率.例如要估计0<X<2的概率,只要把区间中的两个矩形面积加 起来,结果得到043.再譬如说要估计-0.25<X≤1.5中的概率,我们应当计算该区间
«m ê éªê [−5, −4] 1 0.01 [−4, −3] 1 0.01 [−3, −2] 6 0.06 [−2, −1] 13 0.13 [−1, 0] 24 0.24 [0, 1] 27 0.27 [1, 2] 16 0.16 [2, 3] 7 0.07 [3, 4] 3 0.03 [4, 5] 2 0.02 þL±^eã5L«µ ã 2.3.1 :©Ùã X Density −4 −2 0 2 4 0.00 0.05 0.10 0.15 0.20 0.25 −5 −4 −3 −2 −1 0 1 2 3 4 5 ·5¿zÝ/.u1§pTÝ/«m¤éAéªê§¤±¡È éªê. ÜÝ/¡È´1. éu[−5, 5]?f«m§·±âþãO á3Tf«mVÇ. ~XO0 < X ≤ 2Vǧr«m¥üÝ/¡È\ å5§(J0.43. 2X`O−0.25 < X ≤ 1.5¥Vǧ·AOT«m 19
上的面积,结果得到 0.06+0.27+0.08=0.41 如果第二批的100颗子弹射在靶子上,我们就将获得另一个经验分布.它与第一个 经验分布多半是不同的,尽管它们的外表可能相似.如果把观察到的相对频数看作为某 “真”概率的估计,则我们假定有一个函数,它将给出任何区间中的精确概率.这些概 率由曲线下的面积给出.由此我们得到如下定义 定义2.3.1.X称为连续型随机变量,如果存在一个函数∫,叫做X的概率密度函数,它 满足下面的条件: 1.对所有的-∞<x<+∞,有f(x)≥0; 2.8f(x)dr=1; 3对于任意的-∞<a≤b<+∞,有P(a≤X≤b)=f(x)d 注231.对于任意的-∞<x<+∞,有P(X=x)=/f(u)u=0 注2.3.2.如果∫只取某有限区间a,列的值,令 f(x)= f(x)∈[ab, 其它 则∫是定义在(-∞,+∞)上的密度函数,且∫(x)和f(x)给出相同的概率分布 注2.3.3.假设有总共一个单位的质量连续地分布在a≤x≤b上.那么∫(x)表示在点x的 质量密度且f(x)d表示在区间,上的全部质量 由于连续随机变量的概率是用积分给出的,我们可以直接处理密度的积分而不是密 度本身 定义2.3.2.设X为一连续型随机变量.则 f(u)dua,-∞<x<+∞ (23.1 称为X的(累积)分布函数
þ¡È§(Jµ 0.06 + 0.27 + 0.08 = 0.41. XJ11100f3qfþ§·Òò¼,²©Ù. §1 ²©Ùõ´ØÓ§¦+§ LUq. XJr* éªêw, “ý”VÇO§K·b½k¼ê§§òÑ?Û«m¥°(VÇ. ù V Çde¡ÈÑ. dd·Xe½Âµ ½Â 2.3.1. X¡ëY.ÅCþ§XJ3¼êf§XVÇݼꧧ ÷ve¡^µ 1. é¤k−∞ < x < +∞, kf(x) ≥ 0; 2. ´ +∞ −∞ f(x)dx = 1; 3. éu?¿−∞ < a ≤ b < +∞, kP(a ≤ X ≤ b) = ´ b a f(x)dx. 5 2.3.1. éu?¿−∞ < x < +∞, kP(X = x) = ´ x x f(u)du = 0. 5 2.3.2. XJf,k«m[a, b], - ˜f(x) = ( f(x) x ∈ [a, b], 0 Ù§. K ˜f´½Â3(−∞, +∞)þݼê, f(x)Ú ˜f(x)ÑÓVÇ©Ù. 5 2.3.3. bkoü þëY/©Ù3a ≤ x ≤ bþ. @of(x)L«3:x þÝ ´ d c f(x)dxL«3«m[c, d]þÜþ. duëYÅCþVÇ´^È©Ñ, ·±?nÝÈ© Ø´ Ý. ½Â 2.3.2. XëY.ÅCþ. K F(x) = ˆ x −∞ f(u)du, −∞ < x < +∞ (2.3.1) ¡X(\È)©Ù¼ê. 20
注2.3.4.F(x)表示的是随机变量的数值小于或等于x的概率,即 F(x)=P(X≤x)-∞<x<+∞. (23.2) 由式(2.3.9)定义的F为X的(累积)分布函数的一般定义.它适用于任意的随机变量.设X为 离散型随机变量,它以概率{,…phn,}取值{a1,…an,…}.则 分布函数F具有下列性质 (1)F是非减的函数; F(x)=0; +∞F(x)=1 对于连续随机变量,如果F(x)在点x的导数存在,则 f(x)=F'(x) 连续随机变量的分布函数的图象如下图所示 下面我们介绍常见的连续型分布.它们包括正态分布,指数分布和均匀分布 §231正态分布 如果一个随机变量X具有概率密度函数 f(r) (x-p)2 p 0<x<+∞ (23.3) 其中-∞<μ<+∞,a2>0,则称X为一正态随机变量,记为X~N(μ4,a2).以(233)为 密度的分布称为参数为和2的正态分布 具有参数=0,σ=1的正态分布称为标准正态分布.用(x)和a(x)表示标准正态分 布N(0,1)的分布函数和密度函数 从图(2.3.3)可以看出,正态分布的密度函数是以x=p为对称轴的对称函数.p称为 位置参数.密度函数在x=p处达到最大值,在(-∞,1)和(,+∞)内严格单调.同时我们 看到,σ的大小决定了密度函数的陡峭程度.通常称σ为正态分布的形状参数 以F(x)记正态分布N(,a2)的概率分布函数,则恒有F(x)=(2).所以任一正态 分布的概率分布函数都可通过标准正态分布的分布函数计算出来
5 2.3.4. F(x)L«´ÅCþêu½uxVÇ, = F(x) = P(X ≤ x) − ∞ < x < +∞. (2.3.2) dª(2.3.2)½ÂFX(\È)©Ù¼ê½Â. §·^u?¿ÅCþ. X lÑ.ÅCþ, §±VÇ{p1, ..., pn, ..}{a1, ..., an, ...}. K F(x) = X ai≤x pi . ©Ù¼êFäke5: (1) F´~¼ê; (2) limx→−∞ F(x) = 0; (3) limx→+∞ F(x) = 1. éuëYÅCþ, XJF(x)3:xê3, K f(x) = F 0 (x). ëYÅCþ©Ù¼êãXe㤫. e¡·0~ëY.©Ù. §)©Ù, ê©ÙÚþ!©Ù. §2.3.1 ©Ù XJÅCþXäkVÇݼê f(x) = 1 √ 2πσ exp − (x − µ) 2 2σ 2 , −∞ < x < +∞, (2.3.3) Ù¥−∞ < µ < +∞, σ2 > 0§K¡XÅCþ§PX ∼ N(µ, σ2 ). ±(2.3.3) ݩ١ëêµÚσ 2©Ù. äkëêµ = 0, σ = 1©Ù¡IO©Ù. ^Φ(x)Úφ(x)L«IO© ÙN(0, 1)©Ù¼êÚݼê. lã(2.3.3)±wÑ, ©Ùݼ괱x = µé¡¶é¡¼ê. µ¡ ëê. ݼê3x = µ?§3(−∞, µ)Ú(µ, +∞)SîüN. Ó· w, σû½ ݼêͧÝ. Ï~¡σ©Ù/Gëê. ±F(x)P©ÙN(µ, σ2 )Vǩټê§KðkF(x) = Φ( x−µ σ ). ¤±? ©ÙVǩټêÑÏLIO©Ù©Ù¼êOÑ5. 21