口以及 P(X (0,1)= J e-d =(1 -et)5随机向量定义5.1.X1,·,X,都是(2,F,P)上的rv.,则称文=(X1.·,Xn)为一个n维随机向量,n元函数F(ri,..., an) =P((w |Xi(w) ≤ri)n...n(w / Xn(w) ≤an))= P(Xi ≤ai,*., Xn ≤rn)称为×的联合分布函数(Jointdistributionfunction)引理5.1.当n=2时,(X,Y)的联合分布函数F(r,y)性质:(i) F(r,y)分别关于,y单调(i)F(r,y)分别关于r,y右连续(ii) lim F(r,y) =0= lim F(r,), a- lim tF(c,y) = 1.(iv) V ai < 2, y1 <y2, F(2, y2) - F(1,y2) - F(2, y1) + F(r1, y1) ≥ 0.证明.(i)记An=X≤n)n[Y≤n) 2.则lim F(n,n) = lim P(An) = P (lim An) = 1最后由F(r,y)关于(r,y)的单调性得到_lim.F(a,y)=1.(iv)P(T1<X≤ 2, 1 <Y≤y2)=P(X ≤ ±2, 91 <Y ≤y2) - P(X≤1, 91 <Y≤ 92)=P(X< 2, Y≤y2) - P(X≤ 22, Y≤y1) - [P(X ≤1,Y≤y2) - P(X ≤a1, Y≤ y1)]=F(2,92)-F(2,91)-F(r1,92)+F(1,91)≥0口评论.注意 (iv)→(i)r+y≥o但是(i)(iv).反例F(c,y)满足(i)(ii)(ii),但不满足(iv)0r+y<o定义5.2.对(X,Y),F(r,y)是联合分布函数,称分量X,Y的分布函数Fx(c),Fy(y)为边缘分布函数因为 F(r,y)=P(X≤,Y≤y),因此Fx(r) = lim F(r,y), Fy(y) = lim F(r,y)→+2
以及 P(X ∈ (0, 1)) = ∫ 1 0 1 2b e − x b dx = 1 2 (1 − e − 1 b ). 5 随机向量 定义 5.1. X1, · · · , Xn 都是 (Ω, F, P) 上的 r.v., 则称 −→X = (X1, · · · , Xn) 为一个 n 维随机向 量,n 元函数 F(x1, · · · , xn) = P({ω | X1(ω) ≤ x1} ∩ · · · ∩ {ω | Xn(ω) ≤ xn}) = P(X1 ≤ x1, · · · , Xn ≤ xn) 称为 −→X 的联合分布函数 (Joint distribution function). 引理 5.1. 当 n = 2 时, (X, Y ) 的联合分布函数 F(x, y) 性质: (i) F(x, y) 分别关于 x, y 单调 ↗. (ii) F(x, y) 分别关于 x, y 右连续. (iii) lim x→−∞ F(x, y) = 0 = lim y→−∞ F(x, y), lim x→+∞,y→+∞ F(x, y) = 1. (iv) ∀ x1 < x2, y1 < y2, F(x2, y2) − F(x1, y2) − F(x2, y1) + F(x1, y1) ≥ 0. 证明. (iii) 记 An = {X ≤ n} ∩ {Y ≤ n} ↗ Ω. 则 limn→∞ F(n, n) = limn→∞ P(An) = P ( limn→∞ An ) = 1. 最后由 F(x, y) 关于 (x, y) 的单调性得到 lim x,y→+∞ F(x, y) = 1. (iv) P(x1 < X ≤ x2, y1 < Y ≤ y2) =P(X ≤ x2, y1 < Y ≤ y2) − P(X ≤ x1, y1 < Y ≤ y2) =P(X ≤ x2, Y ≤ y2) − P(X ≤ x2, Y ≤ y1) − [P(X ≤ x1, Y ≤ y2) − P(X ≤ x1, Y ≤ y1)] =F(x2, y2) − F(x2, y1) − F(x1, y2) + F(x1, y1) ≥ 0. 评论. 注意 (iv)⇒(i). 但是 (i)̸⇒(iv). 反例 F(x, y) = 1, x + y ≥ 0 0, x + y < 0 满足 (i)(ii)(iii), 但不满足 (iv). 定义 5.2. 对 (X, Y ), F(x, y) 是联合分布函数, 称分量 X, Y 的分布函数 FX(x), FY (y) 为 边缘分布函数. 因为 F(x, y) = P(X ≤ x, Y ≤ y), 因此 FX(x) = lim y→+∞ F(x, y), FY (y) = lim x→+∞ F(x, y). 2
5.1联合离散型,联合连续型随机向量定义5.3.称文=(Xi,,Xn)为联合离散型r.v.,指文只取Rn中至多可数个不同的点.记联合分布列f(r1,,n)=IP(Xi=1,X2=2,...,Xn=n)称文为联合连续型r.v.,指存在非负可积函数f(r1,...,an)s.t.F(ri,..,an)=..." f(u,.., un)dui...dun.此时称f(ri,,n)为文的联合密度函数(Jointdensityfunction)评论。(i)(X,Y)为联合连续型,则X和Y的密度函数被称为边缘密度函数fx(r)= /f(r,u)du, fy(y) =/f(u,y)du因为 Fx(r) = ,lim J J= f(u,v)dudu = J (J+ f(u, )de) du(ii)若F连续且除有限个点之外E存在且连续,则(X,Y)为联合连续型,且f(c,y)=82F()Dray例5.1.二项分布.投币n次,Hn+Tn=n,那么O(H,=h 7 =)-前() ()更一般地,(Xi,.,X,)服从参数为(n,P1,.,pr)的多项分布,指n!() -(, ) p.,.这里k,为非负整数,且,k,=n,,Pi=1,piE[0,1].例5.2.均匀分布(Uniformdistribution)。设GCRn为有界区域,若n维随机向量(Xi,,Xn)的联合密度函数f(a1,,n)=向,(1,,n)G,则称(Xi,,Xn)服从区域G上的均匀分布[1, (r,y)eGG =(0,1), f(a) =特别地,取G=[0,1] ×[0,1],f(,y)0, (r,y)G[1, rE (0,1)(0, (0,1)例5.3.再看Monte-Carlo模拟计算定积分I=Jf(r)da,0≤f(r)≤M.设(X,Y)服从[a,可]×[0,M]上均匀分布,则I[A|P(X,Y) E A) =2 - (6-a)M例5.4.r.v.U~U(0,1)服从(0,1)上均匀分布。若F为严格单增的分布函数,则YF-1(U)也是r.V.且Y的分布函数恰为F3
5.1 联合离散型, 联合连续型随机向量 定义 5.3. 称 −→X = (X1, · · · , Xn) 为联合离散型 r.v., 指 −→X 只取 R n 中至多可数个不同的 点. 记联合分布列 f(x1, · · · , xn) = P(X1 = x1, X2 = x2, · · · , Xn = xn). 称 −→X 为联合连续型 r.v., 指存在非负可积函数 f(x1, · · · , xn) s.t. F(x1, · · · , xn) = ∫ x1 −∞ · · · ∫ xn −∞ f(u1, · · · , un)du1 · · · dun. 此时称 f(x1, · · · , xn) 为 −→X 的联合密度函数 (Joint density function). 评论. (i) (X, Y ) 为联合连续型, 则 X 和 Y 的密度函数被称为边缘密度函数. fX(x) = ∫ +∞ −∞ f(x, v)dv, fY (y) = ∫ +∞ −∞ f(u, y)du. 因为 FX(x) = lim y→+∞ ∫ x −∞ ∫ y −∞ f(u, v)dudv = ∫ x −∞ (∫ +∞ −∞ f(u, v)dv ) du. (ii) 若 F 连续且除有限个点之外 ∂ 2F ∂x∂y 存在且连续, 则(X, Y ) 为联合连续型, 且 f(x, y) = ∂ 2F(x,y) ∂x∂y . 例 5.1. 二项分布. 投币 n 次, Hn + Tn = n, 那么 P(Hn = h, Tn = t) = n! h!t! ( 1 2 )h ( 1 2 )t . 更一般地, (X1, · · · , Xr) 服从参数为 (n, p1, · · · , pr) 的多项分布, 指 P((X1, · · · , Xr) = (k1, · · · , kr)) = n! k1! · · · kr! p k1 1 · · · p kr r , 这里 ki 为非负整数, 且 ∑ i ki = n, ∑ i pi = 1, pi ∈ [0, 1]. 例 5.2. 均匀分布 (Uniform distribution). 设 G ⊂ R n 为有界区域, 若 n 维随机向量 (X1, · · · , Xn) 的联合密度函数 f(x1, · · · , xn) = 1 |G| , (x1, · · · , xn) ∈ G, 则称 (X1, · · · , Xn) 服从区域 G 上的均匀分布. 特别地, 取 G = [0, 1] × [0, 1], f(x, y) = 1, (x, y) ∈ G 0, (x, y) ∈/ G . G = (0, 1), f(x) = 1, x ∈ (0, 1) 0, x /∈ (0, 1) . 例 5.3. 再看 Monte-Carlo 模拟. 计算定积分 I = ∫ b a f(x)dx, 0 ≤ f(x) ≤ M. 设 (X, Y ) 服从 [a, b] × [0, M] 上均匀分布, 则 P((X, Y ) ∈ A) = |A| |Ω| = I (b − a)M . 例 5.4. r.v. U ∼ U(0, 1) 服从 (0,1) 上均匀分布. 若 F 为严格单增的分布函数, 则 Y = F −1 (U) 也是 r.v., 且 Y 的分布函数恰为 F. 3
证明.要证P({Y≤y))=F(y)口注意到 (F-1(U)≤y) =[U≤ F(y)). P(Y ≤y)=P(U ≤F(y)) =F(y)对于一般的分布函数F,定义其逆F-1(u) = supr|F(r) <u) = inf(r[F(r)≥u), uE (0, 1).注意这里分别设sup和inf为α与β,那么α=β在于显然α≤β,而F(α+e)≥u→β≤Q+=再由任意性得到β≤α.于是有如下引理引理5.2.设rvU~U(0,1),F为某分布函数,则Y=F-1(U)为r.V且Y的分布函数为F(y).证明.{Y≤y)=[F-1(U)≤y),我们宣称其等于[U≤F(y)) EF.下证claim,即证[F-1(U)>y) =[U>F(y)}. 即证F-1(u)>y台u>F(y), Vué(0, 1), y E R.由F右连续,s>0s.t.F(y+)→y≤F-1(u)→yF-1(u),于是RHSLHS口yEF-l(u), 日s>0 s.t. F(y+d)<u→F(y)≤F(y+)<u.Part II离散型随机变量6典型随机变量定义6.1.若X满足分布列为P(X = k) =hqn-k, k =0,1,2,..这里pE(O,1),p+q=1,则称X服从参数为(n,p)的二项分布(Binomialdistribution)记为 X ~B(n,p)如投币,P(H)=p,投n次时X=H的次数满足二项分布例6.1.每台机器故障概率为1%,不同机器是否故障相互独立,问下面两种情形机器来不及修的概率:(i)1人看20台;(ii)3人看80台4
证明. 要证 P({Y ≤ y}) = F(y). 注意到 {F −1 (U) ≤ y} = {U ≤ F(y)}. P(Y ≤ y) = P(U ≤ F(y)) = F(y). 对于一般的分布函数 F, 定义其逆 F −1 (u) = sup{x | F(x) < u} = inf{x | F(x) ≥ u}, u ∈ (0, 1). 注意这里分别设 sup 和 inf 为 α 与 β, 那么 α = β 在于显然 α ≤ β, 而 F(α + ε) ≥ u ⇒ β ≤ α + ε 再由 ε 任意性得到 β ≤ α. 于是有如下引理 引理 5.2. 设 r.v. U ∼ U(0, 1), F 为某分布函数, 则 Y = F −1 (U) 为 r.v. 且 Y 的分布函数为 F(y). 证明. {Y ≤ y} = {F −1 (U) ≤ y}, 我们宣称其等于 {U ≤ F(y)} ∈ F. 下证 claim, 即证 {F −1 (U) > y} = {U > F(y)}. 即证 F −1 (u) > y ⇔ u > F(y), ∀ u ∈ (0, 1), y ∈ R. 由 F 右连续, ∃ δ > 0 s.t. F(y + δ) < u ⇒ y + δ ≤ F −1 (u) ⇒ y ∈ F −1 (u), 于是 RHS ⇒ LHS. y ∈ F −1 (u), ∃ δ > 0 s.t. F(y + δ) < u ⇒ F(y) ≤ F(y + δ) < u. Part II 离散型随机变量 6 典型随机变量 定义 6.1. 若 X 满足分布列为 P(X = k) = ( n k ) p k q n−k , k = 0, 1, 2, · · · , 这里 p ∈ (0, 1), p + q = 1, 则称 X 服从参数为 (n, p) 的二项分布 (Binomial distribution), 记为 X ∼ B(n, p). 如投币, P(H) = p, 投 n 次时 X = H 的次数满足二项分布. 例 6.1. 每台机器故障概率为 1%, 不同机器是否故障相互独立, 问下面两种情形机器来不 及修的概率: (i) 1 人看 20 台; (ii) 3 人看 80 台. 4
解。记事件X={1人看20台同时故障的台数1,Y={3人看80台同时故障的台数}:则X ~ B(20,1%), Y ~ B(80,1%)P(X > 1) = 1 - (0.99)20 - 20 × (0.99)19 × 0.01 ~ 0.0169P(Y > 3) = 1 - = b(k; 80, 1%) ~ 0.0087.口故(i)的出错率更高例6.2.小数感染某病的概率为30%,为检验其血清是否能预防此病,对20只健康小鼠注射该血清.若注射后有一只感染,问血清是否有效?解.设血清无效→有一只感染应为b(0:20.0.3)+6(1:20.0.3)=0.0076.很小:故血清有口效.评论.统计学:假设检验法(假设成立→计算概率→小概率假设不成立)注意b(k;n,p)关于k的变化b(k; n,p)(n -k+ 1)p = 1 + (mn+ 1)p=kb(k- 1;n,p)kqk(1 -p)k-1qn-k+1可见当0≤k≤(n+1)p时,b(k;n,p);而(n+1)p≤≤n时,b(k;n,p)若m=(n+1)pEN*,则b(m;n,p)=b(m-1;n,p)同时取最大值.若(n+1)p±N*,记m=L(n+1)pl,则b(m;n,p)取最大值.例6.3.投币2n次,问H最大可能下出现次数设X为H出现次数,X~B(2n,),P(X=k)=b(k;n,p),由(2n+1)±N*,投H的最大可能次数为n.i.e.投2n次,H,T各n次的可能性最大2n stirling11)-(2n)!(1)b (n;2n,)-0 (n →8).2)=(nl)2(2)V元n评论.P最大≠发生概率超大,而是在此条件下最可能发生。5
解. 记事件 X = {1人看20台同时故障的台数}, Y = {3人看80台同时故障的台数}. 则 X ∼ B(20, 1%), Y ∼ B(80, 1%). P(X > 1) = 1 − (0.99)20 − 20 × (0.99)19 × 0.01 ≃ 0.0169. P(Y > 3) = 1 − ∑3 k=0 b(k; 80, 1%) ≃ 0.0087. 故 (i) 的出错率更高. 例 6.2. 小数感染某病的概率为 30%, 为检验其血清是否能预防此病, 对 20 只健康小鼠注 射该血清. 若注射后有一只感染, 问血清是否有效? 解. 设血清无效 ⇒ 有一只感染应为 b(0; 20, 0.3) + b(1; 20, 0.3) = 0.0076, 很小. 故血清有 效. 评论. 统计学: 假设检验法 (假设成立 ⇒ 计算概率 ⇒ 小概率 ⇒ 假设不成立). 注意 b(k; n, p) 关于 k 的变化. b(k; n, p) b(k − 1; n, p) = ( n k ) p k q n−k ( n k − 1 ) p k−1q n−k+1 = (n − k + 1)p kq = 1 + (n + 1)p − k k(1 − p) . 可见当 0 ≤ k ≤ (n + 1)p 时, b(k; n, p) ↗; 而 (n + 1)p ≤ k ≤ n 时, b(k; n, p) ↘. 若 m = (n + 1)p ∈ N ∗ , 则 b(m; n, p) = b(m − 1; n, p) 同时取最大值. 若 (n + 1)p /∈ N ∗ , 记 m = ⌊(n + 1)p⌋, 则 b(m; n, p) 取最大值. 例 6.3. 投币 2n 次, 问 H 最大可能下出现次数. 设 X 为 H 出现次数, X ∼ B(2n, 1 2 ), P(X = k) = b(k; n, p), 由 (2n + 1) 1 2 ∈/ N ∗ , 投 H 的最大可能次数为 n. i.e. 投 2n 次, H, T 各 n 次的可能性最大. b ( n; 2n, 1 2 ) = (2n)! (n!)2 ( 1 2 )2n Stirling ≃ 1 √ πn → 0 (n → ∞). 评论. P 最大 ̸= 发生概率超大, 而是在此条件下最可能发生. 5
Lec7 Note of ProbabilityXuxuayame日期:2024年3月18日6.1一些分布记X ~B(n,p),若P(X = k) =kqn-k,k=0,1,2,...,n,q=1-p即X服从参数为n,p的二项分布.这里记P(X=k)为b(k;n,p)若(n+1)p不是整数,令m=[(n+1)p],则b(m;n,p)为最大值定义6.2.称X服从几何分布,记为X~Geo(p),若P(X = k) =p(1 -p)-1, k = 1,2,-. , pE (0, 1),易知 P(X >k)= (1-p)k下面给出几何分布的一个模型.考虑非均匀币,P(H)=p,记X=首次出现H所投的次数,则X~Geo(p)注意几何分布有无记忆性.前m次试验中A都没发生,在此条件下,A发生所需的条件时间X的分布与m无关,也即X~Geo(p)P(X'=k)= P(X =m+k IX >m)_P(X = m + k) _ p(1 - p)m+k-1(1 -p)mP(X >m)=p(1 - p)k-1.注意在整数值离散型分布中只有几何分布无记忆性引理6.1.离散型r.vX取值正整数,若VkEN,P(X=k+1「X>k)与k无关,则X服从几何分布Geo(p)证明.记p=P(X =k+1IX>k)与k=0,1,2,...无关.令rk=P(X>k),则p= P(X=k+1) = ± → = 1 - p, Vk, ro = 1 → r = (1 - p)k.rArk口P(X = k) = rk-1 - rk = (1 -p)<-1 - (1 -p)= p(1 -p)<-1定义6.3.若P(X = k) = e, k = , 1,, ^>0,称X服从参数为入的泊松分布(Poissondistribution),记为X~P()1
Lec7 Note of Probability Xuxuayame 日期:2024 年 3 月 18 日 6.1 一些分布 记 X ∼ B(n, p), 若 P(X = k) = n k p k q n−k , k = 0, 1, 2, · · · , n, q = 1 − p. 即 X 服从参数为 n, p 的二项分布. 这里记 P(X = k) 为 b(k; n, p). 若 (n + 1)p 不是整数, 令 m = ⌊(n + 1)p⌋, 则 b(m; n, p) 为最大值. 定义 6.2. 称 X 服从几何分布, 记为 X ∼ Geo(p), 若 P(X = k) = p(1 − p) k−1 , k = 1, 2, · · · , p ∈ (0, 1). 易知 P(X > k) = (1 − p) k . 下面给出几何分布的一个模型. 考虑非均匀币, P(H) = p, 记 X = 首次出现 H 所投 的次数, 则 X ∼ Geo(p). 注意几何分布有无记忆性. 前 m 次试验中 A 都没发生, 在此条件下, A 发生所需的 条件时间 X′ 的分布与 m 无关, 也即 X′ ∼ Geo(p). P(X ′ = k) = P(X = m + k | X > m) = P(X = m + k) P(X > m) = p(1 − p) m+k−1 (1 − p)m =p(1 − p) k−1 . 注意在整数值离散型分布中只有几何分布无记忆性. 引理 6.1. 离散型 r.v. X 取值正整数, 若 ∀ k ∈ N, P(X = k + 1 | X > k) 与 k 无关, 则 X 服从几何分布 Geo(p). 证明. 记 p = P(X = k + 1 | X > k) 与 k = 0, 1, 2, · · · 无关. 令 rk = P(X > k), 则 p = P(X=k+1) rk = rk−rk+1 rk ⇒ rk+1 rk = 1 − p, ∀ k, r0 = 1 ⇒ rk = (1 − p) k . P(X = k) = rk−1 − rk = (1 − p) k−1 − (1 − p) k = p(1 − p) k−1 . 定义 6.3. 若 P(X = k) = λ k k! e −λ , k = 0, 1, 2, · · · , λ > 0, 称 X 服从参数为 λ 的泊松分布 (Poisson distribution), 记为 X ∼ P(λ). 1