其以概率1收敛到Φ(x). TExample x<-seq(.1,2.5,1 ength=10) m<-10000 z <-rnorm(m) dim(x)<-length(x) p <apply(x,MARGIN =1, FUN function(x,z){mean(z <x)},zz) Phi <-pnorm(x) print(round(rbind(x,p,Phi),3)) Example 总结如下:欲估计积分 g(x)f(x)dr 其中f为以A为支撑的概率函数,即∫4f(x)dr=1.则产生f的i.d随机 Previous Next First Last Back Forward 9
Ÿ±V«1¬ÒΦ(x). ↑Example x <- seq(.1, 2.5, length = 10) m <- 10000 z <- rnorm(m) dim(x) <- length(x) p <- apply(x, MARGIN = 1, FUN = function(x, z) {mean(z <= x)}, z = z) Phi <- pnorm(x) print(round(rbind(x, p, Phi), 3)) ↓Example o(Xe: ñO»© θ = Z A g(x)f(x)dx Ÿ•fè±Aè|†V«ºÍ, = R A f(x)dx = 1. K)fi.i.dëÅ Previous Next First Last Back Forward 9
数x1,·,xm后,由大数律知的估计为 n m i三1 由于的方差为a2/m,其中a2=Varf(g(X).当随机变量X的分布未知时, 我们可以使用样本x1,·,xm的经验分布函数,从而得到a2/m的估计为 2/m= 1 m2g(z)-g2. 1 再由中心极限定理知道当m→oo时 0-E0 VVar(6) 依分布收敛到标准正态分布.因此对大样本,渐近正态性可以给出积分 的Monte Carlo估计的误差界,以此可以来检查收敛性, Previous Next First Last Back Forward 10
Íx1, · · · , xm, dåÍÆθOè θˆ = 1 m Xm i=1 g(xi). duθˆêèσ 2/m, Ÿ•σ 2 = V arf (g(X)). ëÅC˛X©Ÿôû, ·Çå±¶^x1, · · · , xm²©ŸºÍ, l σ 2/mOè σˆ 2 /m = 1 m2 Xm i=1 [g(xi) − g(x)]2 . 2d•%4Žnm → ∞û θˆ − Eθˆ q V ar(θˆ) ù©Ÿ¬ÒIO©Ÿ. œdÈå, ÏC5å±â—»© Monte CarloOÿ., ±då± 5u¬Ò5. Previous Next First Last Back Forward 10
例5:Monte Carlo积分的误差界建立重(2)和(2.5)的Monte Carlo积分估 计的%95置信区间. X<-2 m<-10000 z <-rnorm(m) g <-(z <x)#the indicator function v<-mean((g-mean(g))2)/m cdf <-mean(g) c(cdf,v) c(cdf -1.96 sqrt(v),cdf +1.96 sqrt(v)) #[1]9.7800e-012.1516e-06 #[1]0.9751250.980875 Example 随机变量I(Z≤2)取值1的概率为④(2)≈0.977.此处g(X)~B(10000,Φ(2) 因此g(X)的方差为0.977(1-0.977)/10000=2.223e-06.Monte Carlo积 分估计的方差为2.1516e-06,已经非常接近了. Previous Next First Last Back Forward 11
~5: Monte Carlo»©ÿ. Ô·Φ(2)⁄Φ(2.5)Monte Carlo»© O%95ò&´m. ↑Example x <- 2 m <- 10000 z <- rnorm(m) g <- (z <= x) #the indicator function v <- mean((g - mean(g))^2) / m cdf <- mean(g) c(cdf, v) c(cdf - 1.96 * sqrt(v), cdf + 1.96 * sqrt(v)) #[1] 9.7800e-01 2.1516e-06 #[1] 0.975125 0.980875 ↓Example ëÅC˛I(Z ≤ 2)ä1V«èΦ(2) ≈ 0.977. d?g(X) ∼ B(10000, Φ(2)), œd g(X)êè0.977(1 − 0.977)/10000 = 2.223e − 06. Monte Carlo» ©Oêè2.1516e − 06, Ʋö~C . Previous Next First Last Back Forward 11
1.1.2 Variance and Efficiency Monte Carlo方法在估计一个积分2g(c)dz时,将其表示为一个均匀随机变 量的期望,从而 de=((a)(X).xa). 从而算法如下 1.从U(a,b)中产生i.i.d样本X1,…,Xm 2.计算g(可=品∑19X). 3.0=(b-a)g(X. 易知, E6=0 Var(d)=(-a)2Var((X))=(-a)'Var(a(X). Previous Next First Last Back Forward 12
1.1.2 Variance and Efficiency Monte Carlo ê{3Oòứ R b a g(x)dxû, ÚŸL´èòá˛!ëÅC ˛œ", l θ = Z b a g(x)dx = (b−a) Z b a g(x) 1 b − a dx = (b−a)E[g(X)], X ∼ U(a, b). l é{Xe 1. lU(a, b)•)i.i.dX1, · · · , Xm. 2. Oég(X) = 1 m Pm i=1 g(Xi). 3. θˆ = (b − a)g(X). ¥, Eθˆ = θ, V ar(θˆ) = (b − a) 2V ar(g(X)) = (b − a) 2 m V ar(g(X). Previous Next First Last Back Forward 12
有中心极限定理,9(X)依分布渐近到正态分布,因此也渐近到正态分布. Hit-or-miss Monte Carlo方法则使用了另外一种估计积分的方式,其 方差和上面说的方法不同.表述如下:假设∫为随机变量X的概率函数,使 用hit-or-miss”方法估计积分F(x)=。f(t)dt: 1.从X的分布中产生i.i.d样本X1,·,Xm 2.计算g(灯=品∑严1I(X,≤x) 3.F(x)=g(X) 显然对每个有限的x,Y=g(X)=I(X≤x)~B(1,P),p=F(x).因 此 EF(x】=F(x),Var[F(c】=F(e)(1-F(x)/m. F(x)的方差可以通过F(x)(1-F(x)/m来估计. 这两种方法的方差不同,自然会问哪种优一些,即更有效率。 Previous Next First Last Back Forward 13
k•%4Žn, g(X)ù©ŸÏC©Ÿ, œdθˆèÏC©Ÿ. Hit-or-miss Monte Carlo ê{K¶^ , ò´O»©ê™, Ÿ ê⁄˛°`ê{ÿ”. L„Xe: bfèëÅC˛XV«ºÍ, ¶ ^“hit-or-miss”ê{O»©F(x) = R x −∞ f(t)dt: 1. lX©Ÿ•)i.i.dX1, · · · , Xm. 2. Oég(X) = 1 m Pm i=1 I(Xi ≤ x). 3. F ˆ(x) = g(X). w,ÈzákÅx, Y = g(X) = I(X ≤ x) ∼ B(1, p), p = F(x). œ d E[F ˆ(x)] = F(x), V ar[F ˆ(x)] = F(x)(1 − F(x))/m. F ˆ(x)ê屜LF ˆ(x)(1 − F ˆ(x))/m5O. ˘¸´ê{êÿ”, g,¨Ø=´`ò , =çk«. Previous Next First Last Back Forward 13