直方图得不到光滑的密度估计,根本原因在于使用示 性函数作为“权重函数”( weighting function),以及各 组间不允许交叠 核密度估计法使用更一般的权重函数,并允许各组之 间交叠 核密度佔计量为 f(xo)=2> K[(x2-x0)/h] i=1 函数K()称为“核函数”( kernel function),本质上 就是权重函数。 6
6 直方图得不到光滑的密度估计,根本原因在于使用示 性函数作为“权重函数”(weighting function),以及各 组间不允许交叠。 核密度估计法使用更一般的权重函数,并允许各组之 间交叠。 核密度估计量为 函数 称为“核函数”(kernel function),本质上 就是权重函数
带宽h越大,在Ⅺ附近邻域越大,则估计的密度函数 ∫(x)越光滑,故称带宽h为“光滑参数” 般假设核函数K(z)满足以下性质: K(z)连续且关于原点对称(偶函数); (i k(z)dz=1, zk(z)dz=0 IK(z)I dz<+
7 带宽h越大,在x0附近邻域越大,则估计的密度函数 越光滑,故称带宽h为“光滑参数” 。 一般假设核函数 满足以下性质: (i) 连续且关于原点对称(偶函数); (ii) , ;
i)或者①存在z0>0,使得当|z|>z时,K(z)=0 或者②当|2|→+∞时,z|K(z)→0; (V)|z2k(z)dz=y,其中y为常数。 条件()要求核函数的曲线下面积为1,并满足一些 有界条件。 条件(i)比条件(i)2更强,实践中常采用条件(i) ①。常将邻域[z0,z0]标准化为[-1,1]。条件(v)也是 有界条件
8 (iii)或者①存在 ,使得当 时, ; 或者②当 时, ; (iv) ,其中 为常数。 条件(ii)要求核函数的曲线下面积为1,并满足一些 有界条件。 条件(iii)①比条件(iii)②更强,实践中常采用条件(iii) ①。常将邻域 标准化为[-1,1] 。条件(iv)也是 有界条件
152对密度函数的非参数估计 常见核函数见下表。这些核函数的共同特点是,离原 点越近,则核函数取值越大,并在原点达到最大;即越 近的点权重越大。 其中,均匀核也用于直方图,只是在用均匀核进行核 密度估计时并不固定分组,而在每个点上进行估计。 最流行的核函数为二次核(也称 Epanechnikov核)与高 斯核。 注:其中δ为用来计算“ Silverman嵌入估计”的常数
9 15.2 对密度函数的非参数估计 常见核函数见下表。这些核函数的共同特点是,离原 点越近,则核函数取值越大,并在原点达到最大;即越 近的点权重越大。 其中,均匀核也用于直方图,只是在用均匀核进行核 密度估计时并不固定分组,而在每个点上进行估计。 最流行的核函数为二次核(也称Epanechnikov核)与高 斯核。 注:其中 为用来计算“Silverman嵌入估计”的常数
核函数名称 核函数的数学形式δ 均匀核 (uniform or rectangular <1 .3510 ⊥三角核(mie:t)x 伊番科尼可夫核( Epanechnikov)或二 -z)2< 1.7188 次核( quadratic 四次核quri或双权核6 biweight)(a-z)V4<)2.062 三权核( Reweight) 2(-z2)<D2312 三三核 Tricubic #),x<D 高斯核( Gaussian or normal) 0.7764 10
10