给定核函数K()与带宽h,可估计核密度f(xo)。在 Stata中,默认设置为在等距离的min(n,50)个点来计 算f(x0),然后连成光滑的密度函数。 11
11 给定核函数 与带宽h,可估计核密度 。在 Stata中,默认设置为在等距离的 个点来计 算 ,然后连成光滑的密度函数
Quadratic Kemel (Epanechnikov) 5 图151二次核 12
12 图15.1二次核
153核密度估计的性质 由于核密度估计使用了在x附近的点X来估计f(x0), 而一般地,如果x≠x0,则f(x)≠f(xo),故核密度 估计通常是有偏的: Bias(o)=E(xo)1-f(xo)x5h2f"(xo_ 2K(2)dz 即偏差与h2成正比,为h的同阶无穷小,记为0(h2) 当龍→∞时,让带宽h→0,则偏差将在大样本中 消失。 偏差还取决于核函数K(z)。 13
13 15.3 核密度估计的性质 由于核密度估计使用了在x0附近的点x来估计 , 而一般地,如果 ,则 ,故核密度 估计通常是有偏的: 即偏差与h 2成正比,为h 2的同阶无穷小,记为 。 当 时,让带宽 ,则偏差将在大样本中 消失。 偏差还取决于核函数
核密度佔计的方差为: a=(0⊥+mh 故var[f(xo)=0(1/nh),是(1/nh)的同阶无穷小 了更多观测点来估计(),做带h 样本容量n越大,则方差越小 h越大,由于使用 方差越小 当1→∞时,让nh→∞(虽然h→0,但h趋于0的 速度比样本容量n→∞的速度更慢),则此方差将在大样 本中消失
14 核密度估计的方差为: 故 ,是 的同阶无穷小。 样本容量n越大,则方差越小;带宽h越大,由于使用 了更多观测点来估计 ,故方差越小。 当 时,让 (虽然 ,但h趋于0的 速度比样本容量 的速度更慢),则此方差将在大样 本中消失