第14章分位数回归
第14章 分位数回归
主要内容 ◆为什么需要分位数回归 ◆总体分位数 ◆样本分位数 ◆分位数回归的估计方法
2 主要内容 为什么需要分位数回归 总体分位数 样本分位数 分位数回归的估计方法
14.1为什么需要分位数回归 一般的回归模型着重考察x对y的条件期望Eyx)的 影响,实际上是均值回归。 但我们关心x对整个条件分布yx的影响,而Ey|x) 只是刻画条件分布yx集中趋势的一个指标而已。 如果yx不是对称分布,则E(y|x)很难反映条件分布 的全貌。 如能够估计条件分布yx的若干重要的条件分位数 ( conditional quantiles),比如中位数( median)、分 位数(10 wer quartile)、分位数( upper quartile),能 更全面认识条件分布yx
3 14.1 为什么需要分位数回归 一般的回归模型着重考察𝐱对y的条件期望𝐸(𝑦|𝐱ሻ的 影响,实际上是均值回归。 但我们关心𝐱对整个条件分布𝑦|𝐱的影响,而𝐸(𝑦|𝐱ሻ 只是刻画条件分布𝑦|𝐱集中趋势的一个指标而已。 如果𝑦|𝐱不是对称分布,则𝐸(𝑦|𝐱ሻ很难反映条件分布 的全貌。 如能够估计条件分布𝑦|𝐱的若干重要的条件分位数 (conditional quantiles),比如中位数(median)、 分 位数(lower quartile)、 分位数(upper quartile),能 更全面认识条件分布𝑦|𝐱
14.1为什么需要分位数回归 使用OLS进行“均值回归”,由于最小化的目标函数 为残差平方和(∑,e2),故易受极端值影响。 Koenker and Bassett提出“分位数回归”(简记QR) 使用残差绝对值的加权平均(比如,∑292)作为最小化 的目标函数,不易受极端值影响,较为稳健。 分位数回归还能提供关于条件分布yx的全面信息
4 14.1 为什么需要分位数回归 使用OLS进行“均值回归” ,由于最小化的目标函数 为残差平方和(𝑖=1 𝑛 𝑒𝑖 2 ),故易受极端值影响。 Koenker and Bassett提出“分位数回归”(简记QR), 使用残差绝对值的加权平均(比如,𝑖=1 𝑛 𝑒𝑖 2 )作为最小化 的目标函数,不易受极端值影响,较为稳健。 分位数回归还能提供关于条件分布𝑦|𝐱的全面信息
142总体分位数 假设Y为连续型随机变量,其累积分布函数为F() Y的“总体q分位数”(0<q<1),记为y,满足以 下定义式: q=P(Y≤y)=Fn) 总体q分位数y正好将总体分布分为两部分,其中小 于或等于y的概率为q,而大于y的概率为(1-q)。 如果q=1/2,则为中位数,正好将总体分为两个相 等的部分。 如果F()严格单调递增,则有 Da=Fv1(q
5 14.2 总体分位数 假设𝑌为连续型随机变量,其累积分布函数为𝐹𝑦(⋅൯。 𝑌的“总体q分位数”(0 < 𝑞 < 1),记为𝑦𝑞,满足以 下定义式: 𝑞 = P(𝑌 ≤ 𝑦𝑞 ሻ = 𝐹𝑦(𝑦𝑞൯ 总体q分位数𝑦𝑞正好将总体分布分为两部分,其中小 于或等于𝑦𝑞的概率为q,而大于𝑦𝑞的概率为 1 − 𝑞 。 如果𝑞 = 1Τ2,则为中位数,正好将总体分为两个相 等的部分。 如果𝐹𝑦(⋅൯严格单调递增,则有: 𝑦𝑞 = 𝐹𝑦 ൯ −1 (𝑞