HIT-SCIR 逻辑斯蒂回归 【例1】一般认为,体质指数越大(BMl≥25),表示某人越肥胖 根据3983人的体检结果有388人肥胖,肥胖组中患心血管 病的数据见表(xX),试建立体质指数与患心血管病概率 的 logistic回归模型。 【解】根据题目知道是逻辑斯蒂回归问题。运用统计软件可 以对参数进行估计得到 b=60323W=02570 于是log[t模型为 n =-6.0323+0.2570×BM P # 哈工大社会计算与信息检索研究中心 16/9
哈工大社会计算与信息检索研究中心 逻辑斯蒂回归 【例1】一般认为,体质指数越大(BMI≥25),表示某人越肥胖。 根据3983人的体检结果有388人肥胖,肥胖组中患心血管 病的数据见表(xx),试建立体质指数与患心血管病概率 的logistic回归模型。 【解】根据题目知道是逻辑斯蒂回归问题。运用统计软件可 以对参数进行估计得到: b = -6.0323 w = 0.2570 • 于是logit模型为: ˆ ln 6.0323 0.2570 1 ˆ p BMI p = − + − # 16/79
HIT-SCIR 逻辑斯蒂回归 由得到的模型可知 患病概率为: 6.0323+0.257×BM e P=16023+0257×8M 1+e 当体质指数BM变化1单位时,对数优势比将增 加o2570,优势比将增加多少? n2(1-B)-h(-B)=h/21(1-应2) 0.2570 B1/(1-p) B1/(1-B/e 0.2570 1.293 哈工大社会计算与信息检索研究中心 1779
哈工大社会计算与信息检索研究中心 逻辑斯蒂回归 • 由得到的模型可知 – 患病概率为: – 当体质指数BMI变化1单位时,对数优势比将增 加0.2570,优势比将增加多少? 6.0323 0.257 6.0323 0.257 ˆ 1 BMI BMI e p e − + − + = + 2 2 2 2 1 1 1 1 2 2 0.2570 1 1 ˆ / (1 ) ˆ ln( / (1 )) ln( / (1 )) ln 0.2570 ˆ ˆ ˆ ˆ ˆ / (1 ) ˆ ˆ / (1 ) ˆ 1.293 ˆ / (1 ) ˆ p p p p p p p p p p e p p − − − − = = − − = = − 17/79
HIT-SCIR 目录 线性回归 逻辑斯蒂回归 最大熵模型 极大似然估计 模型学习浅谈 最大熵总结 最大熵应用举例(略) 最大熵源码分析(略) 最大熵包使用(略 哈工大社会计算与信息检索研究中心 18/79
哈工大社会计算与信息检索研究中心 目录 • 线性回归 • 逻辑斯蒂回归 • 最大熵模型 • 极大似然估计 • 模型学习浅谈 • 最大熵总结 • 最大熵应用举例(略) • 最大熵源码分析(略) • 最大熵包使用(略) 18/79
HIT-SCIR 6.2熵 关于熵的几句熟悉的话 熵越大则无序性越强 熵增原理 信息熵 It's a trap 信息量好大 捡,还是不捡 哈工大社会计算与信息检索研究中心 @谷大日话
哈工大社会计算与信息检索研究中心 6.2 熵 • 关于熵的几句熟悉的话 – 熵越大则无序性越强 – 熵增原理 – 信息熵 – 信息量好大 19/79
HIT-SCIR 生活中的熵 谢耳朵:“大师,我 paper-辛苦准备了很久 但是引用降了好多,有什么方法能让我的 paper引用只升不降么? 禅师浅笑,答:“潮涨潮落,月圆月缺,这世 上可有什么规律是一直增长却断然不会下降 的 谢耳朵略一沉呤,说“熵"。 理论依据:在无外力作用下, 事物总是朝着最混乱的方向发展 Good brain 哈工大社会计算与信息检索研究中心
哈工大社会计算与信息检索研究中心 生活中的熵 • 谢耳朵:“大师,我paper辛苦准备了很久, 但是引用降了好多,有什么方法能让我的 paper引用只升不降么?” • 禅师浅笑,答:“潮涨潮落,月圆月缺,这世 上可有什么规律是一直增长却断然不会下降 的?” • 谢耳朵略一沉吟,说“熵”。 • 理论依据:在无外力作用下, 事物总是朝着最混乱的方向发展 20/79