二项分布 ·有一非均质硬币,要估计在抛硬币时出现正面 的概率p 投掷硬币n次并计算出现正面的次数r,那么p的 个合理估计是r/n 如果重新进行一次实验,生成一个新的n次抛 硬币的集合,出现正面的次数r可能与前不同, 得到对p的另一个估计 二项分布描述的是对任一可能的r值,这个正面 概率为p的硬币抛掷n次恰好出现r次正面的概率 2003.12.18 机器学习-评估假设作者: Mitchell译者:曾华军等讲者:陶晓鹏 16
2003.12.18 机器学习-评估假设作者:Mitchell 译者:曾华军等讲者:陶晓鹏 16 二项分布 • 有一非均质硬币,要估计在抛硬币时出现正面 的概率p • 投掷硬币n次并计算出现正面的次数r,那么p的 一个合理估计是r/n • 如果重新进行一次实验,生成一个新的n次抛 硬币的集合,出现正面的次数r可能与前不同, 得到对p的另一个估计 • 二项分布描述的是对任一可能的r值,这个正面 概率为p的硬币抛掷n次恰好出现r次正面的概率
二项分布(2) 从抛掷硬币的随机样本中估计p与在实例的随机样本上 测试h以估计 error(h是相同的问题 次硬币抛掷对应于从D中抽取一个实例并测试它是否 被h误分类 一次随机抛掷出现正面的概率p对应于随机抽取的实例 被误分类的概率 error(h 二项分布给出了一个一般形式的概率分布,无论用于 表示n次硬币出现正面的次数还是在n个样例中假设出 错的次数 二项分布的具体形式依赖于样本大小n以及概率p或 error h 2003.12.18 机器学习-评估假设作者: Mitchell译者:曾华军等讲者:陶晓鹏 7
2003.12.18 机器学习-评估假设作者:Mitchell 译者:曾华军等讲者:陶晓鹏 17 二项分布(2) • 从抛掷硬币的随机样本中估计p与在实例的随机样本上 测试h以估计errorD(h)是相同的问题 • 一次硬币抛掷对应于从D中抽取一个实例并测试它是否 被h误分类 • 一次随机抛掷出现正面的概率p对应于随机抽取的实例 被误分类的概率errorD(h) • 二项分布给出了一个一般形式的概率分布,无论用于 表示n次硬币出现正面的次数还是在n个样例中假设出 错的次数 • 二项分布的具体形式依赖于样本大小n以及概率p或 errorD(h)