信息检索与数据挖掘 2019/3/25 1 信息检索与数据挖掘 第6章检索的评价
信息检索与数据挖掘 2019/3/25 1 信息检索与数据挖掘 第6章 检索的评价
信息检索与数据挖掘 2019/3/25 3 提纲 ①上一讲回顾 ②检索系统的评价概述 3 无序检索结果的评价 ④有序检索结果的评价 ⑤为IR系统构建测试集 6检索结果的展示
信息检索与数据挖掘 2019/3/25 3 提纲 ❶ 上一讲回顾 ❷ 检索系统的评价概述 ❸ 无序检索结果的评价 ❹ 有序检索结果的评价 ❺ 为IR系统构建测试集 ❻ 检索结果的展示
信息检索与数据挖掘 2019/3/25 4 搜索系统组成 用户查询 语言分析器 0 结果 文档 自由文本查询分析器 页面 0 索引器 拼写校正 评分排序 文档缓存 域索引及字 段索引中的 非精确 层次型位置倒 k-gram 评分参数 元数据 topK检索 排索引 索引 训练 索引 机器学习 集合
信息检索与数据挖掘 2019/3/25 4 搜索系统组成 4
信息检索与数据挖掘 2019/3/25 5 综合评分 已经介绍的评分函数有余弦相似度、静态得分、近 邻性等。 ·如何将这些评分组合才是最优的? •通用方法一 机器学习 机器学习有下面几种定义:“机器学习是一门人工智能的科学,该领域的主要 研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。“机 器学习是对能通过经验自动改进的计算机算法的研究”。“机器学习是用数据 或以往的经验,以此优化计算机程序的性能标准。”一种经常引用的英文定义 A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P,if its performance at tasks in T,as measured by P,improves with experience E
信息检索与数据挖掘 2019/3/25 5 综合评分 • 已经介绍的评分函数有余弦相似度、静态得分、近 邻性等。 • 如何将这些评分组合才是最优的? • 通用方法——机器学习 5 机器学习有下面几种定义: “机器学习是一门人工智能的科学,该领域的主要 研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 “机 器学习是对能通过经验自动改进的计算机算法的研究”。 “机器学习是用数据 或以往的经验,以此优化计算机程序的性能标准。” 一种经常引用的英文定义 是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E
信息检索与数据挖掘 2019/3/25 6 提纲 ①上一讲回顾 检索系统的评价概述 3 无序检索结果的评价 ④有序检索结果的评价 ⑤为IR系统构建测试集 6检索结果的展示
信息检索与数据挖掘 2019/3/25 6 提纲 ❶ 上一讲回顾 ❷ 检索系统的评价概述 ❸ 无序检索结果的评价 ❹ 有序检索结果的评价 ❺ 为IR系统构建测试集 ❻ 检索结果的展示