信息检索与数据挖掘 2019/2/26 12 1.5.4授课内容 ·第四章索引构建和索引压缩 文本预处理。一般构建过程。基于块排序的构建过程。 单遍内存式扫描构建方法。分布式及动态索引方法。 词项的统计特性。词典的压缩。倒排记录表的压缩。 ·第五章向量模型及检索系统 向量空间模型及词项权重计算机制。检索中的快速实现 方法。检索系统的一般构成。隐性语义索引方法。基于 开源工具搭建简单搜索引擎。 ·第六章检索的评价 效率和效果的评价。查全率和查准率。其他效果评价方 法。用户体验及结果摘要。相关评测语料和评测会议。 12
信息检索与数据挖掘 2019/2/26 12 • 第四章 索引构建和索引压缩 文本预处理。一般构建过程。基于块排序的构建过程。 单遍内存式扫描构建方法。分布式及动态索引方法。 词项的统计特性。词典的压缩。倒排记录表的压缩。 • 第五章 向量模型及检索系统 向量空间模型及词项权重计算机制。检索中的快速实现 方法。检索系统的一般构成。隐性语义索引方法。基于 开源工具搭建简单搜索引擎。 • 第六章 检索的评价 效率和效果的评价。查全率和查准率。其他效果评价方 法。用户体验及结果摘要。相关评测语料和评测会议。 1.5.4 授课内容 12
信息检索与数据挖掘 2019/2/26 13 1.5.4授课内容 ·第七章相关反馈和查询扩展 相关反馈和伪相关反馈。查询扩展及重构。全局方法及局部方法。 。第八章概率模型 概率排序原理。回归模型。二值独立概率模型。OKAPI BM25公式。 ·第九章基于语言建模的检索模型 查询似然模型。其他语言模型。语言模型的相关反馈。 ·第十章文本分类 文本分类的概念及评价方法。文本分类中的特征选择方法。 13
信息检索与数据挖掘 2019/2/26 13 • 第七章 相关反馈和查询扩展 相关反馈和伪相关反馈。查询扩展及重构。全局方法及局部方法。 • 第八章 概率模型 概率排序原理。回归模型。二值独立概率模型。OKAPI BM25公式。 • 第九章 基于语言建模的检索模型 查询似然模型。其他语言模型。语言模型的相关反馈。 • 第十章 文本分类 文本分类的概念及评价方法。文本分类中的特征选择方法。 1.5.4 授课内容 13
信息检索与数据挖掘 2019/2/26 14 1.5.4授课内容 ·第十一章文本聚类 文本聚类的概念及评价方法。文本聚类算法。检索结果聚类 的标签生成。 ·第十二章Web搜索 Web结构。信息采集。网页查重方法。链接分析算法 (PageRank和HITS)。 ·第十三章多媒体信息检索 自动图像标注,语义距离的度量,图像搜索,视频概念检测 ·第十四章其他应用简介 数字图书馆,过滤及推送系统、XML检索、跨语言检索、信 息抽取、问答系统、互联网广告系统等等。 14
信息检索与数据挖掘 2019/2/26 14 • 第十一章 文本聚类 文本聚类的概念及评价方法。文本聚类算法。检索结果聚类 的标签生成。 • 第十二章 Web搜索 Web结构。信息采集。网页查重方法。链接分析算法 (PageRank和HITS)。 • 第十三章 多媒体信息检索 自动图像标注,语义距离的度量,图像搜索,视频概念检测 • 第十四章 其他应用简介 数字图书馆,过滤及推送系统、XML检索、跨语言检索、信 息抽取、问答系统、互联网广告系统等等。 1.5.4 授课内容 14
信息检索与数据挖掘 2019/2/26 15 课程内容 第1章绪论 第2章布尔检索及倒排索引 第3章词典查找及扩展的倒排索引 第4章索引构建和索引压缩 。1 第5章向量模型及检索系统 。 第6章检索的评价 第7章相关反馈和查询扩展 第8章概率模型 。 第9章基于语言建模的检索模型 。 第10章文本分类 ·第11章文本聚类 第12章Web搜索 第13章多媒体信息检索 ·第14章其他应用简介 15
信息检索与数据挖掘 2019/2/26 15 课程内容 • 第1章 绪论 • 第2章 布尔检索及倒排索引 • 第3章 词典查找及扩展的倒排索引 • 第4章 索引构建和索引压缩 • 第5章 向量模型及检索系统 • 第6章 检索的评价 • 第7章 相关反馈和查询扩展 • 第8章 概率模型 • 第9章 基于语言建模的检索模型 • 第10章 文本分类 • 第11章 文本聚类 • 第12章 Web搜索 • 第13章 多媒体信息检索 • 第14章 其他应用简介 15
信息检索与数据挖掘 2019/2/26 16 第2章布尔检索及倒排索引 ·2.1信息检索模型概述 ·2.2一个简单的搜索示例 ·2.3倒排索引 2.4布尔检索模型 •2.5布尔检索模型的优化与扩展 16
信息检索与数据挖掘 2019/2/26 16 第2章 布尔检索及倒排索引 • 2.1 信息检索模型概述 • 2.2 一个简单的搜索示例 • 2.3 倒排索引 • 2.4 布尔检索模型 • 2.5 布尔检索模型的优化与扩展 16