当前位置：和泉文库 > 信息系统 > 浏览文档

中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第5章向量模型及检索系统 5.1 向量模型

❶ 回顾 ❷ 排序式检索 ❸ 词项频率 ❹ tf-idf权重计算 ❺ 向量空间模型

文件格式：PDF，文件大小：1.58MB，售价：15.71元

文档详细内容（约64页）

信息检索与数据挖掘 2019/3/16 17 排序式检索 ·迄今为止，我们只介绍了布尔查询 ·文档要么匹配要么不匹配对自身需求和文档集性质非常了解的专家而言，布尔查询是不错的选择 ·然而对大多数用户来说不方便 ·大部分用户不能撰写布尔查询或者他们认为需要大量训练才能撰写合适的布尔查询。大部分用户不愿意逐条浏览1000多条结果，特别是对Web搜索更是如此

信息检索与数据挖掘 2019/3/16 17 排序式检索 • 迄今为止，我们只介绍了布尔查询 • 文档要么匹配要么不匹配 • 对自身需求和文档集性质非常了解的专家而言，布尔查询是不错的选择 • 然而对大多数用户来说不方便 • 大部分用户不能撰写布尔查询或者他们认为需要大量训练才能撰写合适的布尔查询 • 大部分用户不愿意逐条浏览1000多条结果，特别是对Web搜索更是如此

信息检索与数据挖掘 2019/3/16 18 布尔查询：“盛宴”or“饥荒” ·布尔查询的结果经常不是太多就是太少 Query1“standard user dlink650”->200,000 个匹配结果 Query2 "standard user dlink 650 no card found”->0个匹配结果 ·需要花费很多精力去构造一个合适的query.才可以获得一个在数量上可以接受的查询结果

信息检索与数据挖掘 2019/3/16 18 布尔查询：“盛宴”or“饥荒” • 布尔查询的结果经常不是太多就是太少 • Query1“standard user dlink 650”->200,000 个匹配结果 • Query2“standard user dlink 650 no card found”->0个匹配结果 • 需要花费很多精力去构造一个合适的query才可以获得一个在数量上可以接受的查询结果

信息检索与数据挖掘 2019/3/16 19 排序检索模型在排序检索模型中，系统根据文档与query的相关性排序返回文档集合中的文档，而不是简单地返回所有满足query:描述的文档集合 ·自由文本查询：用户query是自然语言的一个或多个词语而不是由查询语言构造的表达式 ·总体上，排序检索模型中有布尔查询和自由文本查询两种方式，但是实际中排序检索模型总是与自由文本查询联系在一起，反之亦然

信息检索与数据挖掘 2019/3/16 19 排序检索模型 • 在排序检索模型中，系统根据文档与query的相关性排序返回文档集合中的文档，而不是简单地返回所有满足query描述的文档集合 • 自由文本查询：用户query是自然语言的一个或多个词语而不是由查询语言构造的表达式 • 总体上，排序检索模型中有布尔查询和自由文本查询两种方式，但是实际中排序检索模型总是与自由文本查询联系在一起，反之亦然

信息检索与数据挖掘 2019/3/16 20 盛宴”or“饥荒”：不再是问题当系统给出的是有序的查询结果，查询结果数目多不再是问题 ·事实上，结果的数目不再是问题 ·我们只需要给出topK(10左右)个结果 ·为用户减轻负担前提：合适的排序算法

信息检索与数据挖掘 2019/3/16 20 “盛宴”or“饥荒”：不再是问题 • 当系统给出的是有序的查询结果，查询结果数目多不再是问题 • 事实上，结果的数目不再是问题 • 我们只需要给出top K（10左右）个结果 • 为用户减轻负担前提：合适的排序算法

信息检索与数据挖掘 2019/3/16 21 排序检索的基本一评分我们希望根据文档对查询者的有用性大小顺序将文档返回给查询者 ·怎样根据一个query对文档进行排序？ ·给每个“查询-文档对”进行评分，在[0,1]之间 ·这个评分值衡量文档与query的匹配程度

信息检索与数据挖掘 2019/3/16 21 排序检索的基本——评分 • 我们希望根据文档对查询者的有用性大小顺序将文档返回给查询者 • 怎样根据一个query对文档进行排序？ • 给每个“查询-文档对”进行评分，在[0,1]之间 • 这个评分值衡量文档与query的匹配程度

点击进入文档下载页（PDF格式）

共64页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第4章索引构建与索引压缩 4.2 索引压缩
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第4章索引构建与索引压缩 4.1 索引构建
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第3章词项词典和倒排记录表
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第2章布尔检索和倒排索引
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第1章绪论（主讲：陈晓辉）
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）SSD Single Shot MultiBox Detector
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）QuickScorer a Fast Algorithm to Rank Documents with Additive Ensembles of Regression Trees
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）Neural Ordinary Differential Equations
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）Memory - Augmented Monte Carlo Tree Search
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）FOTS - Fast oriented Text Spotting with a Unified Network
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）BitFunnel Revisiting Signatures for Search
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）Beliefs and Biases in Web Search
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第5章向量模型及检索系统 5.2 检索系统
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第6章检索的评价
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第7章相关反馈和查询扩展
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第8章概率模型
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第9章基于语言建模的检索模型
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）课程要求（论文阅读&研讨）
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）矩阵分解在信息检索中的应用
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第10章文本分类（文本分类及朴素贝叶斯方法）
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第10章文本分类（基于向量空间的文本分类）
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第10章文本分类（支持向量机及机器学习方法）
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）概率图及主题模型 Probabilistic Graphical Models Topic Model
中国科学技术大学：《信息检索与数据挖掘》课程教学资源（课件讲稿）第11章文本聚类

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录