信息检索模型 刘挺 哈工大信息检索研究室 2004年秋
信息检索模型 刘挺 哈工大信息检索研究室 2004年秋
提纲 信息检索模型的概述 ■布尔模型 ■向量空间模型(VSM) ■扩展的布尔模型 ■潜在语义索引模型(LSI) ■概率模型 ■基于统计语言模型的信息检索模型 ■基于本体论的信息检索模型
提纲 信息检索模型的概述 布尔模型 向量空间模型(VSM) 扩展的布尔模型 潜在语义索引模型(LSI) 概率模型 基于统计语言模型的信息检索模型 基于本体论的信息检索模型
信息检索模型的概述
信息检索模型的概述
什么是模型? 模型是采用数学工具,对现实世界某种事物或 某种运动的抽象描述 ■面对相同的输入,模型的输出应能够无限地逼 近现实世界的输出 ·举例:天气的预测模型 ■模型和实现的区别 ·一个模型可以用多种方法实现 .例如:布尔模型可以用倒排文档(inverted file)实 现,也可以用B-tree实现
什么是模型? 模型是采用数学工具,对现实世界某种事物或 某种运动的抽象描述 面对相同的输入,模型的输出应能够无限地逼 近现实世界的输出 举例:天气的预测模型 模型和实现的区别 一个模型可以用多种方法实现 例如:布尔模型可以用倒排文档(inverted file) 实 现,也可以用B-tree实现
信息检索模型 四元组[D,Q,F,R(q,d)] ■D:文档集的机内表示 ■Q:用户需求的机内表示 ·F:文档表示、查询表示和它们之间的关系的模型框 架(Frame) ·R(q,d:给query g,和document d;评分 ■信息检索模型决定于: ·从什么样的视角去看待查询式和文档 ·基于什么样的理论去看待查询式和文档的关系 ·如何计算查询式和文档之间的相似度
信息检索模型 四元组[D, Q, F, R(qi, d j)] D: 文档集的机内表示 Q: 用户需求的机内表示 F: 文档表示、查询表示和它们之间的关系的模型框 架(Frame) R(qi, dj): 给query qi 和document dj评分 信息检索模型决定于: 从什么样的视角去看待查询式和文档 基于什么样的理论去看待查询式和文档的关系 如何计算查询式和文档之间的相似度