第二节信息检索语言 °的常 自然语言的标识包括 (1)关键词( keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。 这部分有时由人工自由标引进行,如期刊论文中的作者关键词,大部分由计算机标引系统自动完成 (2)题名:信息资源的名称,如论文篇名、图书书名、网站名称等。 (3)全文:从资源的全部内容中自动抽取、查找,是目前网上各类搜索引擎使用得最多的方法。 (4)引文:将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。 此外,还有责任人(作者)、摘要等。由于自然语言检索系统对同义词、近义词、多义词等与其相关的词 语没有进行规范和统一,当用户提问的检索概念具有多种表达形式时,采用单一的关键词或自然语言索引 词匹配方式势必会影响査全率。自然语言检索系统的选词没有严格限制,词量过多过杂势必会影响查准率
n (1)关键词(keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。 这部分有时由人工自由标引进行,如期刊论文中的作者关键词,大部分由计算机标引系统自动完成。 n (2)题名:信息资源的名称,如论文篇名、图书书名、网站名称等。 n (3)全文:从资源的全部内容中自动抽取、查找,是目前网上各类搜索引擎使用得最多的方法。 n (4)引文:将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。 自然语言的标识包括: 此外,还有责任人(作者)、摘要等。由于自然语言检索系统对同义词、近义词、多义词等与其相关的词 语没有进行规范和统一,当用户提问的检索概念具有多种表达形式时,采用单一的关键词或自然语言索引 词匹配方式势必会影响查全率。自然语言检索系统的选词没有严格限制,词量过多过杂势必会影响查准率。 第二节 信息检索语言
第三节信息检素技术 °的常 只 基本概念 何谓信息检索? 信息检索( Information retrieva)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关 的信息的过程和技术 何谓信息检索技术? 由于信息资源具有高度的组织结构。因此,要想做到快速、准确地检索需要一些特殊的技术。通过学习 和掌握这些技术与技巧,你就能在浩瀚的信息海洋中,轻而易举的获取你的“目标”,从而让你的科硏 或学习过程变得更加便捷与高效。 信息检索技术的构成? 检索算符、检索功能、检索策略、检索评价
基本概念 第三节 信息检索技术 n 何谓信息检索? 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关 的信息的过程和技术。 n 何谓信息检索技术? 由于信息资源具有高度的组织结构。因此,要想做到快速、准确地检索需要一些特殊的技术。通过学习 和掌握这些技术与技巧,你就能在浩瀚的信息海洋中,轻而易举的获取你的“目标”,从而让你的科研 或学习过程变得更加便捷与高效。 n 信息检索技术的构成? 检索算符、检索功能、检索策略、检索评价
第三节信息检索技术 °的常 3.1检索算符 ■用一个关键词检索可能比较简单容易,但通常检索课题会用到多个关键词。 ■如何科学的将这些检索词进行有效组合,以求达到最好的检索效果,这就要涉及到多个检 索概念的方法和技巧。 3.1.1布尔逻辑算符 布尔逻辑算符是规定检索词之间逻辑关系的算符,利用布尔逻辑算符进行检索词或代码的 逻辑组配,是计算机信息检索系统中最常用的一种检索方法,也称布尔检索。 D
3.1 检索算符 n 用一个关键词检索可能比较简单容易,但通常检索课题会用到多个关键词。 n 如何科学的将这些检索词进行有效组合,以求达到最好的检索效果,这就要涉及到多个检 索概念的方法和技巧。 第三节 信息检索技术 n 布尔逻辑算符是规定检索词之间逻辑关系的算符,利用布尔逻辑算符进行检索词或代码的 逻辑组配,是计算机信息检索系统中最常用的一种检索方法,也称布尔检索。 3.1.1 布尔逻辑算符