检索共有的过程,因此从这个意义上说,信息存储是信息检索的逆过程, 两者是不可分割的一个整体 、信息检索的类型 1.按检索内容分,有数据信息检索、事实信息检索和文献信息检索 1)数据信息检索( Data information Retrieval)是将经过选择、整理、 鉴定的数值数据存入数据库中,根据需要查处可回答某一问题的数据的检 索。这些数据包括物理性能常数、统计数据国民生产总值、外汇收支等。 这类检索不仅査处数据,还可以提供一定的推导、运算的能力。 2)事实信息检索( Fact Information Retrieval)是将存储于数据库中 的关于某一事件发生的时间、地点、经过等情况查找出来的检索。它既包 含数值数据库的检索、运算、推导,也包括事实、概念等的检索、比较、 逻辑判断。 3)文献信息检索( Document Information retrieval)是将存储于数据 库中的关于某一主题文献的线索查找出来的检索。它通常通过目录、索引、 文摘等二次文献,以原始文献的出处为检索目的,可以向用户提供原文献 的信息。一些观点也认为可称为“数目检索”。 2.按组织方式分,可有全文检索、超文本检索和超媒体检索 1)全文检索( Full Text Retrieva1)是将存储在数据库中的整本书、 整篇文章中的任意内容信息査找出来的检索。可以根据需要获得全文中 的有关章、节、断、句、词等的信息,也可进行各种统计和分析。 2)超文本检索( Hyper Text Retrieva1)是对每个节点中所存的信息 以及信息链构成的网络中信息的检索。强调中心节点之间的语义联结结
6 检索共有的过程,因此从这个意义上说,信息存储是信息检索的逆过程, 两者是不可分割的一个整体。 二、 信息检索的类型 1.按检索内容分,有数据信息检索、事实信息检索和文献信息检索 1)数据信息检索(Data Information Retrieval)是将经过选择、整理、 鉴定的数值数据存入数据库中,根据需要查处可回答某一问题的数据的检 索。这些数据包括物理性能常数、统计数据国民生产总值、外汇收支等。 这类检索不仅查处数据,还可以提供一定的推导、运算的能力。 2)事实信息检索(Fact Information Retrieval)是将存储于数据库中 的关于某一事件发生的时间、地点、经过等情况查找出来的检索。它既包 含数值数据库的检索、运算、推导,也包括事实、概念等的检索、比较、 逻辑判断。 3)文献信息检索(Document Information Retrieval)是将存储于数据 库中的关于某一主题文献的线索查找出来的检索。它通常通过目录、索引、 文摘等二次文献,以原始文献的出处为检索目的,可以向用户提供原文献 的信息。一些观点也认为可称为“数目检索”。 2.按组织方式分,可有全文检索、超文本检索和超媒体检索 1)全文检索(Full Text Retrieval)是将存储在数据库中的整本书、 整篇文章中的任意内容信息查找出来的检索。可以根据需要获得全文中 的有关章、节、断、句、词等的信息,也可进行各种统计和分析。 2)超文本检索(Hyper Text Retrieval )是对每个节点中所存的信息 以及信息链构成的网络中信息的检索。强调中心节点之间的语义联结结
构,靠系统提供的工具进行图示穿行和节点展示,提供浏览式查询,可 进行跨库检索。 3)超媒体检索( Hyper Media Retrieval)是对存储的文本、图像、声 音等多种媒体信息的检索。它是多维存储结构,有向的链接,与超文本 检索一样,可提供浏览式査询和跨库检索 3.按检索手段分,有手工检索和机器检索 1)手工检索( Hand Retrieval)是人直接用手、眼、脑组织、查找印刷 型文献的检索。具有直观、灵活、无需各种设备和上机费用的优点。 2)机器检索( Machine retrieval)又称计算机检索。是通过机器对已数 字化的信息,按照设计好的程序进行査找和输出的过程。按机器检索的 处理方式分又有脱机检索和联机检索;按存储方式分,有光盘检索和网 络检索。机检可大大提高检索效率,扩宽检索领域。 信息检索的研究内容、研究方法和作用 1.检索理论研究 检索理论是检索活动中总结出来的系统化的知识,研究内容包括信 息与信息资源定义、信息检索的定义、类型、特点、作用、研究对象、 方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。 当前要多做信息检索知识体系化、整合化的研究。 2.检索语言研究 原指从自然语言中精选出来,并以简练形式表示文献、信息的受控语 言的集合。现指受控语言和自然语言(未规范的书面语言)。研究内容包括 关键词、主题词、词表编制、分类表编制、概念分析、规范档、代码标识
7 构,靠系统提供的工具进行图示穿行和节点展示,提供浏览式查询,可 进行跨库检索。 3)超媒体检索(Hyper Media Retrieval)是对存储的文本、图像、声 音等多种媒体信息的检索。它是多维存储结构,有向的链接,与超文本 检索一样,可提供浏览式查询和跨库检索。 3.按检索手段分,有手工检索和机器检索 1)手工检索(Hand Retrieval)是人直接用手、眼、脑组织、查找印刷 型文献的检索。具有直观、灵活、无需各种设备和上机费用的优点。 2)机器检索(Machine Retrieval)又称计算机检索。是通过机器对已数 字化的信息,按照设计好的程序进行查找和输出的过程。按机器检索的 处理方式分又有脱机检索和联机检索;按存储方式分,有光盘检索和网 络检索。机检可大大提高检索效率,扩宽检索领域。 三、信息检索的研究内容、研究方法和作用 1.检索理论研究 检索理论是检索活动中总结出来的系统化的知识,研究内容包括信 息与信息资源定义、信息检索的定义、类型、特点、作用、研究对象、 方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。 当前要多做信息检索知识体系化、整合化的研究。 2.检索语言研究 原指从自然语言中精选出来,并以简练形式表示文献、信息的受控语 言的集合。现指受控语言和自然语言(未规范的书面语言)。研究内容包括 关键词、主题词、词表编制、分类表编制、概念分析、规范档、代码标识
等 3)数据库研究 数据库是多个互相关联的数据的集合,是信息检索系统必不可少的组 成部分。研究内容包括数据库建设规划与协调共享、收录信息与文献的筛 选、文档结构、维护与更新、版权、市场、效果评价、数据库跨库检索、 Z39.50标准等的研究。目前要加强异构数据库系统信息资源一体化整合和 检索、知识库、数据仓库的研究。 4)著录法研究 著录法是对信息与文献形式特征和内容特征进行分析、选择和记录的方法。 研究内容包括国内外著录标准与规则,格式,各种信息与文献著录方法, CN-MARC, UNI-MARC, US-MARC, Dublin cor(都柏林核心)元数据,XML 等的研究,目前要重视电子型文献及网络信息的著录研究。 a)标引和组织法研究 标引是通过对信息资源的分析,选用确切的检索标识反映资源内容的过程。 组织法即排检法,是指按一定次序将标引标识(如主题词、分类号)排列 起来的反方法。 以上研究内容包括信息资源的阅读、分析、词表的编制与选用、标引规则、 中外文排检、类序、失序、地序、谱系序等。目前应重点研究网络信息资 源的镖隐语排序、数字资源的全球统一的分类体系、主题分类词表(用、 代、属、酚、参、见类系)、自动标引与排序、智能搜索引擎、网格( Great Global grid)的研究。 6)检索系统研究
8 等。 3)数据库研究 数据库是多个互相关联的数据的集合,是信息检索系统必不可少的组 成部分。研究内容包括数据库建设规划与协调共享、收录信息与文献的筛 选、文档结构、维护与更新、版权、市场、效果评价、数据库跨库检索、 Z39.50 标准等的研究。目前要加强异构数据库系统信息资源一体化整合和 检索、知识库、数据仓库的研究。 4)著录法研究 著录法是对信息与文献形式特征和内容特征进行分析、选择和记录的方法。 研究内容包括国内外著录标准与规则,格式,各种信息与文献著录方法, CN-MARC, UNI-MARC, US-MARC, Dublin Cor(都柏林核心)元数据,XML 等的研究,目前要重视电子型文献及网络信息的著录研究。 a) 标引和组织法研究 标引是通过对信息资源的分析,选用确切的检索标识反映资源内容的过程。 组织法即排检法,是指按一定次序将标引标识(如主题词、分类号)排列 起来的反方法。 以上研究内容包括信息资源的阅读、分析、词表的编制与选用、标引规则、 中外文排检、类序、失序、地序、谱系序等。目前应重点研究网络信息资 源的镖隐语排序、数字资源的全球统一的分类体系、主题分类词表(用、 代、属、酚、参、见类系)、自动标引与排序、智能搜索引擎、网格(Great Global Grid)的研究。 6) 检索系统研究
检索系统是由有序化的信息资源、设备、检索方法和策略等组成的集合体 研究内容包括系统设计、运行和评价。目前重点研究计算机检索系统软硬 件配置、设计与评价、智能化应用等。 ⑦)检索策略研究 检索策略是在分析信息需求检索提问时确定的检索途径与检索用词,并明 确各词之间逻辑关系和查找步骤的安排。研究内容包括用户需求提问分析、 检索表达式、检索符号的设置与应用、步骤优化。目前应加强检索策略自 动调节、修改的研究 8)检索服务研究 检索服务是根据用户需求,由专门人员帮助查找信息,并将结果提供给用 户的工作,研究内容包括服务手段、服务方式、用户培训、检索效果(查 准率、查全率)等。目前应加强个性化信息服务的研究 2.研究方法 信息检索的研究从属于图书馆学与情报学。涉及到自然科学、社会科学 人文科学的许多学科和领域。通用的方法有:观察法、实验法、调查法、 模拟法、归纳与演绎法、分析与比较法等;还使用文献计量学法、信息计 量学法、目录学、分类学、主题法、著录法、排序法、咨询法等独特的研 究方法。 3.信息检索的作用 1)能较全面地掌握有关的必要信息 信息检索可以有目的、较系统地获得某一主题的必要信息 2)能提高信息利用的效率,节省时间与费用
9 检索系统是由有序化的信息资源、设备、检索方法和策略等组成的集合体。 研究内容包括系统设计、运行和评价。目前重点研究计算机检索系统软硬 件配置、设计与评价、智能化应用等。 7) 检索策略研究 检索策略是在分析信息需求检索提问时确定的检索途径与检索用词,并明 确各词之间逻辑关系和查找步骤的安排。研究内容包括用户需求提问分析、 检索表达式、检索符号的设置与应用、步骤优化。目前应加强检索策略自 动调节、修改的研究。 8) 检索服务研究 检索服务是根据用户需求,由专门人员帮助查找信息,并将结果提供给用 户的工作,研究内容包括服务手段、服务方式、用户培训、检索效果(查 准率、查全率)等。目前应加强个性化信息服务的研究。 2.研究方法 信息检索的研究从属于图书馆学与情报学。涉及到自然科学、社会科学、 人文科学的许多学科和领域。通用的方法有:观察法、实验法、调查法、 模拟法、归纳与演绎法、分析与比较法等;还使用文献计量学法、信息计 量学法、目录学、分类学、主题法、著录法、排序法、咨询法等独特的研 究方法。 3.信息检索的作用 1)能较全面地掌握有关的必要信息 信息检索可以有目的、较系统地获得某一主题的必要信息。 2)能提高信息利用的效率,节省时间与费用
般公信度高的,较准确的信息才会被收集、组织或存储在检索工具或数 据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数 十倍 3)能提高信息素质,加速成才 信息素质( Information Literacy)是指具有获取信息的强烈意识,掌 握信息检索的技术和方法,拥有信息鉴别和利用的能力。中国的高等教育 法明确要求大学生要具备信息素质。 第二章信息检索理论与方法 第一节信息检索原理 信息检索策略 信息检索策略是为实现检索目标而制定的计划和方案,是对整个检索 过程的谋划和指导。即是对检索过程的安排。 检索策略有两种方式:手工检索策略和计算机检索策略。 在计算机检索的条件下,检索策略的构造应是在明确检索目标和信息 需求的基础上进行的,包括选择检索数据库、确定检索项、选定检索范围 和检索方法,运用逻辑算符拟定检索表达式,按照一定的步骤实施检索, 并根据需要进行反馈调整 信息需求按范围和程度的不同,可分为三种类型: 普查型:需要全面收集某一主题的文献资料 公关型:需要收集有关某一主题的某一特定方面的文献资料,以解决 科研生产中的关键问题;
10 一般公信度高的,较准确的信息才会被收集、组织或存储在检索工具或数 据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数 十倍。 3)能提高信息素质,加速成才 信息素质(Information Lliteracy)是指具有获取信息的强烈意识,掌 握信息检索的技术和方法,拥有信息鉴别和利用的能力。中国的高等教育 法明确要求大学生要具备信息素质。 第二章 信息检索理论与方法 第一节 信息检索原理 一、 信息检索策略 信息检索策略是为实现检索目标而制定的计划和方案,是对整个检索 过程的谋划和指导。即是对检索过程的安排。 检索策略有两种方式:手工检索策略和计算机检索策略。 在计算机检索的条件下,检索策略的构造应是在明确检索目标和信息 需求的基础上进行的,包括选择检索数据库、确定检索项、选定检索范围 和检索方法,运用逻辑算符拟定检索表达式,按照一定的步骤实施检索, 并根据需要进行反馈调整。 信息需求按范围和程度的不同,可分为三种类型: ——普查型:需要全面收集某一主题的文献资料; ——公关型:需要收集有关某一主题的某一特定方面的文献资料,以解决 科研生产中的关键问题;