探索型:需要了解和掌握某一领域的最新研究动向或硏究成果 查出的文献具有新颖及时的特点 并要明确课题对査新、査全和査准的要求,包括信息的形式需求和内 容需求。 制定检索策略就是在确定检索主题的基础上,选择检索系统,确定检 索途径和拟定检索程序,它包括手工检索策略和机器检索策略的制定 1、选择检索系统 考虑选择计算机检索系统要包含与信息需求结合紧密、学科专业对口、 覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的数据库以及 系统的检索功能是否完善等。 选择检索系统关键是数据库的选择,如书目文摘型数据库可检索文献 信息的题名、作者、出处和文摘;(《医学文摘》 MEDLINE,《科学文摘》 INSPEC 《美国化学文摘》 CHEMICAL ABSTRACTS)事实型数据库可检索文字、图形、 声像、计算机程序等(《中国法律法规大典》《中国雕塑史图录》《中国古典 音乐大全》) 这就需要了解数据库所对应的版本形式如印刷版、光盘版、网络版等, 如《工程索引》数据库就有三个版本,印刷版( The Engineering Index-Ei,1884--)、光盘版( Ei Compendex plus,1989)、网络版 EiCompendexWeb, http://ultr2.libtsinghuaeducn/ei-village/plisg/switch.main 1970--)。 2、确定检索词
11 ——探索型:需要了解和掌握某一领域的最新研究动向或研究成果 查出的文献具有新颖及时的特点。 并要明确课题对查新、查全和查准的要求,包括信息的形式需求和内 容需求。 制定检索策略就是在确定检索主题的基础上,选择检索系统,确定检 索途径和拟定检索程序,它包括手工检索策略和机器检索策略的制定。 1、 选择检索系统 考虑选择计算机检索系统要包含与信息需求结合紧密、学科专业对口、 覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的数据库以及 系统的检索功能是否完善等。 选择检索系统关键是数据库的选择,如书目文摘型数据库可检索文献 信息的题名、作者、出处和文摘;(《医学文摘》MEDLINE,《科学文摘》INSPEC 《美国化学文摘》CHEMICAL ABSTRACTS)事实型数据库可检索文字、图形、 声像、计算机程序等(《中国法律法规大典》《中国雕塑史图录》《中国古典 音乐大全》)。 这就需要了解数据库所对应的版本形式如印刷版、光盘版、网络版等, 如《工程索引》数据库就有三个版本,印刷版(The Engineering Index---Ei, 1884--)、光盘版(Ei Compendex Plus, 1989--)、网络版 EiCompendexWeb, http://ultr2.lib.tsinghua.edu.cn/ei-village/plsg/switch. main, 1970--)。 2、 确定检索词
检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有 关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索 效果。检索词分为四类: 1)表示主题的检索词 标题词:指经规范化处理得先组定组式的词汇。 单元词:指从信息内容中抽出的最基本的词汇 ——叙词:指从信息的内容中抽出德、能概括表达信息内容基本概念的 名词或术语,它是经规范化处理的自然语言词汇。 关键词:指从信息单元的题目、正文或摘要中抽出德能表征信息主 体内容的具有实质意义的词语,它是未经规范化处理的自然语言词汇。 2)表示作者的检索词。如作者姓名、机构名。 3)表示分类的检索词。如分类号 4)表示特殊意义的检索词。如ISBN、ISSN、引文标引词等。 检索词的选择与确定要遵循以下两个原则 a)根据检索课题所涉及的学科专业和技术内容选词。 b)对检索词进行处理。如使用检索词表进行比较对照,选用规范化 的词汇作为检索词。 构造检索表达式 在计算机检索过程中,检索提问与存储标识之间的对比是由机器进行 的,构造检索表达式的核心是构造一个既能表达检索课题需求,又能被计 算机识别的检索表达式 构造检索表达式前要弄清所使用数据库的检索功能和所采用的操作算
12 检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有 关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索 效果。检索词分为四类: 1)表示主题的检索词 ——标题词:指经规范化处理得先组定组式的词汇。 ——单元词:指从信息内容中抽出的最基本的词汇。 ——叙词:指从信息的内容中抽出德、能概括表达信息内容基本概念的 名词或术语,它是经规范化处理的自然语言词汇。 ——关键词:指从信息单元的题目、正文或摘要中抽出德能表征信息主 体内容的具有实质意义的词语,它是未经规范化处理的自然语言词汇。 2)表示作者的检索词。如作者姓名、机构名。 3)表示分类的检索词。如分类号 4)表示特殊意义的检索词。如 ISBN、ISSN、引文标引词等。 检索词的选择与确定要遵循以下两个原则 a) 根据检索课题所涉及的学科专业和技术内容选词。 b) 对检索词进行处理。如使用检索词表进行比较对照,选用规范化 的词汇作为检索词。 3、 构造检索表达式 在计算机检索过程中,检索提问与存储标识之间的对比是由机器进行 的,构造检索表达式的核心是构造一个既能表达检索课题需求,又能被计 算机识别的检索表达式。 构造检索表达式前要弄清所使用数据库的检索功能和所采用的操作算
符,才能有效地进行信息检索。如截词符,在 Ei Compendex中用 表示,在 DIALOG,UMI中用“?”表示,在OCLC中用“+”表示 检索表达式中用于连接各词的算符按其功能不同可分为逻辑算符、位 置算符、截词算符和限制符等,不同的数据库会采用不同的符号或文字来 描述词与词之间的组配关系。 逻辑算符:又称布尔逻辑算符,利用布尔代数中的逻辑运算符来描述 检索词之间的关系。常用的三种:逻辑与(AND或*)、逻辑或(OR或+)、 逻辑非(NOT或-)。 位置算符:指表示词与词之间位置关系的符号。是对检索词进行加工 修饰,限制词与词之间位置关系,弥补布尔逻辑算符只是定性规定检索词 的范围,可提高查准率。 常用的位置算符有:W——With的缩写,表示算符两侧的检索词按此 前后衔接的顺序排列,词序不可变更,且两词之间不许有其他的词或字母, 但允许两词之间有空格或标点符号。 nW—— n Word的缩写,表示算符两侧的检索词之间允许插入个实词 或系统禁用词,如冠词、介词和连接词 N—Near的缩写,表示算符两侧的检索词必须紧密连接,词间只允 许有空格或标点符号。同时出现在文献纪录的同一字段中 nN一表示算符两侧的检索词之间允许插入n个实词或系统禁用词, 两词词序可变。同时出现在文献纪录的同一字段中 S—_ Subfield的缩写。表示算符两侧的检索词必须同时出现在文献 纪录的同一字段、句子或短语中,允许插入n个实词或系统禁用词,词序
13 符,才能有效地进行信息检索。如截词符,在 Ei Compendex 中用“*” 表示,在 DIALOG ,UMI 中用“?”表示,在 OCLC 中用“+”表示。 检索表达式中用于连接各词的算符按其功能不同可分为逻辑算符、位 置算符、截词算符和限制符等,不同的数据库会采用不同的符号或文字来 描述词与词之间的组配关系。 逻辑算符:又称布尔逻辑算符,利用布尔代数中的逻辑运算符来描述 检索词之间的关系。常用的三种:逻辑与(AND 或*)、逻辑或(OR 或+)、 逻辑非(NOT 或-)。 位置算符:指表示词与词之间位置关系的符号。是对检索词进行加工、 修饰,限制词与词之间位置关系,弥补布尔逻辑算符只是定性规定检索词 的范围,可提高查准率。 常用的位置算符有:W——With 的缩写, 表示算符两侧的检索词按此 前后衔接的顺序排列,词序不可变更,且两词之间不许有其他的词或字母, 但允许两词之间有空格或标点符号。 nW—— n Word 的缩写, 表示算符两侧的检索词之间允许插入个实词 或系统禁用词,如冠词、介词和连接词。 N ——Near 的缩写,表示算符两侧的检索词必须紧密连接,词间只允 许有空格或标点符号。同时出现在文献纪录的同一字段中 nN——表示算符两侧的检索词之间允许插入 n 个实词或系统禁用词, 两词词序可变。同时出现在文献纪录的同一字段中 S ——Subfield 的缩写。表示算符两侧的检索词必须同时出现在文献 纪录的同一字段、句子或短语中,允许插入 n 个实词或系统禁用词, 词序
可变 Field的缩写。表示算符两侧的检索词必须同时出现在文献纪 录的同一字段中,允许插入n个实词或系统禁用词,词序可变。 C- CItation的缩写。表示算符两侧的检索词必须同时出现在一条 文献的记录中,词间允许插入n个实词或系统禁用词,词序可变。 L—Link的缩写。表示算符两侧的检索词之间有一定的从属关系。 截词符:是指在检索词的合适位置进行截断。截词符的作用是对检索 词进行截词处理,解决一个词的单复数问题,词干相同而词尾不同的问题 和英美词汇拼写差异的问题。常用的截词符有“*”、“?”“$”。按截断的 字符数量可分为有限截断和无限截短。 有限截断是指检索词串与被检索词实现只能在指定位置可以不一致的 匹配,常用“?”表示。如:acid,可以匹配acid, acidic但不能匹配 acidity 无限截断是指检索词串与被检索词实现部分一致的匹配。常用“*”表 其截断形式有左截断、中截断、右截断 左截断是指检索词与被检索词实现词间的后部相同,即对同词干而前 缀不同的概念进行检索如* magnetic,可检出 magnetic,or, parama gnetic 的信息,但检不出 magenetic的信息 右截断词是指检索词与被检索词间的前部相同而后缀不同的检索。如: acid*可检出含有acid, acidify, acidic等词的信息。 中断截词是指检索词与被检索词之间只需任意部分匹配即可。如 * relation*可检出 relation, relations, interrelation等词的信息。 限制符:其作用是限制检索词或检索式在数据库记录中出现的字段位置
14 可变。 F—— Field 的缩写。表示算符两侧的检索词必须同时出现在文献纪 录的同一字段中,允许插入 n 个实词或系统禁用词,词序可变。 C——Citation 的缩写。表示算符两侧的检索词必须同时出现在一条 文献的记录中,词间允许插入 n 个实词或系统禁用词,词序可变。 L——Link 的缩写。表示算符两侧的检索词之间有一定的从属关系。 截词符:是指在检索词的合适位置进行截断。截词符的作用是对检索 词进行截词处理,解决一个词的单复数问题,词干相同而词尾不同的问题 和英美词汇拼写差异的问题。常用的截词符有“*”、“?”“$”。按截断的 字符数量可分为有限截断和无限截短。 有限截断是指检索词串与被检索词实现只能在指定位置可以不一致的 匹配,常用“?”表示。如:acid,可以匹配 acid,acidic 但不能匹配acidity。 无限截断是指检索词串与被检索词实现部分一致的匹配。常用“*”表 示。其截断形式有左截断、中截断、右截断。 左截断是指检索词与被检索词实现词间的后部相同,即对同词干而前 缀不同的概念进行检索如*magnetic,可检出 magnetic,or,paramagnetic 的信息,但检不出 mangenetics 的信息。 右截断词是指检索词与被检索词间的前部相同而后缀不同的检索。如: acid*可检出含有 acid,acidify,acidic 等词的信息。 中断截词是指检索词与被检索词之间只需任意部分匹配即可。如: *relation*可检出 relation,relations,interralation 等词的信息。 限制符:其作用是限制检索词或检索式在数据库记录中出现的字段位置
数据库中可供检索的字段通常分为基本检索字段和辅助检索字段 基本检索字段主要有题名(TI)文摘(AB)主题词(DE)和标识词(ID), 适用于各种数据库。 辅助检索字段主要有作者(AU),语种(LA),出版年代(PY)刊物名 称(JN)。文献类型(DT)等字段。这些限制氟在不同的系统或数据库中有 不同的表达形式和使用规则,使用时要参照有关数据库的使用说明。避免 产生误检。 要注意选择的检索标识只能表达信息需求的不同侧面,而不能反映需 求的完整内容,只有用逻辑表达式将不同的检索标识组合在一起,才有可 能表达完整的检索课题。“与”和“非”组合使用得越多,信息需求的开年 表达得越深,切题性就比较高 如:“有关造纸废水的处理技术”方面的检索式,首先抽起检索词: 造纸一 paper making, paper pulp 废水一— waster water 处理— treat, treatment 构造检索式:( paper w making or paper w pulp) and waster water and (treat or treatment) 4、实施检索策略 1)获取检索信息 手工检索策略的实施,主要将检索策略中信息需求所涉及到的有关提 问特征如:主题词、分类号、作者姓名等与检索系统中的检索标识进行比 较分析,筛选与信息需求相一致的检索结果
15 数据库中可供检索的字段通常分为基本检索字段和辅助检索字段。 基本检索字段主要有题名(TI)文摘(AB)主题词(DE)和标识词(ID), 适用于各种数据库。 辅助检索字段主要有作者(AU),语种(LA),出版年代(PY)刊物名 称(JN)。文献类型(DT)等字段。这些限制氟在不同的系统或数据库中有 不同的表达形式和使用规则,使用时要参照有关数据库的使用说明。避免 产生误检。 要注意选择的检索标识只能表达信息需求的不同侧面,而不能反映需 求的完整内容,只有用逻辑表达式将不同的检索标识组合在一起,才有可 能表达完整的检索课题。“与”和“非”组合使用得越多,信息需求的开年 表达得越深,切题性就比较高。 如:“有关造纸废水的处理技术”方面的检索式,首先抽起检索词: 造纸——paper making, paper pulp 废水——waster water 处理——treat, treatment 构造检索式:(paper w making or paper w pulp) and waster water and (treat or treatment)。 4、 实施检索策略 1)获取检索信息 手工检索策略的实施,主要将检索策略中信息需求所涉及到的有关提 问特征如:主题词、分类号、作者姓名等与检索系统中的检索标识进行比 较分析,筛选与信息需求相一致的检索结果