第八章主题法 第一节主题法概述 主题法一直接以表达文献主题的语词作检索标识以字 第一节主题法概述 顺为主要检索途径的标引和检索文献的方法 第二节叙词表的结构 主题法特征 第三节叙词法的词汇控制 直接以语词为检素标识。例:“茶的焙制”,分类标 识为:TS272.41主题标识为:“茶叶加工” 第四节叙词表的编制与维护 以字顺为主要检宗途径。汉语一拼音或笔划笔顺。 以主题为中心集中图书资料 通过参照系统等揭示主题之间关系 主题法的类型 1标题法 按照选词方式 ·标题法—一种以标题词作为主题标识 以词表预先确定的组配方式标引和检索 叙词法 的主题法 ·标题词一亦称标题,指经过规范化处理 的,用来标引文献的词或词组,通常为 比较定型的事物名称 美国国会标题表基本标题类型 (Lbrary of Congress Sbject Heading) 副标题、复分标题 Library(图书馆一单词标题) 自由浮动通用复分表(Fre English literature(英语文学一形容词词组标题) Floating Subdivisions ): Children in motion pictures(电影中的儿童一介词词组标题 种族、团体、 Literature and science(文学与科学一连词词组标题 人名、地名 Chemistry, Organic(有机化学一倒量标题) 示范标题: Cookery( Frozen food)(冷冻食品的烹调一带限定调的标题) Personal name]in Reference books-Bibliography(参考书一书目一复分标题) poetry, etc [Topic or place] in literatu [Topic or place] in art
1 第八章 主题法 第一节 主题法概述 第二节 叙词表的结构 第三节 叙词法的词汇控制 第四节 叙词表的编制与维护 第一节 主题法概述 主题法—直接以表达文献主题的语词作检索标识,以字 顺为主要检索途径的标引和检索文献的方法。 主题法特征 • 直接以语词为检索标识。例:“茶的焙制”,分类标 识为:TS272.4;主题标识为:“茶叶加工” ; • 以字顺为主要检索途径。汉语-拼音或笔划笔顺。 • 以主题为中心集中图书资料。 • 通过参照系统等揭示主题之间关系。 主题法的类型 • 按照选词方式, – 标题法 – 元词法 – 叙词法 – 关键词法 • 按照组配的先后 – 为先组式主题法 – 后组式主题法 • 按照是否控制 – 自然语言主题法 – 受控主题法 1.标题法 • 标题法 —一种以标题词作为主题标识, 以词表预先确定的组配方式标引和检索 的主题法。 • 标题词—亦称标题,指经过规范化处理 的,用来标引文献的词或词组,通常为 比较定型的事物名称。 美国国会标题表基本标题类型 (Lbrary of Congress of Congress Sbject Heading) Library (图书馆 ─单词标题) English literature (英语文学─形容词词组标题) Children in motion pictures(电影中的儿童─介词词组标题) Literature and science (文学与科学─连词词组标题) Chemistry, Organic (有机化学 ─倒置标题) Cookery (Frozen food)(冷冻食品的烹调─带限定词的标题) Reference books—Bibliography(参考书—书目─复分标题) 副标题、复分标题 • 自由浮动通用复分表( FreeFloating Subdivisions): – 供特定范畴如:人物、种族、团体、 人名、地名、河流等使用; • 示范标题: – [ Personal name] in fiction,drama, poetry,etc. – [Topic or place] in literature – [Topic or place] in art
标题法的参照 标题法主题法特点与不足 特点 早期只限于 采用列举式词表,形式直 定组式标题结构固定,食义明确 见参照}—揭示等同关系 按照调列举的标属和副标进行标引,操作 参见参照—揭示等级、相关关系 主通过以参顺方式揭示标题之闻的相关性。 《美国国会图书馆标题表》(LCSH)自 1988年开始也使用了类似叙词法的参照 定组式标,无法多元检囊〔手工系统中 2元词法 3叙词法 元词一指用来标引文献主题的、最基本的、 字面上不能再分的语词 叙词亦称主题词,是经过规范化处 文献”、“分类”、“主题”、“标引”——元词: 理的,以基本概念为基础的表达文献主 文献分类”、“主题标引”非元词 题的词和词组 元词法一以元词作为主题标识,通过字面 叙词法以叙词作为文献主题标识 组配的方式表达文就主题的主题法 过概念组配方式表达文献主题的主题 法类型 叙词法与元词法的不同 司对h它的收 其它检索语言技术 叙词语言技术 其一,语词的形式不同。元词法只用单元 体系分类法学科分类 范畴索引 词,叙词法同时收词组。 等级结构 族索引 洋细分类词表 仪表 分面分类语言分面组配 概念组 其二,组配的依据不同。元词法:按照字 面组配对复合主题分拆和相加;叙词法 标题语言 依据概念关系对复合主题进行分解和组 见参照、参见参照 配 元词语言 如主题“生物物理学”,元词法标引为:生物 完全后组 基本后组 法标引为:“生物学”、“物理 反记法 倒排档 关键词语言轮排技术 轮排索引
2 标题法的参照 • 早期只限于: – 见参照|——揭示等同关系 – 参见参照——揭示等级、相关关系。 • 《美国国会图书馆标题表》( LCSH)自 1988年开始也使用了类似叙词法的参照 方式。 标题法主题法特点与不足 特点: – 采用列举式词表,形式直观; – 定组式标题结构固定,含义明确; – 按照词表列举的标题和副标题进行标引,操作 简便; – 主通过以参照方式揭示标题之间的相关性。 不足: – 收词量大; – 专指度不足; – 修订量大; – 定组式标题,无法多元检索(手工系统中)。 2.元词法 元词—指用来标引文献主题的、最基本的、 字面上不能再分的语词。 “文献”、“分类”、“主题”、“标引”——元词; “文献分类”、“主题标引”——非元词。 元词法—以元词作为主题标识,通过字面 组配的方式表达文献主题的主题法。 3.叙词法 • 叙词——亦称主题词,是经过规范化处 理的,以基本概念为基础的表达文献主 题的词和词组。 • 叙词法——以叙词作为文献主题标识, 通过概念组配方式表达文献主题的主题 法类型。 叙词法与元词法的不同 其一,语词的形式不同。 元词法只用单元 词,叙词法同时收词组。 – 例:主题“工业仪表”,元词法标引:“工业”、 “仪表”,叙词法标引:“工业仪表”。 其二,组配的依据不同。元词法:按照字 面组配对复合主题分拆和相加;叙词法: 依据概念关系对复合主题进行分解和组 配。 – 如主题“生物物理学”,元词法标引为:生物、 物理学;叙词法标引为:“生物学”、“物理 学” 叙词语言对其它检索语言技术的吸收 其它检索语言 技 术 叙词语言技术 体系分类法 学科分类 等级结构 范畴索引 词族索引 详细分类词表 分面分类语言 分面组配 概念组配 分面词表 标题语言 先组 见参照、参见参照 适当先组 用、代、属、分、参参照 元词语言 字面组配 完全后组 反记法 概念组配 基本后组 倒排档 关键词语言 轮排技术 轮排索引 (引自《主题法导论》)
叙词法的特点与问题 关键词法 特 关键词法直接以自然语言中未经控制或只作少量控制的语词为 (1)概念组配,能准确揭示主题 文献主题标识,标引和检索的方法 (2)通过参照系统和索引,对词汇有效控制 例:早期的机编关键词索引,目前的文本检索系统。下面是题 (3)多途径检索,可采用灵活组配方式及对词间联系 名关键词索引的例子 充分揭示检索 (4)同时适用于多种方式,包括:标识单元和文献单 佥索入口 元检索方式,机检和手检。 (1)词表编制和管理的难度大,花费较多人力、物力 (2)文献标引须在概念分析的基础上进行,标引难度 大 弱智儿童的游戏疗法小学中300 关键词特点和不足 主题语言类型:先组式与后组式 特点 掌机进行标引或处理,速度快,成 先组式检素语言指在标引阶段,复杂主题的标 本低,词汇更新及时; 识在系统中就已经按一定方式组好了的一种标 专指性优于标题语言和叙词语言 引和检崭的语言。如:标题法。 本表达质量的影响,检索质量不稳 后组式检宗语言指检前,复杂主题的标识在 检索系统中是以基本念的形式独立存在的,实 缺乏词汇控制 施检索时,才很捐检案提问进行组合检亲语言 中文关键词计算机抽词标引需要词表。 包括:元词法、叙词法 主题语言类型:受控语言与自然语言 主题法类型 受控语言—指经过词汇控制的标识系 搜选择的词汇 按黑组聚先后 是否制 统。包括;分类法、标题法、叙词法。 自然语言—直接使用文就用词或检囊 标法 先式主法 词为标识的系统。包括:关健词法、自 由标引、自动标引、自然语言文本检索 后解击氯法 旱期为非控主 受控与自然语言结合形式,包括:受控 标引结合自由标引、自由标引+后控检 后成散組式主黑法受控的主题法 关调 后解主愿法 非控主
3 叙词法的特点与问题 特点 (1)概念组配,能准确揭示主题。 (2)通过参照系统和索引,对词汇有效控制。 (3)多途径检索,可采用灵活组配方式及对词间联系 充分揭示检索。 (4)同时适用于多种方式,包括:标识单元和文献单 元检索方式,机检和手检。 不足: (1)词表编制和管理的难度大,花费较多人力、物力; (2)文献标引须在概念分析的基础上进行,标引难度 大 。 关键词法 关键词法直接以自然语言中未经控制或只作少量控制的语词为 文献主题标识,标引和检索的方法。 例:早期的机编关键词索引,目前的文本检索系统。下面是题 名关键词索引的例子: * 检索入口 法/小学中 弱智儿童的游戏疗 3000 小学中弱智 儿童的游戏疗法/ 3000 儿童的游戏 疗法/小学中弱智 3000 游戏疗法/ 小学中弱智儿童的 3000 弱智儿童的 游戏疗法/小学中 3000 关键词特点和不足 特点: • 可以使用计算机进行标引或处理,速度快,成 本低,词汇更新及时; • 专指性优于标题语言和叙词语言。 不足 • 容易受到文本表达质量的影响,检索质量不稳 定; • 缺乏词汇控制。 • 中文关键词计算机抽词标引需要词表。 主题语言类型:先组式与后组式 先组式检索语言——指在标引阶段,复杂主题的标 识在系统中就已经按一定方式组配好了的一种标 引和检索的语言。如:标题法。 后组式检索语言——指检索前,复杂主题的标识在 检索系统中是以基本概念的形式独立存在的,实 施检索时,才根据检索提问进行组合检索语言。 包括:元词法、叙词法。 主题语言类型:受控语言与自然语言 受控语言——指经过词汇控制的标识系 统。 包括:分类法、标题法、叙词法。 自然语言——直接使用文献用词或检索 词为标识的系统。包括:关键词法、自 由标引、自动标引、自然语言文本检索。 受控与自然语言结合形式,包括:受控 标引结合自由标引、自由标引+后控检 索 主题法类型 按照选择的词汇 按照组配先后 按照是否控制 标题法 先组式主题法 受控的主题法 元词法 后组式主题法 早期为非控主题法 叙词法 后组或散组式主题法 受控的主题法 关键词法 后组式主题法 非控主题法
第二节叙词表的结构 叙词表结构组成 叙词表是一种将标引人员或用户的 按照其显示方式 自然语言转换成规范化语言的术语控制 字顺显示 工具;是概括各门或某一学科领域并由 系统显示 词义相关、语义相关的术语组成的可以 图形显示 不断补充的规范化词典 ·按照各组成部分的性质,包括 从结构组成看,是对术语之间各种词义联 字顺表 系进行显示的词汇系统 附表 从功能看,将自然语言转换成规范化语言 辅助素引等 的术语控制工具 字顺显示 1字顺表 字顺表一由叙词款目和非叙词款目按字 字顺主表 顺排列的一览表。亦称为主表。 2专类复分表 3入口词表 叙词款目一由叙词及其相关语义关系项 构成的独立排检单位,包括正式叙词 4叙词式 款目和非叙词款目 5双语种词表 叙词款目组成一包括:款目词项、标记 项、注释项、参照项 wve zhengce-汉语拼音 钗词——农业政策 05B—范畴号 Agncultural policy-英文译名 Nongye fangzhen zhengce 汉语拼音 D农业方针政策一一非叙 非叙词——农业方针政策 05A范赙号 F副业政 Agricultural programand poli 粮食政策 用项一 Y农政策 汉词 林业政策 土地政 畜牧业政策 上位词 一族首词 C农村经济政策 农业法令 农业发展路线 》司款且,趔
4 第二节 叙词表的结构 • 叙词表——是一种将标引人员或用户的 自然语言转换成规范化语言的术语控制 工具;是概括各门或某一学科领域并由 词义相关、语义相关的术语组成的可以 不断补充的规范化词典。 – 从结构组成看,是对术语之间各种词义联 系进行显示的词汇系统; – 从功能看,将自然语言转换成规范化语言 的术语控制工具 。 叙词表结构组成 • 按照其显示方式 – 字顺显示 – 系统显示 – 图形显示 • 按照各组成部分的性质,包括 – 字顺表 – 附表 – 辅助索引等 一、字顺显示 1.字顺主表 2.专类复分表 3.入口词表 4.叙词索引 5.双语种词表 1. 字顺表 字顺表—由叙词款目和非叙词款目按字 顺排列的一览表。 亦称为主表。 叙词款目—由叙词及其相关语义关系项 构成的独立排检单位,包括正式叙词 款目和非叙词款目。 叙词款目组成—包括:款目词项、标记 项、注释项、参照项。 Nongye zhengce──汉语拼音 叙词── 农业政策 05B──范畴号 Agricultural policy──英文译名 代项── D 农业方针政策──非叙词 分项── F 副业政策 粮食政策 ────下位词 林业政策 土地政策 畜牧业政策 渔业政策 属项── S 经济 ────上位词 族项── Z 政策 ────族首词 参项── C 农村经济政策 农业法令 ────相关词 农业发展路线 《汉表》叙词款目样例 Nongye fangzhen zhengce ────汉语拼音 非叙词──农业方针政策 05A──范畴号 Agricultural program and policy ──英文译名 用项── Y 农业政策 ──叙词 《汉表》非叙词款目样例
字顺表款目的有关概念 字顺索引与入口词表 款目词—款目中起标目作用的词。汉语叙词 表中,款目词项往往包括汉语拼音和对应的外 字顺索引仅收入叙词、非叙词,非叙 标记项一记录款目词的序号以及款目词所属范 词含有用项参照,其余项目一概不收。 注释 目词的补充说明,包括含义注 入口词表是由非叙词单独编制的表, 历史注释及用法注释等,用于明确款目词的含 义、用法和变动等 收入词表编制或标引中出现的按等同关 义关系参照项 般根据语义情况依次设置 系处理的非叙词(包括未收入词表的其 族、参各项参照。非叙词下只设 它非叙词),用以提高检全率。 用项,用于指向相应的叙词 2.专有叙词表(1) 3.双语种索引 双语种黨引——是一种将全部叙词及非叙词与相应外语译名相互对 专有叙词表—亦称附表,是将众多专有名词按 外文译名字顺排列的索引,是通过外文译名使用词表的辅 缩小主变的篇幅 分类显示的作用,可从范畔出发查 及时管理或增补 主分析 《汉表》的专有叙词表:“世界各国政区名称” 主目录 自然地理区划名称”、“组织机构和“人物” 《铁路汉语主题词表》专有叙词表:根据专业的 标法(主法 点或需要,设有地名、机构、型号、路名等 专有叙词表在确有必要时才编制,否则会造成词 Subject indexing 表结构的分散。 主引 二、系统显示 1.范畴索引 通过将叙词按照一定的关系加以组织,以 范囀案引—亦称分类索引,范畸表,是一种按 清足从不同角度查找叙词的显示方式 照词汇所属学科或范喇编制的概略分类系统 是从分类角度查找叙词的辅助工具 包括: 范索引作用 畴索引 ①便于从分类角度查找与某一范有关的叙 轮排索引 ②可以作为类分文献的依据 分类主题一体化词表 是编表时按类选词、确定词间关系、编制 参照系统等的工具
5 字顺表款目的有关概念 款目词——一款目中起标目作用的词。汉语叙词 表中,款目词项往往包括汉语拼音和对应的外 语译名。 标记项——记录款目词的序号以及款目词所属范 畴的号码。 注释项——款目词的补充说明,包括含义注释、 历史注释及用法注释等,用于明确款目词的含 义、用法和变动等。 语义关系参照项—— 一般根据语义情况依次设置 代、分、属、族、参各项参照。非叙词下只设 用项,用于指向相应的叙词。 字顺索引与入口词表 字顺索引——仅收入叙词、非叙词,非叙 词含有用项参照,其余项目一概不收。 入口词表——是由非叙词单独编制的表, 收入词表编制或标引中出现的按等同关 系处理的非叙词(包括未收入词表的其 它非叙词),用以提高检全率。 2. 专有叙词表(1) 专有叙词表——亦称附表,是将众多专有名词按 字顺排列的表。作用: – 缩小主表的篇幅; – 分类显示的作用,可从范畴出发查词; – 及时管理或增补。 《汉表》的专有叙词表:“世界各国政区名称”、 “自然地理区划名称”、“组织机构”和“人物” 。 《铁路汉语主题词表》专有叙词表:根据专业的 特点或需要,设有地名、机构、型号、路名等。 专有叙词表在确有必要时才编制,否则会造成词 表结构的分散。 3. 双语种索引 双语种索引——是一种将全部叙词及非叙词与相应外语译名相互对 应、按外文译名字顺排列的索引,是通过外文译名使用词表的辅 助工具。 Subject 主语 主体 Subject analysis 主题分析 Subject catalogue 主题目录 Subject heading 标题法 (Y 主题法) Subject index 主题索引 Subject indexing 主题标引 二、系统显示 通过将叙词按照一定的关系加以组织,以 满足从不同角度查找叙词的显示方式。 包括: – 范畴索引 – 词族索引 – 轮排索引 – 分类主题一体化词表 1. 范畴索引 范畴索引——亦称分类索引,范畴表,是一种按 照词汇所属学科或范畴编制的概略分类系统, 是从分类角度查找叙词的辅助工具。 范畴索引作用: ①便于从分类角度查找与某一范畴有关的叙 词。 ②可以作为类分文献的依据 。 ③是编表时按类选词、确定词间关系、编制 参照系统等的工具