第15卷第5期 智能系统学报 Vol.15 No.5 2020年9月 CAAI Transactions on Intelligent Systems Sep.2020 D0:10.11992/tis.201907021 网络出版地址:https:/ns.cnki.net/kcms/detail/23.1538.TP.20200804.0848.002.html SFEP文本因果关系提取及其与SFN转化研究 崔铁军2,李莎莎2 (1.辽宁工程技术大学安全科学与工程学院,辽宁阜新123000;2.辽宁工程技术大学工商管理学院,辽宁葫 芦岛125105) 摘要:为将系统故障演化过程(system fault evolution process,SFEP)的文本描述转化为空间故障网络(space fault network,SFN)结构,用于故障分析,本文提出SFEP文本因果关系提取方法,及其与SFN基本结构的转化 方法。首先给出SFEP中事件的几种典型因果关系。随后提出因果关系与SFN基本结构的转化流程。本文方 法围绕着关键字和因果关系组模式展开,通过模型的不断学习补充和丰富关键字和组模式。最终使方法具备 将SFP文本转化为SN结构的能力。以飞机起落架故障发生过程文本为例进行了应用,实验结果表明该方法可用于SFEP 文本中的因果关系分析,并得到了理想的SFN。完善的关键字和组模式有利于使用计算机智能处理SFEP的 SFN。 关键词:安全系统工程:智能科学;知识提取;系统故障:演化过程;文本因果关系;空间故障网络:转化研究 中图分类号:X913;C931.1;TP18文献标志码:A文章编号:1673-4785(2020)05-0998-08 中文引用格式:崔铁军,李莎莎.SFEP文本因果关系提取及其与SFN转化研究.智能系统学报,2020,15(5):998-1005. 英文引用格式:CUI Tiejun,.LI Shasha..Causality extraction of SFEP text and its conversion to SFN[J]..CAAI transactions on intel-- ligent systems,.2020,15(⑤):998-1005. Causality extraction of SFEP text and its conversion to SFN CUI Tiejun'2,LI Shasha? (1.College of Safety Science and Engineering,Liaoning Technical University,Fuxin 123000,China;2.School of Business Adminis- tration,Liaoning Technical University,Huludao 125105,China) Abstract:To transform the text description of the system fault evolution process(SFEP)into a space fault network (SFN)for fault analyses,we propose a method for extracting the text causality of SFEP and its transformation with the basic structure of SFN.First,several typical causal relationships of events in SFEP are given.Then,the transformation process of causality and SFN basic structure is proposed.The method focuses on the key words and causal group mod- els,the keywords and group models are enriched and supplemented through continuous model learning.Finally,the method transforms SFEP text into an SFN structure.The method is applied to the text processing of aircraft landing gear failure.The findings show that the method can be used to analyze causality in SFEP text and obtain an ideal SFN.Per- fect keywords and group models are beneficial to the intelligent processing of SFEP text to SFN using computers. Keywords:safety system engineering;intelligence science;knowledge extraction;system fault;evolution process;text causality;space fault network;transformation research 系统故障演化过程SFEp表示了故障产生 按照一定顺序依次发生形成的:微观上则是事件 过程中,从原因开始到结果之间各事件及其逻辑 之间逻辑关系导致的。这里的逻辑关系主要是因 关系。通常无论是自然系统还是人工系统发生灾 果逻辑关系。 害或故障都不是一蹴而就的。宏观上是众多事件 作者2018年首次提出SFN理论.用于描述 收稿日期:2017-07-12.网络出版日期:2020-08-04. 和研究SFEP。SFN理论是空间故障树(space fault 基金项目:国家自然科学基金项目(52004120,51704141):国家 重点研发计划项目(2017YFC1503102). tree,SFT)理论的第3阶段。SFT的4个研究阶段 通信作者:崔铁军.E-mail:ctj.159@163.com. 分别为SFT理论基础s、智能化SFT220、SFN
DOI: 10.11992/tis.201907021 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20200804.0848.002.html SFEP 文本因果关系提取及其与 SFN 转化研究 崔铁军1,2,李莎莎2 (1. 辽宁工程技术大学 安全科学与工程学院,辽宁 阜新 123000; 2. 辽宁工程技术大学 工商管理学院,辽宁 葫 芦岛 125105) 摘 要:为将系统故障演化过程 (system fault evolution process,SFEP) 的文本描述转化为空间故障网络 (space fault network,SFN) 结构,用于故障分析,本文提出 SFEP 文本因果关系提取方法,及其与 SFN 基本结构的转化 方法。首先给出 SFEP 中事件的几种典型因果关系。随后提出因果关系与 SFN 基本结构的转化流程。本文方 法围绕着关键字和因果关系组模式展开,通过模型的不断学习补充和丰富关键字和组模式。最终使方法具备 将SFEP文本转化为SFN结构的能力。以飞机起落架故障发生过程文本为例进行了应用,实验结果表明该方法可用于SFEP 文本中的因果关系分析,并得到了理想的 SFN。完善的关键字和组模式有利于使用计算机智能处理 SFEP 的 SFN。 关键词:安全系统工程;智能科学;知识提取;系统故障;演化过程;文本因果关系;空间故障网络;转化研究 中图分类号:X913; C931.1;TP18 文献标志码:A 文章编号:1673−4785(2020)05−0998−08 中文引用格式:崔铁军, 李莎莎. SFEP 文本因果关系提取及其与 SFN 转化研究 [J]. 智能系统学报, 2020, 15(5): 998–1005. 英文引用格式:CUI Tiejun, LI Shasha. Causality extraction of SFEP text and its conversion to SFN[J]. CAAI transactions on intelligent systems, 2020, 15(5): 998–1005. Causality extraction of SFEP text and its conversion to SFN CUI Tiejun1,2 ,LI Shasha2 (1. College of Safety Science and Engineering, Liaoning Technical University, Fuxin 123000, China; 2. School of Business Administration, Liaoning Technical University, Huludao 125105, China) Abstract: To transform the text description of the system fault evolution process (SFEP) into a space fault network (SFN) for fault analyses, we propose a method for extracting the text causality of SFEP and its transformation with the basic structure of SFN. First, several typical causal relationships of events in SFEP are given. Then, the transformation process of causality and SFN basic structure is proposed. The method focuses on the key words and causal group models; the keywords and group models are enriched and supplemented through continuous model learning. Finally, the method transforms SFEP text into an SFN structure. The method is applied to the text processing of aircraft landing gear failure. The findings show that the method can be used to analyze causality in SFEP text and obtain an ideal SFN. Perfect keywords and group models are beneficial to the intelligent processing of SFEP text to SFN using computers. Keywords: safety system engineering; intelligence science; knowledge extraction; system fault; evolution process; text causality; space fault network; transformation research 系统故障演化过程 SFEP[1-5] 表示了故障产生 过程中,从原因开始到结果之间各事件及其逻辑 关系。通常无论是自然系统还是人工系统发生灾 害或故障都不是一蹴而就的。宏观上是众多事件 按照一定顺序依次发生形成的;微观上则是事件 之间逻辑关系导致的。这里的逻辑关系主要是因 果逻辑关系。 作者 2018 年首次提出 SFN 理论[1-5] 用于描述 和研究 SFEP。SFN 理论是空间故障树 (space fault tree,SFT) 理论的第 3 阶段。SFT 的 4 个研究阶段 分别为 SFT 理论基础[6-11] 、智能化 SFT[12-20] 、SFN[1-5] 收稿日期:2017−07−12. 网络出版日期:2020−08−04. 基金项目:国家自然科学基金项目 (52004120,51704141);国家 重点研发计划项目 (2017YFC1503102). 通信作者:崔铁军. E-mail:ctj.159@163.com. 第 15 卷第 5 期 智 能 系 统 学 报 Vol.15 No.5 2020 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2020
第5期 崔铁军,等:SFEP文本因果关系提取及其与SFN转化研究 ·999· 及系统运动空间和系统映射论。SFN可描述SFEP 过程事件(process event):由边缘事件或其他 中各事件及其之间的逻辑关系,但研究的困难在 过程事件导致的事件,同时也导致其他过程事件 于将SFEP转化为SFN。通常情况下,SFEP是通 或最终事件,用pe表示。 过事故调查、现场人员叙述或者专家推断得到的。 最终事件(target event):边缘事件或过程事件 这些SFEP数据是一种非结构的、文本形式的信 导致的事件,但不导致任何其他事件发生,用 息。如何将SFEP的文本描述转化为规则化的,具 te表示。 有符号表示特征的模式,以便进一步处理成为了 传递概率(transfer probability:原因事件可导 关键问题。这涉及到信息收集、知识提取、知识表 致结果事件的概率,用p表示。 示、知识规则化,更涉及到安全科学和SFN理论等。 原因事件(cause event):导致其他事件发生的 对类似问题,文本知识的提取和表示已有较 事件,包括边缘事件和过程事件,用c心表示。 多研究。涌现了如基于数据挖掘和数据驱动的因 结果事件(result event):被导致发生的事件, 果关系提取P2四、知识地图文本分类232训、结构因 包括过程事件和最终事件,用re表示。 果关系故障诊断、学习行为数据因果关系挖掘的 连接(connection):表示事件之间的相互关系, 条件随机域突发事件因果关系提取2)、因果关系 连接具有方向,从原因事件指向结果事件,并蕴 脑电特征提取21、因果关系验证信息提取2)、医 含传递概率。 疗知识文本内容提取o]、网站信息资源多维语义 1 SFEP的典型因果关系 知识融合B川、特征项权重与句子相似度的知识元 智能提取等方法。但一般情况下,这些文本知 在SFEP中主要蕴含了事件间的因果关系, 识提取方法都具有专业领域特征,难以应用于安 分为如下6种。 全及系统故障分析领域,难以在SFEP文本中有 1)单层传递结构:A→B,A事件导致B事 效提取因果知识,更难以形成SFN所需要的知识 件。A代表原因事件,B代表结果事件,下同。 规则化形式。 2)多层传递结构:A→B→C,A事件导致B事 针对上述问题,作者借鉴文本知识提取的一 件,B导致C事件。 般方法23),专门研究了适合SFN的因果关系提 3)归一与结构:A1∧A2A→B,多个原因事 取方法用于研究SFEP描述文本的表示和分析。 件A同时导致结果事件B。 方法可将SFEP文本语言描述转化为完整的 4)归一或结构:A,VA2V→B,多个原因事 SFN结构,从而为SFN的有效构建提供支持,同 件A,至少有一个发生导致结果事件B。 时该方法也适合计算机对符号序列的智能处理。 5)分支与结构:A→B1AB2八…,原因事件 这里首先解释文中出现的前期概念,其余相关概 A发生,同时产生多个结果事件。 念见参考文献[1-5]。 6)分支或结构:A→B,VB2V…,原因事件 边缘事件(edge event):导致故障的基本事件, A发生,产生多个结果事件中的一个或多个。 用ce表示。 上述关系在SFN中的表示如图1所示。 A→® B B A B (a)单层传递结构 ④ A ⑧ @ (a)单层传递结构 (c)归一与结构 (d归一或结构 (c)归一与结构 B A (b)多层传递结构 ()分支与结构 (g)分支或结构 (d)归一或结构 图16种逻辑关系的SFN转化结构 Fig.1 SFN transformation structures of 6 logic relations
及系统运动空间和系统映射论。SFN 可描述 SFEP 中各事件及其之间的逻辑关系,但研究的困难在 于将 SFEP 转化为 SFN。通常情况下,SFEP 是通 过事故调查、现场人员叙述或者专家推断得到的。 这些 SFEP 数据是一种非结构的、文本形式的信 息。如何将 SFEP 的文本描述转化为规则化的,具 有符号表示特征的模式,以便进一步处理成为了 关键问题。这涉及到信息收集、知识提取、知识表 示、知识规则化,更涉及到安全科学和 SFN 理论等。 对类似问题,文本知识的提取和表示已有较 多研究。涌现了如基于数据挖掘和数据驱动的因 果关系提取[21-22] 、知识地图文本分类[23-24] 、结构因 果关系故障诊断[25] 、学习行为数据因果关系挖掘[26] 、 条件随机域突发事件因果关系提取[27] 、因果关系 脑电特征提取[28] 、因果关系验证信息提取[29] 、医 疗知识文本内容提取[30] 、网站信息资源多维语义 知识融合[31] 、特征项权重与句子相似度的知识元 智能提取[32] 等方法。但一般情况下,这些文本知 识提取方法都具有专业领域特征,难以应用于安 全及系统故障分析领域,难以在 SFEP 文本中有 效提取因果知识,更难以形成 SFN 所需要的知识 规则化形式。 针对上述问题,作者借鉴文本知识提取的一 般方法[21-33] ,专门研究了适合 SFN 的因果关系提 取方法用于研究 SFEP 描述文本的表示和分析。 方法可 将 SFEP 文本语言描述转化为完整 的 SFN 结构,从而为 SFN 的有效构建提供支持,同 时该方法也适合计算机对符号序列的智能处理。 这里首先解释文中出现的前期概念,其余相关概 念见参考文献 [1-5]。 边缘事件 (edge event):导致故障的基本事件, 用 ee 表示。 过程事件 (process event):由边缘事件或其他 过程事件导致的事件,同时也导致其他过程事件 或最终事件,用 pe 表示。 最终事件 (target event):边缘事件或过程事件 导致的事件,但不导致任何其他事件发生,用 te 表示。 传递概率 (transfer probability):原因事件可导 致结果事件的概率,用 tp 表示。 原因事件 (cause event):导致其他事件发生的 事件,包括边缘事件和过程事件,用 ce 表示。 结果事件 (result event):被导致发生的事件, 包括过程事件和最终事件,用 re 表示。 连接 (connection):表示事件之间的相互关系, 连接具有方向,从原因事件指向结果事件,并蕴 含传递概率。 1 SFEP 的典型因果关系 在 SFEP 中主要蕴含了事件间的因果关系, 分为如下 6 种。 1) 单层传递结构:A→B,A 事件导致 B 事 件。A 代表原因事件,B 代表结果事件,下同。 2) 多层传递结构:A→B→C,A 事件导致 B 事 件,B 导致 C 事件。 3) 归一与结构:A1∧A2∧…→B,多个原因事 件 A 同时导致结果事件 B。 4) 归一或结构:A1∨A2∨…→B,多个原因事 件 A,至少有一个发生导致结果事件 B。 5) 分支与结构:A→B1∧B2∧…,原因事件 A 发生,同时产生多个结果事件。 6) 分支或结构:A→B1∨B2∨…,原因事件 A 发生,产生多个结果事件中的一个或多个。 上述关系在 SFN 中的表示如图 1 所示。 A B A B C A1 A2 B· A1 A2 B+ A B1 B2 A B1 B2 (a) 单层传递结构 (b) 多层传递结构 (d) 归一或结构 (a) 单层传递结构 (c) 归一与结构 (d) 归一或结构 (c) 归一与结构 (f) 分支与结构 (g) 分支或结构 A B A1 A2 B· A1 A2 B+ … … … … … … 图 1 6 种逻辑关系的 SFN 转化结构 Fig. 1 SFN transformation structures of 6 logic relations 第 5 期 崔铁军,等:SFEP 文本因果关系提取及其与 SFN 转化研究 ·999·
·1000· 智能系统学报 第15卷 从图1左侧可了解6种因果关系与SFN基本 2SFEP因果关系与SFN基本结构转 结构的转化情况。 化流程 定义1SFN基本结构。指由一个或多个原因 事件,一次连接和一个或多个结果事件组成的基 一般情况下SFEP通过语言描述形成文本, 本单元,即原因事件到结果事件经过一次连接的 如何将这些文本转化成可用于SFEP分析的 结构。 SFN是关键问题。SFN中包括事件和连接及其逻 SFN用于描述SFEP,对于最终事件的分析是 辑关系。事件主要包括原因事件和结果事件;或 按照SFEP的逆序关系描述的,即从最终事件 可分为边缘事件、过程事件和最终事件。所涉及 开始,按照连接的反方向找到各过程事件,最终 的原因事件和结果事件的逻辑关系主要是与或关 系,实际上存在20种这样的关系B43。在SFEP 找到边缘事件。从该角度出发,图1(a)、(b)2种形 中提取这些信息,首先要对SFEP语言论述进行 式的因果关系对于SN的分析是等效的,可归结 因果关系组划分;其次确定关键词;最后确定常 为图1(a)形式。图1(c)、(d)2种形式对SFN分析 用的因果关系组模式。 很重要。由于分析过程是结果事件到原因事件的 定义2因果关系组。划分SFEP的描述文本 逆序分析,B事件与其原因事件A之间的因果关 后,每一个因果关系划分表达一个完整的因果关 系很重要,因此在B事件后标注了A事件通过何 系描述,称为因果关系组(文本以“。”号分解最为 种逻辑关系导致B。图1(e)、(f)2种形式对 简单),因果关系组也是因果关系分析的最基本 SFN分析没有实际意义。因为从B事件寻找 单元。 A事件时,对B而言A总是确定的,不存在多个 定义3因果关系组模式。利用关键字将一个 A事件导致B事件的情况。综上将SFEP表示为 因果关系组中的词汇符号化,形成可表示原因果 SFN时,这6种因果关系形式都有可能出现,重要 关系组因果关系的符号序列。因果关系组模式是 度相同。但分析时只有图1(a)、(c)和(d)因果结 一类因果关系的抽象,是因果关系组表示为符号 构发挥作用。图1(b)、(©)和()3种因果结构都可 序列的模板。来源于实际SFEP的多个因果关系 归结为图l(a)因果结构进行研究。因此SFN表 组可能对应一个因果关系组模式。 示SFEP时使用图1左侧6种结构,而分析 使用知识提取方法,将SFEP的描述文本转 SFN时只需图1右侧3种结构。当然这里不考虑 化为SFN基本结构可分为3个阶段,如图2所 单向环结构,单向环的处理方法见文献[1-3,5]。 示,包括模型研究、模型学习和实例分析。 模型研究阶段 模型学习阶段 实例分析阶段 SFEP因果关系分析 SFEP收集 实例SFEP SFEP因果关系组划分 SFEP分解,分析关键词 补充关键词 SFEP分解为因果关系组 因果关键词确定 根据SFEP和关键词分析 补充组模式 寻找关键词 因果关系组模式 关键词收集并形成集合 判断因果关系模式 组模式转化SFN基本结构 补充基本结构 因果关系组模式确定 模式转化为SFN基本结构 模式对应的SFN 基本结构确定 根据等事件原则形成 根据等事件原则形成 SFN完整结构 SFN完整结构 图2因果关系与SN基本结构转化流程 Fig.2 Transform processes of causality and SFN basic structure 模型研究阶段主要是模型建立,通过SFEP 的划分都表达一个完整的因果关系描述,称为因 因果关系分析,将SFEP的描述文本进行因果关 果关系组(以“。”号分解最为简单),因果关系组 系分解,从而对文本进行划分。每一个因果关系 也是因果关系分析的最基本单元。在各个因果关
从图 1 左侧可了解 6 种因果关系与 SFN 基本 结构的转化情况。 定义 1 SFN 基本结构。指由一个或多个原因 事件,一次连接和一个或多个结果事件组成的基 本单元,即原因事件到结果事件经过一次连接的 结构。 SFN 用于描述 SFEP,对于最终事件的分析是 按照 SFEP 的逆序关系[1-5] 描述的,即从最终事件 开始,按照连接的反方向找到各过程事件,最终 找到边缘事件。从该角度出发,图 1(a)、(b) 2 种形 式的因果关系对于 SFN 的分析是等效的,可归结 为图 1(a) 形式。图 1(c)、(d) 2 种形式对 SFN 分析 很重要。由于分析过程是结果事件到原因事件的 逆序分析,B 事件与其原因事件 A 之间的因果关 系很重要,因此在 B 事件后标注了 A 事件通过何 种逻辑关系导 致 B。 图 1(e)、 (f) 2 种形式 对 SFN 分析没有实际意义。因为从 B 事件寻找 A 事件时,对 B 而言 A 总是确定的,不存在多个 A 事件导致 B 事件的情况。综上将 SFEP 表示为 SFN 时,这 6 种因果关系形式都有可能出现,重要 度相同。但分析时只有图 1(a)、(c) 和 (d) 因果结 构发挥作用。图 1(b)、(e) 和 (f) 3 种因果结构都可 归结为图 1(a) 因果结构进行研究。因此 SFN 表 示 SFE P 时使用 图 1 左 侧 6 种结构,而分 析 SFN 时只需图 1 右侧 3 种结构。当然这里不考虑 单向环结构,单向环的处理方法见文献 [1-3, 5]。 2 SFEP 因果关系与 SFN 基本结构转 化流程 一般情况下 SFEP 通过语言描述形成文本, 如何将这些文本转化成可用 于 SFEP 分 析 的 SFN 是关键问题。SFN 中包括事件和连接及其逻 辑关系。事件主要包括原因事件和结果事件;或 可分为边缘事件、过程事件和最终事件。所涉及 的原因事件和结果事件的逻辑关系主要是与或关 系,实际上存在 20 种这样的关系[34-35]。在 SFEP 中提取这些信息,首先要对 SFEP 语言论述进行 因果关系组划分;其次确定关键词;最后确定常 用的因果关系组模式。 定义 2 因果关系组。划分 SFEP 的描述文本 后,每一个因果关系划分表达一个完整的因果关 系描述,称为因果关系组 (文本以“。”号分解最为 简单),因果关系组也是因果关系分析的最基本 单元。 定义 3 因果关系组模式。利用关键字将一个 因果关系组中的词汇符号化,形成可表示原因果 关系组因果关系的符号序列。因果关系组模式是 一类因果关系的抽象,是因果关系组表示为符号 序列的模板。来源于实际 SFEP 的多个因果关系 组可能对应一个因果关系组模式。 使用知识提取方法,将 SFEP 的描述文本转 化为 SFN 基本结构可分为 3 个阶段,如图 2 所 示,包括模型研究、模型学习和实例分析。 SFEP 因果关系分析 SFEP 因果关系组划分 因果关键词确定 关键词收集并形成集合 因果关系组模式确定 模式对应的 SFN 基本结构确定 SFEP 收集 SFEP 分解, 分析关键词 根据 SFEP 和关键词分析 因果关系组模式 组模式转化 SFN 基本结构 补充关键词 补充组模式 补充基本结构 实例 SFEP SFEP 分解为因果关系组 寻找关键词 判断因果关系模式 模式转化为 SFN 基本结构 模型研究阶段 模型学习阶段 实例分析阶段 根据等事件原则形成 SFN 完整结构 根据等事件原则形成 SFN 完整结构 图 2 因果关系与 SFN 基本结构转化流程 Fig. 2 Transform processes of causality and SFN basic structure 模型研究阶段主要是模型建立,通过 SFEP 因果关系分析,将 SFEP 的描述文本进行因果关 系分解,从而对文本进行划分。每一个因果关系 的划分都表达一个完整的因果关系描述,称为因 果关系组 (以“。”号分解最为简单),因果关系组 也是因果关系分析的最基本单元。在各个因果关 ·1000· 智 能 系 统 学 报 第 15 卷
第5期 崔铁军,等:SFEP文本因果关系提取及其与SFN转化研究 ·1001· 系组转化为SFN基本结构后,可根据因果关系组 献21-33]和SFEP的特点,制定如下定义。 之间的相同事件叠加形成完整的SFN网络,最终 定义4关键词(key words,,KW)。用于代表 完成SFEP到SFN转化。 SFEP文本描述中,可进行形式化抽取和同类词汇 确定因果关系组后,对组内各部分进行分析, 表示,关键词是由表示相同含义的词汇组成的集 主要包括原因事件、结果事件及逻辑关系。可将 合,由关键词组成的集合称为关键词组(key words 文本抽象为连接词、原因词、结果词、原因部分、 set,KWS) 结果部分、标点符号、其他类型短语等,称为关键 KW是一类文本词汇的统一标识。用于在 词。在SFEP描述中这些词都有具体的词汇,可 SFEP中因果关系组的抽象和形式化。将因果关 在模型学习过程中累计。逐渐形成这些关键词对 系组代表的文本转化为因果关系组模式的符号序 应的词汇集合,以便丰富文本因果关系分析能力。 列。KW包括多种类型,连接词1、连接词2、原因 根据因果关系组和得到的关键词集合,研究 词、结果词、原因部分、结果部分、其他关于符号 因果关系组的基本模式。由于已事先获得关键 部分。这些KW组成了KWS。 字,将因果关系组中的文本描述进行替换,可得 定义5连接词1 link word1,LW1)。用于表 到为数不多的因果关系组模式。每种模式都代表 示SFEP中,归一和分支结构的与关系,即多个原 了一类因果关系描述类型的语句。该过程在模型 因事件同时发生导致结果事件,一个原因事件同 学习阶段得到补充和丰富。 时导致多个结果事件。LW1={并且,且,而且,切, 将组模式转化为SFN的基本结构。在第1节 以及,加之,…},这些词汇表示两事件并列及同时 已提到SN表示SFEP使用6种结构,而分析过 的与关系。 程只需其中3种结构。根据组模式转化为SFN 定义6连接词2 link word2,LW2)。用于表 的对应结构。 示SFEP中,归一和分支结构的或关系,即多个原 因此,关键词中的原因词和结果词引导的原 因事件之一发生导致结果事件,一个原因事件导 因部分和结果部分将成为SFN的节点对应事 致其一或多个结果事件。LW2={或者,或,要不, 件。连接词代表了原因部分或结果部分之间的逻 之一,都,…},这些词汇表示两事件之一发生导致 辑与或关系,将成为SFN的连接和逻辑关系。其 结果发生的关系,或导致可能的两个结果事件 他类型短语一般成为原因和结果事件的一部分。 最后得到的所有SFN基本结构都只传递了一次, 之一。 那么之中必定有事件即作为原因又作为结果,因 定义7原因词(cause words,,CW)。用于表示 此根据等事件规则将所有SFN基本结构叠加,形 SFEP中引导原因事件的词汇。CW={由于,因为, 成SFEP文本描述转化的完整SFN结构。 当,…},这些词汇用于引导原因事件,是原因事 模型学习阶段主要是关键词和因果关系模式 件的标志。 的补充和丰富。在已分析的SFEP文本中,可获 定义8结果词(result words,RW)。用于表示 得一些关键词对应的词汇,也可确定因果关系模 SFEP中引导结果事件的词汇。RW={所以,因此, 式。但关键词在语言中千变万化,一个关键词可 因而,于是,…},这些词汇用于引导结果事件,是 以有很多词汇表示,需要实践中学习丰富。同理 结果事件的标志。 因果关系模式代表了一句完整的因果关系描述, 定义9原因部分(cause part,,CP)。用于表示 这些描述的结构千变万化,也需不断补充。 SFEP中原因事件的描述。CP用于表示原因事 对于一个实例SFEP分析,如果它的关键词 件,可以是复杂的句式或短语等。 和关系模式都是已知的,那么将会顺利完成 定义I0结果部分(result part,.RP)。用于表 SFEP到SFN的转化。如果关键词或因果关系模 示SFEP中结果事件的描述。RP用于表示结果事 式不在集合中,非已知,那么对模型而言是个学 件,可以是复杂的句式或短语等。 习过程,以丰富关键词和关系模式。在经过大量 其他关键词(other KW)包括动词性短语(verb 实例的学习后方法将达到成熟。 phrase,VP)、名词性偏正短语(nominal partial 3关键词提取及规则确定 phrases,NPP)、主语词(subject word,.SW)。也可能 存在其他类型的关键词,但这些关键词在因果关 为说明方便形成形式化表示结构,结合文 系组模式分析时不是必要的,或者出现几率很
系组转化为 SFN 基本结构后,可根据因果关系组 之间的相同事件叠加形成完整的 SFN 网络,最终 完成 SFEP 到 SFN 转化。 确定因果关系组后,对组内各部分进行分析, 主要包括原因事件、结果事件及逻辑关系。可将 文本抽象为连接词、原因词、结果词、原因部分、 结果部分、标点符号、其他类型短语等,称为关键 词。在 SFEP 描述中这些词都有具体的词汇,可 在模型学习过程中累计。逐渐形成这些关键词对 应的词汇集合,以便丰富文本因果关系分析能力。 根据因果关系组和得到的关键词集合,研究 因果关系组的基本模式。由于已事先获得关键 字,将因果关系组中的文本描述进行替换,可得 到为数不多的因果关系组模式。每种模式都代表 了一类因果关系描述类型的语句。该过程在模型 学习阶段得到补充和丰富。 将组模式转化为 SFN 的基本结构。在第 1 节 已提到 SFN 表示 SFEP 使用 6 种结构,而分析过 程只需其中 3 种结构。根据组模式转化为 SFN 的对应结构。 因此,关键词中的原因词和结果词引导的原 因部分和结果部分将成为 SFN 的节点对应事 件。连接词代表了原因部分或结果部分之间的逻 辑与或关系,将成为 SFN 的连接和逻辑关系。其 他类型短语一般成为原因和结果事件的一部分。 最后得到的所有 SFN 基本结构都只传递了一次, 那么之中必定有事件即作为原因又作为结果,因 此根据等事件规则将所有 SFN 基本结构叠加,形 成 SFEP 文本描述转化的完整 SFN 结构。 模型学习阶段主要是关键词和因果关系模式 的补充和丰富。在已分析的 SFEP 文本中,可获 得一些关键词对应的词汇,也可确定因果关系模 式。但关键词在语言中千变万化,一个关键词可 以有很多词汇表示,需要实践中学习丰富。同理 因果关系模式代表了一句完整的因果关系描述, 这些描述的结构千变万化,也需不断补充。 对于一个实例 SFEP 分析,如果它的关键词 和关系模式都是已知的,那么将会顺利完 成 SFEP 到 SFN 的转化。如果关键词或因果关系模 式不在集合中,非已知,那么对模型而言是个学 习过程,以丰富关键词和关系模式。在经过大量 实例的学习后方法将达到成熟。 3 关键词提取及规则确定 为说明方便形成形式化表示结构,结合文 献 [21-33] 和 SFEP 的特点,制定如下定义。 定义 4 关键词 (key words, KW)。用于代表 SFEP 文本描述中,可进行形式化抽取和同类词汇 表示,关键词是由表示相同含义的词汇组成的集 合,由关键词组成的集合称为关键词组 (key words set, KWS)。 KW 是一类文本词汇的统一标识。用于在 SFEP 中因果关系组的抽象和形式化。将因果关 系组代表的文本转化为因果关系组模式的符号序 列。KW 包括多种类型,连接词 1、连接词 2、原因 词、结果词、原因部分、结果部分、其他关于符号 部分。这些 KW 组成了 KWS。 定义 5 连接词 1(link word 1, LW1)。用于表 示 SFEP 中,归一和分支结构的与关系,即多个原 因事件同时发生导致结果事件,一个原因事件同 时导致多个结果事件。LW1={并且, 且, 而且, 切, 以及, 加之,…},这些词汇表示两事件并列及同时 的与关系。 定义 6 连接词 2(link word 2, LW2)。用于表 示 SFEP 中,归一和分支结构的或关系,即多个原 因事件之一发生导致结果事件,一个原因事件导 致其一或多个结果事件。LW2={或者, 或, 要不, 之一, 都,… },这些词汇表示两事件之一发生导致 结果发生的关系,或导致可能的两个结果事件 之一。 定义 7 原因词 (cause words, CW)。用于表示 SFEP 中引导原因事件的词汇。CW={由于, 因为, 当,… },这些词汇用于引导原因事件,是原因事 件的标志。 定义 8 结果词 (result words, RW)。用于表示 SFEP 中引导结果事件的词汇。RW={所以, 因此, 因而, 于是,… },这些词汇用于引导结果事件,是 结果事件的标志。 定义 9 原因部分 (cause part, CP)。用于表示 SFEP 中原因事件的描述。CP 用于表示原因事 件,可以是复杂的句式或短语等。 定义 10 结果部分 (result part, RP)。用于表 示 SFEP 中结果事件的描述。RP 用于表示结果事 件,可以是复杂的句式或短语等。 其他关键词 (other KW) 包括动词性短语 (verb phrase, VP)、名词性偏正短语 (nominal partial phrases, NPP)、主语词 (subject word, SW)。也可能 存在其他类型的关键词,但这些关键词在因果关 系组模式分析时不是必要的,或者出现几率很 第 5 期 崔铁军,等:SFEP 文本因果关系提取及其与 SFN 转化研究 ·1001·
·1002· 智能系统学报 第15卷 小,因此均归于其他关键词。这些词即可作为 ①wL,Lw2 VP LWI.LW2 LWI,LW2 P NNP P CP也可作为RP。 定义I1标点符号(punctuation,Pun)。表示 CP NNP 在SFEP中文本间的标点符号。标点符号可以判 断事件间的因果关系,也用于因果关系组的划 P 分,Pun={,,,,…}o (a)模式1的SFN (b)模式2的SFN (c)模式3的SFN 那么KWS={LW1,LW2,CW,RW,CP,RP,oth VPLWLLW-RP erKW,Pun}。当然这些词汇是在模型学习和实例 分析过程中不断补充和丰富的。根据文献[21-33] CPLW1.LW2 P P 给出的因果知识提取规则,结合SFEP特点,给出 NNP RP 6种常见的因果关系组模式的表达形式。由于组 P 模式是一系列符号表示的符号序列,为澄清关键 (d模式4的SFN (e)模式5的SFN 词之间关系,引人3种符号:“$”分割符号,表示 (田模式6的SFN 关键词的分割;“”并列符号,表示并列的2种形 图36种组模式转化得到的SFN基本结构 Fig.3 Basic structures of SFN transformed from the 6 式,可选择之一;“{}”跟随符号,表示之前关键词 group models 的补充或形式说明,多用于CP和RP,是可选 这种转化是在SFN建立过程中使用的,而不 项。这3种符号之一即可进行划分。这6种符号 用于SFN分析,进一步处理SFN并不涉及这些转 序列形式为 化。处理方法:一是将SFN转化为SFT进行研 1)CWSCP;Pun PunSLW1PunSLW2SCWSCPP 究,以便利用已有研究成果;二是SFN独立研 nn$RWSRP{PunSRP) 究方法,即SFN结构化表示和分析方法。请参考 2)CWSVP(Pun|Pun$LW1|Pun$LW2SCWSVPN 相关文献,这里不做论述。 PPPnnSSWSRPPunSRP 3)CWSNPP(Pun|Pun$LWIPunSLW2SCWSNPP 5实例分析 PnnSRP(PunSRP) 完成了SFEP文本因果关系提取,及因果关 4)CWSCP;PunSLWIPunSLW2SCWSCPPnn$ 系组模式与SFN基本结构的转化。本节针对经 RP(Pun$RP} 典飞机起落架故障发生过程的文本应用上述方法 5)CWSCP(Pun$CP)Pun$RP 进行分析。 6)CP(PunSCPSPun|PunSNPP}Pun$LWIS 实例:由于机场地面温度过高,载荷过大且输 LW2SRP 入油有问题,作动筒自发收起。当锁键压簧力过 这些符号序列可用于计算机对SFEP文本描 大、电信号故障,这2个事件都能导致下位锁自 述的智能处理,但过程需要借助关键词。当然 动打开。由于下位锁自动打开和作动筒自发收起 SFEP中因果关系组模式并不限于这些形式,与关 的同时发生导致机构本身失效。最终因为电信号 键字补充相同,也需要在模型学习过程中不断增 故障、液压系统自发收起、机构本身失效引起了 加组模式。 前起落架的自发收起。 首先,对该描述进行分解,以句号进行划分。 4因果关系组模式与SFN基本结构 得到如下4个因果关系组: 转换 1)由于机场地面温度过高,载荷过大且输入 油有问题,作动筒自发收起。 上述过程完成了因果关系组模式的获取。得 2)当锁键压簧力过大、电信号故障,这2个 到的6种组模式具有一定代表性,是大部分因果 事件都能导致下位锁自动打开。 关系组的基本模式,可表示SFEP中的大部分因 3)由于下位锁自动打开和作动筒自发收起的 果关系。完成转化的最后一步确定这6种模式 同时发生导致机构本身失效。 与SFN基本结构的对应关系。根据第1节给出 4)最终因为电信号故障、液压系统自发收 的SFN基本结构,结合6种组模式,得到它们对 起、机构本身失效都引起了前起落架自发收起。 应的SFN基本结构如图3所示。 对1)进行分析,由于∈CW,且∈LW1;机场
小,因此均归于其他关键词。这些词即可作为 CP 也可作为 RP。 定义 11 标点符号 (punctuation, Pun)。表示 在 SFEP 中文本间的标点符号。标点符号可以判 断事件间的因果关系,也用于因果关系组的划 分,Pun={,,;,、, …}。 那么 KWS={LW1, LW2, CW, RW, CP, RP, other KW, Pun}。当然这些词汇是在模型学习和实例 分析过程中不断补充和丰富的。根据文献 [21-33] 给出的因果知识提取规则,结合 SFEP 特点,给出 6 种常见的因果关系组模式的表达形式。由于组 模式是一系列符号表示的符号序列,为澄清关键 词之间关系,引入 3 种符号:“$”分割符号,表示 关键词的分割;“|”并列符号,表示并列的 2 种形 式,可选择之一;“{}”跟随符号,表示之前关键词 的补充或形式说明,多用于 CP 和 RP,是可选 项。这 3 种符号之一即可进行划分。这 6 种符号 序列形式为 1)CW$CP{Pun|Pun$LW1|Pun$LW2$CW$CP}P nn$RW$RP{Pun$RP} 2)CW$VP{Pun|Pun$LW1|Pun$LW2$CW$VP|N PP}Pnn$SW$RP{Pun$RP} 3)CW$NPP{Pun|Pun$LW1|Pun$LW2$CW$NPP }Pnn$RP{Pun$RP} 4)CW$CP{Pun$LW1|Pun$LW2$CW$CP}Pnn$ RP{Pun$RP} 5)CW$CP{Pun$CP}Pun$RP 6)CP{Pun$CP$Pun|Pun$NPP} Pun$LW1$ LW2$RP 这些符号序列可用于计算机对 SFEP 文本描 述的智能处理,但过程需要借助关键词。当然 SFEP 中因果关系组模式并不限于这些形式,与关 键字补充相同,也需要在模型学习过程中不断增 加组模式。 4 因果关系组模式与 SFN 基本结构 转换 上述过程完成了因果关系组模式的获取。得 到的 6 种组模式具有一定代表性,是大部分因果 关系组的基本模式,可表示 SFEP 中的大部分因 果关系。完成转化的最后一步确定这 6 种模式 与 SFN 基本结构的对应关系。根据第 1 节给出 的 SFN 基本结构,结合 6 种组模式,得到它们对 应的 SFN 基本结构如图 3 所示。 CP1 RP1-m CPn LW1, LW2 LW1, LW2 LW1, LW2 VP1 RP1-m … … … … … NNP1 VPn NNPn RP1-m NNP1 NNPn RP1-m CP1 LW1, LW2 CPn RP1-m CP1 CPn VP1 RPi NNP1 LW1, LW2 VPn NNPn RPi (a) 模式1的 SFN (b) 模式2的 SFN (c) 模式3的 SFN (d) 模式4的 SFN (e) 模式5的 SFN (f) 模式6的 SFN … … … … 图 3 6 种组模式转化得到的 SFN 基本结构 Fig. 3 Basic structures of SFN transformed from the 6 group models 这种转化是在 SFN 建立过程中使用的,而不 用于 SFN 分析,进一步处理 SFN 并不涉及这些转 化。处理方法:一是将 SFN 转化为 SFT 进行研 究 [1-5] ,以便利用已有研究成果;二是 SFN 独立研 究方法,即 SFN 结构化表示和分析方法。请参考 相关文献,这里不做论述。 5 实例分析 完成了 SFEP 文本因果关系提取,及因果关 系组模式与 SFN 基本结构的转化。本节针对经 典飞机起落架故障发生过程的文本应用上述方法 进行分析。 实例:由于机场地面温度过高,载荷过大且输 入油有问题,作动筒自发收起。当锁键压簧力过 大、电信号故障,这 2 个事件都能导致下位锁自 动打开。由于下位锁自动打开和作动筒自发收起 的同时发生导致机构本身失效。最终因为电信号 故障、液压系统自发收起、机构本身失效引起了 前起落架的自发收起。 首先,对该描述进行分解,以句号进行划分。 得到如下 4 个因果关系组: 1) 由于机场地面温度过高,载荷过大且输入 油有问题,作动筒自发收起。 2) 当锁键压簧力过大、电信号故障,这 2 个 事件都能导致下位锁自动打开。 3) 由于下位锁自动打开和作动筒自发收起的 同时发生导致机构本身失效。 4) 最终因为电信号故障、液压系统自发收 起、机构本身失效都引起了前起落架自发收起。 对 1) 进行分析,由于∈CW,且∈LW1;机场 ·1002· 智 能 系 统 学 报 第 15 卷