第14卷第5期 智能系统学报 Vol.14 No.5 2019年9月 CAAI Transactions on Intelligent Systems Sep.2019 D0:10.11992/tis.201807022 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20190527.1353.008.html 空间故障树与因素空间融合的智能可靠性分析方法 崔铁军2,汪培庄3 (1.辽宁工程技术大学安全科学与工程学院,辽宁阜新123000:2.大连交通大学辽宁省隧道与地下结构工程 技术研究中心,辽宁大连116028:3.辽宁工程技术大学数学与系统科学研究院,辽宁阜新123000) 摘要:现有系统可靠性分析方法一般具有针对性,缺乏广泛的适应性和扩展性。由于智能科学、信息科学和 大数据技术的涌现和发展,使得传统可靠性分析技术难以适应新的需要。因此作者提出了空间故障树理论,目 的是分析多因素影响下的系统可靠性变化特征。将空间故障树理论与因素空间理论、云模型、模糊数学及系 统稳定性等相结合,使其具有智能分析和故障大数据处理能力,以满足未来技术环境下的分析要求。本文论述 了空间故障树和因素空间的发展史及主要理论与功能:以及两种理论结合,描述和分析系统演化过程的可行 性。研究表明.空间故障树理论具有良好的扩展性和适应性,可适应未来技术环境,也可作为系统演化过程分 析的普适框架。 关键词:安全科学;安全系统工程:空间故障树;因素空间;系统可靠性;智能科学;系统演化过程:普适框架 中图分类号:X913:C931.1:TP18文献标志码:A文章编号:1673-4785(2019)05-0853-12 中文引用格式:崔铁军,汪培庄.空间故障树与因素空间融合的智能可靠性分析方法J.智能系统学报,2019,14(5): 853-864. 英文引用格式:CUITiejun,WANG Peizhuang..Intelligent reliability analysis method based on space fault tree and factor space. CAAI transactions on intelligent systems,2019,14(5):853-864. Intelligent reliability analysis method based on space fault tree and factor space CUI Tiejun,WANG Peizhuang (1.College of Safety Science and Engineering,Liaoning Technical University,Fuxin 123000,China;2.Tunnel Underground Structure Engineering Center of Liaoning,Dalian Jiaotong University,Dalian 116028,China;3.Institute of Mathematics and Sys- tems Science,Liaoning Technical University,Fuxin 123000,China) Abstract:The existing system reliability analysis methods are generally targeted and lack extensive adaptability and ex- pansibility.Moreover,due to the emergence and development of intelligent science,information science,and big data technology,the traditional reliability analysis technology can hardly meet the new demands.Therefore,the authors pro- pose the space fault tree theory to analyze the reliability change characteristics of systems influenced by multiple factors. The space fault tree theory is combined with factor space theory,cloud model,fuzzy mathematics,and system stability theory to enable it have the ability of intelligent analysis and fault big data processing,so as to meet the analysis require- ments in the future technology environment.This paper discusses the development history and the main theories and functions of the space fault tree and factor space,as well as the feasibility of combining these two theories to describe and analyze the system evolution process.The results show that the space fault tree theory has good expansibility and adaptability;it adapts to future technology environment and can also be used as a universal framework for the analysis of a system evolution process. Keywords:safety science;safety system engineering:space fault tree;factor space;system reliability;intelligent sci- ence;system evolution process;universal framework 收稿日期:2018-07-21.网络出版日期:2019-05-28. 基金项目:国家自然科学基金项目(51704141):国家重点研发 系统可靠性理论是安全科学的基础理论之 计划项目(2017Y下℃1503102):国家自然科学基金委 主任基金项目(61350003). 一。源于系统工程,在安全科学领域系统可靠性 通信作者:崔铁军.E-mail:c中.159@163.com 主要关注于系统发生故障和事故的可能性。由于
DOI: 10.11992/tis.201807022 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20190527.1353.008.html 空间故障树与因素空间融合的智能可靠性分析方法 崔铁军1,2,汪培庄3 (1. 辽宁工程技术大学 安全科学与工程学院,辽宁 阜新 123000; 2. 大连交通大学 辽宁省隧道与地下结构工程 技术研究中心,辽宁 大连 116028; 3. 辽宁工程技术大学 数学与系统科学研究院,辽宁 阜新 123000) 摘 要:现有系统可靠性分析方法一般具有针对性,缺乏广泛的适应性和扩展性。由于智能科学、信息科学和 大数据技术的涌现和发展,使得传统可靠性分析技术难以适应新的需要。因此作者提出了空间故障树理论,目 的是分析多因素影响下的系统可靠性变化特征。将空间故障树理论与因素空间理论、云模型、模糊数学及系 统稳定性等相结合,使其具有智能分析和故障大数据处理能力,以满足未来技术环境下的分析要求。本文论述 了空间故障树和因素空间的发展史及主要理论与功能;以及两种理论结合,描述和分析系统演化过程的可行 性。研究表明,空间故障树理论具有良好的扩展性和适应性,可适应未来技术环境,也可作为系统演化过程分 析的普适框架。 关键词:安全科学;安全系统工程;空间故障树;因素空间;系统可靠性;智能科学;系统演化过程;普适框架 中图分类号:X913;C931.1;TP18 文献标志码:A 文章编号:1673−4785(2019)05−0853−12 中文引用格式:崔铁军, 汪培庄. 空间故障树与因素空间融合的智能可靠性分析方法 [J]. 智能系统学报, 2019, 14(5): 853–864. 英文引用格式:CUI Tiejun, WANG Peizhuang. Intelligent reliability analysis method based on space fault tree and factor space[J]. CAAI transactions on intelligent systems, 2019, 14(5): 853–864. Intelligent reliability analysis method based on space fault tree and factor space CUI Tiejun1,2 ,WANG Peizhuang3 (1. College of Safety Science and Engineering, Liaoning Technical University, Fuxin 123000, China; 2. Tunnel & Underground Structure Engineering Center of Liaoning, Dalian Jiaotong University, Dalian 116028, China; 3. Institute of Mathematics and Systems Science, Liaoning Technical University, Fuxin 123000, China) Abstract: The existing system reliability analysis methods are generally targeted and lack extensive adaptability and expansibility. Moreover, due to the emergence and development of intelligent science, information science, and big data technology, the traditional reliability analysis technology can hardly meet the new demands. Therefore, the authors propose the space fault tree theory to analyze the reliability change characteristics of systems influenced by multiple factors. The space fault tree theory is combined with factor space theory, cloud model, fuzzy mathematics, and system stability theory to enable it have the ability of intelligent analysis and fault big data processing, so as to meet the analysis requirements in the future technology environment. This paper discusses the development history and the main theories and functions of the space fault tree and factor space, as well as the feasibility of combining these two theories to describe and analyze the system evolution process. The results show that the space fault tree theory has good expansibility and adaptability; it adapts to future technology environment and can also be used as a universal framework for the analysis of a system evolution process. Keywords: safety science; safety system engineering; space fault tree; factor space; system reliability; intelligent science; system evolution process; universal framework 系统可靠性理论是安全科学的基础理论之 一。源于系统工程,在安全科学领域系统可靠性 主要关注于系统发生故障和事故的可能性。由于 收稿日期:2018−07−21. 网络出版日期:2019−05−28. 基金项目:国家自然科学基金项目 (51704141);国家重点研发 计划项目 (2017YFC1503102);国家自然科学基金委 主任基金项目 (61350003). 通信作者:崔铁军. E-mail:ctj.159@163.com. 第 14 卷第 5 期 智 能 系 统 学 报 Vol.14 No.5 2019 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2019
·854· 智能系统学报 第14卷 近代科学进步和工业化水平逐渐提高,为了追求 数学模型来说明上述内容。希望本文的介绍能开 更大的经济和战略目标,各国加紧研究并建立大 阔安全科学基础理论研究方向,使读者了解空间 型或超大型系统以满足要求。但系统运行过程中 故障树理论及因素空间理论,及其在系统可靠性 人们发现随着系统复杂性的增加,其可靠性下降 分析中的作用,以面向智能科学和大数据技术寻 非常明显。在这种情况下,原始的问题出发型, 求可靠性的理论发展。 即事故发生后吸取教训的方法不能满足要求。因 为问题出发型的研究方法一般适用于低价值、对 1当前系统可靠性研究存在的问题 系统可靠性要求不高、故障发生后果不严重的系 近年来随着信息科学与智能科学的迅猛发 统,而对当今大规模和巨复杂系统而言意义不 展,系统运行、故障检测和设备维护数据量暴涨 大。因此,在20世纪50年代的英美发达国家首 成为许多行业共同面对的严峻挑战和发展机遇, 先提出了安全系统工程理论,当时将系统工程的 尤其是在安全科学领域。对美国各个行业在一天 一些概念引入到安全领域,尤其是可靠性分析方 内产生的数据量进行统计,结果表明制造业一天 法,并用于军事和航天领域,形成了安全科学的 内产生的数据最多。如飞机制造过程,需要对飞 基础理论之一的安全系统工程。 机各部分的基本元件进行各种测试,包括各种条 安全系统工程与系统可靠性分析方法发展到 件下的物理强度、化学腐蚀性及疲劳等测试。这 今天,已具备了对相对简单、系统复杂性不高、数 样仅就一个飞机汽轮压缩器叶片的测试,一天可 据规模有限情况下的系统可靠性分析能力。但随 产生588GB数据。但这些有价值的数据并未得 着大数据技术、智能科学、系统科学和相关数学 到企业有效利用。这些数据可分析系统基本元件 理论的发展,现有系统可靠性分析方法也暴露出 故障原因、可能性和后果严重程度,也能得到基 一些问题,如故障大数据处理、可靠性因果关系、 本元件故障与系统故障之间的联系。遗憾的是对 可靠性的稳定性、可靠性逆向工程及可靠性变化 这些数据的挖掘程度很低问。又如最早美国空军 过程描述等。同时现有系统可靠性分析方法较多 网站公布的照片显示一辆外表重新喷涂过的燃料 针对特定领域中使用的系统,虽然分析效果良 车,其说明写着“℉-35战机存在燃料温度阀值,如 好,但缺乏系统层面的抽象,难以满足通用性、可 果燃料温度太高将无法工作”。飞机设计阶段 扩展性和适应性。因此需要一种具备上述能力和 似乎都没有考虑飞机使用过程的环境因素(比如 满足未来科技要求的系统可靠性分析方法。所以 温度、湿度、气压、使用时间等)对可靠性的影响, 系统可靠性分析方法与智能科学和大数据技术结 导致实际使用时故障频出,严重影响了原设计试 合是必然的,也是必须的。 图实现的功能。F-35是信息化作战平台,飞行及 空间故障树理论山是笔者2012年提出的一 维护过程数据是实时记录的,按照最低记录量 种系统可靠性分析方法。经过5年的发展,初步 1MB/s,那么飞行一天的数量为84GB。如果实 完成了空间故障树理论框架的基础。可满足对简 时传输,F35带宽为4GBs,飞行一天的最大数据 单系统的可靠性分析,包括故障大数据处理、可 量为336TB。这些系统运行时记录的数据蕴含 靠性因果关系、可靠性的稳定性、可靠性逆向工 着系统故障和可靠性特征,但缺乏相应的可靠性 程及可靠性变化过程描述等,并具有良好的通用 分析方法。上述问题表明,这些信息中蕴含的故 性、可扩展性和适应性。发展过程中融合了智能 障数据并未进行可靠性方面的分析;油温升高影 科学和大数据处理技术,包括因素空间理论冈、模 响飞机各元件可靠性变化程度也无法确定;进而 糊结构元理论印、云模型理论)等。虽然还存在 无法确定油温因素与飞机可靠性之间的关系。同 些问题,但空间故障树理论还有足够的发展空 样的问题也影响我国高铁在高寒高海拔地区的可 间来解决他们。 靠性。高寒高海拔地区运行高铁的速度、时间和 本文将介绍空间故障树的现有发展,及其与 运量与一般情况下不同。不同环境对高铁运行的 因素空间的融合研究。空间故障树用于分析影响 可靠性影响不同,因此高铁前期研制和运行测试 因素与系统可靠性关系;而因素空间则是帮助空 阶段累积的大量数据为保证高铁可靠运行起到了 间故障树进行智能处理的理论。两者融合可使空 关键作用。在深海中高压低温潜航设备可靠性也 间故障树理论拥有智能故障数据处理能力。本文 同样存在这类问题。 以综述形式介绍2种理论的特点,及它们结合的 上述飞机、高铁、潜航器等设备系统在设计、 可行性、功能及成果。因此使用描述性语言而非 制造及运行期间已经存储了大量工况数据,但实
近代科学进步和工业化水平逐渐提高,为了追求 更大的经济和战略目标,各国加紧研究并建立大 型或超大型系统以满足要求。但系统运行过程中 人们发现随着系统复杂性的增加,其可靠性下降 非常明显。在这种情况下,原始的问题出发型, 即事故发生后吸取教训的方法不能满足要求。因 为问题出发型的研究方法一般适用于低价值、对 系统可靠性要求不高、故障发生后果不严重的系 统,而对当今大规模和巨复杂系统而言意义不 大。因此,在 20 世纪 50 年代的英美发达国家首 先提出了安全系统工程理论,当时将系统工程的 一些概念引入到安全领域,尤其是可靠性分析方 法,并用于军事和航天领域,形成了安全科学的 基础理论之一的安全系统工程。 安全系统工程与系统可靠性分析方法发展到 今天,已具备了对相对简单、系统复杂性不高、数 据规模有限情况下的系统可靠性分析能力。但随 着大数据技术、智能科学、系统科学和相关数学 理论的发展,现有系统可靠性分析方法也暴露出 一些问题,如故障大数据处理、可靠性因果关系、 可靠性的稳定性、可靠性逆向工程及可靠性变化 过程描述等。同时现有系统可靠性分析方法较多 针对特定领域中使用的系统,虽然分析效果良 好,但缺乏系统层面的抽象,难以满足通用性、可 扩展性和适应性。因此需要一种具备上述能力和 满足未来科技要求的系统可靠性分析方法。所以 系统可靠性分析方法与智能科学和大数据技术结 合是必然的,也是必须的。 空间故障树理论[1] 是笔者 2012 年提出的一 种系统可靠性分析方法。经过 5 年的发展,初步 完成了空间故障树理论框架的基础。可满足对简 单系统的可靠性分析,包括故障大数据处理、可 靠性因果关系、可靠性的稳定性、可靠性逆向工 程及可靠性变化过程描述等,并具有良好的通用 性、可扩展性和适应性。发展过程中融合了智能 科学和大数据处理技术,包括因素空间理论[2] 、模 糊结构元理论[3] 、云模型理论[4] 等。虽然还存在 一些问题,但空间故障树理论还有足够的发展空 间来解决他们。 本文将介绍空间故障树的现有发展,及其与 因素空间的融合研究。空间故障树用于分析影响 因素与系统可靠性关系;而因素空间则是帮助空 间故障树进行智能处理的理论。两者融合可使空 间故障树理论拥有智能故障数据处理能力。本文 以综述形式介绍 2 种理论的特点,及它们结合的 可行性、功能及成果。因此使用描述性语言而非 数学模型来说明上述内容。希望本文的介绍能开 阔安全科学基础理论研究方向,使读者了解空间 故障树理论及因素空间理论,及其在系统可靠性 分析中的作用,以面向智能科学和大数据技术寻 求可靠性的理论发展。 1 当前系统可靠性研究存在的问题 近年来随着信息科学与智能科学的迅猛发 展,系统运行、故障检测和设备维护数据量暴涨 成为许多行业共同面对的严峻挑战和发展机遇, 尤其是在安全科学领域。对美国各个行业在一天 内产生的数据量进行统计,结果表明制造业一天 内产生的数据最多。如飞机制造过程,需要对飞 机各部分的基本元件进行各种测试,包括各种条 件下的物理强度、化学腐蚀性及疲劳等测试。这 样仅就一个飞机汽轮压缩器叶片的测试,一天可 产生 588 GB 数据。但这些有价值的数据并未得 到企业有效利用。这些数据可分析系统基本元件 故障原因、可能性和后果严重程度,也能得到基 本元件故障与系统故障之间的联系。遗憾的是对 这些数据的挖掘程度很低[5]。又如最早美国空军 网站公布的照片显示一辆外表重新喷涂过的燃料 车,其说明写着“F-35 战机存在燃料温度阀值,如 果燃料温度太高将无法工作” [6]。飞机设计阶段 似乎都没有考虑飞机使用过程的环境因素 (比如 温度、湿度、气压、使用时间等) 对可靠性的影响, 导致实际使用时故障频出,严重影响了原设计试 图实现的功能。F-35 是信息化作战平台,飞行及 维护过程数据是实时记录的,按照最低记录量 1 MB/s,那么飞行一天的数量为 84 GB。如果实 时传输,F35 带宽为 4 GB/s,飞行一天的最大数据 量为 336 TB。这些系统运行时记录的数据蕴含 着系统故障和可靠性特征,但缺乏相应的可靠性 分析方法。上述问题表明,这些信息中蕴含的故 障数据并未进行可靠性方面的分析;油温升高影 响飞机各元件可靠性变化程度也无法确定;进而 无法确定油温因素与飞机可靠性之间的关系。同 样的问题也影响我国高铁在高寒高海拔地区的可 靠性。高寒高海拔地区运行高铁的速度、时间和 运量与一般情况下不同。不同环境对高铁运行的 可靠性影响不同,因此高铁前期研制和运行测试 阶段累积的大量数据为保证高铁可靠运行起到了 关键作用。在深海中高压低温潜航设备可靠性也 同样存在这类问题。 上述飞机、高铁、潜航器等设备系统在设计、 制造及运行期间已经存储了大量工况数据,但实 ·854· 智 能 系 统 学 报 第 14 卷
第5期 崔铁军,等:空间故障树与因素空间融合的智能可靠性分析方法 ·855· 际并没有挖掘出这些数据的价值。该问题在系统 行参数是多少,或在什么情况下出现了故障或事 可靠性研究方面更为突出。可靠性理论是安全科 故。可见,这些监测数据不但能反映工作环境因 学的基础理论,可靠性研究是安全科学的核心内 素对系统运行可靠性的影响,而且其数据量较 容。可靠性问题在当今充斥着各种大型复杂系统 大,可全面分析系统可靠性。所以应研究适应大 的社会生产生活中是必须要解决的问题,特别是 数据的方法从而将这些故障数据特征融人系统可 工矿、交通、医疗、军事等复杂且又关系到生命财 靠性分析过程和结果中。 产和具有战略意义的领域中更是重中之重。但目 4)系统设计阶段进行的需求分析难以全面覆 前研究存在一些误区和不足。 盖使用环境带来的对可靠性的影响。即通过设计 1)研究中过分关注于系统内部结构和元件自 手段难以保证系统使用过程中的可靠性。所以设 身可靠性,竭力从提高元件自身可靠性和优化系 计后系统在使用期间会遇到一些问题。特别是航 统结构来保证系统可靠性。但一般忽略了一个事 天、深海和地下工程等方面所使用的系统会遇到 实,各种系统的基本组成元件是由物理材料制造 极端工作环境。只依靠需求分析,在设计阶段进 的。这些元件在不同的物理学、力学、电学等环 行系统结构冗余或鲁棒设计难以保证系统在使用 境下的相关性质随着这些因素的变化而变化,而 过程中的可靠性,是不稳妥的设计。该问题可归 不是恒定的。即执行某项功能的系统元件的功能 结为系统可靠性反分析。即知道系统运用过程可 性在元件制成之后主要取决于其工作环境。原因 靠性特征和基本元件可靠性特征,借助因素变化 在于,不同工作环境下元件材料的基础属性可能 形成它们的对应关系,分析元件如何组成系统, 是不同的,而在设计元件时相关参数基本固定。 进而反推系统内部可靠性结构。当然该内部结构 这就导致了元件在变化的环境中工作时随着基础 是一个等效结构,可能不是真正的物理结构。 属性的改变,其执行特定功能的能力也发生变 5)系统的基本元件材料在不同环境因素影响 化,致使元件可靠性发生变化。进一步地,即使 时性能不同,导致元件完成特定功能的能力不 是一个简单的、执行单一功能的系统也要由若干 同,即可靠性发生变化。系统由这些元件组成, 元件组成,如果考虑每个元件随工作环境变化其 在受到不同环境影响时系统可靠性也是改变的, 可靠性的变化,那么这些元件组成的系统也随着 这是普遍现象。但从另一角度看,环境因素变化 环境因素变化,系统可靠性变化是多样的复杂 是原因,系统或元件可靠性或故障率变化是结 的。上述事实是存在的,且不应该被忽略。 果,即故障率随着环境变化而变化。将环境影响 2)系统可靠性研究所面对的主要问题是系统 作为系统受到的作用,而故障率变化作为系统的 如何失效、系统失效的原因是什么、这些原因是 一种响应,组成一种关于可靠性的运动系统,进 否相关、这些失效导致系统失效的可能性如何 而讨论故障率变化程度和可靠性的稳定性。稳定 等。目前相关研究成果主要呈现了元件故障率与 的可靠性或故障率是系统投人实际使用的重要条 系统故障率之间关系,以及元件故障率与因素之 件,如果可靠性或故障率变化较大则系统功能无 间的关系,这些一般使用函数形式表示。另外一 法控制。研究使用运动系统稳定性理论对可靠性 些使用定性分析方法,研究故障原因与可靠性之 系统进行描述和稳定性分析是一个关键问题。 间的因果关系。但这些研究一般针对特定行业, 上述现象和问题可归结为目前的系统可靠性 不具有普适性,难以分析多因素并发与可靠性变 分析方法对故障大数据和多因素影响分析的不适 化关系,难以分析影响因素关联性。而且从实际 应。现有方法难以在大数据量级的故障数据中挖 现场得来的故障数据一般情况数据量较大,且存 掘出有效信息,也难以有效携带这些数据特征进 在由于人机环境导致的数据冗余和确实。现有可 行系统可靠性分析。这些问题是传统可靠性分析 靠性分析方法难以解决这些问题,特别是针对故 方法与故障大数据涌现、多因素分析和智能科学 障大数据、原因与可靠性关系推理等且适应计算 技术适应性的矛盾。 机处理的算法在安全系统工程领域仍是鲜见的。 2因素空间理论 3)在日常系统使用和维护过程中会形成大量 的监测数据,属于大数据量级,如安全检查记录、 1981年在《随机微分方程》论文中首先提出 故障或事故的记录、例行维护记录等。这些数据 了因素空间的原始定义,用以解释随机性的根源 往往反映了系统在实际情况下的功能运行特征。 及概率规律的数学实质。1982年笔者在与日本 这些特征一般可表示为在某工作环境下,系统运 学者菅野道夫合作发表《因素场与fuzy集的背
际并没有挖掘出这些数据的价值。该问题在系统 可靠性研究方面更为突出。可靠性理论是安全科 学的基础理论,可靠性研究是安全科学的核心内 容。可靠性问题在当今充斥着各种大型复杂系统 的社会生产生活中是必须要解决的问题,特别是 工矿、交通、医疗、军事等复杂且又关系到生命财 产和具有战略意义的领域中更是重中之重。但目 前研究存在一些误区和不足。 1) 研究中过分关注于系统内部结构和元件自 身可靠性,竭力从提高元件自身可靠性和优化系 统结构来保证系统可靠性。但一般忽略了一个事 实,各种系统的基本组成元件是由物理材料制造 的。这些元件在不同的物理学、力学、电学等环 境下的相关性质随着这些因素的变化而变化,而 不是恒定的。即执行某项功能的系统元件的功能 性在元件制成之后主要取决于其工作环境。原因 在于,不同工作环境下元件材料的基础属性可能 是不同的,而在设计元件时相关参数基本固定。 这就导致了元件在变化的环境中工作时随着基础 属性的改变,其执行特定功能的能力也发生变 化,致使元件可靠性发生变化。进一步地,即使 是一个简单的、执行单一功能的系统也要由若干 元件组成,如果考虑每个元件随工作环境变化其 可靠性的变化,那么这些元件组成的系统也随着 环境因素变化,系统可靠性变化是多样的复杂 的。上述事实是存在的,且不应该被忽略。 2) 系统可靠性研究所面对的主要问题是系统 如何失效、系统失效的原因是什么、这些原因是 否相关、这些失效导致系统失效的可能性如何 等。目前相关研究成果主要呈现了元件故障率与 系统故障率之间关系,以及元件故障率与因素之 间的关系,这些一般使用函数形式表示。另外一 些使用定性分析方法,研究故障原因与可靠性之 间的因果关系。但这些研究一般针对特定行业, 不具有普适性,难以分析多因素并发与可靠性变 化关系,难以分析影响因素关联性。而且从实际 现场得来的故障数据一般情况数据量较大,且存 在由于人机环境导致的数据冗余和确实。现有可 靠性分析方法难以解决这些问题,特别是针对故 障大数据、原因与可靠性关系推理等且适应计算 机处理的算法在安全系统工程领域仍是鲜见的。 3) 在日常系统使用和维护过程中会形成大量 的监测数据,属于大数据量级,如安全检查记录、 故障或事故的记录、例行维护记录等。这些数据 往往反映了系统在实际情况下的功能运行特征。 这些特征一般可表示为在某工作环境下,系统运 行参数是多少,或在什么情况下出现了故障或事 故。可见,这些监测数据不但能反映工作环境因 素对系统运行可靠性的影响,而且其数据量较 大,可全面分析系统可靠性。所以应研究适应大 数据的方法从而将这些故障数据特征融入系统可 靠性分析过程和结果中。 4) 系统设计阶段进行的需求分析难以全面覆 盖使用环境带来的对可靠性的影响。即通过设计 手段难以保证系统使用过程中的可靠性。所以设 计后系统在使用期间会遇到一些问题。特别是航 天、深海和地下工程等方面所使用的系统会遇到 极端工作环境。只依靠需求分析,在设计阶段进 行系统结构冗余或鲁棒设计难以保证系统在使用 过程中的可靠性,是不稳妥的设计。该问题可归 结为系统可靠性反分析。即知道系统运用过程可 靠性特征和基本元件可靠性特征,借助因素变化 形成它们的对应关系,分析元件如何组成系统, 进而反推系统内部可靠性结构。当然该内部结构 是一个等效结构,可能不是真正的物理结构。 5) 系统的基本元件材料在不同环境因素影响 时性能不同,导致元件完成特定功能的能力不 同,即可靠性发生变化。系统由这些元件组成, 在受到不同环境影响时系统可靠性也是改变的, 这是普遍现象。但从另一角度看,环境因素变化 是原因,系统或元件可靠性或故障率变化是结 果,即故障率随着环境变化而变化。将环境影响 作为系统受到的作用,而故障率变化作为系统的 一种响应,组成一种关于可靠性的运动系统,进 而讨论故障率变化程度和可靠性的稳定性。稳定 的可靠性或故障率是系统投入实际使用的重要条 件,如果可靠性或故障率变化较大则系统功能无 法控制。研究使用运动系统稳定性理论对可靠性 系统进行描述和稳定性分析是一个关键问题。 上述现象和问题可归结为目前的系统可靠性 分析方法对故障大数据和多因素影响分析的不适 应。现有方法难以在大数据量级的故障数据中挖 掘出有效信息,也难以有效携带这些数据特征进 行系统可靠性分析。这些问题是传统可靠性分析 方法与故障大数据涌现、多因素分析和智能科学 技术适应性的矛盾。 2 因素空间理论 1981 年在《随机微分方程》论文中首先提出 了因素空间的原始定义,用以解释随机性的根源 及概率规律的数学实质。1982 年笔者在与日本 学者菅野道夫合作发表《因素场与 fuzzy 集的背 第 5 期 崔铁军,等:空间故障树与因素空间融合的智能可靠性分析方法 ·855·
·856· 智能系统学报 第14卷 景结构》中给出了因素空间的严格定义,并转向 述人类思维活动,并用微分几何和代数拓扑对因 对概念的内涵与外延的解释。因素空间理论为 素空间理论再次进行了描述。冯嘉礼将基于 知识的表述提供了一个自然合理的描述框架,并 物理思想的属性论引入到因素空间进行研究,应 被广泛应用于概念表达、语义分析、数据挖掘、知 用于模式识别领域,提出了许多有效方法。袁学 识获取、机器学习、管理决策、安全分析等领 海等s6在代数、范畴等方面与因素空间理论相 域中。 结合进行了深入研究。 因素空间理论源于模糊数学研究,进而描述 因素空间理论处理大数据的优势在于: 人类认识活动,建立了知识表示的数学理论。近 1)现有的关系数据库不能处理异构的海量数 年又提出了因素库,为大数据智能化表示、分析、 据,无法对大数据进行组织和存放,因素空间能 处理和归纳奠定了数学基础,成为目前三大智能 按目标来组织数据,变换表格形式。 科学基础理论之一。因素空间是数据信息的普适 2)因素空间用背景关系来提取知识,可分布 分析框架,能简明表示智能问题并提供快捷的处 式处理,便于云计算。 理方法。因素库的基本单元是认知包,可在线吞 3)将背景关系化为背景基,实现大幅度的信 吐数据。数据转换和处理中增值数据,融合数据 息压缩,可以实时地在线吞吐数据,将对大数据 形成背景关系,这些背景关系组成知识基。知识 的分析始终掌控在可操作层面。 基决定知识包内所有推理句;它对大数据进行吞 原中国人工智能学会理事长、参与国家人工 吐并始终保持自己的低维度状态;它按因素藤进 智能十年发展规划起草工作的钟义信教授对因素 行连接,形成人机认知体,引领大数据的时代潮 空间理论的评价:因素空间理论是对信息和知识 流。相关理论发展见文献[7-25]。目前因素空间 进行有效表示与复杂演绎的数学方法,是人工智 得到了国内外广泛的研究和承认,相关研究如下: 能研究不可或缺的理论基础。可见因素空间在智 1)背景关系的信息压缩:文献26]为利用托 能科学和大数据处理方面的重要地位。 架空间作了初步工作,利用因素逻辑化简可得到 3空间故障树理论 精炼的背景关系。因素逻辑化简方法与布尔代数 逻辑不同,因此这里称为因素逻辑。 空间故障树理论(space fault tree,.SFT)前期称 2)因素空间分析非结构化数据:石勇21提出 为多维空间故障树,重点在于解决多因素影响下 了因素库框图,因素库可以容纳结构化数据、非 的系统可靠性分析问题。其主要内容包括连续型 结构化数据及异构数据,并考虑增添半结构性数 空间故障树、离散型空间故障树、空间故障树的 据表征因素。 数据挖掘方法。进一步地,在空间故障树基础理 3)因素藤、因素粒化空间及数据认知生态 论上,加入大数据和智能科学技术,以使空间故 系统:因素是区别对象的标准,而数据这是标准 障树理论适合未来的可靠性分析。包括SFT的 值;因素粒化的嵌套和细化形成了数据认知生态 云模型改造、可靠性与影响因素关系、系统可靠 系统;因素藤是为数据认知生态系统所提供的一 性结构分析、可靠性变化特征研究等。 种知识表示构架,它是因素空间的概念树。 目前空间故障树理论的具体研究内容如下: 4)变权评价与决策理论:综合评价及贴近度 1)给出空间故障树SFT理论框架中,连续型 和最大隶属原则始于文献[10-28]。李洪兴2提 空间故障树(continuous space fault tree,CSFT)的理 出了因素空间的权重决策理论,及因素位势的 论、定义、公式和方法,及应用这些方法的实 3种动态微分方程。这符合李德毅院士对数据 例。定义了连续型空间故障树、基本事件影响 空间要建立认知物理学的思想u。曾文艺等23 因素、基本事件发生概率特征函数、基本事件发 研究了变权综合决策评价方法,并应用于各领 生概率空间分布、顶上事件发生概率空间分布、 域,取得了良好效果。 概率重要度空间分布、关键重要度空间分布、顶 5)因素空间与公共安全:因素空间理论已应 上事件发生概率空间分布趋势、事件更换周期、 用于公共安全管理。在治安方面,何平B742提出 系统更换周期、基本事件及系统的径集域、割集 了非优理论并与因素空间进行结合,形成了犯罪 域和域边界4叨、因素重要度和因素联合重要度分 过程推理理论。 布64等概念。 6)代数、拓扑、微分几何、范畴理论的综合研 2)研究元件和系统在不同因素影响下的故障 究:欧阳合提出因素空间应结合拓扑结构来描 概率变化趋势;系统最优更换周期方案及成本方
景结构》中给出了因素空间的严格定义,并转向 对概念的内涵与外延的解释。因素空间理论为 知识的表述提供了一个自然合理的描述框架,并 被广泛应用于概念表达、语义分析、数据挖掘、知 识获取、机器学习、管理决策、安全分析等领 域中。 因素空间理论源于模糊数学研究,进而描述 人类认识活动,建立了知识表示的数学理论。近 年又提出了因素库,为大数据智能化表示、分析、 处理和归纳奠定了数学基础,成为目前三大智能 科学基础理论之一。因素空间是数据信息的普适 分析框架,能简明表示智能问题并提供快捷的处 理方法。因素库的基本单元是认知包,可在线吞 吐数据。数据转换和处理中增值数据,融合数据 形成背景关系,这些背景关系组成知识基。知识 基决定知识包内所有推理句;它对大数据进行吞 吐并始终保持自己的低维度状态;它按因素藤进 行连接,形成人机认知体,引领大数据的时代潮 流。相关理论发展见文献 [7-25]。目前因素空间 得到了国内外广泛的研究和承认,相关研究如下: 1) 背景关系的信息压缩:文献 [26] 为利用托 架空间作了初步工作,利用因素逻辑化简可得到 精炼的背景关系。因素逻辑化简方法与布尔代数 逻辑不同,因此这里称为因素逻辑。 2) 因素空间分析非结构化数据:石勇[27] 提出 了因素库框图,因素库可以容纳结构化数据、非 结构化数据及异构数据,并考虑增添半结构性数 据表征因素。 3) 因素藤、因素粒化空间及数据认知生态 系统:因素是区别对象的标准,而数据这是标准 值;因素粒化的嵌套和细化形成了数据认知生态 系统;因素藤是为数据认知生态系统所提供的一 种知识表示构架,它是因素空间的概念树。 4) 变权评价与决策理论:综合评价及贴近度 和最大隶属原则始于文献 [10-28]。李洪兴[29] 提 出了因素空间的权重决策理论,及因素位势的 3 种动态微分方程[30]。这符合李德毅院士对数据 空间要建立认知物理学的思想[31]。曾文艺等[32-36] 研究了变权综合决策评价方法,并应用于各领 域,取得了良好效果。 5) 因素空间与公共安全:因素空间理论已应 用于公共安全管理。在治安方面,何平[37-42] 提出 了非优理论并与因素空间进行结合,形成了犯罪 过程推理理论。 6) 代数、拓扑、微分几何、范畴理论的综合研 究:欧阳合[43] 提出因素空间应结合拓扑结构来描 述人类思维活动,并用微分几何和代数拓扑对因 素空间理论再次进行了描述。冯嘉礼[44] 将基于 物理思想的属性论引入到因素空间进行研究,应 用于模式识别领域,提出了许多有效方法。袁学 海等[45-46] 在代数、范畴等方面与因素空间理论相 结合进行了深入研究。 因素空间理论处理大数据的优势在于: 1) 现有的关系数据库不能处理异构的海量数 据,无法对大数据进行组织和存放,因素空间能 按目标来组织数据,变换表格形式。 2) 因素空间用背景关系来提取知识,可分布 式处理,便于云计算。 3) 将背景关系化为背景基,实现大幅度的信 息压缩,可以实时地在线吞吐数据,将对大数据 的分析始终掌控在可操作层面。 原中国人工智能学会理事长、参与国家人工 智能十年发展规划起草工作的钟义信教授对因素 空间理论的评价:因素空间理论是对信息和知识 进行有效表示与复杂演绎的数学方法,是人工智 能研究不可或缺的理论基础。可见因素空间在智 能科学和大数据处理方面的重要地位。 3 空间故障树理论 空间故障树理论 (space fault tree,SFT) 前期称 为多维空间故障树,重点在于解决多因素影响下 的系统可靠性分析问题。其主要内容包括连续型 空间故障树、离散型空间故障树、空间故障树的 数据挖掘方法。进一步地,在空间故障树基础理 论上,加入大数据和智能科学技术,以使空间故 障树理论适合未来的可靠性分析。包括 SFT 的 云模型改造、可靠性与影响因素关系、系统可靠 性结构分析、可靠性变化特征研究等。 目前空间故障树理论的具体研究内容如下: 1) 给出空间故障树 SFT 理论框架中,连续型 空间故障树 (continuous space fault tree, CSFT) 的理 论、定义、公式和方法,及应用这些方法的实 例 [1]。定义了连续型空间故障树、基本事件影响 因素、基本事件发生概率特征函数、基本事件发 生概率空间分布、顶上事件发生概率空间分布、 概率重要度空间分布、关键重要度空间分布、顶 上事件发生概率空间分布趋势、事件更换周期、 系统更换周期、基本事件及系统的径集域、割集 域和域边界[47] 、因素重要度和因素联合重要度分 布 [46-49] 等概念。 2) 研究元件和系统在不同因素影响下的故障 概率变化趋势;系统最优更换周期方案及成本方 ·856· 智 能 系 统 学 报 第 14 卷
第5期 崔铁军,等:空间故障树与因素空间融合的智能可靠性分析方法 ·857· 案@,系统故障概率的可接受因素域:因素对系统 合SFT的故障概率分布表示,特别是对离散故障 可靠性影响的重要度;系统故障定位方法6;系统 数据的处理。提出了可控因素和不可控因素的概 维修率确定及优化;系统可靠性评估方法$):系 念及其分析方法。 统和元件因素重要度等。 8)提出基于因素分析法的系统功能结构分析 3)给出空间故障树SFT理论框架中,离散型 方法,指出因素空间能描述智能科学中的定性 空间故障树(discrete space fault tree,DSFT)的理 认知过程。基于因素逻辑具体建立了系统功能 论51、定义、公式和方法,及应用这些方法的实 结构分析公理体系,给出了定义、逻辑命题和证 例。提出离散型空间故障树概念,并与连续型空 明过程。提出系统功能结构的极小化方法⑧。简 间故障树进行了对比分析。给出在DSFT下求故 述了空间故障树理论中系统结构反分析方法,论 障概率分布的方法,即因素投影拟合法阿,并分析 述了其中分类推理法与因素空间的功能结构分 了该方法的不精确原因。进而提出了更为精确的 析方法的关系。使用系统功能结构分析方法分 使用ANN确定故障概率分布的方法,同时也使 别对信息完备和不完备情况的系统功能结构进 用ANN求导得到了故障概率变化趋势S7。同时 行了分析。 提出了模糊结构元理论与空间故障树的结合,即 9)提出作用路径和作用历史的概念。前者刻 模糊结构元化特征函数及空间故障树56)。 画了在不同环境因素变化过程中系统及元件经历 4)研究系统结构反分析方法,提出了01型空 的各种状态的集合,是因素的函数。后者描述经 间故障树表示系统的物理结构和因素结构,及结 历作用路径过程中的可积累状态量,是累积的结 构表示方法,即表法和图法。提出了可用于系统 果。尝试使用运动系统稳定性理论描述可靠性系 元件及因素结构反分析的逐条分析法和分类推理 统的稳定性问题,将系统划分为功能子系统、容 法,并描述了分析过程和数学定义6261。 错子系统、阻碍子系统。对这3个子系统在可靠 5)研究从实际监测数据记录中挖掘出适合 性系统中的作用进行了论述。根据微分方程解 于SFT处理的基础数据方法。研究定性安全评 的8种稳定性,解释了其中5种对应的系统可靠 价和监测记录的化简、区分及因果关系6;工作 性含义。 环境变化情况下的系统适应性改造成本6,环境 10)提出基于包络线的云模型相似度计算方 因素影响下系统中元件重要性;系统可靠性决策 法剧。适用于安全评价中表示不确定性数据特点 规则发掘方法及其改进方法66;不同对象分类 的评价信息,对信息进行分析、合并,进而达到化 和相似性网及其改进方法例。 简的目的。为使云模型能方便有效地进行多属性 6)引人云模型改造空间故障树。云化空间故 决策,对已有属性圆进行改造,使其适应不确定 障树继承了SFT分析多因素影响可靠性的能力, 性特点,并能计算云模型特征参数。提出可考 也继承了云模型表示数据不确定性的能力。从 虑不同因素值变化对系统可靠性影响的模糊综合 而使云化空间故障树适合于实际故障数据的分析 评价方法⑧。依靠云模型对专家所提供的评价数 处理。提出云化概念包括:云化特征函数,云化 据蕴含的不确定性的分析能力,结合云模型和 元件和系统故障概率分布,云化元件和系统故障 AHP,对AHP进行云模型改造。构建合作博弈 概率分布变化趋势四,云化概率和关键重要度分 云化AHP算法⑧,根据专家对施工方式选择的自 布四,云化因素和因素联合重要度分布1,云化区 然思维过程的两个层面,在算法中使用了两次云 域重要度,云化径集域和割集域阿,可靠性数据 化AHP模型。提出了云化ANP模型及其步骤圈。 的不确定性分析。 11)研究了元件维修率确定方法,分析不同环 7)给出了基于随机变量分解式的可靠性数据 境因素对同类元件维修率分布影响情况8刿。结 表示方法m。研究了从不同侧面分析影响因素和 合Markov状态转移链和SFT特征函数推导了串 目标因素之间逻辑关系的状态吸收法和状态复现 联系统和并联系统的元件维修率分布。研究异类 法。构建了针对SFT中故障数据的因果概念分 元件的并联、串联和混联形式系统,提出元件维 析方法网。 修率分布计算方法并给出了限制条件侧。 参照故障数据特征,提出了故障及影响因素 4空间故障树与因素空间的融合 构建背景关系的分析方法四。根据因素空间中的 信息增益法,制定了SFT的影响因素降维方法。 空间故障树理论认为在实际环境中工作的系 提出了基于内点定理的故障数据压缩方法,其适 统,由于组成系统的元件的物理材料性质受因素
案 [50] ;系统故障概率的可接受因素域;因素对系统 可靠性影响的重要度;系统故障定位方法[51] ;系统 维修率确定及优化[52] ;系统可靠性评估方法[53] ;系 统和元件因素重要度[54] 等。 3) 给出空间故障树 SFT 理论框架中,离散型 空间故障树 (discrete space fault tree,DSFT) 的理 论 [55] 、定义、公式和方法,及应用这些方法的实 例。提出离散型空间故障树概念,并与连续型空 间故障树进行了对比分析。给出在 DSFT 下求故 障概率分布的方法,即因素投影拟合法[56] ,并分析 了该方法的不精确原因。进而提出了更为精确的 使用 ANN 确定故障概率分布的方法,同时也使 用 ANN 求导得到了故障概率变化趋势[57]。同时 提出了模糊结构元理论与空间故障树的结合,即 模糊结构元化特征函数及空间故障树[58-61]。 4) 研究系统结构反分析方法,提出了 01 型空 间故障树表示系统的物理结构和因素结构,及结 构表示方法,即表法和图法。提出了可用于系统 元件及因素结构反分析的逐条分析法和分类推理 法,并描述了分析过程和数学定义[62-63]。 5) 研究从实际监测数据记录中挖掘出适合 于 SFT 处理的基础数据方法。研究定性安全评 价和监测记录的化简、区分及因果关系[64] ;工作 环境变化情况下的系统适应性改造成本[65] ;环境 因素影响下系统中元件重要性;系统可靠性决策 规则发掘方法及其改进方法[66-67] ;不同对象分类 和相似性[68] 及其改进方法[69]。 6) 引入云模型改造空间故障树。云化空间故 障树继承了 SFT 分析多因素影响可靠性的能力, 也继承了云模型表示数据不确定性的能力[70]。从 而使云化空间故障树适合于实际故障数据的分析 处理。提出云化概念包括:云化特征函数,云化 元件和系统故障概率分布,云化元件和系统故障 概率分布变化趋势[71] ,云化概率和关键重要度分 布 [72] ,云化因素和因素联合重要度分布[73] ,云化区 域重要度[74] ,云化径集域和割集域[75] ,可靠性数据 的不确定性分析[76]。 7) 给出了基于随机变量分解式的可靠性数据 表示方法[77]。研究了从不同侧面分析影响因素和 目标因素之间逻辑关系的状态吸收法和状态复现 法。构建了针对 SFT 中故障数据的因果概念分 析方法[78]。 参照故障数据特征,提出了故障及影响因素 构建背景关系的分析方法[79]。根据因素空间中的 信息增益法,制定了 SFT 的影响因素降维方法。 提出了基于内点定理的故障数据压缩方法,其适 合 SFT 的故障概率分布表示,特别是对离散故障 数据的处理。提出了可控因素和不可控因素的概 念及其分析方法。 8) 提出基于因素分析法的系统功能结构分析 方法[80] ,指出因素空间能描述智能科学中的定性 认知过程。基于因素逻辑具体建立了系统功能 结构分析公理体系,给出了定义、逻辑命题和证 明过程。提出系统功能结构的极小化方法[81]。简 述了空间故障树理论中系统结构反分析方法,论 述了其中分类推理法与因素空间的功能结构分 析方法的关系。使用系统功能结构分析方法分 别对信息完备和不完备情况的系统功能结构进 行了分析[82]。 9) 提出作用路径和作用历史的概念。前者刻 画了在不同环境因素变化过程中系统及元件经历 的各种状态的集合,是因素的函数。后者描述经 历作用路径过程中的可积累状态量,是累积的结 果。尝试使用运动系统稳定性理论描述可靠性系 统的稳定性问题,将系统划分为功能子系统、容 错子系统、阻碍子系统。对这 3 个子系统在可靠 性系统中的作用进行了论述。根据微分方程解 的 8 种稳定性,解释了其中 5 种对应的系统可靠 性含义。 10) 提出基于包络线的云模型相似度计算方 法 [83]。适用于安全评价中表示不确定性数据特点 的评价信息,对信息进行分析、合并,进而达到化 简的目的。为使云模型能方便有效地进行多属性 决策,对已有属性圆进行改造,使其适应不确定 性特点,并能计算云模型特征参数[84]。提出可考 虑不同因素值变化对系统可靠性影响的模糊综合 评价方法[85]。依靠云模型对专家所提供的评价数 据蕴含的不确定性的分析能力,结合云模型和 AHP,对 AHP 进行云模型改造[86]。构建合作博弈- 云化 AHP 算法[87] ,根据专家对施工方式选择的自 然思维过程的两个层面,在算法中使用了两次云 化 AHP 模型。提出了云化 ANP 模型及其步骤[88]。 11) 研究了元件维修率确定方法,分析不同环 境因素对同类元件维修率分布影响情况[89]。结 合 Markov 状态转移链和 SFT 特征函数推导了串 联系统和并联系统的元件维修率分布。研究异类 元件的并联、串联和混联形式系统,提出元件维 修率分布计算方法并给出了限制条件[90]。 4 空间故障树与因素空间的融合 空间故障树理论认为在实际环境中工作的系 统,由于组成系统的元件的物理材料性质受因素 第 5 期 崔铁军,等:空间故障树与因素空间融合的智能可靠性分析方法 ·857·