工程科学学报,第40卷,第7期:815-821,2018年7月 Chinese Journal of Engineering,Vol.40,No.7:815-821,July 2018 DOI:10.13374/j.issn2095-9389.2018.07.007;http://journals.ustb.edu.cn 基于极限学习机(ELM)的连铸坯质量预测 陈恒志”,杨建平),卢新春12),余相灼),刘青) 1)北京科技大学钢铁治金新技术国家重点实验室,北京1000832)方大特钢科技股份有限公司,南昌330000 区通信作者,E-mail:qliu@usth.edu.cm 摘要针对传统基于BP神经网络建立的连铸坯质量预测模型训练速度慢、适应能力弱、预测精度低等问题,本文提出一种 基于极限学习机的连铸坯质量预测方法,对方大特钢60Si2M连铸坯中心疏松和中心偏析缺陷进行预测,并与BP和遗传算 法优化BP神经网络预测模型的预测结果进行分析对比.结果表明:BP及GA-BP神经网络预测模型对连铸坯中心疏松和中 心偏析缺陷的预测准确率分别为50%、57.5%、70%和72.5%;而基于极限学习机的连铸坯预测模型预测准确率更高,对连铸 坯中心疏松和中心偏析缺陷的预测准确率分别为85%和82.5%,且该模型具有极快的运算时间,仅需0.1s.该模型可对连铸 坯质量进行迅速准确地分析,为连铸坯质量预测的在线应用提供了一种新的方法 关键词连铸坯;BP神经网络:遗传算法:极限学习机:质量预测 分类号TF777.2 Quality prediction of the continuous casting bloom based on the extreme learning machine CHEN Heng-zhi),YANG Jian-ping,LU Xin-chun'2),YU Xiang-zhuo,LIU Qing 1)State Key Laboratory of Advanced Metallurgy,University of Science and Technology Beijing,Beijing 100083,China 2)Fangda Special Steel Technology Co.,Ltd,Nanchang 330000,China Corresponding author,E-mail:qliu@ustb.edu.cn ABSTRACT To solve the problems of slow training,weak generalization ability,and low prediction accuracy in the traditional pre- diction model established in terms of the BP neural network,a method of the quality prediction of the continuous casting bloom based on the extreme learning machine (ELM)was proposed to predict the degree of the center porosity and the central segregation of 60Si2Mn continuous casting bloom produced by Fangda Special Steel.Comparing the prediction models of the BP neural network and the GA-BP neural network,the results show that the prediction accuracy of the model based on ELM is improved to 85%and 82.5% in the center loose and central segregation,respectively,and the operation time is reduced to 0.Is.The model can rapidly and accu- rately analyze the quality of a continuous casting billet,thus providing a new method for the online application of continuous casting bil- let quality prediction. KEY WORDS continuous casting bloom;BP neural network;genetic algorithm;extreme learning machine;quality prediction 连铸坯生产过程中,钢水洁净度较低或工艺操 际生产的连铸坯质量缺陷检测模型,由于检验时间 作不稳定,往往造成连铸坯质量缺陷,如中心偏析、 的滞后性,难以对铸坯质量进行实时精准预测,不利 横纵裂纹等,致使产品质量下降,废品率增加,难以 于钢铁企业高品质钢的生产.如何及时准确地预报 及时满足客户的订单需求.目前,大多数应用于实 和检测铸坯质量是钢铁企业可持续发展过程中亟待 收稿日期:2017-06-12 基金项目:国家自然科学基金资助项目(50874014)
工程科学学报,第 40 卷,第 7 期:815鄄鄄821,2018 年 7 月 Chinese Journal of Engineering, Vol. 40, No. 7: 815鄄鄄821, July 2018 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2018. 07. 007; http: / / journals. ustb. edu. cn 基于极限学习机(ELM)的连铸坯质量预测 陈恒志1) , 杨建平1) , 卢新春1,2) , 余相灼1) , 刘 青1) 苣 1)北京科技大学钢铁冶金新技术国家重点实验室, 北京 100083 2)方大特钢科技股份有限公司, 南昌 330000 苣通信作者,E鄄mail: qliu@ ustb. edu. cn 摘 要 针对传统基于 BP 神经网络建立的连铸坯质量预测模型训练速度慢、适应能力弱、预测精度低等问题,本文提出一种 基于极限学习机的连铸坯质量预测方法,对方大特钢 60Si2Mn 连铸坯中心疏松和中心偏析缺陷进行预测,并与 BP 和遗传算 法优化 BP 神经网络预测模型的预测结果进行分析对比. 结果表明:BP 及 GA鄄鄄BP 神经网络预测模型对连铸坯中心疏松和中 心偏析缺陷的预测准确率分别为 50% 、57郾 5% 、70% 和 72郾 5% ;而基于极限学习机的连铸坯预测模型预测准确率更高,对连铸 坯中心疏松和中心偏析缺陷的预测准确率分别为 85% 和 82郾 5% ,且该模型具有极快的运算时间,仅需 0郾 1 s. 该模型可对连铸 坯质量进行迅速准确地分析,为连铸坯质量预测的在线应用提供了一种新的方法. 关键词 连铸坯; BP 神经网络; 遗传算法; 极限学习机; 质量预测 分类号 TF777郾 2 收稿日期: 2017鄄鄄06鄄鄄12 基金项目: 国家自然科学基金资助项目(50874014) Quality prediction of the continuous casting bloom based on the extreme learning machine CHEN Heng鄄zhi 1) , YANG Jian鄄ping 1) , LU Xin鄄chun 1,2) , YU Xiang鄄zhuo 1) , LIU Qing 1) 苣 1)State Key Laboratory of Advanced Metallurgy, University of Science and Technology Beijing, Beijing 100083, China 2)Fangda Special Steel Technology Co. , Ltd, Nanchang 330000, China 苣Corresponding author,E鄄mail: qliu@ ustb. edu. cn ABSTRACT To solve the problems of slow training, weak generalization ability, and low prediction accuracy in the traditional pre鄄 diction model established in terms of the BP neural network, a method of the quality prediction of the continuous casting bloom based on the extreme learning machine ( ELM) was proposed to predict the degree of the center porosity and the central segregation of 60Si2Mn continuous casting bloom produced by Fangda Special Steel. Comparing the prediction models of the BP neural network and the GA鄄鄄BP neural network, the results show that the prediction accuracy of the model based on ELM is improved to 85% and 82郾 5% in the center loose and central segregation, respectively, and the operation time is reduced to 0郾 1 s. The model can rapidly and accu鄄 rately analyze the quality of a continuous casting billet, thus providing a new method for the online application of continuous casting bil鄄 let quality prediction. KEY WORDS continuous casting bloom; BP neural network; genetic algorithm; extreme learning machine; quality prediction 连铸坯生产过程中,钢水洁净度较低或工艺操 作不稳定,往往造成连铸坯质量缺陷,如中心偏析、 横纵裂纹等,致使产品质量下降,废品率增加,难以 及时满足客户的订单需求. 目前,大多数应用于实 际生产的连铸坯质量缺陷检测模型,由于检验时间 的滞后性,难以对铸坯质量进行实时精准预测,不利 于钢铁企业高品质钢的生产. 如何及时准确地预报 和检测铸坯质量是钢铁企业可持续发展过程中亟待
.816. 工程科学学报,第40卷,第7期 解决的重要问题.连铸坯生产过程中工艺参数众 如图1所示. 多,且连铸坯缺陷的各影响因素之间具有很强的非 输人层 隐含层 输出层 线性关系.基于上述特征,神经网络较强的非线性 逼近能力,可以很好地解决这一问题.张邦礼等) 提出了基于BP神经网络的连铸坯质量预测模型, 误差反馈 并利用不同的激活函数改善网络的性能:Bou- houche2]运用神经网络建立了连铸坯缺陷预测模 型,该模型进行离线学习,并利用图形化编程软件在 过程计算机上实现了神经网络的连铸坯质量的预 测:常运合等]运用改进的BP神经网络建立了连 铸坯质量缺陷预测模型,应用于生产后全年中心裂 图1BP神经网络结构 纹不合格板坯减少50.6%;张静4)在遗传算法中运 Fig.I Structure of the BP neural network 用灾变算子优化神经网络并建立连铸坯质量预测模 该神经网络结构含有L个输入层神经元,n个 型,该模型预测结果精度较高,但测试样本数据较 隐含层神经元,m个输出神经元.典型的单隐层前 少,其可靠性有待进一步测试.虽然神经网络具有 馈神经网络结构如图1所示.设隐含层的神经元激 较强的非线性逼近能力,但是模型训练的速度较慢, 活函数为g(x),其模型表达式如下式所示 易陷入局部最优化,且易出现过度训练引起泛化性 能下降等问题,限制了其在工业上的应用.BP神经 Y= Big(x;+b) (1) j=1i=1 网络是目前研究深入、应用最广泛的神经网络算法 式中:Y为网络的输出值,w:为第i个隐含层神经元 之一,针对BP神经网络预测模型存在的不足,本文 与第j个输入层神经元的连接权值,x:为第j个输入 引入极限学习机(extreme learning machine,ELM) 层神经元的输入值,B为输出层与第i个隐含层神 的方法构建连铸坯质量预测模型.模型在训练过程 经元的连接权值,b,为第i个隐含层神经元的偏置. 中不需要调整网络的输入权值以及隐藏层的偏置, 当网络创建时,输入层和隐藏层中的神经元之 只需设置网络的隐藏层节点个数,就能产生唯一的 间的连接被分配随机的权值和阈值,然后网络生成 最优解,且该模型训练速度快、泛化性能较好.本文 输出值.网络对输出与实际输出值进行比较,并通 通过建立基于极限学习机的连铸坯质量预测模型对 过误差反向传播改变网络的连接权值,从而达到降 连铸方坯(断面为:180mm×180mm)中心疏松和中 低网络的最小均方误差E,表达式如下式所示.网 心偏析缺陷进行预测,并与基于BP和GA(genetic 络的训练一直重复这个过程,直到误差最小化. algorithm)-BP遗传算法优化BP神经网络方法建立 的连铸坯质量预测模型的预测结果进行比较发现: E= 2点 (0-Y)2 (2) 本文建立的基于极限学习机的连铸坯质量预测模型 式中:E是最小均方误差,L是模型的输入层节点个 具有较高的预测准确率且运行过程极为高效,有助 数,n是模型的输出层节点个数,O是实际值,Y是 于实现钢铁企业连铸坯质量预测的在线应用. 网络的输出值. 1 基于BP神经网络的连铸坯质量预测模型 由Kolmogorov理论可知,三层BP神经网络[6-刀 可无限逼近任一非线性函数,本文运用Matlab建立 人工神经网络可以有效地解决非线性问题,且 三层BP神经网连铸坯质量预测模型以期获得较高 网络结构简单,鲁棒性强,已被成功应用于各个领 的连铸坯质量预测准确率.根据实际调研与前人的 域.鉴于上述特点,本文建立基于BP的连铸坯质量 研究,归纳总结了影响连铸坯质量的20个因素(见 预测模型,以期得到较好的连铸坯质量预测准确率. 表1)作为该模型的输入变量[⑧] 1.1模型建立 由于隐含层节点数对预测结果的准确率有很大 BP神经网络由信号前向传播和误差反向传播 的影响,本文根据Dong等9)金矿磨浮过程能耗预 组成,且两个过程的连续循环构成网络的训练过程. 测研究中的经验公式求得最优隐含层节点数范围为 输入层的节点代表预选输入参数.中间层或隐藏层 [6,16]. 的节点与输入输出神经元以外的数据没有直接联 1.2模型验证 系.输出层的节点代表预期的输出参数.网络模型 本文运用Matlab建立BP神经网络的连铸坯质
工程科学学报,第 40 卷,第 7 期 解决的重要问题. 连铸坯生产过程中工艺参数众 多,且连铸坯缺陷的各影响因素之间具有很强的非 线性关系. 基于上述特征,神经网络较强的非线性 逼近能力,可以很好地解决这一问题. 张邦礼等[1] 提出了基于 BP 神经网络的连铸坯质量预测模型, 并利用 不 同 的 激 活 函 数 改 善 网 络 的 性 能; Bou鄄 houche [2]运用神经网络建立了连铸坯缺陷预测模 型,该模型进行离线学习,并利用图形化编程软件在 过程计算机上实现了神经网络的连铸坯质量的预 测;常运合等[3] 运用改进的 BP 神经网络建立了连 铸坯质量缺陷预测模型,应用于生产后全年中心裂 纹不合格板坯减少 50郾 6% ;张静[4] 在遗传算法中运 用灾变算子优化神经网络并建立连铸坯质量预测模 型,该模型预测结果精度较高,但测试样本数据较 少,其可靠性有待进一步测试. 虽然神经网络具有 较强的非线性逼近能力,但是模型训练的速度较慢, 易陷入局部最优化,且易出现过度训练引起泛化性 能下降等问题,限制了其在工业上的应用. BP 神经 网络是目前研究深入、应用最广泛的神经网络算法 之一,针对 BP 神经网络预测模型存在的不足,本文 引入极限学习机[5] (extreme learning machine,ELM) 的方法构建连铸坯质量预测模型. 模型在训练过程 中不需要调整网络的输入权值以及隐藏层的偏置, 只需设置网络的隐藏层节点个数,就能产生唯一的 最优解,且该模型训练速度快、泛化性能较好. 本文 通过建立基于极限学习机的连铸坯质量预测模型对 连铸方坯(断面为:180 mm 伊 180 mm)中心疏松和中 心偏析缺陷进行预测,并与基于 BP 和 GA( genetic algorithm)鄄鄄BP 遗传算法优化 BP 神经网络方法建立 的连铸坯质量预测模型的预测结果进行比较发现: 本文建立的基于极限学习机的连铸坯质量预测模型 具有较高的预测准确率且运行过程极为高效,有助 于实现钢铁企业连铸坯质量预测的在线应用. 1 基于 BP 神经网络的连铸坯质量预测模型 人工神经网络可以有效地解决非线性问题,且 网络结构简单,鲁棒性强,已被成功应用于各个领 域. 鉴于上述特点,本文建立基于 BP 的连铸坯质量 预测模型,以期得到较好的连铸坯质量预测准确率. 1郾 1 模型建立 BP 神经网络由信号前向传播和误差反向传播 组成,且两个过程的连续循环构成网络的训练过程. 输入层的节点代表预选输入参数. 中间层或隐藏层 的节点与输入输出神经元以外的数据没有直接联 系. 输出层的节点代表预期的输出参数. 网络模型 如图 1 所示. 图 1 BP 神经网络结构 Fig. 1 Structure of the BP neural network 该神经网络结构含有 L 个输入层神经元,n 个 隐含层神经元,m 个输出神经元. 典型的单隐层前 馈神经网络结构如图 1 所示. 设隐含层的神经元激 活函数为 g(x),其模型表达式如下式所示. Y = 移 L j = 1 移 n i = 1 茁ig(棕ji xj + bi) (1) 式中:Y 为网络的输出值,棕ji为第 i 个隐含层神经元 与第 j 个输入层神经元的连接权值,xj 为第 j 个输入 层神经元的输入值,茁i 为输出层与第 i 个隐含层神 经元的连接权值,bi 为第 i 个隐含层神经元的偏置. 当网络创建时,输入层和隐藏层中的神经元之 间的连接被分配随机的权值和阈值,然后网络生成 输出值. 网络对输出与实际输出值进行比较,并通 过误差反向传播改变网络的连接权值,从而达到降 低网络的最小均方误差 E,表达式如下式所示. 网 络的训练一直重复这个过程,直到误差最小化. E = 1 2 移 L j = 1 移 n i = 1 (Oji - Yji) 2 (2) 式中:E 是最小均方误差,L 是模型的输入层节点个 数,n 是模型的输出层节点个数,Oji是实际值,Yji是 网络的输出值. 由 Kolmogorov 理论可知,三层 BP 神经网络[6鄄鄄7] 可无限逼近任一非线性函数,本文运用 Matlab 建立 三层 BP 神经网连铸坯质量预测模型以期获得较高 的连铸坯质量预测准确率. 根据实际调研与前人的 研究,归纳总结了影响连铸坯质量的 20 个因素(见 表 1)作为该模型的输入变量[8] . 由于隐含层节点数对预测结果的准确率有很大 的影响,本文根据 Dong 等[9] 金矿磨浮过程能耗预 测研究中的经验公式求得最优隐含层节点数范围为 [6,16]. 1郾 2 模型验证 本 文运用Matlab建立BP神经网络的连铸坯质 ·816·
陈恒志等:基于极限学习机(ELM)的连铸坯质量预测 .817· 表1连铸坯质量缺陷影响因素 Table 1 Influential factors of the quality of the continuous casting bloom 变量 符号 变量 符号 钢水C质量分数/% X 钢水S质量分数/% 钢水P质量分数/% X2 钢水Mn质量分数/% 古 钢水Si质量分数/% X3 钢水C质量分数/% Xs 钢水Cr质量分数/% 专 钢水全AI质量分数/% Xo 钢水酸溶铝质量分数/% Xs 钢水C质量分数/% Xio 二冷比水量/kg Xn 二冷0段水量/(m3h1) X16 中间包温度/℃ Xn 二冷1段水量/(m3,h1) Xn 拉速/(m'min) Xns 二冷2段水量/(m3.h1) X18 结品器水量/(m3.h1) Xi4 结品器进出水温差/℃ X19 结品器锥度/(°) X15 电磁搅拌电流/A X2o 量预测模型,且模型以方大特钢60Si2Mn的160组 25 -0预测值 实际生产数据为样本,随机选取其中120组数据建 一一实际值 立模型,剩余40组数据验证模型的准确性.在模型 2.0 9 训练前对输入数据进行归一化处理,处理方式为对 1.5 同一影响因素集进行归一化处理,这样既能消除由 于数据量纲不同造成预测精度不高的问题,又能保 1.0 9 持各变量的原始信息,数据归一化范围为[0.1, 0.5 0.9].在神经网络的隐含层节点数寻优过程中发 现,当节点数为9且隐含层神经元激活函数为$型 函数[]时模型的预测精度最佳.BP神经网络参数 10 20 30 0 如表2所示. 样本 图2中心疏松的实际值和预测值的比较 表2BP神经网络参数 Fig.2 Comparison of the center porosity between the actual values Table 2 Fundamental parameters of the BP neural network and the predicted values 参数 值 参数 值 输入层节点数 20 输出层节点数 1 25 -0-预测值 隐含层节点数 9 最大训练步数 1000 一·一实际值 2.09 9 学习速率 0.001 动量因子 0.9 训练函数 trainlm 隐含层数 1 5 图2为基于BP神经网络的连铸坯质量预测模 型对连铸坯中心疏松缺陷等级的预测值和实际值. 0.5 图3为该模型对连铸坯中心偏析缺陷的预测值和实 际值.该模型对连铸坯的中心疏松和中心偏析缺陷 3 测试准确率分别为50%和57.5%.从预测结果可 0 20 30 40 知该连铸坯质量预测模型对连铸坯缺陷进行预测的 样本 实际值和预测值存在较大的差异,模型对连铸坯质 图3中心偏析的实际值和预测值的比较 量预测的准确率有待于提升,下文将尝试运用遗传 Fig.3 Comparison of the central segregation between the actual val- 算法来优化BP神经网络连铸坯质量预测模型以期 ues and the predicted values 提高模型的预测准确率. 一非线性函数,但是网络在训练过程中容易陷入局 基于GA-BP神经网络的连铸坯质量预 部最优值.而遗传算法具有较强的全局寻优能力, 因此,将遗传算法和BP神经网络相结合的连铸坯 测模型 质量预测模型可以使模型在较强的学习能力下搜索 虽然BP神经网络的学习能力很强,可逼近任 全局最优值
陈恒志等: 基于极限学习机(ELM)的连铸坯质量预测 表 1 连铸坯质量缺陷影响因素 Table 1 Influential factors of the quality of the continuous casting bloom 变量 符号 变量 符号 钢水 C 质量分数/ % X1 钢水 S 质量分数/ % X6 钢水 P 质量分数/ % X2 钢水 Mn 质量分数/ % X7 钢水 Si 质量分数/ % X3 钢水 Cu 质量分数/ % X8 钢水 Cr 质量分数/ % X4 钢水全 Al 质量分数/ % X9 钢水酸溶铝质量分数/ % X5 钢水 C 质量分数/ % X10 二冷比水量/ kg X11 二冷 0 段水量/ (m 3·h - 1 ) X16 中间包温度/ 益 X12 二冷 1 段水量/ (m 3·h - 1 ) X17 拉速/ (m·min - 1 ) X13 二冷 2 段水量/ (m 3·h - 1 ) X18 结晶器水量/ (m 3·h - 1 ) X14 结晶器进出水温差/ 益 X19 结晶器锥度/ (毅) X15 电磁搅拌电流/ A X20 量预测模型,且模型以方大特钢 60Si2Mn 的 160 组 实际生产数据为样本,随机选取其中 120 组数据建 立模型,剩余 40 组数据验证模型的准确性. 在模型 训练前对输入数据进行归一化处理,处理方式为对 同一影响因素集进行归一化处理,这样既能消除由 于数据量纲不同造成预测精度不高的问题,又能保 持各变量的原始信息,数据归一化范围为 [0郾 1, 0郾 9]. 在神经网络的隐含层节点数寻优过程中发 现,当节点数为 9 且隐含层神经元激活函数为 S 型 函数[10]时模型的预测精度最佳. BP 神经网络参数 如表 2 所示. 表 2 BP 神经网络参数 Table 2 Fundamental parameters of the BP neural network 参数 值 参数 值 输入层节点数 20 输出层节点数 1 隐含层节点数 9 最大训练步数 1000 学习速率 0郾 001 动量因子 0郾 9 训练函数 trainlm 隐含层数 1 图 2 为基于 BP 神经网络的连铸坯质量预测模 型对连铸坯中心疏松缺陷等级的预测值和实际值. 图 3 为该模型对连铸坯中心偏析缺陷的预测值和实 际值. 该模型对连铸坯的中心疏松和中心偏析缺陷 测试准确率分别为 50% 和 57郾 5% . 从预测结果可 知该连铸坯质量预测模型对连铸坯缺陷进行预测的 实际值和预测值存在较大的差异,模型对连铸坯质 量预测的准确率有待于提升,下文将尝试运用遗传 算法来优化 BP 神经网络连铸坯质量预测模型以期 提高模型的预测准确率. 2 基于 GA鄄鄄 BP 神经网络的连铸坯质量预 测模型 虽然 BP 神经网络的学习能力很强,可逼近任 图 2 中心疏松的实际值和预测值的比较 Fig. 2 Comparison of the center porosity between the actual values and the predicted values 图 3 中心偏析的实际值和预测值的比较 Fig. 3 Comparison of the central segregation between the actual val鄄 ues and the predicted values 一非线性函数,但是网络在训练过程中容易陷入局 部最优值. 而遗传算法具有较强的全局寻优能力, 因此,将遗传算法和 BP 神经网络相结合的连铸坯 质量预测模型可以使模型在较强的学习能力下搜索 全局最优值. ·817·
818. 工程科学学报,第40卷,第7期 2.1模型建立 25 遗传算法由美国的Holland教授提出,该方法 -0预测值 一◆一实际值 是以自然中的遗传和生物进化论为指导思想而提出 2.0 的一种全局最优化搜索方法,他把自然界中“优胜 15 劣汰”的生物进化引入到优化神经网络的参数中, 按照所选择的适应度函数并通过模拟生物遗传中的 1.0 选择、交叉和变异,然后对个体进行“适者生存,优 开05 胜劣汰”的选择.反复循环迭代,直到筛选出满足条 件的个体为止. 下面本文将运用Matlab建立遗传算法(genetic 10 20 30 40 algorithm,GA)和BP神经网络I-)相结合的连铸 样本 坯质量预测模型来提高模型的预测准确率,且本模 图4中心疏松的实际值和预测值的比较 型遗传算法的种群个体适应度值K为各输出节点 Fig.4 Comparison of the center porosity between the actual values 的连铸坯缺陷预测结果输出值与连铸坯缺陷实际值 and the predicted values 的误差绝对值的和,其计算公式如下式所示 2.5 -0-预测值 K= ,abs(ym-om) (3) 一实际值 2.0 式中:K为适应度值,n为网络输出的节点数,ym为 1.5 神经网络的第m个样本对应的期望输出,0m为第m 个样本对应的的实际输出,abs(x)为绝对值函数. 1.0 遗传算法的基本参数如表3所示 表3遗传算法的基本参数 Table 3 Fundamental parameters and operations of the genetic algorithm 参数名 值 操作项 操作方法 10 20 30 初始种群数 30 编码方式 实数编码 样本 迭代次数 20 选择操作 适应度比例法 图5中心偏析的实际值和预测值的比较 Fig.5 Comparison of the central segregation between the actual val- 交叉概率 0.42 交叉操作 实数交叉法 ues and the predicted values 变异概率 0.2 变异操作 非一致变异法 2.2 模型验证 3 基于极限学习机的连铸坯质量预测模型 通过运用方大特钢60Si2Mn的120组数据对基 为了提高连铸坯质量预测模型的运算速度和预 于GA-BP神经网络连铸坯质量预测模型进行训 测准确率,本文尝试多种方法建立连铸坯预测模型, 练,并运用剩余的40组测试样本来检测GA-BP神 最终选择基于极限学习机的连铸坯质量预测模型, 经网铬的连铸坯质量预测模型的预测精度.图4为 因为该模型具有较快的运行速度[14且模型对连铸 基于GA-BP的连铸坯质量预测模型对连铸坯中 坯质量缺陷的预测准确率有了进一步的提高. 心疏松缺陷等级的预测值和实际值.图5为该模 3.1模型建立 型对连铸坯中心偏析缺陷的预测值和实际值.该 极限学习机是一种简单有效的单隐层前馈神经 模型对连铸坯的中心疏松和中心偏析缺陷预测准 网络1s6,该神经网络结构含有n个输入层神经 确率分别为70%和72.5%,与基于BP神经网络 元,l个隐层神经元,m个输出神经元;其中,输入层 连铸坯质量预测模型相比较,该模型的预测精度 第i个神经元与隐含层第j个神经元的连接权值为 有了明显的提升,对连铸坯中心疏松和中心偏析 ω,隐含层对应的神经元偏置为b.典型的单隐层前 的预测准确率分别提升了20%和15%.然而对于 馈神经网络结构如图6所示. 实际生产,该模型训练时间较长不利于连铸坯质 假设任意N个不同样本(X,Y)∈R。×R,隐 量预测模型在线的应用,且该模型的预测精度还 含层节点个数为L,设隐层神经元的激活函数为 有待进一步提升 G(x),极限学习机模型数学表达式如下式所示
工程科学学报,第 40 卷,第 7 期 2郾 1 模型建立 遗传算法由美国的 Holland 教授提出,该方法 是以自然中的遗传和生物进化论为指导思想而提出 的一种全局最优化搜索方法,他把自然界中“优胜 劣汰冶的生物进化引入到优化神经网络的参数中, 按照所选择的适应度函数并通过模拟生物遗传中的 选择、交叉和变异,然后对个体进行“适者生存,优 胜劣汰冶的选择. 反复循环迭代,直到筛选出满足条 件的个体为止. 下面本文将运用 Matlab 建立遗传算法( genetic algorithm, GA)和 BP 神经网络[11鄄鄄13] 相结合的连铸 坯质量预测模型来提高模型的预测准确率,且本模 型遗传算法的种群个体适应度值 K 为各输出节点 的连铸坯缺陷预测结果输出值与连铸坯缺陷实际值 的误差绝对值的和,其计算公式如下式所示. K = 移 n m = 1 abs(ym - om ) (3) 式中:K 为适应度值,n 为网络输出的节点数,ym 为 神经网络的第 m 个样本对应的期望输出,om 为第 m 个样本对应的的实际输出,abs( x) 为绝对值函数. 遗传算法的基本参数如表 3 所示. 表 3 遗传算法的基本参数 Table 3 Fundamental parameters and operations of the genetic algorithm 参数名 值 操作项 操作方法 初始种群数 30 编码方式 实数编码 迭代次数 20 选择操作 适应度比例法 交叉概率 0郾 42 交叉操作 实数交叉法 变异概率 0郾 2 变异操作 非一致变异法 2郾 2 模型验证 通过运用方大特钢 60Si2Mn 的 120 组数据对基 于 GA鄄鄄BP 神经网络连铸坯质量预测模型进行训 练,并运用剩余的 40 组测试样本来检测 GA鄄鄄 BP 神 经网络的连铸坯质量预测模型的预测精度. 图 4 为 基于 GA鄄鄄BP 的连铸坯质量预测模型对连铸坯中 心疏松缺陷等级的预测值和实际值. 图 5 为该模 型对连铸坯中心偏析缺陷的预测值和实际值. 该 模型对连铸坯的中心疏松和中心偏析缺陷预测准 确率分别为 70% 和 72郾 5% ,与基于 BP 神经网络 连铸坯质量预测模型相比较,该模型的预测精度 有了明显的提升,对连铸坯中心疏松和中心偏析 的预测准确率分别提升了 20% 和 15% . 然而对于 实际生产,该模型训练时间较长不利于连铸坯质 量预测模型在线的应用,且该模型的预测精度还 有待进一步提升. 图 4 中心疏松的实际值和预测值的比较 Fig. 4 Comparison of the center porosity between the actual values and the predicted values 图 5 中心偏析的实际值和预测值的比较 Fig. 5 Comparison of the central segregation between the actual val鄄 ues and the predicted values 3 基于极限学习机的连铸坯质量预测模型 为了提高连铸坯质量预测模型的运算速度和预 测准确率,本文尝试多种方法建立连铸坯预测模型, 最终选择基于极限学习机的连铸坯质量预测模型, 因为该模型具有较快的运行速度[14] 且模型对连铸 坯质量缺陷的预测准确率有了进一步的提高. 3郾 1 模型建立 极限学习机是一种简单有效的单隐层前馈神经 网络[15鄄鄄16] ,该神经网络结构含有 n 个输入层神经 元,l 个隐层神经元,m 个输出神经元;其中,输入层 第 i 个神经元与隐含层第 j 个神经元的连接权值为 棕,隐含层对应的神经元偏置为 b. 典型的单隐层前 馈神经网络结构如图 6 所示. 假设任意 N 个不同样本(Xj,Yj)沂Rn 伊 Rm ,隐 含层节点个数为 L,设隐层神经元的激活函数为 G(x),极限学习机模型数学表达式如下式所示. ·818·
陈恒志等:基于极限学习机(ELM)的连铸坯质量预测 ·819· 确率整体呈上升趋势:当隐含层神经元个数为120 时,训练模型的拟合度达到了最高(激活函数为 ‘sin'和‘sigmoid'时,训练准确率为100%;激活函 数为‘hardlim'时,模型训练准确率高达92%).图7 和图8分别为不同的激活函数和隐含层神经元个数 对连铸坯中心疏松模型和连铸坯中心偏析模型预测 准确率的影响. 90 hardlim -o-sigmoid 输人层 隐层 输出层 80外0 A-sin 图6典型的单隐层前馈神经网络模型 70 Fig.6 Typical feedforward neural network model of the single hidden layer Y.= B.G(0,4)G=1,2,…,m)(4) 50 式中:Y为网络的第m个输出层神经元的输出, 40 w,=[ua,w2,…,wn]T是隐含层第i个神经元与输 30 20 406080 100 120 入层的连接权值,B:为隐含层第i个神经元与输出 隐含层节点数 层的连接权值,G(w:,b:,x:)为第i个隐含层神经元 图7不同激活函数和隐层节点数对应的中心疏松预测准确率 的输出. Fig.7 Testing accuracy of the center porosity corresponding to differ- 该神经网络在对样本训练前随机的产生连接权 ent activation functions and the hidden layer node 值ω和隐含层神经元的偏置b,只需确定隐含层神 90 经元个数和隐含层神经元激活函数,即可计算出B. hardlim o-sigmoid 80 本文运用Matlab软件构建基于极限学习机的 ▲-stn 连铸坯质量预测模型.在建模过程中,发现不同的 70 隐藏层节点个数,对模型的预测精确度存在着很大 60 影响.因此模型需要在确定激活函数的情况下选择 隐藏层节点个数,且该模型分别选取不同的激励函 50 数进行实验,对比分析不同的激活函数和隐藏层节 40 点个数对模型测试精度的影响.本文选择的激活函 数为‘sin'、‘sigmoid'和‘hardlim';其中‘sigmoid'函 30 0 20 40 60 80 100 120 数是一种常见的S型函数.其函数表达式为 隐含层节点数 5() 图8不同激活函数和隐层节点数对应的中心偏析预测准确率 (5) Fig.8 Testing accuracy of the center segregation corresponding to ‘sin'函数为正弦函数.而hardlim'是一种传 different activation functions and the hidden laver node 递函数,传递函数是通过层的网络输入来计算输出: 由图7可知,在验证连铸坯中心疏松缺陷预测 hardlim(N)需要一组网络输入N,N是一个S×Q 模型的有效性时发现,模型隐含层神经元个数在 的矩阵,由网络输入矢量组成,当N符合条件时,函 (0,20]时模型的预测准确率逐渐增加,隐含层神经 数返回值为1,否则返回值为0 元个数在(20,120]时模型的预测准确率整体呈下 3.2模型验证 降趋势,由此可知当隐含层神经元个数超过20时, 本模型同样以方大特钢60Si2Mn的160组实际 模型的训练开始出现过度拟合:同样对于连铸坯中 生产数据为样本,选取其中的120组数据建立模型, 心偏析缺陷预测模型,在验证模型的有效性时发现 剩余的40组数据验证模型的准确性.在模型训练 模型的隐含层神经元个数在(0,20]时模型的预测 的过程中发现,随着隐含层神经元个数的逐渐增加 准确率基本不变,隐含层神经元个数超过20时模型 (隐含层神经元个数范围(0,120]),模型的训练准 的预测准确率整体呈下降趋势,具体如图8所示,由
陈恒志等: 基于极限学习机(ELM)的连铸坯质量预测 图 6 典型的单隐层前馈神经网络模型 Fig. 6 Typical feedforward neural network model of the single hidden layer Ym = 移 L i = 1 茁iG(棕i,bi,xj) (j = 1,2,…,n) (4) 式中:Ym 为网络的第 m 个输出层神经元的输出, 棕i = [棕i1 ,棕i2 ,…,棕in ] T是隐含层第 i 个神经元与输 入层的连接权值,茁i 为隐含层第 i 个神经元与输出 层的连接权值,G(棕i,bi,xi)为第 i 个隐含层神经元 的输出. 该神经网络在对样本训练前随机的产生连接权 值 棕 和隐含层神经元的偏置 b,只需确定隐含层神 经元个数和隐含层神经元激活函数,即可计算出 茁. 本文运用 Matlab 软件构建基于极限学习机的 连铸坯质量预测模型. 在建模过程中,发现不同的 隐藏层节点个数,对模型的预测精确度存在着很大 影响. 因此模型需要在确定激活函数的情况下选择 隐藏层节点个数,且该模型分别选取不同的激励函 数进行实验,对比分析不同的激活函数和隐藏层节 点个数对模型测试精度的影响. 本文选择的激活函 数为‘sin爷、‘sigmoid爷和‘hardlim爷;其中‘sigmoid爷函 数是一种常见的 S 型函数. 其函数表达式为. S(x) = 1 1 + e - x (5) ‘sin爷函数为正弦函数. 而‘ hardlim爷是一种传 递函数,传递函数是通过层的网络输入来计算输出; hardlim(N) 需要一组网络输入 N,N 是一个 S 伊 Q 的矩阵,由网络输入矢量组成,当 N 符合条件时,函 数返回值为 1,否则返回值为 0. 3郾 2 模型验证 本模型同样以方大特钢 60Si2Mn 的 160 组实际 生产数据为样本,选取其中的 120 组数据建立模型, 剩余的 40 组数据验证模型的准确性. 在模型训练 的过程中发现,随着隐含层神经元个数的逐渐增加 (隐含层神经元个数范围(0,120]),模型的训练准 确率整体呈上升趋势;当隐含层神经元个数为 120 时,训练模型的拟合度达到了最高( 激活函数为 ‘sin爷和‘ sigmoid爷 时,训练准确率为 100% ;激活函 数为‘hardlim爷时,模型训练准确率高达 92% ). 图 7 和图 8 分别为不同的激活函数和隐含层神经元个数 对连铸坯中心疏松模型和连铸坯中心偏析模型预测 准确率的影响. 图 7 不同激活函数和隐层节点数对应的中心疏松预测准确率 Fig. 7 Testing accuracy of the center porosity corresponding to differ鄄 ent activation functions and the hidden layer node 图 8 不同激活函数和隐层节点数对应的中心偏析预测准确率 Fig. 8 Testing accuracy of the center segregation corresponding to different activation functions and the hidden layer node 由图 7 可知,在验证连铸坯中心疏松缺陷预测 模型的有效性时发现,模型隐含层神经元个数在 (0,20]时模型的预测准确率逐渐增加,隐含层神经 元个数在(20,120] 时模型的预测准确率整体呈下 降趋势,由此可知当隐含层神经元个数超过 20 时, 模型的训练开始出现过度拟合;同样对于连铸坯中 心偏析缺陷预测模型,在验证模型的有效性时发现 模型的隐含层神经元个数在(0,20] 时模型的预测 准确率基本不变,隐含层神经元个数超过 20 时模型 的预测准确率整体呈下降趋势,具体如图 8 所示,由 ·819·