工程科学学报 Chinese Journal of Engineering 基于支持向量回归与极限学习机的高炉铁水温度预测 王振阳江德文王新东张建良刘征建赵宝军 Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine WANG Zhen-yang.JIANG De-wen,WANG Xin-dong.ZHANG Jian-liang.LIU Zheng-jian,ZHAO Bao-jun 引用本文: 王振阳,江德文,王新东,张建良,刘征建,赵宝军.基于支持向量回归与极限学习机的高炉铁水温度预测工程科学学报, 2021,43(4:569-576.doi:10.13374.issn2095-9389.2020.05.28.001 WANG Zhen-yang,JIANG De-wen,WANG Xin-dong,ZHANG Jian-liang.LIU Zheng-jian,ZHAO Bao-jun.Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine [Chinese Journal of Engineering, 2021,43(4:569-576.doi:10.13374f.issn2095-9389.2020.05.28.001 在线阅读View online::https:/doi.org/10.13374.issn2095-9389.2020.05.28.001 您可能感兴趣的其他文章 Articles you may be interested in 基于极限学习机ELMD的连铸坯质量预测 Quality prediction of the continuous casting bloom based on the extreme learning machine 工程科学学报.2018,40(7):815 https:1doi.org/10.13374j.issn2095-9389.2018.07.007 基于改进的支持向量回归机算法的磁记忆定量化缺陷反演 Metal magnetic memory quantitative inversion of defects based onoptimized support vector machine regression 工程科学学报.2018,40(9%:1123 https:1doi.org/10.13374.issn2095-9389.2018.09.014 函数型数据分析与优化极限学习机结合的弹药传输机械臂参数辨识 Parameter identification of a shell transfer arm using FDA and optimized ELM 工程科学学报.2017,394:611htps:/doi.org10.13374 /j.issn2095-9389.2017.04.017 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报.2019,41(3:401 https:/1doi.org10.13374j.issn2095-9389.2019.03.014 基于多目标支持向量机的ADHD分类 ADHD classification based on a multi-objective support vector machine 工程科学学报.2020,42(4:441htps:/oi.org10.13374.issn2095-9389.2019.09.12.007 多模态学习方法综述 A survey of multimodal machine learning 工程科学学报.2020,42(5:557 https:/doi.org10.13374j.issn2095-9389.2019.03.21.003
基于支持向量回归与极限学习机的高炉铁水温度预测 王振阳 江德文 王新东 张建良 刘征建 赵宝军 Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine WANG Zhen-yang, JIANG De-wen, WANG Xin-dong, ZHANG Jian-liang, LIU Zheng-jian, ZHAO Bao-jun 引用本文: 王振阳, 江德文, 王新东, 张建良, 刘征建, 赵宝军. 基于支持向量回归与极限学习机的高炉铁水温度预测[J]. 工程科学学报, 2021, 43(4): 569-576. doi: 10.13374/j.issn2095-9389.2020.05.28.001 WANG Zhen-yang, JIANG De-wen, WANG Xin-dong, ZHANG Jian-liang, LIU Zheng-jian, ZHAO Bao-jun. Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine [J]. Chinese Journal of Engineering, 2021, 43(4): 569-576. doi: 10.13374/j.issn2095-9389.2020.05.28.001 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.05.28.001 您可能感兴趣的其他文章 Articles you may be interested in 基于极限学习机(ELM)的连铸坯质量预测 Quality prediction of the continuous casting bloom based on the extreme learning machine 工程科学学报. 2018, 40(7): 815 https://doi.org/10.13374/j.issn2095-9389.2018.07.007 基于改进的支持向量回归机算法的磁记忆定量化缺陷反演 Metal magnetic memory quantitative inversion of defects based onoptimized support vector machine regression 工程科学学报. 2018, 40(9): 1123 https://doi.org/10.13374/j.issn2095-9389.2018.09.014 函数型数据分析与优化极限学习机结合的弹药传输机械臂参数辨识 Parameter identification of a shell transfer arm using FDA and optimized ELM 工程科学学报. 2017, 39(4): 611 https://doi.org/10.13374/j.issn2095-9389.2017.04.017 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报. 2019, 41(3): 401 https://doi.org/10.13374/j.issn2095-9389.2019.03.014 基于多目标支持向量机的ADHD分类 ADHD classification based on a multi-objective support vector machine 工程科学学报. 2020, 42(4): 441 https://doi.org/10.13374/j.issn2095-9389.2019.09.12.007 多模态学习方法综述 A survey of multimodal machine learning 工程科学学报. 2020, 42(5): 557 https://doi.org/10.13374/j.issn2095-9389.2019.03.21.003
工程科学学报.第43卷,第4期:569-576.2021年4月 Chinese Journal of Engineering,Vol.43,No.4:569-576,April 2021 https://doi.org/10.13374/j.issn2095-9389.2020.05.28.001;http://cje.ustb.edu.cn 基于支持向量回归与极限学习机的高炉铁水温度预测 王振阳)区,江德文),王新东),张建良1,3),刘征建),赵宝军) 1)北京科技大学治金与生态工程学院,北京1000832)河钢集团有限公司钢铁技术研究总院,石家庄0500233)昆士兰大学化学工程学 院,圣卢西亚QLD4072 ☒通信作者.E-mail:wangzhenyang(@ustb.edu.cn 摘要选取某4000m3级别高炉2014年至2019年时间范围内的日平均数据,以铁水温度为目标函数.首先对铁水温度的 特征参量进行线性与非线性相关性分析、特征选择与规范化处理,获取了显著影响铁水温度的正负相关性特征参量.在此基 础上,基于支持向量回归与极限学习机两种算法对铁水温度构建预测模型,模型均可对铁水温度实现有效预测,基于支持向 量回归算法构建的预测模型较优,预测平均绝对误差为4.33℃,±10℃误差范围内的命中率为94.0%. 关键词大数据:机器学习:支持向量回归:极限学习机:铁水温度 分类号TF543.1 Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine WANG Zhen-yang JIANG De-wen.WANG Xin-dong.ZHANG Jian-liang LIU Zheng-jian,ZHAO Bao-jun 1)School of Metallurgical and Ecological Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Iron and Steel Technology Research Institute,Hegang Group Co.Ltd.,Shijiazhuang 050023,China 3)School of Chemical Engineering,The University of Queensland,St Lucia QLD 4072,Australia Corresponding author,E-mail:wangzhenyang@ustb.edu.cn ABSTRACT The hot metal temperature is a key process parameter for blast furnace(BF)ironmaking that reflects the quality of hot metal,the thermal state of BF hearth,the energy utilization efficiency of BF,and many other information.Prediction of the hot metal temperature in the next smelting cycle will be helpful in gaining a better understanding of the change trend of hot metal quality and BF smelting status in time.With this,corresponding operational measures can be conducted to maintain the BF stable and smooth state,high production,and low consumption.Nowadays,big data technology has made considerable progress toward a more accurate and faster collection,storage,transmission,query,analysis,and integration of mass data,providing a good data foundation for data-driven machine learning models.In addition,with the substantial increase in computer calculation speed and the significant development of algorithms, the prediction accuracy of deep machine learning models has noticeably improved.The development of these technologies provides feasibility for the prediction of important indicators under complex industrial conditions.Based on the data produced from a 4000-mBF in a large span time range(2014-2019)and daily time dimension,this paper considered hot metal temperature as the objective function. First,the characteristic parameters of hot metal temperature were processed by linear and nonlinear correlation analysis,feature selection,and normalization methods.Then,the positive and negative correlation characteristic parameters that have a significant influence on the temperature of the hot metal were obtained.Finally,prediction models of hot metal temperature were established based on two algorithms of support vector regression and extreme learning machine.Although both the algorithms can achieve effective 收稿日期:202005-28 基金项目:中国博士后科学基金面上资助项目(2019M650490)
基于支持向量回归与极限学习机的高炉铁水温度预测 王振阳1) 苣,江德文1),王新东2),张建良1,3),刘征建1),赵宝军3) 1) 北京科技大学冶金与生态工程学院,北京 100083 2) 河钢集团有限公司钢铁技术研究总院,石家庄 050023 3) 昆士兰大学化学工程学 院,圣卢西亚 QLD 4072 苣通信作者,E-mail: wangzhenyang@ustb.edu.cn 摘 要 选取某 4000 m 3 级别高炉 2014 年至 2019 年时间范围内的日平均数据,以铁水温度为目标函数,首先对铁水温度的 特征参量进行线性与非线性相关性分析、特征选择与规范化处理,获取了显著影响铁水温度的正负相关性特征参量. 在此基 础上,基于支持向量回归与极限学习机两种算法对铁水温度构建预测模型,模型均可对铁水温度实现有效预测,基于支持向 量回归算法构建的预测模型较优,预测平均绝对误差为 4.33 ℃,±10 ℃ 误差范围内的命中率为 94.0%. 关键词 大数据;机器学习;支持向量回归;极限学习机;铁水温度 分类号 TF543.1 Prediction of blast furnace hot metal temperature based on support vector regression and extreme learning machine WANG Zhen-yang1) 苣 ,JIANG De-wen1) ,WANG Xin-dong2) ,ZHANG Jian-liang1,3) ,LIU Zheng-jian1) ,ZHAO Bao-jun3) 1) School of Metallurgical and Ecological Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Iron and Steel Technology Research Institute, Hegang Group Co. Ltd., Shijiazhuang 050023, China 3) School of Chemical Engineering, The University of Queensland, St Lucia QLD 4072, Australia 苣 Corresponding author, E-mail: wangzhenyang@ustb.edu.cn ABSTRACT The hot metal temperature is a key process parameter for blast furnace (BF) ironmaking that reflects the quality of hot metal, the thermal state of BF hearth, the energy utilization efficiency of BF, and many other information. Prediction of the hot metal temperature in the next smelting cycle will be helpful in gaining a better understanding of the change trend of hot metal quality and BF smelting status in time. With this, corresponding operational measures can be conducted to maintain the BF stable and smooth state, high production, and low consumption. Nowadays, big data technology has made considerable progress toward a more accurate and faster collection, storage, transmission, query, analysis, and integration of mass data, providing a good data foundation for data-driven machine learning models. In addition, with the substantial increase in computer calculation speed and the significant development of algorithms, the prediction accuracy of deep machine learning models has noticeably improved. The development of these technologies provides feasibility for the prediction of important indicators under complex industrial conditions. Based on the data produced from a 4000-m3 BF in a large span time range (2014–2019) and daily time dimension, this paper considered hot metal temperature as the objective function. First, the characteristic parameters of hot metal temperature were processed by linear and nonlinear correlation analysis, feature selection, and normalization methods. Then, the positive and negative correlation characteristic parameters that have a significant influence on the temperature of the hot metal were obtained. Finally, prediction models of hot metal temperature were established based on two algorithms of support vector regression and extreme learning machine. Although both the algorithms can achieve effective 收稿日期: 2020−05−28 基金项目: 中国博士后科学基金面上资助项目(2019M650490) 工程科学学报,第 43 卷,第 4 期:569−576,2021 年 4 月 Chinese Journal of Engineering, Vol. 43, No. 4: 569−576, April 2021 https://doi.org/10.13374/j.issn2095-9389.2020.05.28.001; http://cje.ustb.edu.cn
570 工程科学学报,第43卷,第4期 prediction,results from support vector regression are better at an average absolute error of 4.33 C and a hit rate of 94.0%(+10C). KEY WORDS big data;machine learning;support vector regression;extreme learning machine;hot metal temperature 2000年以来,我国生铁产量快速增加,并于 基础的模型在炼铁领域应用较为广泛61网,已成 2019年全年产量达到8.06亿吨,约占当年世界生 功实现对铁水硅含量和高炉故障的预判0,此 铁产量的63%.能耗方面,我国钢铁行业能耗约占 外,极限学习机(Extreme learning machine,简称 工业总能耗的16%,而炼铁工序又占钢铁全流程 ELM)因隐藏神经元的参数无需调整,而获得快速 能耗的70%左右.在此背景下,高炉作为炼铁工序 的训练速度和良好的工业适应度2-2]因此,本研 的主反应器,其稳定顺行对我国钢铁工业的节能 究以支持向量回归和极限学习机算法为基础,在 降耗与高效生产尤为重要.然而高炉原燃料波动 日平均数据的时间维度下,对铁水温度进行模型 造成的炉型改变,以及设备破损导致的不均匀传 学习和预测研究,期望在拓宽时间维度的基础上 热等多种内外因素使高炉炉况波动时有发生,给 获得工艺可接受的铁水温度预测准确度,为高炉 炼铁工序的增产降耗带来影响- 在线实际应用提供基础模型支撑 铁水温度是高炉炼铁的一项重要参数,不仅 可以反映当前铁水本身质量与高炉炉缸热状态, 1 理论与方法 且通过其变化趋势和幅度也能预判高炉运转方 1.1SVR算法 向.因此,若能通过当前时刻的各项治炼参数预测 回归预测模型的构建一般是基于训练样本集 一定时间后的铁水温度变化趋势与幅度,则可以 D={cm,ym)}而获得形如x)=wx+b模型中w和 提前采取应对凋控措施,减少炉况波动,稳定高炉 b等未知参量,传统回归模型通常是直接以预测 热制度,从而促进高炉稳定顺行与炼铁工序节能 值x)与测量值y之间的差别计算损失,并通过优 降耗B3- 化损失函数以降低误差,使x)与y之间的差别 基于此,国内外研究学者对铁水温度展开了 (损失)减小,损失函数(0如式(1)所示 多种构建机制条件下的机器学习与模型预测研 究,取得了一定进展.崔桂梅等分别采用模糊神经 J0=∑hex)-yw2 (1) 网络与分布式神经网络网构建铁水温度预测模 =1 型,使铁水温度预测误差在±10℃内的准确度达 其中,m为样本量,x为第i个训练样本特征值组 到90%.石琳等9基于样条变换的非线性偏最小 合,为为第i个训练样本测量值,hc)为第i个训 二乘回归方法,控制铁水温度预测值与测量值的 练样本特征值组合预测函数,0为选定的某个预测 相对误差小于0.1l.Zhang等lo以均方根误差和 函数标号 相关系数为标准,对比分析了3种深度学习算法 对于SVR算法,可允许x)与y之间存在e的 与7种浅层学习算法对高炉铁水温度的预测效 偏差,即仅当x)pε才计算损失.若训练样本是 果,认为浅层神经网络(SNN)对当前铁温预测精 线性可分的,则在样本空间中,可通过式(2)描述 度较高,且计算资源消耗较低,适合在线反馈.此 其划分出的超平面 外,Zhang等山还通过整合单一模式树构建集合 wx+b=0 (2) 模式树,并据此进一步将铁水温度预测均方根误 其中,w为法向量,b为位移项.若将x从低维空间 差降低至7.33.基于多元自适应回归样条(MARS) 算法和滚动时域估计(MHE),Diaz等和Hashi- 映射到高维空间的特征向量表示为(x),则高维 moto等]对铁水温度预测的平均绝对误差分别 空间划分的超平面模型如式(3)所示 为11.2℃和11.6℃.通过结合粒子群算法(APS0), f(x)=wD(x)+b (3) Su等和Zhao等分别以极限学习机(ELM)和 此时,样本空间任意点x到超平面(e,b)的距 最小二乘支持向量机(LS-SVM)作为基础算法预 离r与间隔宽度y分别如式(4)、(5)所示 测铁水温度,模型取得较好预测精度和泛化性能 r=mT)+以 (4) 基于数据驱动的预测模型还包括基于时间序 hell 列的自回归算法、贝叶斯网络算法等,其中以支持 28 =Iwill (5) 向量回归(Support vector regression,.简称SVR)为
prediction, results from support vector regression are better at an average absolute error of 4.33 °C and a hit rate of 94.0% (±10 °C). KEY WORDS big data;machine learning;support vector regression;extreme learning machine;hot metal temperature 2000 年以来,我国生铁产量快速增加,并于 2019 年全年产量达到 8.06 亿吨,约占当年世界生 铁产量的 63%. 能耗方面,我国钢铁行业能耗约占 工业总能耗的 16%,而炼铁工序又占钢铁全流程 能耗的 70% 左右. 在此背景下,高炉作为炼铁工序 的主反应器,其稳定顺行对我国钢铁工业的节能 降耗与高效生产尤为重要. 然而高炉原燃料波动 造成的炉型改变,以及设备破损导致的不均匀传 热等多种内外因素使高炉炉况波动时有发生,给 炼铁工序的增产降耗带来影响[1−2] . 铁水温度是高炉炼铁的一项重要参数,不仅 可以反映当前铁水本身质量与高炉炉缸热状态, 且通过其变化趋势和幅度也能预判高炉运转方 向. 因此,若能通过当前时刻的各项冶炼参数预测 一定时间后的铁水温度变化趋势与幅度,则可以 提前采取应对调控措施,减少炉况波动,稳定高炉 热制度,从而促进高炉稳定顺行与炼铁工序节能 降耗[3−6] . 基于此,国内外研究学者对铁水温度展开了 多种构建机制条件下的机器学习与模型预测研 究,取得了一定进展. 崔桂梅等分别采用模糊神经 网络[7] 与分布式神经网络[8] 构建铁水温度预测模 型,使铁水温度预测误差在±10 ℃ 内的准确度达 到 90%. 石琳等[9] 基于样条变换的非线性偏最小 二乘回归方法,控制铁水温度预测值与测量值的 相对误差小于 0.11. Zhang 等[10] 以均方根误差和 相关系数为标准,对比分析了 3 种深度学习算法 与 7 种浅层学习算法对高炉铁水温度的预测效 果,认为浅层神经网络(SNN)对当前铁温预测精 度较高,且计算资源消耗较低,适合在线反馈. 此 外 ,Zhang 等[11] 还通过整合单一模式树构建集合 模式树,并据此进一步将铁水温度预测均方根误 差降低至 7.33. 基于多元自适应回归样条(MARS) 算法和滚动时域估计(MHE) ,Diaz 等[12] 和 Hashimoto 等[13] 对铁水温度预测的平均绝对误差分别 为 11.2 ℃ 和 11.6 ℃. 通过结合粒子群算法(APSO), Su 等[14] 和 Zhao 等[15] 分别以极限学习机(ELM)和 最小二乘支持向量机(LS-SVM)作为基础算法预 测铁水温度,模型取得较好预测精度和泛化性能. 基于数据驱动的预测模型还包括基于时间序 列的自回归算法、贝叶斯网络算法等,其中以支持 向量回归(Support vector regression,简称 SVR)为 基础的模型在炼铁领域应用较为广泛[16−18] ,已成 功实现对铁水硅含量[19] 和高炉故障的预判[20] . 此 外 ,极限学习机 ( Extreme learning machine, 简 称 ELM)因隐藏神经元的参数无需调整,而获得快速 的训练速度和良好的工业适应度[21−23] . 因此,本研 究以支持向量回归和极限学习机算法为基础,在 日平均数据的时间维度下,对铁水温度进行模型 学习和预测研究,期望在拓宽时间维度的基础上 获得工艺可接受的铁水温度预测准确度,为高炉 在线实际应用提供基础模型支撑. 1 理论与方法 1.1 SVR 算法 回归预测模型的构建一般是基于训练样本集 D={(xm, ym)}而获得形 如 f(x)=w T x+b 模 型 中 w 和 b 等未知参量,传统回归模型通常是直接以预测 值 f(x) 与测量值 y 之间的差别计算损失,并通过优 化损失函数以降低误差,使 f(x) 与 y 之间的差别 (损失)减小,损失函数 J(θ) 如式(1)所示. J(θ)= 1 2 ∑m i=1 (hθ(xi)−yi) 2 (1) 其中,m 为样本量,xi 为第 i 个训练样本特征值组 合,yi 为第 i 个训练样本测量值,hθ (xi ) 为第 i 个训 练样本特征值组合预测函数,θ 为选定的某个预测 函数标号. 对于 SVR 算法,可允许 f(x) 与 y 之间存在ε的 偏差,即仅当|f(x)−y|>ε 才计算损失. 若训练样本是 线性可分的,则在样本空间中,可通过式(2)描述 其划分出的超平面. w T x+b = 0 (2) 其中,w 为法向量,b 为位移项. 若将 x 从低维空间 映射到高维空间的特征向量表示为 Φ(x),则高维 空间划分的超平面模型如式(3)所示. f(x) = w TΦ(x)+b (3) 此时,样本空间任意点 x 到超平面(w,b)的距 离 r 与间隔宽度 γ 分别如式(4)、(5)所示. r = |w TΦ(x)+b| ||w|| (4) γ = 2ε ||w|| (5) · 570 · 工程科学学报,第 43 卷,第 4 期
王振阳等:基于支持向量回归与极限学习机的高炉铁水温度预测 571. 以x)为中心,构建宽度为2ε的间隔带,若训 影响.本文依据冶金原理以及现场监测条件,选取 练样本落入此间隔带,则认为是预测正确.进一步 国内某4000m3级别高炉2014年至2019年时间范 地,将核函数引入SVR后如式(6)所示 围内22项特征参量的日平均数据构成初选数据 集,特征参量与实际数据样本分别如表1和图1所示 f(x)= (ai-ai).k(xi,x)+b (6) i=l 表1铁水温度预测的初选特征参量 式中: Table 1 Primary data items for hot metal temperature prediction b=yi+8- >(ai-ai)xIx Operating parameters State parameters (7) Blast volume Volume utilization coefficient 其中,kx,x)为核函数,拉格朗日乘子a:≥0、a,≥ Blast pressure Synthetic load 0,其中核函数的选择至关重要,通过优化选择适 Blast temperature Gas utilization efficiency 用的核函数(例如:径向基核函数、线性核函数、 Blast velocity energy Daily hot metal production 多项式核函数或Sigmoid核函数),从而最终确定 Coke rate Pressure difference 基于SVR的预测模型 Coal injection rate Permeability index 1.2ELM算法 Nut coke rate Bosh gas volume ELM是用于单层前馈神经网络的训练学习方 Fuel rate Bosh gas index 法,单层前馈网络拥有三层神经元,即输入层、隐 Oxygen enrichment Cooling water temperature difference 藏层和输出层.对于含有N个样本的数据集(: Pulverized coal injection per hour Current hot metal temperature ),其单层前馈神经网络数学模型如式(8)所示 Theoretical combustion temperature Hot metal Si content Bigi(xk)= Big(wi,bi,xk)=tk,k =1,2,....N 图1所示铁水温度的初选特征参量共计22 (8) 项.特征参量过多将增加模型计算复杂度,并大幅 其中,xx,x2,…,x】表示第k个样本的N维 提高计算时间,因此需要对主要特征参量进行提 特征,=,2,…,]表示对应的目标向量,B,是 取.本文依据冶金原理、Pearson相关系数以及 输出权重矩阵,用于连接第i个隐藏和输出节点, Spearman相关系数对初选特征参量进一步筛选, gw,bnx)为非线性分段连续函数,极限能力满 以减少后续模型训练与预测过程中的无效计算, 足ELM定理,w,和b,为随机确定的模型参数.因 降低模型的计算复杂度,以适应工业生产条件 而,式(8)可写成隐含输出矩阵形式,如式(9)、 Pearson与Spearman相关系数计算方法分别如式 (10)所示,其中,H为隐含层输出矩阵,B为输出权 (12)与(13)所示,式中,X为特征向量,Y为目标向 重矩阵,T为目标矩阵 量,Pxn和R分别为X与Y的Pearson和Spearman HB=T (9) 相关系数,cov(X)为X和Y的协方差,Var()与 Var()为X与Y的样本方差,N为样本数,RX)与 g(w1·x1+b1) … g(wN·r1+bR) H(W.B.X)= R(Y)分别为元素X和Y,在X和Y中的排序.经计 g(w1·xN+bI) …g(wNxN+b)JNxN 算,初选特征参量与铁水温度的相关系数计算结 (10) 果如图2所示 根据最小二乘法理论,结合奇异值分解方法, cov(X,Y) P(X.)= (12) ELM的解可表示为式(11) Var(X)Var(Y) B=(HH)HTT (11) N 6×[R(X)-R(Y2 2铁水温度预测模型 R=1- (13) N×(W2-1) 2.1特征参量提取与数据标准化 由图2可知,对铁水温度发展走向的影响因素 高炉生产过程中会产生两类参数,即人为调 较多,既包含影响高炉直接与间接还原度的炉腹 控的主动操作参数以及反馈炉况的被动状态参 煤气指数、煤气利用率等,也包含影响高炉物料与 数,均会对铁水温度的走向变化产生不同程度的 热量平衡的炉料结构、水温差等.具体来看,对后
以 f(x) 为中心,构建宽度为 2ε 的间隔带,若训 练样本落入此间隔带,则认为是预测正确. 进一步 地,将核函数[24] 引入 SVR 后如式(6)所示. f(x) = ∑m i=1 (ˆai −ai)· k(xi , x)+b (6) 式中: b = yi +ε− ∑m i=1 (ˆai −ai)x T i x (7) 其中,k(xi,x) 为核函数,拉格朗日乘子aˆi ⩾ 0、ai ≥ 0,其中核函数的选择至关重要,通过优化选择适 用的核函数(例如:径向基核函数、线性核函数、 多项式核函数或 Sigmoid 核函数),从而最终确定 基于 SVR 的预测模型. 1.2 ELM 算法 ELM 是用于单层前馈神经网络的训练学习方 法,单层前馈网络拥有三层神经元,即输入层、隐 藏层和输出层. 对于含有 N 个样本的数据集 (xk, tk ),其单层前馈神经网络数学模型如式(8)所示. ∑ N˜ i=1 βigi(xk) = ∑ N˜ i=1 βig(wi ,bi , xk) = tk, k = 1,2,··· ,N (8) , ··· , , ··· , 其中, xk=[xk1, xk2 xkn] 表示第 k 个样本的 N 维 特征,tk=[tk1,tk2 tkn] 表示对应的目标向量,βi 是 输出权重矩阵,用于连接第 i 个隐藏和输出节点, g(wi,bi,xk ) 为非线性分段连续函数,极限能力满 足 ELM 定理,wi 和 bi 为随机确定的模型参数. 因 而,式( 8)可写成隐含输出矩阵形式,如式( 9) 、 (10)所示,其中,H 为隐含层输出矩阵,β 为输出权 重矩阵,T 为目标矩阵. Hβ = T (9) H(W,B,X) = g(w1 · x1 +b1) ... g(wN˜ · x1 +bN˜ ) . . . . . . . . . g(w1 · xN +b1) ... g(wN˜ · xN +bN˜ ) N×N˜ (10) 根据最小二乘法理论,结合奇异值分解方法, ELM 的解可表示为式(11). βˆ = (H TH) −1H TT (11) 2 铁水温度预测模型 2.1 特征参量提取与数据标准化 高炉生产过程中会产生两类参数,即人为调 控的主动操作参数以及反馈炉况的被动状态参 数,均会对铁水温度的走向变化产生不同程度的 影响. 本文依据冶金原理以及现场监测条件,选取 国内某 4000 m 3 级别高炉 2014 年至 2019 年时间范 围内 22 项特征参量的日平均数据构成初选数据 集,特征参量与实际数据样本分别如表 1 和图 1 所示. 表 1 铁水温度预测的初选特征参量 Table 1 Primary data items for hot metal temperature prediction Operating parameters State parameters Blast volume Volume utilization coefficient Blast pressure Synthetic load Blast temperature Gas utilization efficiency Blast velocity energy Daily hot metal production Coke rate Pressure difference Coal injection rate Permeability index Nut coke rate Bosh gas volume Fuel rate Bosh gas index Oxygen enrichment Cooling water temperature difference Pulverized coal injection per hour Current hot metal temperature Theoretical combustion temperature Hot metal Si content 图 1 所示铁水温度的初选特征参量共计 22 项. 特征参量过多将增加模型计算复杂度,并大幅 提高计算时间,因此需要对主要特征参量进行提 取. 本文依据冶金原理、 Pearson 相关系数以及 Spearman 相关系数对初选特征参量进一步筛选, 以减少后续模型训练与预测过程中的无效计算, 降低模型的计算复杂度,以适应工业生产条件. Pearson 与 Spearman 相关系数计算方法分别如式 (12)与(13)所示,式中,X 为特征向量,Y 为目标向 量,ρ(X, Y) 和 Rs 分别为 X 与 Y 的 Pearson 和 Spearman 相关系数,cov(X,Y) 为 X 和 Y 的协方差,Var(X) 与 Var(Y) 为 X 与 Y 的样本方差,N 为样本数,R(Xi ) 与 R(Yi ) 分别为元素 Xi 和 Yi 在 X 和 Y 中的排序. 经计 算,初选特征参量与铁水温度的相关系数计算结 果如图 2 所示. ρ(X,Y)= cov(X,Y) √ Var(X) √ Var(Y) (12) Rs = 1− 6× ∑ N i=1 [R(Xi)−R(Yi)]2 N ×(N2 −1) (13) 由图 2 可知,对铁水温度发展走向的影响因素 较多,既包含影响高炉直接与间接还原度的炉腹 煤气指数、煤气利用率等,也包含影响高炉物料与 热量平衡的炉料结构、水温差等. 具体来看,对后 王振阳等: 基于支持向量回归与极限学习机的高炉铁水温度预测 · 571 ·
572 工程科学学报,第43卷,第4期 9000 1) (12) 6000 aunjoA uonezi jn (2) 4.0 (13) 0.3 2.5 1300 (3) (14) 1100 4) 12000 0000 (15) 6000 5000 (5 400 0.25 (16) 0.20 300 0.15 150 (6 20 100 50 10 80 2×10 40 uin]o 1×10 600 (19) 500 60 50 (9) M u00 (20) 2 60 (10) 1520 (21) 30 0 1440 2400 (11) 1.0 (22) 0.5 2100 0 0 200400 6008001000120014001600 0 2004006008001000120014001600 Sample number Sample number 图1铁水温度初选特征参量样本散点图 Fig.I Scatter plot of the primary characteristic parameters of hot metal temperature 续铁水温度存在显著正相关关系的特征参量主要 的影响.零-均值规范可以减小噪声点的影响,且 为当前铁水温度、煤气利用率、铁水硅含量、利用 不受特征参量最大值和最小值的限制,在当前数 系数、铁水日产量和综合负荷等,存在显著负相关 据标准化中使用较为广泛,其计算公式如式(14) 关系的特征参量为炉腹煤气指数、水温差、焦丁 所示,其中:为原始数据的均值,σ为原始数据的 比、燃料比、焦比和透气性等.通过预实验计算 标准差,‘为标准化处理后的样本值 并综合考量计算复杂度与预测精准度,最终选取 2=-) (14) 如表2所示特征参量进行模型拟合,其中1~4项 为操作参数,5~14项为状态参数,删除相关度较 2.2铁水温度模型预测与结果表征 低的冗余特征参量 铁水温度特征参量提取及数据标准化处理 本文使用零-均值规范法对数据进行标准化 后,形成的数据集将用于模型的训练与测试.数据 处理,以消除特征参量之间量纲和取值范围差异 集中随机抽取80%的数据用于支持向量回归与极
续铁水温度存在显著正相关关系的特征参量主要 为当前铁水温度、煤气利用率、铁水硅含量、利用 系数、铁水日产量和综合负荷等,存在显著负相关 关系的特征参量为炉腹煤气指数、水温差、焦丁 比、燃料比、焦比和透气性等. 通过预实验计算, 并综合考量计算复杂度与预测精准度,最终选取 如表 2 所示特征参量进行模型拟合,其中 1~4 项 为操作参数,5~14 项为状态参数,删除相关度较 低的冗余特征参量. 本文使用零–均值规范法对数据进行标准化 处理,以消除特征参量之间量纲和取值范围差异 z¯ 的影响. 零–均值规范可以减小噪声点的影响,且 不受特征参量最大值和最小值的限制,在当前数 据标准化中使用较为广泛,其计算公式如式(14) 所示,其中: 为原始数据的均值,σ 为原始数据的 标准差,z *为标准化处理后的样本值. z ∗ = (z−z¯) σ (14) 2.2 铁水温度模型预测与结果表征 铁水温度特征参量提取及数据标准化处理 后,形成的数据集将用于模型的训练与测试. 数据 集中随机抽取 80% 的数据用于支持向量回归与极 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) (21) (22) Blast volume/ (m3·min−1 ) Bosh gas volume/ (m3·min−1 ) Bosh gas index Cooling water temperature difference/ ℃ Current hot metal temperature/ ℃ Hot metal Si content/ % Blast pressure/ MPa Blast temperature/ ℃ Blast velocity energy/J Coke rate/ (kg·t−1 ) Coal injection rate/(kg·t−1 ) Nut coke rate/(kg·t−1 ) Pulverized coal injection/ (kg·h−1 ) Theoretical combustion temperature/ ℃ Fuel rate/ (kg·t−1 ) Oxygen enrichment/ % Sample number 0 200 400 600 800 1000 1200 1400 1600 Sample number 0 200 400 600 800 1000 1200 1400 1600 9000 6000 0.4 0.3 1300 1100 12000 6000 400 300 150 100 50 80 40 600 500 4 2 0 60 2400 2100 30 0 Volume utilization coefficient Synthetic load Gas utilization efficiency/ % Daily hot metal production/t Pressure difference/ MPa Permeability index 2 1 4.0 2.5 55 35 10000 5000 0.25 0.20 0.15 20 10 2×104 1×104 70 60 50 8 4 1520 1440 1.0 0.5 0 0 图 1 铁水温度初选特征参量样本散点图 Fig.1 Scatter plot of the primary characteristic parameters of hot metal temperature · 572 · 工程科学学报,第 43 卷,第 4 期