工程科学学报.第42卷.第3期:348-357.2020年3月 Chinese Journal of Engineering,Vol.42,No.3:348-357,March 2020 https://doi.org/10.13374/j.issn2095-9389.2019.04.02.004;http://cje.ustb.edu.cn 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报 方法的开发 段海洋1,2),王旭东,2)四,姚曼2) 1)大连理工大学材料科学与工程学院.大连1160242)辽宁省凝固控制与数字化制备技术重点实验室.大连116024 ☒通信作者,E-mail:hler@dlut..edu.cn 摘要针对漏钢时结晶器铜板温度呈现出的“时间滞后”和“空间倒置”等典型特征,本文通过引入动态时间弯曲(DTW)和 机器学习中的密度聚类(DBSCAN)方法,提取、汇集并区分结晶器温度的典型变化模式,在此基础上开发出一种新型的漏钢 预报方法,借助动态时间弯曲度量不同拉速、钢种或工艺操作条件下结晶器热电偶温度的相似性,并运用密度聚类方法聚集 和分离正常工况、黏结漏钢状况下的温度样本,在此基础上检测和预报结晶器漏钢.结果证实,相较于传统的逻辑判断和人 工神经元网络预报结晶器漏钢的方法,基于聚类的漏钢预报方法无需人为设置阈值或参数,能够依据漏钢历史样本中温度变 化的共性规律,提取并融合热电偶温度在时间、空间上典型的变化特征,准确区分和预报结晶器漏钢,具有较好的自适应性 和鲁棒性 关键词连铸:结品器:漏钢预报:密度聚类:动态时间弯曲 分类号TG249.7 Development of prediction method for mold sticking breakout based on density-based spatial clustering of applications with noise and dynamic time warping DUAN Hai-yang2).WANG Xu-dong2,YAO Man2) 1)School of Materials Science and Engineering,Dalian University of Technology,Dalian 116024,China 2)Key Laboratory of Solidification Control and Digital Preparation Technology (Liaoning Province),Dalian 116024,China Corresponding author,E-mail:hler@dlut.edu.cn ABSTRACT As the core component of continuous casting machines,complex behaviors of fluid flow,heat transfer,mass transfer,and solidification occurring inside the mold are the key factors affecting the slabs quality.Breakout is one of the most catastrophic accidents in continuous casting process,which brings severe impacts on personal security,smooth producing,slab quality,and caster equipment. In particular,with the development of the high-speed casting technology,quality defects and sticking breakouts caused by high-load emerge frequently and missing or false alarms for online prediction of breakout occasionally occur.Thus,accurate identification and prediction for the mold breakout is a top priority for online processing control.Considering the typical temperature characteristics of "time lag"and"space inversion"during a breakout,this paper introduced the concepts of dynamic time warping(DTW)and density- based spatial clustering of applications with noise (DBSCAN)in machine learning.On the basis of collecting and distinguishing the typical change modes of mold temperature,an integrated novel method for predicting breakout was developed.The proposed method applied DTW to measure the similarity of mold thermocouple temperature under different casting speeds,steel grades,and other operating conditions,while DBSCAN was used to cluster and separate the temperature samples between normal casting status and 收稿日期:2019-04-02 基金项目:国家自然科学基金资助项目(51974056.51474047):中央高校基本科研业务费资助项目
基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报 方法的开发 段海洋1,2),王旭东1,2) 苣,姚 曼1,2) 1) 大连理工大学材料科学与工程学院,大连 116024 2) 辽宁省凝固控制与数字化制备技术重点实验室,大连 116024 苣通信作者,E-mail:hler@dlut.edu.cn 摘 要 针对漏钢时结晶器铜板温度呈现出的“时间滞后”和“空间倒置”等典型特征,本文通过引入动态时间弯曲 (DTW) 和 机器学习中的密度聚类 (DBSCAN) 方法,提取、汇集并区分结晶器温度的典型变化模式,在此基础上开发出一种新型的漏钢 预报方法. 借助动态时间弯曲度量不同拉速、钢种或工艺操作条件下结晶器热电偶温度的相似性,并运用密度聚类方法聚集 和分离正常工况、黏结漏钢状况下的温度样本,在此基础上检测和预报结晶器漏钢. 结果证实,相较于传统的逻辑判断和人 工神经元网络预报结晶器漏钢的方法,基于聚类的漏钢预报方法无需人为设置阈值或参数,能够依据漏钢历史样本中温度变 化的共性规律,提取并融合热电偶温度在时间、空间上典型的变化特征,准确区分和预报结晶器漏钢,具有较好的自适应性 和鲁棒性. 关键词 连铸;结晶器;漏钢预报;密度聚类;动态时间弯曲 分类号 TG249.7 Development of prediction method for mold sticking breakout based on density-based spatial clustering of applications with noise and dynamic time warping DUAN Hai-yang1,2) ,WANG Xu-dong1,2) 苣 ,YAO Man1,2) 1) School of Materials Science and Engineering, Dalian University of Technology, Dalian 116024, China 2) Key Laboratory of Solidification Control and Digital Preparation Technology (Liaoning Province), Dalian 116024, China 苣 Corresponding author, E-mail: hler@dlut.edu.cn ABSTRACT As the core component of continuous casting machines, complex behaviors of fluid flow, heat transfer, mass transfer, and solidification occurring inside the mold are the key factors affecting the slabs quality. Breakout is one of the most catastrophic accidents in continuous casting process, which brings severe impacts on personal security, smooth producing, slab quality, and caster equipment. In particular, with the development of the high-speed casting technology, quality defects and sticking breakouts caused by high-load emerge frequently and missing or false alarms for online prediction of breakout occasionally occur. Thus, accurate identification and prediction for the mold breakout is a top priority for online processing control. Considering the typical temperature characteristics of “time lag” and “space inversion” during a breakout, this paper introduced the concepts of dynamic time warping (DTW) and densitybased spatial clustering of applications with noise (DBSCAN) in machine learning. On the basis of collecting and distinguishing the typical change modes of mold temperature, an integrated novel method for predicting breakout was developed. The proposed method applied DTW to measure the similarity of mold thermocouple temperature under different casting speeds, steel grades, and other operating conditions, while DBSCAN was used to cluster and separate the temperature samples between normal casting status and 收稿日期: 2019−04−02 基金项目: 国家自然科学基金资助项目 (51974056,51474047);中央高校基本科研业务费资助项目 工程科学学报,第 42 卷,第 3 期:348−357,2020 年 3 月 Chinese Journal of Engineering, Vol. 42, No. 3: 348−357, March 2020 https://doi.org/10.13374/j.issn2095-9389.2019.04.02.004; http://cje.ustb.edu.cn
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 349· sticking breakout.On the basis of the above mentioned method,the results show that the mold sticking breakout can be effectively detected and predicted.Compared with the traditional method based on logical judgment and artificial neural network,the clustering- based breakout prediction method does not require manual setting of thresholds or parameters.According to the common rule of temperature variation in historical samples of breakout,the typical characteristics of temperature in time and space can be extracted and fused,and the breakout can be accurately distinguished and predicted,which shows good self-adaptability and robustness. KEY WORDS continuous casting:mold:breakout prediction:density-based spatial clustering of applications with noise;dynamic time warping 漏钢是连铸过程中的灾难性事故,不但会严 性.因此,将动态时间弯曲和密度聚类相结合能提 重干扰生产顺行和铸坯质量,而且严重损害结品 取和融合漏钢过程中结品器温度的特征,挖掘热 器、扇形段等连铸机设备,在造成巨大经济损失的 电偶温度变化的共性规律,识别和区分正常与漏 同时,带来重大安全隐患四因此,开发一种准确 钢工况下的温度波动,为机器学习在连铸过程中 而高效的结品器漏钢预报方法对于保障连铸顺行 的应用提供参考和借鉴 具有重要意义, 1黏结漏钢形成机理及温度特征 为了预防和避免漏钢,可利用结晶器与铸坯 之间的摩擦力对其进行预测四.但现有方法主要通 漏钢主要发生在结晶器弯月面附近),由于保 过在结晶器铜板上嵌入测温热电偶,根据热电偶 护渣润滑不良、结晶器液位波动、拉速较大等原 温度的变化来监测是否发生漏钢刂目前,基于 因,较薄的初生坯壳直接与结晶器铜板接触发生 温度测量的漏钢预报方法主要分为两类:逻辑判 黏结⑧叨,在结晶器的振动和冷却作用下,黏结坯 断和人工智能S逻辑判断法对铸机设备、浇铸 壳被反复拉断和愈合,直到黏结点离开结品器,较 工艺和物性参数十分敏感,当工艺调整和拉速提 薄坯壳无法支撑钢水静压力的作用而发生漏钢© 升时,阈值变动大,导致误报率和漏报率大幅上 图1(a)是结晶器铜板热电偶分布示意图.结 升,自适应性和鲁棒性较差:人工智能方法主要通 晶器由四块铜板组成,包括两块宽面铜板和两块 过神经网络、支持向量机等算法识别漏钢发生时 窄面铜板.其中,内、外弧宽面各安装57支热电 单偶和组偶的温度模式,该方法对学习和训练样 偶,左、右侧窄面各安装3支热电偶,四块铜板共 本的要求较高,样本不全或无效时都会严重影响 安装热电偶120支.图1(b)为漏钢时同列的三排 其预报效果,模型的迁移能力较低 热电偶温度变化示意图.正常工况下,结晶器铜板 鉴于漏钢模式温度之间相似度较高,而漏钢 热电偶温度随时间的变化较为平稳,不会出现较 与正常工况模式温度之间差异性较大,本文提出一 大波动.沿浇铸方向,坯壳厚度逐渐增加,铸坯向 种结合动态时间弯曲(DTW)和密度聚类(DBSCAN) 结晶器铜板传热的热阻增加,下排热电偶的温度 的新型漏钢预报方法.动态时间弯曲能够有效提 逐次下降.漏钢发生时,黏结点向下移动.当其经 取漏钢温度模式的相似性,在此基础上,密度聚类 过第一排热电偶时,从坯壳渗出的钢液将与结晶 可以将漏钢样本聚为同一类簇,同时过滤正常工 器铜板直接接触,相应位置的电偶温度会急刷上 况样本,从而最大化漏钢与正常工况温度的差异 升,待黏结点下行远离电偶后,其温度逐渐下降 2 eft side (a) de Loosed side (b) Right Fixed side 号 ● ● mg。。。。。。。。。。。。。。。。。 ●●●●●●●●●●●●●●●●●●● 景120nmm ● ●●●●●●●●●● 150mm lime/s 图1示意图.(a)结品器热电偶分布:(b)黏结漏钢热电偶温度变化 Fig.I Schematic diagram:(a)thermocouple distribution of mold;(b)thermocouple temperature variation of breakout
sticking breakout. On the basis of the above mentioned method, the results show that the mold sticking breakout can be effectively detected and predicted. Compared with the traditional method based on logical judgment and artificial neural network, the clusteringbased breakout prediction method does not require manual setting of thresholds or parameters. According to the common rule of temperature variation in historical samples of breakout, the typical characteristics of temperature in time and space can be extracted and fused, and the breakout can be accurately distinguished and predicted, which shows good self-adaptability and robustness. KEY WORDS continuous casting;mold; breakout prediction; density-based spatial clustering of applications with noise; dynamic time warping 漏钢是连铸过程中的灾难性事故,不但会严 重干扰生产顺行和铸坯质量,而且严重损害结晶 器、扇形段等连铸机设备,在造成巨大经济损失的 同时,带来重大安全隐患[1] . 因此,开发一种准确 而高效的结晶器漏钢预报方法对于保障连铸顺行 具有重要意义. 为了预防和避免漏钢,可利用结晶器与铸坯 之间的摩擦力对其进行预测[2] . 但现有方法主要通 过在结晶器铜板上嵌入测温热电偶,根据热电偶 温度的变化来监测是否发生漏钢[3–4] . 目前,基于 温度测量的漏钢预报方法主要分为两类:逻辑判 断和人工智能[5–6] . 逻辑判断法对铸机设备、浇铸 工艺和物性参数十分敏感,当工艺调整和拉速提 升时,阈值变动大,导致误报率和漏报率大幅上 升,自适应性和鲁棒性较差;人工智能方法主要通 过神经网络、支持向量机等算法识别漏钢发生时 单偶和组偶的温度模式,该方法对学习和训练样 本的要求较高,样本不全或无效时都会严重影响 其预报效果,模型的迁移能力较低. 鉴于漏钢模式温度之间相似度较高,而漏钢 与正常工况模式温度之间差异性较大,本文提出一 种结合动态时间弯曲(DTW)和密度聚类(DBSCAN) 的新型漏钢预报方法. 动态时间弯曲能够有效提 取漏钢温度模式的相似性,在此基础上,密度聚类 可以将漏钢样本聚为同一类簇,同时过滤正常工 况样本,从而最大化漏钢与正常工况温度的差异 性. 因此,将动态时间弯曲和密度聚类相结合能提 取和融合漏钢过程中结晶器温度的特征,挖掘热 电偶温度变化的共性规律,识别和区分正常与漏 钢工况下的温度波动,为机器学习在连铸过程中 的应用提供参考和借鉴. 1 黏结漏钢形成机理及温度特征 漏钢主要发生在结晶器弯月面附近[7] ,由于保 护渣润滑不良、结晶器液位波动、拉速较大等原 因,较薄的初生坯壳直接与结晶器铜板接触发生 黏结[8–9] . 在结晶器的振动和冷却作用下,黏结坯 壳被反复拉断和愈合,直到黏结点离开结晶器,较 薄坯壳无法支撑钢水静压力的作用而发生漏钢[10] . 图 1(a)是结晶器铜板热电偶分布示意图. 结 晶器由四块铜板组成,包括两块宽面铜板和两块 窄面铜板. 其中,内、外弧宽面各安装 57 支热电 偶,左、右侧窄面各安装 3 支热电偶,四块铜板共 安装热电偶 120 支. 图 1(b)为漏钢时同列的三排 热电偶温度变化示意图. 正常工况下,结晶器铜板 热电偶温度随时间的变化较为平稳,不会出现较 大波动. 沿浇铸方向,坯壳厚度逐渐增加,铸坯向 结晶器铜板传热的热阻增加,下排热电偶的温度 逐次下降. 漏钢发生时,黏结点向下移动,当其经 过第一排热电偶时,从坯壳渗出的钢液将与结晶 器铜板直接接触,相应位置的电偶温度会急剧上 升,待黏结点下行远离电偶后,其温度逐渐下降. 900 mm 120 mm 115 mm 150 mm Time/s (a) (b) Thermocouple Temperature/℃ Left side Loosed side Fixed side Right side 图 1 示意图. (a)结晶器热电偶分布;(b)黏结漏钢热电偶温度变化 Fig.1 Schematic diagram: (a) thermocouple distribution of mold; (b) thermocouple temperature variation of breakout 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 349 ·
350 工程科学学报,第42卷,第3期 随着黏结点继续下移,当其经过第二、三排热电偶 “时滞性”和“温度倒置”的特征与上述情况一致, 时,其电偶温度亦会先上升后下降.同列热电偶温 如图2(b)所示;误报(图2(c))时的温度模式各异, 度上升、下降及其峰值在时间上有明显的“时滞 如误报-1温度同时上升,误报-3和误报-4第二排 性”.部分情况下,也会出现下排热电偶温度高于 温度虽上升,但第一排温度均不具备漏钢特征,误 上排热电偶温度的情况,称之为“温度倒置”.“时 报-2和误报-5温度虽有上升和下降,但不具有 滞性”和“温度倒置“是漏钢的典型特征,也是漏钢 “时滞性”.由此可见,漏钢温度模式相似,而包括 预报方法捕捉和预报漏钢的重要依据山 正常和误报在内的正常工况温度模式却不尽相 图2为正常(N)、漏钢(B)和误报(F)(生产正 同,与漏钢模式差别较大 常而漏钢预报系统发出报警)模式下的温度曲线, 基于逻辑判断的漏钢预报方法需要设定温度 每种情况各展示5个例子.从图2(a)中可以看出, 上升幅值、温度上升速率、温度下降速率以及时 正常模式下温度几乎没有波动,不具备漏钢时典 滞参数等,从图2所示的漏钢温度可以看出,上述 型的“时滞性”和“温度倒置”特征;而漏钢 参数难以统一和准确设定,参数设置不合理将增 (图2(b))时的温度模式具有单一性和相似性,其 大误报率,严重时会引起漏报.基于神经网的漏 90FN-1 -o-The first row (a) B-1 -0-The first row (b) 110 F-1 -0-The first row (c) -o-The second row 100 -0-The second row 850000000000000000000000000 105 -0-The second row 9 100 96 95 000000000o000000000000000 15 94 90 700000000000000000000000000 92 85 65 90 00000000000000000600 80 000000000000000000000 N-2 -o-The first row B-2 -0-The first row F-2 -0-The first row 95 sccond row 144 0 -The second row 93 -o-The second row 136 0 90 87 128 84 120 00 81 80000000000000000000000000 112 78 N.3 -o-The first row 133 B-3 -o-The first row 126 F.3 -o-The first row pooooodoob8eod8%0 -0-The second row -oThe second row 88 ⊙126 119 108 99 105 o f0000000000000000000000000 98 91 000000000000000° 81 72 N-4 -o-The first row B-4 -o-The first row F-4 -o-The first row 100 -o-The second row 105 -o-The second row 110 -o-The second row 0000000000000000000000000 95 100 105 1o0000000000000000 90 95 100 95 0000000000000000000000000 90 00 3 90N-5 -oThe first row B-5 -0-The first row F-5 -o-The first row -The second ro 132 -0-The second row 105 0 The second row 0000o000o0000000g 00000o000000000a。 88 129 100 0000 126 T000000o00d 95 00000000000000000000g°000 123 % 120 000000000000000000o 85 Time/s Time/s Iime/s 图2 不同工况下的温度变化.(a)正常:(b)漏钢:(c)误报 Fig.2 Temperature comparison of different situations:(a)normal;(b)breakout;(c)false alarm
随着黏结点继续下移,当其经过第二、三排热电偶 时,其电偶温度亦会先上升后下降. 同列热电偶温 度上升、下降及其峰值在时间上有明显的“时滞 性”. 部分情况下,也会出现下排热电偶温度高于 上排热电偶温度的情况,称之为“温度倒置”. “时 滞性”和“温度倒置“是漏钢的典型特征,也是漏钢 预报方法捕捉和预报漏钢的重要依据[11] . 图 2 为正常(N)、漏钢(B)和误报(F)(生产正 常而漏钢预报系统发出报警)模式下的温度曲线, 每种情况各展示 5 个例子. 从图 2(a)中可以看出, 正常模式下温度几乎没有波动,不具备漏钢时典 型 的 “ 时 滞 性 ” 和 “ 温 度 倒 置 ” 特 征 ; 而 漏 钢 (图 2(b))时的温度模式具有单一性和相似性,其 “时滞性”和“温度倒置”的特征与上述情况一致, 如图 2(b)所示;误报(图 2(c))时的温度模式各异, 如误报−1 温度同时上升,误报−3 和误报−4 第二排 温度虽上升,但第一排温度均不具备漏钢特征,误 报−2 和误报−5 温度虽有上升和下降,但不具有 “时滞性”. 由此可见,漏钢温度模式相似,而包括 正常和误报在内的正常工况温度模式却不尽相 同,与漏钢模式差别较大. 基于逻辑判断的漏钢预报方法需要设定温度 上升幅值、温度上升速率、温度下降速率以及时 滞参数等,从图 2 所示的漏钢温度可以看出,上述 参数难以统一和准确设定,参数设置不合理将增 大误报率,严重时会引起漏报. 基于神经网络的漏 90 85 80 75 70 65 N-1 The first row (a) The second row 95 90 85 80 N-2 The first row The second row 96 88 80 72 64 N-3 The first row The second row Temperature/℃ 100 95 90 85 80 N-4 The first row The second row 90 88 86 84 N-5 Time/s The first row The second row 100 98 96 94 92 90 B-1 The first row (b) The second row 144 136 128 120 112 B-2 The first row The second row 133 126 119 112 105 98 91 B-3 The first row The second row Temperature/℃ 105 100 95 90 85 B-4 The first row The second row 132 135 129 126 123 120 B-5 Time/s The first row The second row 105 110 100 95 90 85 80 F-1 The first row (c) The second row 93 90 84 87 81 78 F-2 The first row The second row 126 117 108 99 90 81 72 F-3 The first row The second row Temperature/℃ 110 105 100 95 90 F-4 The first row The second row 105 100 95 90 85 F-5 Time/s The first row The second row 图 2 不同工况下的温度变化. (a)正常;(b)漏钢;(c)误报 Fig.2 Temperature comparison of different situations: (a) normal; (b) breakout; (c) false alarm · 350 · 工程科学学报,第 42 卷,第 3 期
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 351 钢预报方法首先需要积累大量完整的温度变化模 将漏钢样本和正常工况样本组成的样本集聚类为 式,而后从漏钢、正常工况的历史样本中训练网络 两个类簇,分别为漏钢类簇和正常工况类簇 参数,样本数量和质量都会对网络训练结果造成 3基于聚类和动态时间弯曲的漏钢预报方法 影响,此外,当出现了新的温度变化模式时,该方 法难以准确识别和判定,容易导致误报 3.1全时间序列的温度特征提取 为更好地度量温度数据的相似性,需对粗糙 2机器学习中的密度聚类方法 的原始温度数据进行处理,以提炼其共性特征.首 基于以上分析,依据黏结漏钢温度模式的共 先检查第一、二排温度在升温前的波动情况,当升 性特征,可借助机器学习方法对黏结漏钢温度样 温前的温度连续k秒内上下波动超过1℃时,则 本进行学习,以挖掘其温度特征的共性规律,为此 求取波动温度的平均值以替代升温前波动的温 需选择合适的机器学习方法.聚类作为机器学习 度;然后计算第一、二排电偶温度同一测点处的温 中的典型方法,广泛应用于挖掘具有相似特征的 度数据在k秒内的温度变化率及其差值;最后对 数据集.聚类是将数据样本聚集为多个类簇的过 作差后的结果作z-score均值标准化处理.此处 程.经过聚类分析后,在同一类簇中数据样本之间 k取5,计算公式如(1)~(3)所示: 的相似性较高,不同类簇中数据样本之间的相似 吃=I45- .i=1.2.….20 (1) 性较低即差别较大 5 黏结漏钢时温度彼此相似,与正常工况温度 vminus;,=v1i-2i,i=1,2,…,20 (2) 差异较大,并且正常工况下温度的变化模式彼此 (3) 千差万别,针对上述温度数据的特点,本文采用密 vminusi-av12...0 std 度聚类方法对不同模式的温度进行区分和识 式中:,、vminus,、vminusz分别表示温度的变化 别.密度聚类是聚类算法中的一个分支,利用参数 率、变化率差值及上述差值的z-score均值标准化 邻域半径(Eps)和邻域内最少样本数(MinPts)以及 结果,T,表示第i时刻的温度,2,分别表示第 样本之间的相似度或距离将簇聚集为密度相连的 一、二排温度对应的温度变化率,avg、std分别表 样本的最大集合.密度聚类借助参数邻域半径和 示温度变化率差值vminus的平均值、标准差 邻域内最少样本数所形成的样本捕获规则进行聚 式(1)~(3)可以有效提取“时滞”和“倒置”等 类.该规则可表示为:在邻域半径内包含的样本数 典型特征的温度数据,且能将不同拉速及工艺条 量不少于邻域内最少样本数设定值.在聚类时仅 件下相差较大的温度数据缩放至同一变化区间, 捕获数据集中彼此相似即距离较近的样本,如漏 便于相似性度量.图3~5分别为正常、误报和漏 钢样本,然后将捕获的样本聚集为簇:而对于诸如 钢工况下温度及其预处理后的曲线图.从图中可 模式差异较大的正常工况样本,由于其彼此之间 以看出,经过预处理后三种工况下的温度虽处在 距离较大,不满足捕获规则,算法将自动识别为噪 相同的数值区间,但特征明显不同.值得注意的 声样本,从而与漏钢样本分离.因此,密度聚类可 是,预处理不仅保留了漏钢温度的典型特征,还增 100 (a) -O-The first row 2 2.0(b) -◆-The second row 0000000000000000000000000 盖 96 0.5 -0.5 92 0000000000000000000000000 -1.0 90 -1.5 -2.0 88 10 20 25 10 30 Time/s Time/s 图3温度及其特征提取.()正常工况温度:(b)正常工况温度预处理结果 Fig.3 Temperature and features extraction:(a)temperature of normal status;(b)processing results of normal status
钢预报方法首先需要积累大量完整的温度变化模 式,而后从漏钢、正常工况的历史样本中训练网络 参数,样本数量和质量都会对网络训练结果造成 影响,此外,当出现了新的温度变化模式时,该方 法难以准确识别和判定,容易导致误报. 2 机器学习中的密度聚类方法 基于以上分析,依据黏结漏钢温度模式的共 性特征,可借助机器学习方法对黏结漏钢温度样 本进行学习,以挖掘其温度特征的共性规律,为此 需选择合适的机器学习方法. 聚类作为机器学习 中的典型方法,广泛应用于挖掘具有相似特征的 数据集. 聚类是将数据样本聚集为多个类簇的过 程. 经过聚类分析后,在同一类簇中数据样本之间 的相似性较高,不同类簇中数据样本之间的相似 性较低即差别较大. 黏结漏钢时温度彼此相似,与正常工况温度 差异较大,并且正常工况下温度的变化模式彼此 千差万别,针对上述温度数据的特点,本文采用密 度聚类[12] 方法对不同模式的温度进行区分和识 别. 密度聚类是聚类算法中的一个分支,利用参数 邻域半径(Eps)和邻域内最少样本数(MinPts)以及 样本之间的相似度或距离将簇聚集为密度相连的 样本的最大集合. 密度聚类借助参数邻域半径和 邻域内最少样本数所形成的样本捕获规则进行聚 类. 该规则可表示为:在邻域半径内包含的样本数 量不少于邻域内最少样本数设定值. 在聚类时仅 捕获数据集中彼此相似即距离较近的样本,如漏 钢样本,然后将捕获的样本聚集为簇;而对于诸如 模式差异较大的正常工况样本,由于其彼此之间 距离较大,不满足捕获规则,算法将自动识别为噪 声样本,从而与漏钢样本分离. 因此,密度聚类可 将漏钢样本和正常工况样本组成的样本集聚类为 两个类簇,分别为漏钢类簇和正常工况类簇. 3 基于聚类和动态时间弯曲的漏钢预报方法 3.1 全时间序列的温度特征提取 为更好地度量温度数据的相似性,需对粗糙 的原始温度数据进行处理,以提炼其共性特征. 首 先检查第一、二排温度在升温前的波动情况,当升 温前的温度连续 k 秒内上下波动超过 1 ℃ 时,则 求取波动温度的平均值以替代升温前波动的温 度;然后计算第一、二排电偶温度同一测点处的温 度数据在 k 秒内的温度变化率及其差值;最后对 作差后的结果作 z-score 均值标准化处理. 此处 k 取 5,计算公式如(1)~(3)所示: vi = Ti+5 −Ti 5 ,i = 1,2,··· ,20 (1) vminusi = v1i −v2i ,i = 1,2,··· ,20 (2) vminuszi = vminusi−avg std ,i = 1,2,··· ,20 (3) 式中: vi、vminusi、vminuszi 分别表示温度的变化 率、变化率差值及上述差值的 z-score 均值标准化 结果,Ti 表示第 i 时刻的温度,v1i、v2i 分别表示第 一、二排温度对应的温度变化率,avg、std 分别表 示温度变化率差值 vminus 的平均值、标准差. 式(1)~(3)可以有效提取“时滞”和“倒置”等 典型特征的温度数据,且能将不同拉速及工艺条 件下相差较大的温度数据缩放至同一变化区间, 便于相似性度量. 图 3~5 分别为正常、误报和漏 钢工况下温度及其预处理后的曲线图. 从图中可 以看出,经过预处理后三种工况下的温度虽处在 相同的数值区间,但特征明显不同. 值得注意的 是,预处理不仅保留了漏钢温度的典型特征,还增 98 100 96 94 92 (a) The first row The second row 90 88 0 5 10 15 Time/s 20 25 Temperature/℃ 1.5 −1.5 1.0 −1.0 0.5 −0.5 0 2.0 −2.0 (b) 0 5 10 15 Time/s 20 Z-Score of temerature change rate difference 图 3 温度及其特征提取. (a)正常工况温度;(b)正常工况温度预处理结果 Fig.3 Temperature and features extraction: (a) temperature of normal status; (b) processing results of normal status 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 351 ·
352 工程科学学报,第42卷,第3期 105(a) -O-The first row 1.0 (b) -◇-The second row ●●●●●●●、 ,00000000o00o0000000000000N 100 0.5 95 0 entpioc 90 兰0.5 0fo0000000000o06a00-0000-07 85 -1.0 -1.5 7 -2.0 0 5 1015 20 25 0 10 15 20 Time/s Time/s 图4温度及其特征提取.(a)误报温度:(b)误报温度预处理结果 Fig.4 Temperature and features extraction:(a)temperature of false alarm;(b)processing results of false alarm 125 1.5 (a) -O-The first row (b) ◇-The second row 120F 1.0 ●●● p00000 ●●、 00 0.5 115 00 ● 0/ ● 0.5 105 -1.0 oooooooooooo0oopoa- 100 -1.5 95 -2.0 0 5 10 15 20 25 10 15 20 Time/s Time/s 图5温度及其特征提取.()漏钢温度:(b)漏钢温度预处理结果 Fig.5 Temperature and features extraction:(a)temperature of breakout;(b)processing results of breakout 大了其与正常工况下温度特征的差异性 W表示匹配路径 上述三种类型的历史温度数据,分别选取 图6所示为三例温度样本的特征提取结果,即 20例正常、30例误报及30例漏钢样本作为训练 序列x、y、三,及其欧氏距离(Euclidean)和动态时间 样本 弯曲映射对比示意图,表1为x、y、:彼此之间的 3.2动态时间弯曲样本相似性度量 欧氏距离和动态时间弯曲距离计算结果.从表1 动态时间弯曲)对具有相似波形序列的距离 中可以看出,序列之间的动态时间弯曲距离普遍 或相似性度量具有良好的效果,广泛应用于数据 小于欧氏距离.尤其是波形相似而波峰不对应的 的相似性度量,如时间序列数据.时间序列存在平 序列,如x、八,其动态时间弯曲距离远小于欧氏距 移和伸缩等复杂变形,传统的欧氏距离对时间轴 离.由此表明,对于漏钢温度在不同拉速及工艺条 的变化非常敏感,轻微的变化就会导致欧氏距离 件下的温度极值不对应的情况,运用动态时间弯 发生很大的变动,动态时间弯曲有效克服了欧氏 曲可以有效度量其相似性,避免了因使用其他距 距离的局限46 离度量方式,如欧氏距离,所导致的漏钢温度相似 给定时间序列p、q,动态时间弯曲首先找到它 性差异较大的问题,进而为漏钢样本的聚类打下 们的最佳匹配来计算距离刀具体匹配公式如下: 良好的基础 3.3聚类参数邻域半径和邻域内最少样本数的选择 DTW(p,q)= arg min W=w1.w2.Wk..wK (P-9 k=1,wk=(i,) 参数邻域半径和邻域内最少样本数对密度聚 (4) 类的效果有巨大的影响,因此,选择合适的参数尤 式中:P、9分别表示序列p、q的第i、个元素, 为重要
大了其与正常工况下温度特征的差异性. 上述三种类型的历史温度数据 ,分别选 取 20 例正常、30 例误报及 30 例漏钢样本作为训练 样本. 3.2 动态时间弯曲样本相似性度量 动态时间弯曲[13] 对具有相似波形序列的距离 或相似性度量具有良好的效果,广泛应用于数据 的相似性度量,如时间序列数据. 时间序列存在平 移和伸缩等复杂变形,传统的欧氏距离对时间轴 的变化非常敏感,轻微的变化就会导致欧氏距离 发生很大的变动,动态时间弯曲有效克服了欧氏 距离的局限[14–16] . 给定时间序列 p、q,动态时间弯曲首先找到它 们的最佳匹配来计算距离[17] . 具体匹配公式如下: DTW(p,q) = argmin W=w1,w2,···wk ,···,wK vut ∑ K k=1,wk=(i, j) ( pi −qj )2 (4) 式中 : pi、 qj 分别表示序列 p、 q 的 第 i、 j 个元素 , W 表示匹配路径. 图 6 所示为三例温度样本的特征提取结果,即 序列 x、y、z,及其欧氏距离(Euclidean)和动态时间 弯曲映射对比示意图,表 1 为 x、y、z 彼此之间的 欧氏距离和动态时间弯曲距离计算结果. 从表 1 中可以看出,序列之间的动态时间弯曲距离普遍 小于欧氏距离. 尤其是波形相似而波峰不对应的 序列,如 x、y,其动态时间弯曲距离远小于欧氏距 离. 由此表明,对于漏钢温度在不同拉速及工艺条 件下的温度极值不对应的情况,运用动态时间弯 曲可以有效度量其相似性,避免了因使用其他距 离度量方式,如欧氏距离,所导致的漏钢温度相似 性差异较大的问题,进而为漏钢样本的聚类打下 良好的基础. 3.3 聚类参数邻域半径和邻域内最少样本数的选择 参数邻域半径和邻域内最少样本数对密度聚 类的效果有巨大的影响,因此,选择合适的参数尤 为重要. 95 105 100 90 85 (a) The first row The second row 80 75 0 5 10 15 Time/s 20 25 Temperature/℃ 0.5 −1.5 −1.0 −0.5 0 1.0 −2.0 (b) 0 5 10 15 Time/s 20 Z-Score of temerature change rate difference 图 4 温度及其特征提取. (a)误报温度;(b)误报温度预处理结果 Fig.4 Temperature and features extraction: (a) temperature of false alarm; (b) processing results of false alarm 125 100 105 110 115 120 (a) The first row The second row 95 0 5 10 15 Time/s 20 25 Temperature/℃ 1.5 −1.5 1.0 −1.0 0.5 −0.5 0 −2.0 (b) 0 5 10 15 Time/s 20 Z-Score of temerature change rate difference 图 5 温度及其特征提取. (a)漏钢温度;(b)漏钢温度预处理结果 Fig.5 Temperature and features extraction: (a) temperature of breakout; (b) processing results of breakout · 352 · 工程科学学报,第 42 卷,第 3 期