《工程科学学报》录用稿,https://doi.org/10.13374/i,issn2095-9389.2021.01.04.004©北京科技大学2020 工程科学学报DO: 基于改进降噪自编码器半监督学习模型的热轧带 钢水梁印识别算法1 陈兆宇,荆丰伟”,李杰”,郭强)☒ 1)北京科技大学高效轧制国家工程研究中心,北京100083 ☒通信作者,E-mail:guoqiang@nercar.ustb.edu.cn 摘要水梁印是板坯加热的一种常见问题,造成钢板尺寸和板形缺陷。针对水梁印识别困难臾工作量大问题,本文 提出一种基于改进降噪自编码器半监督学习模型的热轧带钢水梁印识别算法。该算法在降噪编码器(Denoising Auto-encoder,,DAE)的基础上对编码层的每一层添加随机噪声,在隐藏层后添加分类层,对数据添加伪标签,在 解码的同时进行分类训练,使得DE具有半监督学习能力。通过提取热轧带钢粗托出口温度数据中的温差特征,用 相应特征对模型进行训练。实验结果表明,算法能够准确识别出带钢的水梁印,在模型精确度上,与主流分类识别 模型对比,本文提出的模型在带标签样本数量较小时,分类精度相比其他模型高5.0%-10.0%:在带标签样本数量 较大时,提出的模型分类精度达到93.8%,现场能够根据模型的识别结果提高生产效率。 关键词热轧带钢;降噪自编码器:半监督学习:水梁印:加热炉 分类号TP273.5 Recognition Algorithm of Hot Rolled Strip Steel Water Beam Mark Based On Semi-Supervised Learning Model of Improved Denoising Auto-encoder CHEN Zhao-yu,JING Feng-wei LNJlie,GUO Qiang 1)National Engineering Research Center for Advanced Rolling Technology;University of Science and Technology Beijing,100083,China Corresponding author,E-mail guoqia ercar.ustb.edu.cn ABSTRACT Water beam mark is a common problem in slab heating,which causes quality defects on strip steel.In hot strip rolling.the heating quality of slab has an important influence on rolling stability and the quality of finished strip.The water beam mark eaused by heating process and heating equipment is a common defect in slab heating process.The existence of slab water beam imprint has great influence on the control precision of rolling force and the thickness of finished strip.At present,it is difficult to recognize the water beam mark and the workload is heavy in industry.In order to solve these problems,proposed a recognition algorithm of hot rolled strip steel water beam mark based on semi-supervised learning model of improved Denoising Auto-encoder.On the basis of DAE,random noise was added to each layer of the coding layer, a classification layer was added after the hidden layer and fake labels are added to training data.Ensure that decoding and classification training are carried out at the same time.These methods made the model own the ability of semi-supervised.In 1收稿日期:2021-01-04 基金项目:国家自然科学基金资助项目(51674028)
工程科学学报 DOI: 基于改进降噪自编码器半监督学习模型的热轧带 钢水梁印识别算法1 陈兆宇 1),荆丰伟 1),李 杰 1),郭 强 1) 1)北京科技大学高效轧制国家工程研究中心,北京 100083 通信作者,E-mail: guoqiang@nercar.ustb.edu.cn 摘 要 水梁印是板坯加热的一种常见问题,造成钢板尺寸和板形缺陷。针对水梁印识别困难且工作量大问题,本文 提出一种基于改进降噪自编码器半监督学习模型的热轧带钢水梁印识别算法。该算法在降噪自编码器(Denoising Auto-encoder, DAE)的基础上对编码层的每一层添加随机噪声,在隐藏层后添加分类层,并对数据添加伪标签,在 解码的同时进行分类训练,使得 DAE 具有半监督学习能力。通过提取热轧带钢粗轧出口温度数据中的温差特征,用 相应特征对模型进行训练。实验结果表明,算法能够准确识别出带钢的水梁印,在模型精确度上,与主流分类识别 模型对比,本文提出的模型在带标签样本数量较小时,分类精度相比其他模型高 5.0 %-10.0 %;在带标签样本数量 较大时,提出的模型分类精度达到 93.8 %,现场能够根据模型的识别结果提高生产效率。 关键词 热轧带钢;降噪自编码器;半监督学习;水梁印;加热炉 分类号 TP273.5 Recognition Algorithm of Hot Rolled Strip Steel Water Beam Mark Based On Semi-Supervised Learning Model of Improved Denoising Auto-encoder CHEN Zhao-yu1) , JING Feng-wei1) , LI Jie1) , GUO Qiang 1) 1)National Engineering Research Center for Advanced Rolling Technology; University of Science and Technology Beijing, 100083, China Corresponding author, E-mail: guoqiang@nercar.ustb.edu.cn ABSTRACT Water beam mark is a common problem in slab heating, which causes quality defects on strip steel. In hot strip rolling, the heating quality of slab has an important influence on rolling stability and the quality of finished strip. The water beam mark caused by heating process and heating equipment is a common defect in slab heating process. The existence of slab water beam imprint has great influence on the control precision of rolling force and the thickness of finished strip. At present, it is difficult to recognize the water beam mark and the workload is heavy in industry. In order to solve these problems, proposed a recognition algorithm of hot rolled strip steel water beam mark based on semi-supervised learning model of improved Denoising Auto-encoder. On the basis of DAE, random noise was added to each layer of the coding layer, a classification layer was added after the hidden layer and fake labels are added to training data. Ensure that decoding and classification training are carried out at the same time. These methods made the model own the ability of semi-supervised. In 1收稿日期:2021-01-04 基金项目:国家自然科学基金资助项目(51674028) 《工程科学学报》录用稿,https://doi.org/10.13374/j.issn2095-9389.2021.01.04.004 ©北京科技大学 2020 录用稿件,非最终出版稿
this paper,by extracting the feature of temperature difference of strip temperature data at the outlet of roughing mill,this feature was used to train the model.The experimental results showed that the algorithm can accurately recognize the water beam mark of strip steel.And compared with other main stream classification models,the classification accuracy of proposed model is 5.0%-10.0 higher than other models when the number of tags proportions is small,and when the number of tags proportions is large,the accuracy of proposed model is up to 93.8%.According to the result,the production efficiency can be improved by this model KEY WORDS hot rolled strip;denoising auto-encoder,semi-supervised;water beam mark;furnace 近年来,随着带钢热连轧的不断发展,不同钢种、规格的带钢被投入到热连轧生产中。在带钢热 连轧中,板坯的加热质量对轧制稳定性、带钢成品质量有着重要影响,其中由于加热工艺与加热设 备等各方面问题所产生的水梁印是板坯加热过程常见缺陷。板坯水梁印的存在会对粗轧、精轧轧制力 的控制精度及带钢成品厚度等尺寸指标产生较大影响,因此各大钢铁厂对板述是夺存在水梁印的 快速准确识别工作愈加重视。 一般情况下,热连轧产线会配备2-3台步进式加热炉,在步进式如热处中,板坯的支撑和移动 通过炉内固定梁和移动梁的协同配合来完成。板坯在加热炉内的移动依靠加热炉底部可移动步进梁 做周期运动实现,通过顺序控制方式把板坯从装钢侧运到出钢侧、步进式加热炉板坯的运动方式如 图1-所示。移动梁运动形式有上升、前进、下降和后退,板坯在炉内根据移动梁的动作前进或者后 退以满足生产工艺需求山。 Slab Fixed Beam Slab Moving Beam Trajectory Moving Beam Moving Beam Fixed Beam (b) 图1步进式加热内部结构示意图:(a)加热炉左视图:(b)加热炉主视图 Fig.1 Internal structure diagram of walking beam furnace:(a)left view of heating furnace:(b)main view of heating furnace 板坯在加热炉内写固定梁上方垫块直接接触,垫块焊接在固定梁和活动梁内冷却水管上,而冷 却水管内不断通入循环水或汽水混合物进行冷却,导致垫块温度较低,同时在加热过程中固定梁本 身对板坯辐射传热具有遮蔽作用,这些原因导致板坯与垫块的接触处附近不能被很好地加热,加热 终了时在接触处及其附近的局部区域温度相对较低,颜色相对黯淡,形成水梁印。 水梁印在温度数据中显示为多个温度骤降的波谷,图2所示为存在水梁印的粗轧出口温度实测 值
this paper, by extracting the feature of temperature difference of strip temperature data at the outlet of roughing mill, this feature was used to train the model. The experimental results showed that the algorithm can accurately recognize the water beam mark of strip steel. And compared with other main stream classification models, the classification accuracy of proposed model is 5.0 % - 10.0 % higher than other models when the number of tags proportions is small, and when the number of tags proportions is large, the accuracy of proposed model is up to 93.8 %. According to the result, the production efficiency can be improved by this model. KEY WORDS hot rolled strip; denoising auto-encoder; semi-supervised; water beam mark; furnace 近年来,随着带钢热连轧的不断发展,不同钢种、规格的带钢被投入到热连轧生产中。在带钢热 连轧中,板坯的加热质量对轧制稳定性、带钢成品质量有着重要影响,其中由于加热工艺与加热设 备等各方面问题所产生的水梁印是板坯加热过程常见缺陷。板坯水梁印的存在会对粗轧、精轧轧制力 的控制精度及带钢成品厚度等尺寸指标产生较大影响,因此各大钢铁厂对于板坯是否存在水梁印的 快速准确识别工作愈加重视。 一般情况下,热连轧产线会配备 2-3 台步进式加热炉,在步进式加热炉中,板坯的支撑和移动 通过炉内固定梁和移动梁的协同配合来完成。板坯在加热炉内的移动依靠加热炉底部可移动步进梁 做周期运动实现,通过顺序控制方式把板坯从装钢侧运到出钢侧,步进式加热炉板坯的运动方式如 图 1-a 所示。移动梁运动形式有上升、前进、下降和后退,板坯在炉内根据移动梁的动作前进或者后 退以满足生产工艺需求[1]。 图 1 步进式加热炉内部结构示意图:(a)加热炉左视图;(b)加热炉主视图 Fig.1 Internal structure diagram of walking beam furnace:(a) left view of heating furnace; (b) main view of heating furnace 板坯在加热炉内与固定梁上方垫块直接接触,垫块焊接在固定梁和活动梁内冷却水管上,而冷 却水管内不断通入循环水或汽水混合物进行冷却,导致垫块温度较低,同时在加热过程中固定梁本 身对板坯辐射传热具有遮蔽作用,这些原因导致板坯与垫块的接触处附近不能被很好地加热,加热 终了时在接触处及其附近的局部区域温度相对较低,颜色相对黯淡,形成水梁印[2]。 水梁印在温度数据中显示为多个温度骤降的波谷,图 2 所示为存在水梁印的粗轧出口温度实测 值。 录用稿件,非最终出版稿
1060 1040 1020 1000 人 980 960 0 10 20 304050 60 Time/s 图2粗轧出口温度实测数据 Fig.2 Measured data of rough rolling delivery temperature 现代化带钢生产对板坯加热质量要求很高,板坯水梁印较重时, 短鲠高内骤降的温度会严重影 响了精轧入口温度采样,采样温度短时间内急剧波动30℃以上,进之发影响二级头部设定和自动 厚度控制系统(Automatic Gauge Control system,AGC)本体的控制精度, 造成很多产品缺陷和生 产故障。通过开发能够准确、快速、自动识别水梁印的算法,可为生产现场及时排除设备和生产故障 提供帮助,对提高轧制稳定性和产品质量具有重要意义 1水梁印识别算法现状 对于水梁印识别算法,学术界研究较少。在加热炉盈分,肖楠等根据步进式加热炉的过程机理 分析建立钢坯温度数学模型,主要针对水梁在高温段写低温段错开布置的水梁交错技术和添加水梁 垫块两个方法对水梁印的影响进行研究。根据建立的钢坯温度数学模型,对交错技术和不同种类垫 片在加热炉中的应用情况进行数学模拟,计算不同情况下的水梁印,证明卡式垫块对水梁印的改善 效果非常明显,并建议在水梁不交错的情况,采用交错垫块能大幅度降低水梁印,在水梁交错时不 采用垫块交错方式对改善水梁印有较好的效果):陈国锋等在传统钢坯温度数学模型基础上,进一 步研究了炉墙和喷嘴与钢坯之间的连离对水梁印计算的影响,根据钢坯到炉墙和喷嘴的距离计算得 到两个水梁印温度修正因子,衬钢坯温度模拟结果进行修正,提高了水梁印的识别精度仰;孙志斌 等根据水梁相关结构对钢坯温度数紫模拟进行进一步的细化,考虑到了垫块的锚固钉,垫块高度, 垫块底部气隙层厚度, 垫块中心洞等因素对水梁印的影响,进一步提高了水梁印识别精度。建 立数学模型的方法能在一定程度上对水梁印进行识别预测,但是由于采用的数学模型较为简单,对 加热炉的各种参数过杀依赖,对水梁印的识别精度有限。 在精轧部分,王强等通过收集精轧出口厚度数据或者精轧出口温度数据,将按时间分布的数据 转换为按带钢长度分布,对转换后的数据进行快速傅里叶变换,计算厚度或温度变动量的频率成分, 再根据加热炉水梁间距计算对应于该钢卷的水印可能存在的频率,当该频率附近一定范围内数据的 振幅超过指定的阈值时,即可判定水梁印的存在。计算水梁印振动频率的方法虽然同样能够检测 到水梁印的存在,但是由于加热炉到精轧的工序过多,带钢可能受到其他工序的影响,无法精确确 定水梁印的存在。 水梁印的识别工作主要有三个方面的问题。第一,从图2可得,水梁印特征变化较大,同一块 带钢中的水梁印特征都有较大差别,具体的识别工作大多需要依靠现场技术人员按照工作经验进行 主观判别,判别标准统一性差;第二,工业数据具有维数复杂、数据庞大的特点,需要采用人工离 线的方法在工业大数据中进行识别标定,其标定过程工作量巨大。第三,识别标准受到设备和工序 的影响较大,不同现场的识别标准往往存在较大差异
图 2 粗轧出口温度实测数据 Fig.2 Measured data of rough rolling delivery temperature 现代化带钢生产对板坯加热质量要求很高,板坯水梁印较重时,短距离内骤降的温度会严重影 响了精轧入口温度采样,采样温度短时间内急剧波动 30 ℃以上,进一步影响二级头部设定和自动 厚度控制系统(Automatic Gauge Control system,AGC)本体的控制精度,造成很多产品缺陷和生 产故障。通过开发能够准确、快速、自动识别水梁印的算法,可为生产现场及时排除设备和生产故障 提供帮助,对提高轧制稳定性和产品质量具有重要意义。 1 水梁印识别算法现状 对于水梁印识别算法,学术界研究较少。在加热炉部分,肖楠等根据步进式加热炉的过程机理 分析建立钢坯温度数学模型,主要针对水梁在高温段与低温段错开布置的水梁交错技术和添加水梁 垫块两个方法对水梁印的影响进行研究。根据建立的钢坯温度数学模型,对交错技术和不同种类垫 片在加热炉中的应用情况进行数学模拟,计算不同情况下的水梁印,证明卡式垫块对水梁印的改善 效果非常明显,并建议在水梁不交错的情况,采用交错垫块能大幅度降低水梁印,在水梁交错时不 采用垫块交错方式对改善水梁印有较好的效果[3];陈国锋等在传统钢坯温度数学模型基础上,进一 步研究了炉墙和喷嘴与钢坯之间的距离对水梁印计算的影响,根据钢坯到炉墙和喷嘴的距离计算得 到两个水梁印温度修正因子,对钢坯温度模拟结果进行修正,提高了水梁印的识别精度[4];孙志斌 等根据水梁相关结构对钢坯温度数学模拟进行进一步的细化,考虑到了垫块的锚固钉,垫块高度, 垫块底部气隙层厚度,垫块中心孔洞等因素对水梁印的影响,进一步提高了水梁印识别精度[5]。建 立数学模型的方法能在一定程度上对水梁印进行识别预测,但是由于采用的数学模型较为简单,对 加热炉的各种参数过于依赖,对水梁印的识别精度有限。 在精轧部分,王强等通过收集精轧出口厚度数据或者精轧出口温度数据,将按时间分布的数据 转换为按带钢长度分布,对转换后的数据进行快速傅里叶变换,计算厚度或温度变动量的频率成分 , 再根据加热炉水梁间距计算对应于该钢卷的水印可能存在的频率,当该频率附近一定范围内数据的 振幅超过指定的阈值时,即可判定水梁印的存在[6]。计算水梁印振动频率的方法虽然同样能够检测 到水梁印的存在,但是由于加热炉到精轧的工序过多,带钢可能受到其他工序的影响,无法精确确 定水梁印的存在。 水梁印的识别工作主要有三个方面的问题。第一,从图 2 可得,水梁印特征变化较大,同一块 带钢中的水梁印特征都有较大差别,具体的识别工作大多需要依靠现场技术人员按照工作经验进行 主观判别,判别标准统一性差;第二,工业数据具有维数复杂、数据庞大的特点,需要采用人工离 线的方法在工业大数据中进行识别标定,其标定过程工作量巨大。第三,识别标准受到设备和工序 的影响较大,不同现场的识别标准往往存在较大差异。 录用稿件,非最终出版稿
这三个问题中,标定工作量大是工程中最大的问题。传统算法需要大量的人工离线经验对具体 的算法进行识别指导,如果标定工作量不足,得到的识别算法准确率无法满足识别需求。 针对上述问题,在本研究中考虑神经网络相关模型。近些年来神经网络作为机器学习的重要分 支,因在数据处理方面呈现出显着的优势而飞速发展。它通过对模型进行训练,自动提取并不断优 化特征,可快速处理大量数据,拥有更好的性能和更高的精度,现在己有很多神经网络应用于热轧 的案例-山。但是目前的神经网络模型大多为有监督学习模型用于预测识别2),无监督模型6用于 特征提取,很少有专门处理含有少量标定样本的大量数据的半监督学习模型。 目前提出的半监督学习模型,如Ladder Network!)、类别生成对抗网络(Categorical Generative Adversarial Networks,.CAT-GAN)等,在图像识别领域有良好的表现,但是针对数据的半监督学 习却少有研究。 本研究提出一种基于改进降噪自编码器半监督学习模型(Imported Denoising Auto-encoder, Imported-D4E)的热轧带钢水梁印识别算法。通过半监督学习可以有效解决签数是少的问题,利 用少量标定样本和大量无标定样本同时对模型进行训练,使得模型在标签数量较④的情况下具备足 够的学习能力。 水梁印识别算法流程框图如图3所示,首先将采集到的水梁印相送数据进行数据预处理,数据 填充和数据滤波:然后进行特征提取,得到水梁印相关特征数据:进而对特征提取结果进行小样本 标定;之后将包含已标定小样本与大量无标定样本的数据同时对mported-DAE模型进行训练;最 后将训练好的模型作为识别模型进行水梁印识别。 Start Real-time data acquisition Data preprocessing Data filling Data filtering Feature extraction Sample calibration Trained model Model training Water beam mark recognition 录用 End 图3水梁印识别算法流程图 Fig.3 Flow chart of water beam seal recognition algorithm 2改进的降噪自编码器模型设计 2.1自编码器和降噪自编码器原理 自编码器(Auto-Encoder,,AE)是一种无监督模型,可以学习到输入数据的一种特征表示。该 模型的示意图如图4所示。具体来说,AE尝试着去学习一个恒等函数,这个函数包含两部分,编码 器和解码器,AE模型的目的是使得模型的输出值等于或者尽可能地接近于模型的输入值,即X输 入≈Y输出
这三个问题中,标定工作量大是工程中最大的问题。传统算法需要大量的人工离线经验对具体 的算法进行识别指导,如果标定工作量不足,得到的识别算法准确率无法满足识别需求。 针对上述问题,在本研究中考虑神经网络相关模型。近些年来神经网络作为机器学习的重要分 支,因在数据处理方面呈现出显着的优势而飞速发展。它通过对模型进行训练,自动提取并不断优 化特征,可快速处理大量数据,拥有更好的性能和更高的精度,现在已有很多神经网络应用于热轧 的案例[7-11]。但是目前的神经网络模型大多为有监督学习模型用于预测识别[12-15],无监督模型[16]用于 特征提取,很少有专门处理含有少量标定样本的大量数据的半监督学习模型。 目前提出的半监督学习模型,如 Ladder Network[17]、类别生成对抗网络(Categorical Generative Adversarial Networks, CAT-GAN[18])等,在图像识别领域有良好的表现,但是针对数据的半监督学 习却少有研究。 本研究提出一种基于改进降噪自编码器半监督学习模型( Imported Denoising Auto-encoder, Imported-DAE)的热轧带钢水梁印识别算法。通过半监督学习可以有效解决标签数量少的问题,利 用少量标定样本和大量无标定样本同时对模型进行训练,使得模型在标签数量较少的情况下具备足 够的学习能力。 水梁印识别算法流程框图如图 3 所示,首先将采集到的水梁印相关数据进行数据预处理,数据 填充和数据滤波;然后进行特征提取,得到水梁印相关特征数据;进而对特征提取结果进行小样本 标定;之后将包含已标定小样本与大量无标定样本的数据同时对 Imported-DAE 模型进行训练;最 后将训练好的模型作为识别模型进行水梁印识别。 图 3 水梁印识别算法流程图 Fig.3 Flow chart of water beam seal recognition algorithm 2 改进的降噪自编码器模型设计 2.1 自编码器和降噪自编码器原理 自编码器(Auto-Encoder, AE)[19]是一种无监督模型,可以学习到输入数据的一种特征表示。该 模型的示意图如图 4 所示。具体来说,AE 尝试着去学习一个恒等函数,这个函数包含两部分,编码 器和解码器,AE 模型的目的是使得模型的输出值等于或者尽可能地接近于模型的输入值,即 X 输 入 Y 输出。 录用稿件,非最终出版稿
在一个自编码器中,由于只有无标签数据,我们将输入信息输入一个编码器,就会得到一个底 层编码,之后再通过一个解码器,就会得到一个输出信息。通过不断的反向传播来最小化输入信息 和输出信息的误差对模型进行训练,使得输入和输出一样。由于中间层的底层编码能够通过解码器 无损的反编码出输入信息,所以底层编码是一个包含输入信息的所有特征信息且维数较小的输入信 息的另外一个表示,进而达到对输入信息特征提取的目的。 Input Output X2 H 及《以及局 图4自编码器模 AE的编码、解码过程可描述为: 编码过程: =(WX+b) (1) 解码过程: Y=a(W,H+b,) (2) 式中W,b为编码权重和偏置,W2,b为解码权重和偏置,O。为激活函数,目前比较常用 的有sigmoid、tanh、relu等,O,可以是与编码过程o。相同的激活函数,H是隐藏向量。AE的目 的就是要最小化X和Y之间的误差, 般采用均方误差来描述X和Y之间的距离,用每一次训练 的均方误差作为模型的损失函数 J=x(x,Y)=Σy-xE (3) m AE中的参数,即W, 通过对计算过程进行反向传播,最小化目标函数J来学习获得。 DAE20与AE有相同的网绍结构和学习目标,不同的是DAE在训练过程中主动为样本数据添 加随机噪声,如图5所示。 Input Output H Noise o- )
在一个自编码器中,由于只有无标签数据,我们将输入信息输入一个编码器,就会得到一个底 层编码,之后再通过一个解码器,就会得到一个输出信息。通过不断的反向传播来最小化 输入信息 和输出信息的误差对模型进行训练,使得输入和输出一样。由于中间层的底层编码能够通过解码器 无损的反编码出输入信息,所以底层编码是一个包含输入信息的所有特征信息且维数较小的输入信 息的另外一个表示,进而达到对输入信息特征提取的目的。 图 4 自编码器模型 Fig.4 AE model AE 的编码、解码过程可描述为: 编码过程: 1 1 ( ) H W X b e (1) 解码过程: 2 2 ( ) Y W H b d (2) 式中W1 , b1为编码权重和偏置,W2 ,b2 为解码权重和偏置, e 为激活函数,目前比较常用 的有sigmoid 、tanh 、relu 等, d 可以是与编码过程 e 相同的激活函数, H 是隐藏向量。AE 的目 的就是要最小化 X 和Y 之间的误差,一般采用均方误差来描述 X 和Y 之间的距离,用每一次训练 的均方误差作为模型的损失函数。 2 2 1 1 J L X Y Y X ( ( , )) m m (3) AE 中的参数,即W ,b ,通过对计算过程进行反向传播,最小化目标函数 J 来学习获得。 DAE[20]与 AE 有相同的网络结构和学习目标,不同的是 DAE 在训练过程中主动为样本数据添 加随机噪声,如图 5 所示。 录用稿件,非最终出版稿