当前位置：和泉文库 > 电气与自动化 > 浏览文档

【机器感知与模式识别】改进Center-Net网络的自主喷涂机器人室内窗户检测

文件格式：PDF，文件大小：4.44MB，售价：3.12元

文档详细内容（约8页）

第16卷第3期智能系统学报 Vol.16 No.3 2021年5月 CAAI Transactions on Intelligent Systems May 2021 D0L:10.11992tis.202005016 改进Center-Net网络的自主喷涂机器人室内窗户检测洪恺临'，曹江涛'，姬晓飞2 (1.过宁石油化工大学信息与控制工程学院，辽宁抚顺113001；2.沈阳航空航天大学自动化学院，辽宁沈阳 110136) 摘要：室内自主喷涂机器人可以实现室内墙面喷涂的自动化以此提升喷涂的效率，诚少人力物力的投入。而基于计算机视觉的室内窗户检测算法则是该机器人的关键技术。对于室内窗户检测，由于环境光照、窗户形状和窗户透光属性的存在，传统方法无法得到较好的效果。针对此问题，设计一种基于深度学习的室内窗户检测算法。该算法主要对中心点网络(CenterNet))的特征提取网络进行修改，减少部分卷积操作，使用Ghost模块替换原始的卷积模块，降低特征冗余，并引入注意力机制，让网络尽可能表达重要信息。实验结果表明，改进的 CenterNet在不损失网络精度的前提下，大幅度提高了网络的运算速度，使得该检测算法即使在机器人端的嵌入式系统上也可以达到实时检测的效果。关键词：喷涂机器人；深度学习；目标检测；室内窗户检测；中心点网络；Gost模块；注意力机制：嵌入式设备中图分类号：TP391.1文献标志码：A文章编号：1673-4785(2021)03-0425-08 中文引用格式：洪恺临，曹江涛，姬晓飞.改进Center-Net网络的自主喷涂机器人室内窗户检测IJ.智能系统学报，2021， 16(3):425-432. 英文引用格式：HONG Kailin,CAO Jiangtao,JI Xiaofei..Indoor window detection of autonomous spraying robot based on im- proved CenterNet networkJ).CAAI transactions on intelligent systems,2021,16(3):425-432. Indoor window detection of autonomous spraying robot based on improved CenterNet network HONG Kailin',CAO Jiangtao',JI Xiaofei? (1.School of Information and Control Engineering,Liaoning Shihua University,Fushun 113001,China;2.School of Automation, Shenyang Aerospace University,Shenyang 110136,China) Abstract:An indoor autonomous spraying robot can realize the automation of indoor wall spraying to improve the effi- ciency of spraying and reduce the investment of manpower and material resources.The indoor window detection al- gorithm based on computer vision is the key technology of the robot.For indoor window detection,traditional methods cannot obtain good results owing to the actual scene's requirements for recognition speed and accuracy as well as the presence of lighting in the environment,shape of the window,and light transmission properties of the window.To solve this problem,an indoor window detection algorithm based on deep learning is designed.This algorithm mainly modifies the backbone feature extraction of the CenterNet network,reduces part of the convolution operation,replaces the origin- al convolution module with ghost block,reduces the redundancy feature,and introduces an attention mechanism to keep the network under a limited number of parameters that express important information as much as possible.The experi- mental results show that the improved CenterNet algorithm greatly improves the operation speed of the network without losing the accuracy of the network so that the network can achieve a real-time detection effect even on the embedded system of the robot. Keywords:spraying robot;deep learning;target detection;indoor window detection;Center-Net;Ghost block;atten- tion mechanism;embedded device 随着城镇化水平的不断提高，室内装修领域大部分的室内喷涂工作仍然是以人工喷涂为主，的自动化发展水平受到越来越多人的关注。目前喷涂的效率低且质量难以保证。现有的室内喷涂收稿日期：2020-05-12. 机器人虽然可以进行简单的墙面喷涂，但是都缺基金项目：国家自然科学基金项目(61673199)：辽宁省科技公少环境中不可喷涂区域的识别，如果希望喷涂机益研究基金项目(2016002006). 通信作者：姬晓飞.E-mail:jixiaofei7804@126.com 器人真正地做到自主喷涂，那么对于窗户的检测

DOI: 10.11992/tis.202005016 改进 Center-Net 网络的自主喷涂机器人室内窗户检测洪恺临1 ，曹江涛1 ，姬晓飞2 （1. 辽宁石油化工大学信息与控制工程学院，辽宁抚顺 113001; 2. 沈阳航空航天大学自动化学院，辽宁沈阳 110136）摘要：室内自主喷涂机器人可以实现室内墙面喷涂的自动化以此提升喷涂的效率，减少人力物力的投入。而基于计算机视觉的室内窗户检测算法则是该机器人的关键技术。对于室内窗户检测，由于环境光照、窗户形状和窗户透光属性的存在，传统方法无法得到较好的效果。针对此问题，设计一种基于深度学习的室内窗户检测算法。该算法主要对中心点网络 (CenterNet) 的特征提取网络进行修改，减少部分卷积操作，使用 Ghost 模块替换原始的卷积模块，降低特征冗余，并引入注意力机制，让网络尽可能表达重要信息。实验结果表明，改进的 CenterNet 在不损失网络精度的前提下，大幅度提高了网络的运算速度，使得该检测算法即使在机器人端的嵌入式系统上也可以达到实时检测的效果。关键词：喷涂机器人；深度学习；目标检测；室内窗户检测；中心点网络；Ghost 模块；注意力机制；嵌入式设备中图分类号：TP391.1 文献标志码：A 文章编号：1673−4785(2021)03−0425−08 中文引用格式：洪恺临, 曹江涛, 姬晓飞. 改进 Center-Net 网络的自主喷涂机器人室内窗户检测 [J]. 智能系统学报, 2021, 16(3): 425–432. 英文引用格式：HONG Kailin, CAO Jiangtao, JI Xiaofei. Indoor window detection of autonomous spraying robot based on improved CenterNet network[J]. CAAI transactions on intelligent systems, 2021, 16(3): 425–432. Indoor window detection of autonomous spraying robot based on improved CenterNet network HONG Kailin1 ，CAO Jiangtao1 ，JI Xiaofei2 (1. School of Information and Control Engineering, Liaoning Shihua University, Fushun 113001, China; 2. School of Automation, Shenyang Aerospace University, Shenyang 110136, China) Abstract: An indoor autonomous spraying robot can realize the automation of indoor wall spraying to improve the efficiency of spraying and reduce the investment of manpower and material resources. The indoor window detection algorithm based on computer vision is the key technology of the robot. For indoor window detection, traditional methods cannot obtain good results owing to the actual scene’s requirements for recognition speed and accuracy as well as the presence of lighting in the environment, shape of the window, and light transmission properties of the window. To solve this problem, an indoor window detection algorithm based on deep learning is designed. This algorithm mainly modifies the backbone feature extraction of the CenterNet network, reduces part of the convolution operation, replaces the original convolution module with ghost block, reduces the redundancy feature, and introduces an attention mechanism to keep the network under a limited number of parameters that express important information as much as possible. The experimental results show that the improved CenterNet algorithm greatly improves the operation speed of the network without losing the accuracy of the network so that the network can achieve a real-time detection effect even on the embedded system of the robot. Keywords: spraying robot; deep learning; target detection; indoor window detection; Center-Net; Ghost block; attention mechanism; embedded device 随着城镇化水平的不断提高，室内装修领域的自动化发展水平受到越来越多人的关注。目前大部分的室内喷涂工作仍然是以人工喷涂为主，喷涂的效率低且质量难以保证。现有的室内喷涂机器人虽然可以进行简单的墙面喷涂，但是都缺少环境中不可喷涂区域的识别，如果希望喷涂机器人真正地做到自主喷涂，那么对于窗户的检测收稿日期：2020−05−12. 基金项目：国家自然科学基金项目 (61673199)；辽宁省科技公益研究基金项目 (2016002006). 通信作者：姬晓飞. E-mail：jixiaofei7804@126.com. 第 16 卷第 3 期智能系统学报 Vol.16 No.3 2021 年 5 月 CAAI Transactions on Intelligent Systems May 2021

·426· 智能系统学报第16卷就是必不可少的。室内窗户的检测有如下几个难 maximum suppression,.NMS)的方式进行筛选得到点：)光照强度变化使得算法的准确性很容易受最终的检测框。但是对于室内窗户检测而言，机到影响：2)窗户透光属性的存在导致窗户外面的器人所采集到的图片中窗户的数量比较少，会导环境对窗户检测存在很大的干扰：3)喷涂过程中致大量的anchor被NMS去除掉，使得网络效率距离墙面很近时只能捕捉到窗户局部的影像。正不高。而无锚框(Anchor--free)类型的网络则通是因为上述问题的存在使得室内窗户检测变得更过在特征图中直接检测目标的关键点，并回归出加复杂。与此同时，在实际的机器人开发过程中，目标所在的位置，极大地提升了网络的效率。An 机器人的成本、功耗都要在考虑的范围内。因此 chor-free类型具有代表性的网络包括Corner- 应用于喷涂机器人上的窗户检测算法必须要保证 Net、CornerNet-.Lite、Center-Netl、FCOS(fully 所使用传感器和处理器的成本与功耗符合实际的 convolutional one-stage object detection)l等。其开发需求。因此开发一种实时高效的室内窗户检中，Center--Net算法在识别速度和准确性上均具有测算法对机器人的落地具有十分重要的意义。非常好的效果，但是由于其复杂特征提取网络的目前常用的窗户检测数据包括3D点云数据和存在，很难应用于机器人所搭载的嵌入式设备上。图像数据2，其中3D点云数据的获取需要搭载本文设计一种基于深度学习的室内窗户检测造价较为昂贵的双目相机或深度相机，考虑到图像算法，引入Anchor-.free类型的Center--Net网络作数据采集成本较低，因此基于图像数据的研究更为基础网络，并对其网络结构进行改进，在不损具有可行性。Ai等回使用多尺度小波对采集图像失精度的情况下提升其检测速度，减少网络的参进行表示，再将其输入到级联分类器中进行窗户检数量，使其适用于喷涂机器人窗户检测的特定应测：孔倩倩等通过对窗户进行轮廓分析筛选出符用。本文的创新点是简化Center-Net原始特征提合条件的轮廓，并利用最小生成树对所有矩形进行取网络的结构，在提升速度的同时也防止由于参合并以此确定窗户的位置：缪君等结合窗户的直数量过多而导致过拟合的问题；将普通的卷积操线特征、颜色特征和纹理特征使用分割技术提取作替换成更加高效的Ghost模块16，以此进一步完整的窗户。总体来说，目前的方法都是基于手工设提升网络推理速度；在编码结构的最后一层引入计的特征进行室内窗户检测，该种方式受环境的影注意力机制，通过添加压缩激励模块(squeeze and 响较大，无法在喷涂机器人上得到很好的应用。 excitation block,SE-block)m来保证网络在有限的而基于深度学习的方法因其适应性强，易于参数量下尽可能表达重要信息。实验结果表明，转换等特点已被应用到各个领域。针对目标检测该网络即使在嵌入式设备上也可以满足其准确性领域的深度学习方法无论是两阶段的Fast R- 和实时性的需求。 CNN(fast region-based convolutional neural 1 networks)51 Faster R-CNN(faster region-based con- Center-Net目标检测算法 volutional neural networks)SPP-Net(spatial pyram- Center-Net是Zhou等于2019年4月提出的 id pooling networks)m,还是单阶段的YOLO(you Anchor-free目标检测网络。算法框架如图I所 only look once)SSD(single shot multi-box detect- 示，将待检测目标中心视为关键点，然后再分别 or)9、Retina--Neto,都先预设大量不同尺度和横纵对目标的长宽以及中心点的偏移量进行回归以此比的锚框(anchor),再通过非极大值抑制(non- 完成目标检测任务。关链点预测层编码解码结构输出尺寸：类别数×128×128 Resnet-18 DLA-34 Hourglass-104 中心点偏差回层输出尺寸：2×128×128 输人尺寸：3x512×512 宽高回归层输出输出尺寸：256×128×128 金出尺可寸 2×128×128 图1 Center-Net算法框架 Fig.1 Center-Net algorithm framework

就是必不可少的。室内窗户的检测有如下几个难点：1) 光照强度变化使得算法的准确性很容易受到影响；2) 窗户透光属性的存在导致窗户外面的环境对窗户检测存在很大的干扰；3) 喷涂过程中距离墙面很近时只能捕捉到窗户局部的影像。正是因为上述问题的存在使得室内窗户检测变得更加复杂。与此同时，在实际的机器人开发过程中，机器人的成本、功耗都要在考虑的范围内。因此应用于喷涂机器人上的窗户检测算法必须要保证所使用传感器和处理器的成本与功耗符合实际的开发需求。因此开发一种实时高效的室内窗户检测算法对机器人的落地具有十分重要的意义。目前常用的窗户检测数据包括 3D 点云数据[1] 和图像数据[2-4] ，其中 3D 点云数据的获取需要搭载造价较为昂贵的双目相机或深度相机，考虑到图像数据采集成本较低，因此基于图像数据的研究更具有可行性。Ali 等 [2] 使用多尺度小波对采集图像进行表示，再将其输入到级联分类器中进行窗户检测；孔倩倩等[3] 通过对窗户进行轮廓分析筛选出符合条件的轮廓，并利用最小生成树对所有矩形进行合并以此确定窗户的位置；缪君等[4] 结合窗户的直线特征、颜色特征和纹理特征使用分割技术提取完整的窗户。总体来说，目前的方法都是基于手工设计的特征进行室内窗户检测，该种方式受环境的影响较大，无法在喷涂机器人上得到很好的应用。而基于深度学习的方法因其适应性强，易于转换等特点已被应用到各个领域。针对目标检测领域的深度学习方法无论是两阶段的 Fast RCNN(fast region-based convolutional neural networks)[5] 、Faster R-CNN(faster region-based convolutional neural networks)[6] 、SPP-Net(spatial pyramid pooling networks)[7] ，还是单阶段的 YOLO(you only look once)[8] 、SSD(single shot multi-box detector)[9] 、Retina-Net[10] ，都先预设大量不同尺度和横纵比的锚框 (anchor)，再通过非极大值抑制 (nonmaximum suppression, NMS) 的方式进行筛选得到最终的检测框。但是对于室内窗户检测而言，机器人所采集到的图片中窗户的数量比较少，会导致大量的 anchor 被 NMS 去除掉，使得网络效率不高。而无锚框 (Anchor-free)[11] 类型的网络则通过在特征图中直接检测目标的关键点，并回归出目标所在的位置，极大地提升了网络的效率。Anchor-free 类型具有代表性的网络包括 CornerNet[12] 、CornerNet-Lite[13] 、Center-Net[14] 、FCOS(fully convolutional one-stage object detection)[15] 等。其中，Center-Net 算法在识别速度和准确性上均具有非常好的效果，但是由于其复杂特征提取网络的存在，很难应用于机器人所搭载的嵌入式设备上。本文设计一种基于深度学习的室内窗户检测算法，引入 Anchor-free 类型的 Center-Net 网络作为基础网络，并对其网络结构进行改进，在不损失精度的情况下提升其检测速度，减少网络的参数量，使其适用于喷涂机器人窗户检测的特定应用。本文的创新点是简化 Center-Net 原始特征提取网络的结构，在提升速度的同时也防止由于参数量过多而导致过拟合的问题；将普通的卷积操作替换成更加高效的 Ghost 模块[16] ，以此进一步提升网络推理速度；在编码结构的最后一层引入注意力机制，通过添加压缩激励模块 (squeeze and excitation block, SE-block)[17] 来保证网络在有限的参数量下尽可能表达重要信息。实验结果表明，该网络即使在嵌入式设备上也可以满足其准确性和实时性的需求。 1 Center-Net 目标检测算法 Center-Net 是 Zhou 等于 2019 年 4 月提出的 Anchor-free 目标检测网络。算法框架如图 1 所示，将待检测目标中心视为关键点，然后再分别对目标的长宽以及中心点的偏移量进行回归以此完成目标检测任务。 ... 编码解码结构关键点预测层中心点偏差回归层宽高回归层输入输出 Resnet-18 DLA-34 Hourglass-104 输入尺寸: 3×512×512 输出尺寸: 256×128×128 输出尺寸: 类别数×128×128 输出尺寸: 2×128×128 输出尺寸: 2×128×128 图 1 Center-Net 算法框架 Fig. 1 Center-Net algorithm framework ·426· 智能系统学报第 16 卷

第3期洪恺临，等：改进Center-.Net网络的自主喷涂机器人室内窗户检测 ·427· l.1 Center-Net特征提取网络所示，图中绿色箭头对应DA,红色方框对应HDA。原始的Center--Net分别使用Resnet-l8(resid- HDA的作用是将数据的浅层与深层表达进行更 ual networks-18)DLA-34(deep layer aggregation- 好地融合，这种融合方式比简单的残差网络(R©s- 34)和Hourglass-104编码，解码(encoder--decoder) Net)和稠密网络(DenseNet)P更好。而IDA的作结构作为特征提取网络，实验结果表明，DLA-34 用则是通过不断迭代将浅层特征重新定义从而完网络在速度和准确性上得到了很好的平衡。因此善最终输出的特征。网络的编码阶段就是将本文窗户检测算法也是在DLA-34网络基础上进 IDA与HDA相结合。解码部分则是对相邻的行的改进。 HDA结构的输出进行合并，在合并的过程中将小 DLA是Yu等20于2019年提出的一种特征分辨率的特征使用逆卷积(deconv)2四操作进行上聚合的方式，分为迭代深层聚合(iterative deep ag- 采样并将得到的结果与相邻HDA的输出进行可 gregation,IDA)和层次深度聚合(hierarchical deep 形变卷积(deformconv)2),最后再相加，以该种方 aggregation,.HDA)。Center-Net特征提取网络还对式迭代生成树状结构，最终得到256×128×128 原始DLA-34进行了一些改进，网络框架如图2 的输出。下采样解码部分上采样输出尺寸迭代深层聚合 ■ 256×128×128 可形变卷积聚合节点 ☐卷积模块 ■层次深度聚合输出尺寸 3×512×512 输出尺寸 db石b 输出尺寸 64×128×128 输出尺寸输出尺寸 128×64×64编码部分 512×16×16 256×32×2 一一一一一图2 Center-Net中的DLA-34算法框架 Fig.2 DLA-34 algorithm framework in Center-Net l.2 Center-Net检测框回归网络了4次下采样，所以特征图重新映射到原始图像将特征提取网络的结果分别送入3个网络分上的时候会带来精度损失，因此对于每一个中心支中，分别是关键点预测层、中心点偏移量回归点，都额外用一个偏移量去补偿它。这两个层的层以及检测框宽高回归层。损失函数都使用L,损失函数：其中关键点预测层的输出为80×128×128， 128对应输出特征的长宽，而80则对应COC0数 u=R∑o,-(层-p 据集的80类目标。首先将关键点通过高斯核分布到128×l28分辨率的热图(heatmap)上，再将热图与网络的输出逐点计算损失函数。该损失函数式中：R对应下采样的次数；O是网络预测的偏为了解决正负样本不平衡的问题，使用了Focal 移量；币是对实际框下采样之后进行取整。目标 Loss损失函数o的思想，其公式为框长宽的回归也类似，其中S为回归后的尺寸， (1-)°1g(位，立c=1 54为原图尺寸。 N之1-yy(9n)g(1-) 其他 e 在网络的测试阶段，将测试图片送入到网络式中：N是图像中待检测目标的数量；a和B是得到3个分支的输出之后，由于该网络没有使用 Focal Loss的超参数；Yc是真实框映射到heatmap anchor所以在进行多余检测框别除的时候不使用之后的各点像素值；P是网络输出结果的像素值。 NMS,而是使用一个3×3的最大池化操作(max- 目标框长宽和目标框的中心点坐标偏移量估 poo),以此抑制关键点预测输出中极大值的8邻计层的输出都是2×128×128。中心点坐标偏移量域，起到去掉多余框的作用。最后将得到的输出估计层存在的意义是由于该网络中对图像进行进行解码得到检测框

1.1 Center-Net 特征提取网络原始的 Center-Net 分别使用 Resnet-18(residual networks-18)[18] 、DLA-34(deep layer aggregation- 34) 和 Hourglass-104[19] 编码解码 (encoder-decoder) 结构作为特征提取网络，实验结果表明，DLA-34 网络在速度和准确性上得到了很好的平衡。因此本文窗户检测算法也是在 DLA-34 网络基础上进行的改进。 DLA 是 Yu 等 [20] 于 2019 年提出的一种特征聚合的方式，分为迭代深层聚合 (iterative deep aggregation, IDA) 和层次深度聚合 (hierarchical deep aggregation，HDA)。Center-Net 特征提取网络还对原始 DLA-34 进行了一些改进，网络框架如图 2 所示，图中绿色箭头对应 IDA，红色方框对应 HDA。 HDA 的作用是将数据的浅层与深层表达进行更好地融合，这种融合方式比简单的残差网络 (ResNet) 和稠密网络 (DenseNet)[21] 更好。而 IDA 的作用则是通过不断迭代将浅层特征重新定义从而完善最终输出的特征。网络的编码阶段就是将 IDA 与 HDA 相结合。解码部分则是对相邻的 HDA 结构的输出进行合并，在合并的过程中将小分辨率的特征使用逆卷积 (deconv)[22] 操作进行上采样并将得到的结果与相邻 HDA 的输出进行可形变卷积 (deformconv)[23] ，最后再相加，以该种方式迭代生成树状结构，最终得到 256×128×128 的输出。输出尺寸 64×128×128 输出尺寸 128×64×64 输出尺寸 256×32×2 输出尺寸 512×16×16 编码部分下采样聚合节点卷积模块层次深度聚合解码部分输出尺寸 3×512×512 输出尺寸 256×128×128 上采样迭代深层聚合可形变卷积图 2 Center-Net 中的 DLA-34 算法框架 Fig. 2 DLA-34 algorithm framework in Center-Net 1.2 Center-Net 检测框回归网络将特征提取网络的结果分别送入 3 个网络分支中，分别是关键点预测层、中心点偏移量回归层以及检测框宽高回归层。其中关键点预测层的输出为 80×128×128， 128 对应输出特征的长宽，而 80 则对应 COCO 数据集的 80 类目标。首先将关键点通过高斯核分布到 128×128 分辨率的热图 (heatmap) 上，再将热图与网络的输出逐点计算损失函数。该损失函数为了解决正负样本不平衡的问题，使用了 Focal Loss 损失函数[10] 的思想，其公式为 Lk = −1 N ∑ xyc    ( 1−Yˆ xyc)α lg( Yˆ xyc) , Yˆ xyc = 1 ( 1−Yxyc)β ( Yˆ xyc)α lg( 1−Yˆ xyc) , 其他 N α β Yxyc Yˆ xyc 式中：是图像中待检测目标的数量；和是 Focal Loss 的超参数；是真实框映射到 heatmap 之后的各点像素值；是网络输出结果的像素值。目标框长宽和目标框的中心点坐标偏移量估计层的输出都是 2×128×128。中心点坐标偏移量估计层存在的意义是由于该网络中对图像进行了 4 次下采样，所以特征图重新映射到原始图像上的时候会带来精度损失，因此对于每一个中心点，都额外用一个偏移量去补偿它。这两个层的损失函数都使用 L1 损失函数： Loff = 1 N ∑ p Oˆ p˜ − ( p R − p˜ ) Lsize = 1 N ∑N k=1 Sˆ pk − sk Oˆ P˜ p˜ Sˆ pk sk 式中：R 对应下采样的次数；是网络预测的偏移量；是对实际框下采样之后进行取整。目标框长宽的回归也类似，其中为回归后的尺寸，为原图尺寸。在网络的测试阶段，将测试图片送入到网络得到 3 个分支的输出之后，由于该网络没有使用 anchor 所以在进行多余检测框剔除的时候不使用 NMS，而是使用一个 3×3 的最大池化操作 (maxpool)，以此抑制关键点预测输出中极大值的 8 邻域，起到去掉多余框的作用。最后将得到的输出进行解码得到检测框。第 3 期洪恺临，等：改进 Center-Net 网络的自主喷涂机器人室内窗户检测 ·427·

·428· 智能系统学报第16卷 2改进的Center-.Net算法 Ghost模块；在编码阶段的最后一层添加SE模块。本文通过上述3种方式提升网络的速度与准 Center-Net网络虽然在MSCOCO、PASCAL 确性。 VOC等数据集上表现良好，但是被应用于喷涂 2.1网络结构的简化机器人上的目标检测算法在考虑其准确性的同时在COC0数据集中待检测物体一共有80个还需要考虑算法的实时性，所以网络的大小、参类别，并且各类目标的形态尺寸变化较大，但是数量以及网络的运行时间在算法的评估层面都需对于室内窗户检测这种单分类物体检测来说可以要被考虑。本文在原有Center-Net的基础上进行对网络进行一些简化，在提升速度的同时还可以优化改进，分别为：对特征提取网络结构进行简防止因存在大量冗余的特征而导致网络过拟合。化；将网络中的普通卷积模块替换为高性能的改进的特征提取网络如图3所示。。下采样上采样解码部分迭代深层聚合输出尺寸可形变卷积 1256×128×128 聚合节点 Ghost模块层次深度聚合 SE模块输人尺寸 3x512x5120十00也d oo 输出尺寸输出尺寸 64×128×128 输出尺时 256×32×32 128×64×64 图3改进的Center-Net特征提取网络框架 Fig.3 Improved Center-Net feature extraction network framework 对比图2与图3，可以看出特征提取网络改进征进行重新整合，再经过一个Ghost结构得到输的部分在于编码阶段减少了一个HDA模块，这出。其中，BN(batch normalization)为批归一化操种操作使得网络下采样输出的分辨率从原来的作，Relu(rectified linear unit)为激活函数。在图4 16×16变到32×32，该操作减少了编码解码所需要中，使用黑色小方框表示Gost模块。的时间。实验结果表明，网络的简化没有导致检输出测精度的过分下降。 ↑BN 2.2高效卷积模块的使用 Ghost结构 Ghot结构为了使网络的推理速度进一步提升，对普通 ↑BN Relu 的卷积模块也进行了优化。目前有很多高效的网深度可分离卷积络结构可以应用于移动设备，比如MobileNet!2 BN Relu ShuffleNet等。本文使用华为诺亚方舟实验室于输 Ghost结构 2020年由韩凯等o提出的Ghost结构来替换原始网络中所使用的普通卷积模块。Ghost结构见图4 输入左侧，其核心思想是先使用卷积核生成一部分特图4 Ghost模块结构征，之后使用生成的特征通过一些计算代价小的 Fig.4 Ghost block structure 线性变换来生成另外一部分特征，最终将这两部 2.3注意力机制的引入分特征叠加到一起得到最终的输出。上述操作尽可能地减少了网络的参数量和运 Ghost结构这种高效的卷积操作可以使网络行时间，为了让网络在有限参数量下尽可能表达的运行时间进一步缩短。通过Ghost结构搭建的重要信息，在网络编码结构的最后一层引入了注 Ghost模块如图4右侧所示，网络输入首先经过一意力机制，使用了压缩激励模块(SE-block)叨，如个Ghost结构，然后通过深度可分离卷积26]对特图5所示

2 改进的 Center-Net 算法 Center-Net 网络虽然在 MSCOCO、PASCAL VOC 等数据集上表现良好，但是被应用于喷涂机器人上的目标检测算法在考虑其准确性的同时还需要考虑算法的实时性，所以网络的大小、参数量以及网络的运行时间在算法的评估层面都需要被考虑。本文在原有 Center-Net 的基础上进行优化改进，分别为：对特征提取网络结构进行简化；将网络中的普通卷积模块替换为高性能的 Ghost 模块；在编码阶段的最后一层添加 SE 模块。本文通过上述 3 种方式提升网络的速度与准确性。 2.1 网络结构的简化在 COCO 数据集中待检测物体一共有 80 个类别，并且各类目标的形态尺寸变化较大，但是对于室内窗户检测这种单分类物体检测来说可以对网络进行一些简化，在提升速度的同时还可以防止因存在大量冗余的特征而导致网络过拟合。改进的特征提取网络如图 3 所示。输出尺寸 64×128×128 输出尺寸 128×64×64 输出尺寸 256×32×32 编码部分聚合节点层次深度聚合解码部分下采样上采样迭代深层聚合可形变卷积输入尺寸 3×512×512 输出尺寸 256×128×128 Ghost 模块 SE 模块图 3 改进的 Center-Net 特征提取网络框架 Fig. 3 Improved Center-Net feature extraction network framework 对比图 2 与图 3，可以看出特征提取网络改进的部分在于编码阶段减少了一个 HDA 模块，这种操作使得网络下采样输出的分辨率从原来的 16×16 变到 32×32，该操作减少了编码解码所需要的时间。实验结果表明，网络的简化没有导致检测精度的过分下降。 2.2 高效卷积模块的使用为了使网络的推理速度进一步提升，对普通的卷积模块也进行了优化。目前有很多高效的网络结构可以应用于移动设备，比如 MobileNet[24] 、 ShuffleNet[25] 等。本文使用华为诺亚方舟实验室于 2020 年由韩凯等[16] 提出的 Ghost 结构来替换原始网络中所使用的普通卷积模块。Ghost 结构见图 4 左侧，其核心思想是先使用卷积核生成一部分特征，之后使用生成的特征通过一些计算代价小的线性变换来生成另外一部分特征，最终将这两部分特征叠加到一起得到最终的输出。 Ghost 结构这种高效的卷积操作可以使网络的运行时间进一步缩短。通过 Ghost 结构搭建的 Ghost 模块如图 4 右侧所示，网络输入首先经过一个 Ghost 结构，然后通过深度可分离卷积[26] 对特征进行重新整合，再经过一个 Ghost 结构得到输出。其中，BN(batch normalization) 为批归一化操作，Relu (rectified linear unit) 为激活函数。在图 4 中，使用黑色小方框表示 Ghost 模块。深度可分离卷积 BN 输入输出一致卷积输入输出 BN Relu BN Relu Ghost 结构 Ghost 结构 Ghost 结构 Φ1 Φ2 Φk ... 图 4 Ghost 模块结构 Fig. 4 Ghost block structure 2.3 注意力机制的引入上述操作尽可能地减少了网络的参数量和运行时间，为了让网络在有限参数量下尽可能表达重要信息，在网络编码结构的最后一层引入了注意力机制，使用了压缩激励模块 (SE-block)[17] ，如图 5 所示。 ·428· 智能系统学报第 16 卷

第3期洪恺临，等：改进Center--Net网络的自主喷涂机器人室内窗户检测 ·429· F(W 图片，然后对其进行随机拼接，得到训练图，如图6所示。这样做大幅度地增广了数据，还使得训练集中存在大量的局部窗户图。因此本实验将测试集的图片分成2个部分，1000张是采集的完整窗户，1000张是采集的局部窗户。以此验证改进网络的窗户检测效果，以及拼接方式增强的数图5压缩激励模块结构 Fig.5 SE-block structure 据集是否更有利于网络学习局部窗户的特征。该结构主要包括3个操作，首先压缩操作是对所有通道的特征图做一个全局平均池化(glob al average pooling,GAP),得到cxl×1个特征。其多图中每个特征都具有全局的感受野，表征特征通道拼接上响应的全局分布。之后是激励操作，通过参数 W为每个特征通道生成权重，公式为 s=Fex(z,W)=(g(z,W))=(W26(Wiz)) 图6使用多图拼接得到的训练数据式中：6对应Sigmoid激活函数；o对应Relu激活 Fig.6 Training data obtained by multi-graph splicing 函数；z是上一层的输出。最后是权重调整操作， 3.3网络训练与测试公式为如表1所示，本实验在训练和测试阶段分别元e=Fce(ue,Se)=uc·S2 使用了2种不同的处理器。训练阶段使用图形工式中：W为上一个卷积层的输出；s为经过压缩激作站，加快网络的训练速度，节省实验时间。而励操作的输出。相乘的作用是对原始的特征进行在测试阶段，使用喷涂机器人上所搭载的移动端重标定，这样有助于网络更关注具有代表性的特处理器对网络的准确性和实时性进行验证，以此征。在图3中使用蓝色方框代表SE模块，从图3 检验算法是否符合要求。中可以看到，在网络完成3个HDA操作得到的聚合节点不直接送到解码网络中，而是经过SE模表1训练和测试过程实验平台对比 Table 1 Comparison of training and testing process exper- 块之后再进行解码。这种注意力机制的引入让网 imental platform 络更加集中于重要特征的学习，以此保证网络在实验平台训练过程测试过程数据量大幅度减小的情况下也能很好地完成检测 CPU Intel(R)i7-7700 ARM Cortex-A57 任务。 GPU NVIDIA GTX1080Ti NVIDIA Pascal 3实验测试与分析系统 Ubuntu16.04LTS Ubuntu16.04LTS 3.1数据集框架 Pytorch1.4.0 Pytorch1.4.0 本文所检测的日标还没有公开的数据集，所以训练阶段首先使用网络在COCO数据集上进文中使用的数据集是通过喷涂机器人所搭载的摄行训练，以此得到较为健壮的权重参数，然后将像头进行采集室内窗户影像，分辨率为640×480。网络在本次实验中的窗户数据集上进行迁移学使用labelimg软件进行手工标注。一共10000张图习。将图片的分辨率转换为512×512，然后送入像，其中8000张用作训练集，2000张用作测试集。网络训练200次，前100次冻结特征提取网络的 3.2图像预处理与增强权重，只训练3个网络分支，后100次将所有网络相较于大型开源数据集，本次实验所使用的层解冻，并且使用不同的学习率进行训练，以此数据集相对较小，所以需要通过图像预处理对图得到网络最终的权重值。像进行数据增强，除了常规对图像进行简单的位在测试阶段改变图像的分辨率，喷涂机器人移、缩放、颜色空间变换之外，本次实验还对室内上摄像头所采集的是640×480的分辨率，在训练喷涂场景进行了相应的分析，以此让数据集得到的时候将图像统一映射到512×512的分辨率，如更为有效的增强。由于喷涂机器人在喷涂过程中果测试阶段也沿用这种方式那么网络就会计算很具有距离墙面比较近的工作特性，更多时候需要多使用灰色填充的空缺位置，这无疑使得网络进识别的窗户是不完整的，所以本实验对于图像的行了很多没有价值的计算。所以在测试阶段，本预处理还加人了多图拼接，即每次随机选取4张文将图片映射成为512×384，由于网络中没有全

h c c w h w c×1×1 c×1×1 uc 全局平均池化 Fex(·,W) Fscale(·) xc ~ 图 5 压缩激励模块结构 Fig. 5 SE-block structure W 该结构主要包括 3 个操作，首先压缩操作是对所有通道的特征图做一个全局平均池化 (global average pooling, GAP)，得到 c×1×1 个特征。其中每个特征都具有全局的感受野，表征特征通道上响应的全局分布。之后是激励操作，通过参数为每个特征通道生成权重，公式为 s = Fex(z,W) = σ(g(z,W)) = σ(W2δ(W1z)) δ σ z 式中：对应 Sigmoid 激活函数；对应 Relu 激活函数；是上一层的输出。最后是权重调整操作，公式为 x˜c = Fscale(uc ,sc) = uc ·sc 式中：uc 为上一个卷积层的输出； sc 为经过压缩激励操作的输出。相乘的作用是对原始的特征进行重标定，这样有助于网络更关注具有代表性的特征。在图 3 中使用蓝色方框代表 SE 模块，从图 3 中可以看到，在网络完成 3 个 HDA 操作得到的聚合节点不直接送到解码网络中，而是经过 SE 模块之后再进行解码。这种注意力机制的引入让网络更加集中于重要特征的学习，以此保证网络在数据量大幅度减小的情况下也能很好地完成检测任务。 3 实验测试与分析 3.1 数据集本文所检测的目标还没有公开的数据集，所以文中使用的数据集是通过喷涂机器人所搭载的摄像头进行采集室内窗户影像，分辨率为 640×480。使用 labelimg 软件进行手工标注。一共 10000 张图像，其中 8 000 张用作训练集，2 000 张用作测试集。 3.2 图像预处理与增强相较于大型开源数据集，本次实验所使用的数据集相对较小，所以需要通过图像预处理对图像进行数据增强，除了常规对图像进行简单的位移、缩放、颜色空间变换之外，本次实验还对室内喷涂场景进行了相应的分析，以此让数据集得到更为有效的增强。由于喷涂机器人在喷涂过程中具有距离墙面比较近的工作特性，更多时候需要识别的窗户是不完整的，所以本实验对于图像的预处理还加入了多图拼接，即每次随机选取 4 张图片，然后对其进行随机拼接，得到训练图，如图 6 所示。这样做大幅度地增广了数据，还使得训练集中存在大量的局部窗户图。因此本实验将测试集的图片分成 2 个部分，1 000 张是采集的完整窗户，1 000 张是采集的局部窗户。以此验证改进网络的窗户检测效果，以及拼接方式增强的数据集是否更有利于网络学习局部窗户的特征。多图拼接图 6 使用多图拼接得到的训练数据 Fig. 6 Training data obtained by multi-graph splicing 3.3 网络训练与测试如表 1 所示，本实验在训练和测试阶段分别使用了 2 种不同的处理器。训练阶段使用图形工作站，加快网络的训练速度，节省实验时间。而在测试阶段，使用喷涂机器人上所搭载的移动端处理器对网络的准确性和实时性进行验证，以此检验算法是否符合要求。表 1 训练和测试过程实验平台对比 Table 1 Comparison of training and testing process experimental platform 实验平台训练过程测试过程 CPU Intel(R) i7-7700 ARM Cortex-A57 GPU NVIDIA GTX1080Ti NVIDIA Pascal 系统 Ubuntu16.04LTS Ubuntu16.04LTS 框架 Pytorch1.4.0 Pytorch1.4.0 训练阶段首先使用网络在 COCO 数据集上进行训练，以此得到较为健壮的权重参数，然后将网络在本次实验中的窗户数据集上进行迁移学习。将图片的分辨率转换为 512×512，然后送入网络训练 200 次，前 100 次冻结特征提取网络的权重，只训练 3 个网络分支，后 100 次将所有网络层解冻，并且使用不同的学习率进行训练，以此得到网络最终的权重值。在测试阶段改变图像的分辨率，喷涂机器人上摄像头所采集的是 640×480 的分辨率，在训练的时候将图像统一映射到 512×512 的分辨率，如果测试阶段也沿用这种方式那么网络就会计算很多使用灰色填充的空缺位置，这无疑使得网络进行了很多没有价值的计算。所以在测试阶段，本文将图片映射成为 512×384，由于网络中没有全第 3 期洪恺临，等：改进 Center-Net 网络的自主喷涂机器人室内窗户检测 ·429·

点击进入文档下载页（PDF格式）

共8页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录