工程科学学报 Chinese Journal of Engineering 基于梯度压缩的Y0L0v4算法车型识别 牟亮赵红李燕仇俊政孙传龙刘晓童 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang.ZHAO Hong,LI Yan,QIU Jun-zheng.SUN Chuan-long,LIU Xiao-Tong 引用本文: 牟亮,赵红,李燕,仇俊政,孙传龙,刘晓童.基于梯度压缩的Y0L0v4算法车型识别[.工程科学学报,优先发表.doi: 10.13374j.issn2095-9389.2020.10.28.006 MU Liang,ZHAO Hong.LI Yan,QIU Jun-zheng,SUN Chuan-long.LIU Xiao-Tong.Vehicle recognition based on gradient compression and YOLO v4 algorithm[J].Chinese Journal of Engineering.In press.doi:10.13374/j.issn2095-9389.2020.10.28.006 在线阅读View online::htps/ldoi.org10.13374/.issn2095-9389.2020.10.28.006 您可能感兴趣的其他文章 Articles you may be interested in 分布式一致性最优化的梯度算法与收敛分析 Distributed gradient-based consensus optimization algorithm and convergence analysis 工程科学学报.2020.42(4:434 https:doi.org10.13374.issn2095-9389.2019.09.05.005 基于群体智能优化的MKL-SVM算法及肺结节识别 MKL-SVM algorithm for pulmonary nodule recognition based on swarm intelligence optimization 工程科学学报.2021,43(9%:1157 https:/doi.org10.13374.issn2095-9389.2021.01.14.004 基于圆环压缩和挤压模拟法的Z“-4合金塑性成形摩擦因子测定 Measurement of friction factor in plastic forming of Zr-4 alloy based on ring compression and extrusionsimulation 工程科学学报.2020,42(2:209 https::/1doi.org/10.13374j.issn2095-9389.2019.01.07.002 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报.2020,42(11:1525htps:oi.org10.13374.issn2095-9389.2019.12.05.001 基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略 Energy management control strategy for plug-in fuel cell electric vehicle based on reinforcement learning algorithm 工程科学学报.2019.41(10:1332 https:/doi.org10.13374.issn2095-9389.2018.10.15.001 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报.2019,41(6:817htps:/doi.org10.13374issn2095-9389.2019.06.014
基于梯度压缩的YOLO v4算法车型识别 牟亮 赵红 李燕 仇俊政 孙传龙 刘晓童 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang, ZHAO Hong, LI Yan, QIU Jun-zheng, SUN Chuan-long, LIU Xiao-Tong 引用本文: 牟亮, 赵红, 李燕, 仇俊政, 孙传龙, 刘晓童. 基于梯度压缩的YOLO v4算法车型识别[J]. 工程科学学报, 优先发表. doi: 10.13374/j.issn2095-9389.2020.10.28.006 MU Liang, ZHAO Hong, LI Yan, QIU Jun-zheng, SUN Chuan-long, LIU Xiao-Tong. Vehicle recognition based on gradient compression and YOLO v4 algorithm[J]. Chinese Journal of Engineering, In press. doi: 10.13374/j.issn2095-9389.2020.10.28.006 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.10.28.006 您可能感兴趣的其他文章 Articles you may be interested in 分布式一致性最优化的梯度算法与收敛分析 Distributed gradient-based consensus optimization algorithm and convergence analysis 工程科学学报. 2020, 42(4): 434 https://doi.org/10.13374/j.issn2095-9389.2019.09.05.005 基于群体智能优化的MKL-SVM算法及肺结节识别 MKL-SVM algorithm for pulmonary nodule recognition based on swarm intelligence optimization 工程科学学报. 2021, 43(9): 1157 https://doi.org/10.13374/j.issn2095-9389.2021.01.14.004 基于圆环压缩和挤压模拟法的Zr-4合金塑性成形摩擦因子测定 Measurement of friction factor in plastic forming of Zr-4 alloy based on ring compression and extrusionsimulation 工程科学学报. 2020, 42(2): 209 https://doi.org/10.13374/j.issn2095-9389.2019.01.07.002 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报. 2020, 42(11): 1525 https://doi.org/10.13374/j.issn2095-9389.2019.12.05.001 基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略 Energy management control strategy for plug-in fuel cell electric vehicle based on reinforcement learning algorithm 工程科学学报. 2019, 41(10): 1332 https://doi.org/10.13374/j.issn2095-9389.2018.10.15.001 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报. 2019, 41(6): 817 https://doi.org/10.13374/j.issn2095-9389.2019.06.014
工程科学学报.第44卷,第X期:1-11.2021年X月 Chinese Journal of Engineering,Vol.44,No.X:1-11,X 2021 https://doi.org/10.13374/j.issn2095-9389.2020.10.28.006;http://cje.ustb.edu.cn 基于梯度压缩的YOLO V4算法车型识别 牟亮,赵红四,李燕,仇俊政,孙传龙,刘晓童 青岛大学机电工程学院,青岛266071 ☒通信作者,E-mail:qdlizh@163.com 摘要为进一步提高智能交通系统对车辆及不同车型识别的泛化性、鲁棒性与实时性.根据检测区域的特征有针对性地 构建数据集,改变余弦退火衰减(CD)学习率的更新方式,提出一种基于梯度压缩(GC)的Adam优化算法(Adam-GC)来提高 YOLO V4算法的训练速度、检测精度以及网络模型的泛化能力.为验证改进后YOLO v4算法的有效性,对实际路况的车流 进行采集后,利用训练完成的网络模型对不同密度车流进行定量的车型检测实验验证.经实验验证,改进后方法的整体检测 结果要优于改进前,YOL0v4和YOL0v4GCCD训练得到的网络模型在阻塞流样本下检测得到的准确率分别为94.59%和 96.46%;在同步流样本下检测得到的准确率分别为95.34%和97.20%:在自由流样本下检测得到的准确率分别为95.98%和 97.88%. 关键词梯度压缩:学习率;Adam优化算法:YOLO v4:车型识别 分类号TP391.4 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang,ZHAO Hong,LI Yan,OIU Jun-zheng,SUN Chuan-long,LIU Xiao-Tong College of Mechanical and Electrical Engineering,Qingdao University,Qingdao 266071,China Corresponding author,E-mail:qdlizh@163.com ABSTRACT Intelligent transportation systems (ITS)are the development direction of future transportation systems.ITS can effectively reduce traffic load and environmental pollution and ensure traffic safety,which has been a concern in all countries.In the field of intelligent transportation,vehicle detection has always been a hot spot but a difficult matter.To further improve the generalization,robustness,and real-time performance of the intelligent transportation system for the recognition of vehicles and different vehicle types,this study proposes an improved vehicle detection algorithm and chooses a road in the city as the background of the article. According to the characteristics of the detection region,the data set is constructed pertinently and the data set size is reduced using a video frame extraction method,aiming at achieving better detection performance with less training cost.The updating method of cosine decay with warm-up(CD)learning rate is then changed.An Adam gradient compression(GC)based on GC is proposed to improve the training speed,detection accuracy,and generalization ability of the YOLO v4 algorithm.To verify the effectiveness of the proposed algorithm,the trained network model is used to verify the quantitative vehicle type detection experiment of different density traffic flows after collecting the traffic flow information under actual road conditions.Experimental results show that the overall detection of the improved method is better than that of the original method.The accuracy rates of the network models trained by YOLO v4 and YOLO v4 GC CD under the blocking flow samples,synchronous flow samples,and free flow samples are 94.59%and 96.46%,95.34%and 97.20%,95.98%,and 97.88%,respectively.Simultaneously,the detection effect of YOLOV4 GC CD was verified at night and on rainy days with an accuracy rate of 92.06%and 95.51%,respectively. KEY WORDS gradient compression;learning rate;Adam optimization algorithm;YOLO v4;vehicle recognition 收稿日期:2020-10-28 基金项目:青岛市民生科技计划资助项目(19-6-1-88-nsh),山东省重点研发计划资助项目(2018GGX105004)
基于梯度压缩的 YOLO v4 算法车型识别 牟 亮,赵 红苣,李 燕,仇俊政,孙传龙,刘晓童 青岛大学机电工程学院, 青岛 266071 苣通信作者, E-mail: qdlizh@163.com 摘 要 为进一步提高智能交通系统对车辆及不同车型识别的泛化性、鲁棒性与实时性. 根据检测区域的特征有针对性地 构建数据集,改变余弦退火衰减(CD)学习率的更新方式,提出一种基于梯度压缩(GC)的 Adam 优化算法(Adam−GC)来提高 YOLO v4 算法的训练速度、检测精度以及网络模型的泛化能力. 为验证改进后 YOLO v4 算法的有效性,对实际路况的车流 进行采集后,利用训练完成的网络模型对不同密度车流进行定量的车型检测实验验证. 经实验验证,改进后方法的整体检测 结果要优于改进前,YOLO v4 和 YOLO v4 GC CD 训练得到的网络模型在阻塞流样本下检测得到的准确率分别为 94.59% 和 96.46%;在同步流样本下检测得到的准确率分别为 95.34% 和 97.20%;在自由流样本下检测得到的准确率分别为 95.98% 和 97.88%. 关键词 梯度压缩;学习率;Adam 优化算法;YOLO v4;车型识别 分类号 TP391.4 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang,ZHAO Hong苣 ,LI Yan,QIU Jun-zheng,SUN Chuan-long,LIU Xiao-Tong College of Mechanical and Electrical Engineering, Qingdao University, Qingdao 266071, China 苣 Corresponding author, E-mail: qdlizh@163.com ABSTRACT Intelligent transportation systems (ITS) are the development direction of future transportation systems. ITS can effectively reduce traffic load and environmental pollution and ensure traffic safety, which has been a concern in all countries. In the field of intelligent transportation, vehicle detection has always been a hot spot but a difficult matter. To further improve the generalization, robustness, and real-time performance of the intelligent transportation system for the recognition of vehicles and different vehicle types, this study proposes an improved vehicle detection algorithm and chooses a road in the city as the background of the article. According to the characteristics of the detection region, the data set is constructed pertinently and the data set size is reduced using a video frame extraction method, aiming at achieving better detection performance with less training cost. The updating method of cosine decay with warm-up (CD) learning rate is then changed. An Adam gradient compression (GC) based on GC is proposed to improve the training speed, detection accuracy, and generalization ability of the YOLO v4 algorithm. To verify the effectiveness of the proposed algorithm, the trained network model is used to verify the quantitative vehicle type detection experiment of different density traffic flows after collecting the traffic flow information under actual road conditions. Experimental results show that the overall detection of the improved method is better than that of the original method. The accuracy rates of the network models trained by YOLO v4 and YOLO v4 GC CD under the blocking flow samples, synchronous flow samples, and free flow samples are 94.59% and 96.46%, 95.34% and 97.20%, 95.98%, and 97.88%, respectively. Simultaneously, the detection effect of YOLOV4 GC CD was verified at night and on rainy days with an accuracy rate of 92.06% and 95.51%, respectively. KEY WORDS gradient compression;learning rate;Adam optimization algorithm;YOLO v4;vehicle recognition 收稿日期: 2020−10−28 基金项目: 青岛市民生科技计划资助项目(19-6-1-88-nsh),山东省重点研发计划资助项目(2018GGX105004) 工程科学学报,第 44 卷,第 X 期:1−11,2021 年 X 月 Chinese Journal of Engineering, Vol. 44, No. X: 1−11, X 2021 https://doi.org/10.13374/j.issn2095-9389.2020.10.28.006; http://cje.ustb.edu.cn
工程科学学报,第44卷,第X期 随着人工智能与计算机视觉的发展,智能交 R-CNN(Faster region-based convolution neural 通系统u(Intelligent traffic system,ITS)在两者的基 networks)!31 SPP-Net(Spatial pyramid pooling in 础上得到了快速的发展,车辆及其车型的识别也 deep convolutional networks))l等.其中基于回归 在该领域受到了广泛的关注.智能交通系统将先 的YOLO系列算法是当前比较流行的目标检测算 进的信息技术、数据通信技术、传感器技术、电子 法,将模型的训练与检测均放到一个单独的网络 控制技术以及计算机技术等有效地综合运用于整 中来完成原始数据从输入到检测类别和检测目标 个交通运输管理体系,从而建立起一种大范围内、 位置输出的过程.赵坤等)针对弱光照下交通标 全方位发挥作用的,实时、准确、高效的综合运输 志易发生的问题改进了YOLO V3算法来提高交通 和管理系统.车辆检测是智能交通系统数据前 标志的检测和识别;曹凯宁针对在视频检测过 端采集的一个重要环节,并且分不同车型进行识 程中对远端物体检测效率低下和实时性等问题, 别,能够为交通流量统计、交通智能控制以及解决 基于改进的YOLO算法来提升车辆目标检测的速 拥堵问题提供更加详细的数据保障 率和准确率 近几儿年,深度学习在目标检测、语音识别等方 针对交通复杂多变的环境特点及智能交通领 面取得了重大的突破,这很大程度上归功于大型 域对目标检测的实时性要求,本文选取YOLO 数据集、计算机强大的计算能力、复杂网络架构和 V4目标检测算法作为基本算法进行研究,最新的 优化算法的进展.本文所涉及的车辆检测属于目 YOLO V4算法在YOLO v3的基础上实现了检测精 标检测算法的一项应用,目前应用到车辆检测的 度的提升,但是增加了网络的复杂程度,造成训练 主要有传统机器学习和基于深度学习的目标检测 时间较长,本文在该算法的基础上进行了如下工作: 对于传统机器学习的目标检测算法主要是通 (1)针对青岛地区道路及车辆特点进行数据 过对选定区域中车辆的基本信息及其运动特征 采集,拍摄青岛地区四个路段的车流,根据不同的 进行分析,并提取候选区中的特征,将提取到的特 车流密度对每个视频进行分帧,从中剔除冗余的 征送入分类器阿来判断是否为车辆.现有的主要 训练集,剩下2870张构成自建数据集,在网络车 研究有,马泊宁m提出的基于方向梯度直方图 辆信息检测数据集UA-DETRAC中采用同样的方 (Histogram of gradient,HOG)特征、支持向量机 法挑选1500张,对货车进行数据增强所构建的数 (Support vector machine,SVM)的车辆识别算法和 据集包含210张3D图片,共组成含有4580张图片 基于卡尔曼滤波的车辆跟踪算法;Cai等提出了 的训练集 一种基于场景模型和模式识别相结合的概率框 (2)改变学习率余弦退火衰减法的更新方式, 架,由可变形组件模型(Deformable part model,DPM) 学习率的改变会帮助算法在训练过程中跳出局部 和条件随机场(Conditional random field,CRF)描述 最优并防止网络模型超调. 的车辆模型,使用DPM生成的根和组件的分数及 (3)对于检测算法的检测精度及泛化能力,本 其空间配置来学习CRF模型.基于机器学习的目 文考虑直接在梯度上进行操作,通过采用一种合 标检测算法没有针对性区域选择会造成大量的冗 适的梯度压缩方法来平滑梯度曲线,同时梯度压 余窗口,并且因为交通场景的复杂性与多变性,难 缩也会带来权重空间与输出特征空间的正则化, 以实现针对该任务设计的特征提取,数据规模的 从而提高检测算法的性能 缺失和提取特征的质量问题,会造成泛化能力差 1YOL0v4算法 及识别精度低等问题 基于深度学习的目标检测算法,主要是通过 本文选用的YOLO V4是在YOLO V3检测框 建立数据之间多层的、非线性的模型,通过数据集 架的基础上从主干特征提取网络、激活函数、数 的训练来更新层与层之间的权重.该类目标检测 据处理和损失函数等方面进行优化,检测部分与 算法主要分为两类,一类是以SSD(Single shot YOLO v3相似,经参考得知YOLO V4算法具有较 multibox detector)1 YOLO(You only look once)101 好的检测速度与精度,故本文将在YOLO v4算法 RefineDet(Single-shot refinement neural network for 的基础上开展工作 object detection)川等为代表的分类回归算法,而另 1.1主干特征提取网络 一类是基于候选区域生成的算法,主要有RCNN YOLO V4算法的主干特征提取网络采用 (Region-based convolution neural networks)Faster CSPDarknet5:3,如图l所示.该特征提取网络主要
随着人工智能与计算机视觉的发展,智能交 通系统[1] (Intelligent traffic system, ITS)在两者的基 础上得到了快速的发展,车辆及其车型的识别也 在该领域受到了广泛的关注. 智能交通系统将先 进的信息技术、数据通信技术、传感器技术、电子 控制技术以及计算机技术等有效地综合运用于整 个交通运输管理体系,从而建立起一种大范围内、 全方位发挥作用的,实时、准确、高效的综合运输 和管理系统. 车辆检测[2] 是智能交通系统数据前 端采集的一个重要环节,并且分不同车型进行识 别,能够为交通流量统计、交通智能控制以及解决 拥堵问题提供更加详细的数据保障. 近几年,深度学习在目标检测、语音识别等方 面取得了重大的突破[3−5] ,这很大程度上归功于大型 数据集、计算机强大的计算能力、复杂网络架构和 优化算法的进展. 本文所涉及的车辆检测属于目 标检测算法的一项应用,目前应用到车辆检测的 主要有传统机器学习和基于深度学习的目标检测. 对于传统机器学习的目标检测算法主要是通 过对选定区域中车辆的基本信息及其运动特征 进行分析,并提取候选区中的特征,将提取到的特 征送入分类器[6] 来判断是否为车辆. 现有的主要 研究有 ,马泊宁[7] 提出的基于方向梯度直方图 ( Histogram of gradient, HOG)特征 、支持向量机 (Support vector machine,SVM)的车辆识别算法和 基于卡尔曼滤波的车辆跟踪算法; Cai 等[8] 提出了 一种基于场景模型和模式识别相结合的概率框 架,由可变形组件模型 (Deformable part model,DPM) 和条件随机场 (Conditional random field,CRF) 描述 的车辆模型,使用 DPM 生成的根和组件的分数及 其空间配置来学习 CRF 模型. 基于机器学习的目 标检测算法没有针对性区域选择会造成大量的冗 余窗口,并且因为交通场景的复杂性与多变性,难 以实现针对该任务设计的特征提取,数据规模的 缺失和提取特征的质量问题,会造成泛化能力差 及识别精度低等问题. 基于深度学习的目标检测算法,主要是通过 建立数据之间多层的、非线性的模型,通过数据集 的训练来更新层与层之间的权重. 该类目标检测 算 法 主 要 分 为 两 类 , 一 类 是 以 SSD(Single shot multibox detector)[9]、 YOLO(You only look once) [10]、 RefineDet(Single-shot refinement neural network for object detection)[11] 等为代表的分类回归算法,而另 一类是基于候选区域生成的算法,主要有 R−CNN (Region-based convolution neural networks)[12]、Faster R−CNN(Faster region-based convolution neural networks)[13]、 SPP−Net(Spatial pyramid pooling in deep convolutional networks)[14] 等. 其中基于回归 的 YOLO 系列算法是当前比较流行的目标检测算 法,将模型的训练与检测均放到一个单独的网络 中来完成原始数据从输入到检测类别和检测目标 位置输出的过程. 赵坤等[15] 针对弱光照下交通标 志易发生的问题改进了 YOLO v3 算法来提高交通 标志的检测和识别;曹凯宁[16] 针对在视频检测过 程中对远端物体检测效率低下和实时性等问题, 基于改进的 YOLO 算法来提升车辆目标检测的速 率和准确率. 针对交通复杂多变的环境特点及智能交通领 域对目标检测的实时性要求 ,本文选 取 YOLO v4 目标检测算法作为基本算法进行研究,最新的 YOLO v4 算法在 YOLO v3 的基础上实现了检测精 度的提升,但是增加了网络的复杂程度,造成训练 时间较长,本文在该算法的基础上进行了如下工作: (1)针对青岛地区道路及车辆特点进行数据 采集,拍摄青岛地区四个路段的车流,根据不同的 车流密度对每个视频进行分帧,从中剔除冗余的 训练集,剩下 2870 张构成自建数据集,在网络车 辆信息检测数据集 UA-DETRAC 中采用同样的方 法挑选 1500 张,对货车进行数据增强所构建的数 据集包含 210 张 3D 图片,共组成含有 4580 张图片 的训练集. (2)改变学习率余弦退火衰减法的更新方式, 学习率的改变会帮助算法在训练过程中跳出局部 最优并防止网络模型超调. (3)对于检测算法的检测精度及泛化能力,本 文考虑直接在梯度上进行操作,通过采用一种合 适的梯度压缩方法来平滑梯度曲线,同时梯度压 缩也会带来权重空间与输出特征空间的正则化, 从而提高检测算法的性能. 1 YOLO v4 算法 本文选用的 YOLO v4 是在 YOLO v3 检测框 架的基础上从主干特征提取网络、激活函数、数 据处理和损失函数等方面进行优化,检测部分与 YOLO v3 相似,经参考得知 YOLO v4 算法具有较 好的检测速度与精度,故本文将在 YOLO v4 算法 的基础上开展工作. 1.1 主干特征提取网络 YOLO v4 算 法 的 主 干 特 征 提 取 网 络 采 用 CSPDarknet53,如图 1 所示. 该特征提取网络主要 · 2 · 工程科学学报,第 44 卷,第 X 期
牟亮等:基于梯度压缩的YOLO v4算法车型识别 3· 由卷积块CBM(Conv+Batchnorm+Mish)与通过 成两部分,主干部分继续进行原先的残差块堆叠 CSPnet结构修改的残差块(Resblock body)组成. 的操作,而另一部分则通过一个大的残差边实现 YOLOv4采用Mish激活函数替换原有的LeakyReLU 跨阶段层次合并,在减少计算量的同时保证了特 激活函数,CSPnet结构将原来的堆叠残差块拆分 征提取的完整 ×3CBM ResBlock enseBloc 3CBM ResBlock enseBlock ×3CBM 3x3DBM2 ResBlockx2 ResBlock×8 ResBlock ×3CBM esBlock *3CBM Output ResBlock×4 ResBlockx8 BM CONV BN Mish ResBlock *ICBM DenseBlock× xICBM ZeroPaddin 3CBM 图1 CSPDarknet53特征提取网路 Fig.1 CSPDarknet53 feature extraction network 1.2激活函数 具有重要的作用.目前广泛使用的激活函数 激活函数将非线性的特性引入神经网络算 RLUI)存在着负值时会被直接截断和梯度下降 法中,就是在神经元中运行的函数,负责神经元 不够平滑的问题,因此YOLO V4采用Mish激活 输人端与输出端之间的映射,其对于神经网络 函数8I来代替ReLU,图2为Mish与ReLU激活 模型学习并理解非常复杂和非线性的输入特性 函数的图像 (a) 5 (b) 3 -4 -4 -2 图2两种激活函数图像.(a)Mish激活函数:(b)ReLU激活函数 Fig.2 Two kinds of activation function images:(a)Mish activation function;(b)ReLU activation function Mish和ReLU激活函数的公式如下: 时不是像ReLU一样完全不被激活,而是以较小的 Mish =x*tanh(In(1 +e)) (1) 负梯度流入神经网络进而保证了信息的流动性 ReLU max(0,x) (2) 并且Mish也保留了激活函数无边界的优点,巧妙避 其中,x表示输入节点的值.Mish激活函数在负值 开了在两边极限梯度趋向于1而造成的饱和问题
由卷积块 CBM(Conv + Batchnorm + Mish)与通过 CSPnet 结构修改的残差块(Resblock_body)组成. YOLO v4 采用Mish 激活函数替换原有的LeakyReLU 激活函数,CSPnet 结构将原来的堆叠残差块拆分 成两部分,主干部分继续进行原先的残差块堆叠 的操作,而另一部分则通过一个大的残差边实现 跨阶段层次合并,在减少计算量的同时保证了特 征提取的完整. Input ZeroPadding CBM CONV BN Mish 1×1CBM 1×1CBM 1×1CBM DenseBlock×n Add 3×3CBM Output 3×3DBM×2 3×3CBM 3×3CBM 3×3CBM 3×3CBM ResBlock 3×3CBM ResBlock ResBlock ResBlock ResBlock×2 ResBlock×4 ResBlock×8 ResBlock×8 ResBlock ResBlock DenseBlock DenseBlock DenseBlock DenseBlock DenseBlock 图 1 CSPDarknet53 特征提取网络 Fig.1 CSPDarknet53 feature extraction network 1.2 激活函数 激活函数将非线性的特性引入神经网络算 法中,就是在神经元中运行的函数,负责神经元 输入端与输出端之间的映射,其对于神经网络 模型学习并理解非常复杂和非线性的输入特性 具有重要的作用 . 目前广泛使用的激活函 数 ReLU[17] 存在着负值时会被直接截断和梯度下降 不够平滑的问题,因此 YOLO v4 采用 Mish 激活 函数[18] 来代替 ReLU,图 2 为 Mish 与 ReLU 激活 函数的图像. 5 (a) (b) f(x) 4 3 2 1 0 −4 −2 0 2 4 x 5 f(x) 4 3 2 1 0 −4 −2 0 2 4 x 图 2 两种激活函数图像. (a)Mish 激活函数;(b)ReLU 激活函数 Fig.2 Two kinds of activation function images: (a) Mish activation function; (b) ReLU activation function Mish 和 ReLU 激活函数的公式如下: Mish = x ∗ tanh(ln(1+e x )) (1) ReLU = max(0, x) (2) 其中,x 表示输入节点的值. Mish 激活函数在负值 时不是像 ReLU 一样完全不被激活,而是以较小的 负梯度流入神经网络进而保证了信息的流动性. 并且 Mish 也保留了激活函数无边界的优点,巧妙避 开了在两边极限梯度趋向于 1 而造成的饱和问题. 牟 亮等: 基于梯度压缩的 YOLO v4 算法车型识别 · 3 ·
工程科学学报,第44卷,第X期 1.3损失函数 IoU(Intersection over Union)就是所谓的交并 Gc(VwiL)= 〉VwL (6) V2πo 比,是目前检测中比较常用的指标,可以反映出预 测检测框与真实检测框的检测效果. 其中,w:(i=1,2,,W)代表权重向量,VwL代表损 YOLO V4目标检测算法回归损失函数采用 失函数对权重向量w:的梯度,μ为当前训练次数 CIoU Loss(Complete-IoU Loss),该回归损失函数将 与总训练次数epochf的比值.在这里v(=, V2元d 目标与anchors之间的距离、重叠率、尺度及惩罚 项都考虑进去,使得目标框回归变得更加稳定,不 。-兮为梯度平滑曲线,选取σ的值为04,该曲线的 图像如图3所示 会出现训练中发散的问题,公式如下: p2(b,b8) 1.00 CIoU=IoU- -av (3) c2 0.95 0.90 = (4) 1-loU+v 0.85 V= π2 arctan (5) 复0.80 0.75 其中,gt为groundtruth的缩写,表示真实框的信 0.70 息,d为真实框的宽度,h为真实框的高度, 0.65 ρ(亿,b)代表了预测框和真实框中心点的欧式距 0.6 离,c表示同时包含预测框和真实框的最小闭包区 0 500 1000 1500 2000 Epoch 域的对角线距离,α为权重函数,v用来度量长宽比 图3梯度平滑曲线 的相似度 Fig.3 Gradient smoothing curve 2算法改进 只需求得梯度矩阵的均值,在每个梯度的列 向量中减掉该均值后再与梯度平滑系数相乘,就 2.1梯度压缩 可以得到最优的权重更新方向.该方法的计算廉 目前目标检测算法的优化方法主要有在激活 价,不涉及除法运算,只需要几行代码就可以实 函数中起作用的BN(Batch normalization)l和在 现.实验表明,采用卷积神经网络模型来训练 权重上操作的WS(Weight standardization)o,除了 Mnist数据集,每个epoch只需多花费0.5s左右的 在这两方面操作外,本文考虑直接在梯度方面进 时间 行操作,来优化训练过程和检测精度 将上述公式写成矩阵形式如下: 目标检测算法中对梯度进行操作的优化算法 1 中,最常用的就是计算梯度的动量.借用物理中动 Gc(VwL)=- -e-Σ(PTwL (7) 量的概念,模拟物体运动时的惯性,在更新时一定 程度上保留之前更新的方向,并根据梯度微调下 P=I-iiT (8) 一步的更新方向.利用动量思想的优化算法主要有 P2=P=P2 (9) SGDM(Stochastic gradient descent with momentum)211 iTPVwL=0 (10) 和Adam(Adaptive moment estimation)2.经过文献 其中,P表示权值空间法向量为e的超平面的投影 参考,Adam相比于SGDM算法具有更高的性能, 矩阵,i=1/VN为N维单位向量,I为N维单位矩阵 它利用梯度的一阶矩估计(即梯度的均值)与二阶 PvwL是在该平面上的投影梯度2),在超平面上的 矩估计(及梯度的方差)对更新步长进行动态调 投影梯度会压缩权值空间,并且图3所示梯度平 整.为进一步提高算法性能及方便操作者使用本 滑曲线值的范围在0.6~1之间,会进一步缩小投 文方法,提出了一种在Adam优化器上根据训练 影梯度进而压缩权值空间.本文的梯度压缩方法 的epoch自动更新梯度的方法,称为梯度压缩,改 可以简单地在Adam优化算法中实施,带梯度压缩 进后的优化器简称为Adam-GC. 的Adam优化算法的流程如下 梯度压缩的公式如下: Input:Weight vector,w
1.3 损失函数 IoU( Intersection over Union)就是所谓的交并 比,是目前检测中比较常用的指标,可以反映出预 测检测框与真实检测框的检测效果. YOLO v4 目标检测算法回归损失函数采用 CIoU Loss(Complete-IoU Loss),该回归损失函数将 目标与 anchors 之间的距离、重叠率、尺度及惩罚 项都考虑进去,使得目标框回归变得更加稳定,不 会出现训练中发散的问题,公式如下: CIoU = IoU− ρ 2 ( b,b gt) c 2 −αv (3) α = v 1−IoU+v (4) v = 4 π 2 ( arctan d gt h gt −arctan d h ) (5) d gt h gt ρ 2 ( b,b gt) c α ν 其中, gt 为 groundtruth 的缩写,表示真实框的信 息 , 为 真 实 框 的 宽 度 , 为 真 实 框 的 高 度 , 代表了预测框和真实框中心点的欧式距 离, 表示同时包含预测框和真实框的最小闭包区 域的对角线距离, 为权重函数, 用来度量长宽比 的相似度. 2 算法改进 2.1 梯度压缩 目前目标检测算法的优化方法主要有在激活 函数中起作用的 BN(Batch normalization) [19] 和在 权重上操作的 WS(Weight standardization) [20] ,除了 在这两方面操作外,本文考虑直接在梯度方面进 行操作,来优化训练过程和检测精度. 目标检测算法中对梯度进行操作的优化算法 中,最常用的就是计算梯度的动量. 借用物理中动 量的概念,模拟物体运动时的惯性,在更新时一定 程度上保留之前更新的方向,并根据梯度微调下 一步的更新方向. 利用动量思想的优化算法主要有 SGDM(Stochastic gradient descent with momentum)[21] 和 Adam(Adaptive moment estimation)[22] . 经过文献 参考,Adam 相比于 SGDM 算法具有更高的性能, 它利用梯度的一阶矩估计(即梯度的均值)与二阶 矩估计(及梯度的方差)对更新步长进行动态调 整. 为进一步提高算法性能及方便操作者使用本 文方法,提出了一种在 Adam 优化器上根据训练 的 epoch 自动更新梯度的方法,称为梯度压缩,改 进后的优化器简称为 Adam−GC. 梯度压缩的公式如下: φGC(∇wiL) = 1 √ 2πσ e − µ 2 2 ∇wiL− 1 N ∑ N j=1 ∇wi, jL (6) wi(i = 1,2,...,N) ∇wiL wi µ t epoch φ(µ) = 1 √ 2πσ e − µ 2 2 σ 其中, 代表权重向量, 代表损 失函数对权重向量 的梯度, 为当前训练次数 与总训练次数 的比值. 在这里 为梯度平滑曲线,选取 的值为 0.4,该曲线的 图像如图 3 所示. 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0 500 1000 Epoch Value 1500 2000 图 3 梯度平滑曲线 Fig.3 Gradient smoothing curve 只需求得梯度矩阵的均值,在每个梯度的列 向量中减掉该均值后再与梯度平滑系数相乘,就 可以得到最优的权重更新方向. 该方法的计算廉 价,不涉及除法运算,只需要几行代码就可以实 现. 实验表明 ,采用卷积神经网络模型来训练 Mnist 数据集,每个 epoch 只需多花费 0.5 s 左右的 时间. 将上述公式写成矩阵形式如下: φGC(∇wL) = 1 √ 2πσ e − µ 2 2 (P∇wL) (7) P = I− iiT (8) P 2= P =P 2 (9) i T P∇wL = 0 (10) P e i = 1/ √ N N I N P∇wL 其中, 表示权值空间法向量为 的超平面的投影 矩阵, 为 维单位向量, 为 维单位矩阵 是在该平面上的投影梯度[23] ,在超平面上的 投影梯度会压缩权值空间,并且图 3 所示梯度平 滑曲线值的范围在 0.6~1 之间,会进一步缩小投 影梯度进而压缩权值空间. 本文的梯度压缩方法 可以简单地在 Adam 优化算法中实施,带梯度压缩 的 Adam 优化算法的流程如下. w 0 Input: Weight vector, · 4 · 工程科学学报,第 44 卷,第 X 期