当前位置：和泉文库 > 工程 > 浏览文档

《工程科学学报》：基于梯度压缩的YOLO v4算法车型识别

文件格式：PDF，文件大小：1.58MB，售价：4.3元

文档详细内容（约12页）

工程科学学报 Chinese Journal of Engineering 基于梯度压缩的Y0L0v4算法车型识别牟亮赵红李燕仇俊政孙传龙刘晓童 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang.ZHAO Hong,LI Yan,QIU Jun-zheng.SUN Chuan-long,LIU Xiao-Tong 引用本文：牟亮，赵红，李燕，仇俊政，孙传龙，刘晓童.基于梯度压缩的Y0L0v4算法车型识别[.工程科学学报，优先发表.doi: 10.13374j.issn2095-9389.2020.10.28.006 MU Liang,ZHAO Hong.LI Yan,QIU Jun-zheng,SUN Chuan-long.LIU Xiao-Tong.Vehicle recognition based on gradient compression and YOLO v4 algorithm[J].Chinese Journal of Engineering.In press.doi:10.13374/j.issn2095-9389.2020.10.28.006 在线阅读View online::htps/ldoi.org10.13374/.issn2095-9389.2020.10.28.006 您可能感兴趣的其他文章 Articles you may be interested in 分布式一致性最优化的梯度算法与收敛分析 Distributed gradient-based consensus optimization algorithm and convergence analysis 工程科学学报.2020.42(4：434 https:doi.org10.13374.issn2095-9389.2019.09.05.005 基于群体智能优化的MKL-SVM算法及肺结节识别 MKL-SVM algorithm for pulmonary nodule recognition based on swarm intelligence optimization 工程科学学报.2021,43(9%：1157 https:/doi.org10.13374.issn2095-9389.2021.01.14.004 基于圆环压缩和挤压模拟法的Z“-4合金塑性成形摩擦因子测定 Measurement of friction factor in plastic forming of Zr-4 alloy based on ring compression and extrusionsimulation 工程科学学报.2020,42(2：209 https::/1doi.org/10.13374j.issn2095-9389.2019.01.07.002 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报.2020,42(11：1525htps:oi.org10.13374.issn2095-9389.2019.12.05.001 基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略 Energy management control strategy for plug-in fuel cell electric vehicle based on reinforcement learning algorithm 工程科学学报.2019.41(10：1332 https:/doi.org10.13374.issn2095-9389.2018.10.15.001 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报.2019,41(6：817htps:/doi.org10.13374issn2095-9389.2019.06.014

基于梯度压缩的YOLO v4算法车型识别牟亮赵红李燕仇俊政孙传龙刘晓童 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang, ZHAO Hong, LI Yan, QIU Jun-zheng, SUN Chuan-long, LIU Xiao-Tong 引用本文: 牟亮, 赵红, 李燕, 仇俊政, 孙传龙, 刘晓童. 基于梯度压缩的YOLO v4算法车型识别[J]. 工程科学学报, 优先发表. doi: 10.13374/j.issn2095-9389.2020.10.28.006 MU Liang, ZHAO Hong, LI Yan, QIU Jun-zheng, SUN Chuan-long, LIU Xiao-Tong. Vehicle recognition based on gradient compression and YOLO v4 algorithm[J]. Chinese Journal of Engineering, In press. doi: 10.13374/j.issn2095-9389.2020.10.28.006 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.10.28.006 您可能感兴趣的其他文章 Articles you may be interested in 分布式一致性最优化的梯度算法与收敛分析 Distributed gradient-based consensus optimization algorithm and convergence analysis 工程科学学报. 2020, 42(4): 434 https://doi.org/10.13374/j.issn2095-9389.2019.09.05.005 基于群体智能优化的MKL-SVM算法及肺结节识别 MKL-SVM algorithm for pulmonary nodule recognition based on swarm intelligence optimization 工程科学学报. 2021, 43(9): 1157 https://doi.org/10.13374/j.issn2095-9389.2021.01.14.004 基于圆环压缩和挤压模拟法的Zr-4合金塑性成形摩擦因子测定 Measurement of friction factor in plastic forming of Zr-4 alloy based on ring compression and extrusionsimulation 工程科学学报. 2020, 42(2): 209 https://doi.org/10.13374/j.issn2095-9389.2019.01.07.002 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报. 2020, 42(11): 1525 https://doi.org/10.13374/j.issn2095-9389.2019.12.05.001 基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略 Energy management control strategy for plug-in fuel cell electric vehicle based on reinforcement learning algorithm 工程科学学报. 2019, 41(10): 1332 https://doi.org/10.13374/j.issn2095-9389.2018.10.15.001 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报. 2019, 41(6): 817 https://doi.org/10.13374/j.issn2095-9389.2019.06.014

工程科学学报.第44卷，第X期：1-11.2021年X月 Chinese Journal of Engineering,Vol.44,No.X:1-11,X 2021 https://doi.org/10.13374/j.issn2095-9389.2020.10.28.006;http://cje.ustb.edu.cn 基于梯度压缩的YOLO V4算法车型识别牟亮，赵红四，李燕，仇俊政，孙传龙，刘晓童青岛大学机电工程学院，青岛266071 ☒通信作者，E-mail:qdlizh@163.com 摘要为进一步提高智能交通系统对车辆及不同车型识别的泛化性、鲁棒性与实时性.根据检测区域的特征有针对性地构建数据集，改变余弦退火衰减(CD)学习率的更新方式，提出一种基于梯度压缩(GC)的Adam优化算法(Adam-GC)来提高 YOLO V4算法的训练速度、检测精度以及网络模型的泛化能力.为验证改进后YOLO v4算法的有效性，对实际路况的车流进行采集后，利用训练完成的网络模型对不同密度车流进行定量的车型检测实验验证.经实验验证，改进后方法的整体检测结果要优于改进前，YOL0v4和YOL0v4GCCD训练得到的网络模型在阻塞流样本下检测得到的准确率分别为94.59%和 96.46%;在同步流样本下检测得到的准确率分别为95.34%和97.20%：在自由流样本下检测得到的准确率分别为95.98%和 97.88%. 关键词梯度压缩：学习率；Adam优化算法：YOLO v4:车型识别分类号TP391.4 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang,ZHAO Hong,LI Yan,OIU Jun-zheng,SUN Chuan-long,LIU Xiao-Tong College of Mechanical and Electrical Engineering,Qingdao University,Qingdao 266071,China Corresponding author,E-mail:qdlizh@163.com ABSTRACT Intelligent transportation systems (ITS)are the development direction of future transportation systems.ITS can effectively reduce traffic load and environmental pollution and ensure traffic safety,which has been a concern in all countries.In the field of intelligent transportation,vehicle detection has always been a hot spot but a difficult matter.To further improve the generalization,robustness,and real-time performance of the intelligent transportation system for the recognition of vehicles and different vehicle types,this study proposes an improved vehicle detection algorithm and chooses a road in the city as the background of the article. According to the characteristics of the detection region,the data set is constructed pertinently and the data set size is reduced using a video frame extraction method,aiming at achieving better detection performance with less training cost.The updating method of cosine decay with warm-up(CD)learning rate is then changed.An Adam gradient compression(GC)based on GC is proposed to improve the training speed,detection accuracy,and generalization ability of the YOLO v4 algorithm.To verify the effectiveness of the proposed algorithm,the trained network model is used to verify the quantitative vehicle type detection experiment of different density traffic flows after collecting the traffic flow information under actual road conditions.Experimental results show that the overall detection of the improved method is better than that of the original method.The accuracy rates of the network models trained by YOLO v4 and YOLO v4 GC CD under the blocking flow samples,synchronous flow samples,and free flow samples are 94.59%and 96.46%,95.34%and 97.20%,95.98%,and 97.88%,respectively.Simultaneously,the detection effect of YOLOV4 GC CD was verified at night and on rainy days with an accuracy rate of 92.06%and 95.51%,respectively. KEY WORDS gradient compression;learning rate;Adam optimization algorithm;YOLO v4;vehicle recognition 收稿日期：2020-10-28 基金项目：青岛市民生科技计划资助项目(19-6-1-88-nsh),山东省重点研发计划资助项目(2018GGX105004)

基于梯度压缩的 YOLO v4 算法车型识别牟亮，赵红苣，李燕，仇俊政，孙传龙，刘晓童青岛大学机电工程学院, 青岛 266071 苣通信作者， E-mail: qdlizh@163.com 摘要为进一步提高智能交通系统对车辆及不同车型识别的泛化性、鲁棒性与实时性. 根据检测区域的特征有针对性地构建数据集，改变余弦退火衰减（CD）学习率的更新方式，提出一种基于梯度压缩（GC）的 Adam 优化算法（Adam−GC）来提高 YOLO v4 算法的训练速度、检测精度以及网络模型的泛化能力. 为验证改进后 YOLO v4 算法的有效性，对实际路况的车流进行采集后，利用训练完成的网络模型对不同密度车流进行定量的车型检测实验验证. 经实验验证，改进后方法的整体检测结果要优于改进前，YOLO v4 和 YOLO v4 GC CD 训练得到的网络模型在阻塞流样本下检测得到的准确率分别为 94.59% 和 96.46%；在同步流样本下检测得到的准确率分别为 95.34% 和 97.20%；在自由流样本下检测得到的准确率分别为 95.98% 和 97.88%. 关键词梯度压缩；学习率；Adam 优化算法；YOLO v4；车型识别分类号 TP391.4 Vehicle recognition based on gradient compression and YOLO v4 algorithm MU Liang，ZHAO Hong苣，LI Yan，QIU Jun-zheng，SUN Chuan-long，LIU Xiao-Tong College of Mechanical and Electrical Engineering, Qingdao University, Qingdao 266071, China 苣 Corresponding author, E-mail: qdlizh@163.com ABSTRACT Intelligent transportation systems (ITS) are the development direction of future transportation systems. ITS can effectively reduce traffic load and environmental pollution and ensure traffic safety, which has been a concern in all countries. In the field of intelligent transportation, vehicle detection has always been a hot spot but a difficult matter. To further improve the generalization, robustness, and real-time performance of the intelligent transportation system for the recognition of vehicles and different vehicle types, this study proposes an improved vehicle detection algorithm and chooses a road in the city as the background of the article. According to the characteristics of the detection region, the data set is constructed pertinently and the data set size is reduced using a video frame extraction method, aiming at achieving better detection performance with less training cost. The updating method of cosine decay with warm-up (CD) learning rate is then changed. An Adam gradient compression (GC) based on GC is proposed to improve the training speed, detection accuracy, and generalization ability of the YOLO v4 algorithm. To verify the effectiveness of the proposed algorithm, the trained network model is used to verify the quantitative vehicle type detection experiment of different density traffic flows after collecting the traffic flow information under actual road conditions. Experimental results show that the overall detection of the improved method is better than that of the original method. The accuracy rates of the network models trained by YOLO v4 and YOLO v4 GC CD under the blocking flow samples, synchronous flow samples, and free flow samples are 94.59% and 96.46%, 95.34% and 97.20%, 95.98%, and 97.88%, respectively. Simultaneously, the detection effect of YOLOV4 GC CD was verified at night and on rainy days with an accuracy rate of 92.06% and 95.51%, respectively. KEY WORDS gradient compression；learning rate；Adam optimization algorithm；YOLO v4；vehicle recognition 收稿日期: 2020−10−28 基金项目: 青岛市民生科技计划资助项目（19-6-1-88-nsh），山东省重点研发计划资助项目（2018GGX105004）工程科学学报，第 44 卷，第 X 期：1−11，2021 年 X 月 Chinese Journal of Engineering, Vol. 44, No. X: 1−11, X 2021 https://doi.org/10.13374/j.issn2095-9389.2020.10.28.006; http://cje.ustb.edu.cn

工程科学学报，第44卷，第X期随着人工智能与计算机视觉的发展，智能交 R-CNN(Faster region-based convolution neural 通系统u(Intelligent traffic system,ITS)在两者的基 networks)!31 SPP-Net(Spatial pyramid pooling in 础上得到了快速的发展，车辆及其车型的识别也 deep convolutional networks))l等.其中基于回归在该领域受到了广泛的关注.智能交通系统将先的YOLO系列算法是当前比较流行的目标检测算进的信息技术、数据通信技术、传感器技术、电子法，将模型的训练与检测均放到一个单独的网络控制技术以及计算机技术等有效地综合运用于整中来完成原始数据从输入到检测类别和检测目标个交通运输管理体系，从而建立起一种大范围内、位置输出的过程.赵坤等)针对弱光照下交通标全方位发挥作用的，实时、准确、高效的综合运输志易发生的问题改进了YOLO V3算法来提高交通和管理系统.车辆检测是智能交通系统数据前标志的检测和识别；曹凯宁针对在视频检测过端采集的一个重要环节，并且分不同车型进行识程中对远端物体检测效率低下和实时性等问题，别，能够为交通流量统计、交通智能控制以及解决基于改进的YOLO算法来提升车辆目标检测的速拥堵问题提供更加详细的数据保障率和准确率近几儿年，深度学习在目标检测、语音识别等方针对交通复杂多变的环境特点及智能交通领面取得了重大的突破，这很大程度上归功于大型域对目标检测的实时性要求，本文选取YOLO 数据集、计算机强大的计算能力、复杂网络架构和 V4目标检测算法作为基本算法进行研究，最新的优化算法的进展.本文所涉及的车辆检测属于目 YOLO V4算法在YOLO v3的基础上实现了检测精标检测算法的一项应用，目前应用到车辆检测的度的提升，但是增加了网络的复杂程度，造成训练主要有传统机器学习和基于深度学习的目标检测时间较长，本文在该算法的基础上进行了如下工作：对于传统机器学习的目标检测算法主要是通 (1)针对青岛地区道路及车辆特点进行数据过对选定区域中车辆的基本信息及其运动特征采集，拍摄青岛地区四个路段的车流，根据不同的进行分析，并提取候选区中的特征，将提取到的特车流密度对每个视频进行分帧，从中剔除冗余的征送入分类器阿来判断是否为车辆.现有的主要训练集，剩下2870张构成自建数据集，在网络车研究有，马泊宁m提出的基于方向梯度直方图辆信息检测数据集UA-DETRAC中采用同样的方 (Histogram of gradient,HOG)特征、支持向量机法挑选1500张，对货车进行数据增强所构建的数 (Support vector machine,SVM)的车辆识别算法和据集包含210张3D图片，共组成含有4580张图片基于卡尔曼滤波的车辆跟踪算法；Cai等提出了的训练集一种基于场景模型和模式识别相结合的概率框 (2)改变学习率余弦退火衰减法的更新方式，架，由可变形组件模型(Deformable part model,DPM) 学习率的改变会帮助算法在训练过程中跳出局部和条件随机场(Conditional random field,CRF)描述最优并防止网络模型超调. 的车辆模型，使用DPM生成的根和组件的分数及 (3)对于检测算法的检测精度及泛化能力，本其空间配置来学习CRF模型.基于机器学习的目文考虑直接在梯度上进行操作，通过采用一种合标检测算法没有针对性区域选择会造成大量的冗适的梯度压缩方法来平滑梯度曲线，同时梯度压余窗口，并且因为交通场景的复杂性与多变性，难缩也会带来权重空间与输出特征空间的正则化，以实现针对该任务设计的特征提取，数据规模的从而提高检测算法的性能缺失和提取特征的质量问题，会造成泛化能力差 1YOL0v4算法及识别精度低等问题基于深度学习的目标检测算法，主要是通过本文选用的YOLO V4是在YOLO V3检测框建立数据之间多层的、非线性的模型，通过数据集架的基础上从主干特征提取网络、激活函数、数的训练来更新层与层之间的权重.该类目标检测据处理和损失函数等方面进行优化，检测部分与算法主要分为两类，一类是以SSD(Single shot YOLO v3相似，经参考得知YOLO V4算法具有较 multibox detector)1 YOLO(You only look once)101 好的检测速度与精度，故本文将在YOLO v4算法 RefineDet(Single-shot refinement neural network for 的基础上开展工作 object detection)川等为代表的分类回归算法，而另 1.1主干特征提取网络一类是基于候选区域生成的算法，主要有RCNN YOLO V4算法的主干特征提取网络采用 (Region-based convolution neural networks)Faster CSPDarknet5:3,如图l所示.该特征提取网络主要

随着人工智能与计算机视觉的发展，智能交通系统[1] （Intelligent traffic system, ITS）在两者的基础上得到了快速的发展，车辆及其车型的识别也在该领域受到了广泛的关注. 智能交通系统将先进的信息技术、数据通信技术、传感器技术、电子控制技术以及计算机技术等有效地综合运用于整个交通运输管理体系，从而建立起一种大范围内、全方位发挥作用的，实时、准确、高效的综合运输和管理系统. 车辆检测[2] 是智能交通系统数据前端采集的一个重要环节，并且分不同车型进行识别，能够为交通流量统计、交通智能控制以及解决拥堵问题提供更加详细的数据保障. 近几年，深度学习在目标检测、语音识别等方面取得了重大的突破[3−5] ，这很大程度上归功于大型数据集、计算机强大的计算能力、复杂网络架构和优化算法的进展. 本文所涉及的车辆检测属于目标检测算法的一项应用，目前应用到车辆检测的主要有传统机器学习和基于深度学习的目标检测. 对于传统机器学习的目标检测算法主要是通过对选定区域中车辆的基本信息及其运动特征进行分析，并提取候选区中的特征，将提取到的特征送入分类器[6] 来判断是否为车辆. 现有的主要研究有，马泊宁[7] 提出的基于方向梯度直方图（ Histogram of gradient， HOG）特征、支持向量机（Support vector machine，SVM）的车辆识别算法和基于卡尔曼滤波的车辆跟踪算法； Cai 等[8] 提出了一种基于场景模型和模式识别相结合的概率框架，由可变形组件模型 (Deformable part model，DPM) 和条件随机场 (Conditional random field，CRF) 描述的车辆模型，使用 DPM 生成的根和组件的分数及其空间配置来学习 CRF 模型. 基于机器学习的目标检测算法没有针对性区域选择会造成大量的冗余窗口，并且因为交通场景的复杂性与多变性，难以实现针对该任务设计的特征提取，数据规模的缺失和提取特征的质量问题，会造成泛化能力差及识别精度低等问题. 基于深度学习的目标检测算法，主要是通过建立数据之间多层的、非线性的模型，通过数据集的训练来更新层与层之间的权重. 该类目标检测算法主要分为两类，一类是以 SSD(Single shot multibox detector)[9]、 YOLO(You only look once) [10]、 RefineDet(Single-shot refinement neural network for object detection)[11] 等为代表的分类回归算法，而另一类是基于候选区域生成的算法，主要有 R−CNN (Region-based convolution neural networks)[12]、Faster R−CNN(Faster region-based convolution neural networks)[13]、 SPP−Net(Spatial pyramid pooling in deep convolutional networks)[14] 等. 其中基于回归的 YOLO 系列算法是当前比较流行的目标检测算法，将模型的训练与检测均放到一个单独的网络中来完成原始数据从输入到检测类别和检测目标位置输出的过程. 赵坤等[15] 针对弱光照下交通标志易发生的问题改进了 YOLO v3 算法来提高交通标志的检测和识别；曹凯宁[16] 针对在视频检测过程中对远端物体检测效率低下和实时性等问题，基于改进的 YOLO 算法来提升车辆目标检测的速率和准确率. 针对交通复杂多变的环境特点及智能交通领域对目标检测的实时性要求，本文选取 YOLO v4 目标检测算法作为基本算法进行研究，最新的 YOLO v4 算法在 YOLO v3 的基础上实现了检测精度的提升，但是增加了网络的复杂程度，造成训练时间较长，本文在该算法的基础上进行了如下工作：（1）针对青岛地区道路及车辆特点进行数据采集，拍摄青岛地区四个路段的车流，根据不同的车流密度对每个视频进行分帧，从中剔除冗余的训练集，剩下 2870 张构成自建数据集，在网络车辆信息检测数据集 UA-DETRAC 中采用同样的方法挑选 1500 张，对货车进行数据增强所构建的数据集包含 210 张 3D 图片，共组成含有 4580 张图片的训练集. （2）改变学习率余弦退火衰减法的更新方式，学习率的改变会帮助算法在训练过程中跳出局部最优并防止网络模型超调. （3）对于检测算法的检测精度及泛化能力，本文考虑直接在梯度上进行操作，通过采用一种合适的梯度压缩方法来平滑梯度曲线，同时梯度压缩也会带来权重空间与输出特征空间的正则化，从而提高检测算法的性能. 1 YOLO v4 算法本文选用的 YOLO v4 是在 YOLO v3 检测框架的基础上从主干特征提取网络、激活函数、数据处理和损失函数等方面进行优化，检测部分与 YOLO v3 相似，经参考得知 YOLO v4 算法具有较好的检测速度与精度，故本文将在 YOLO v4 算法的基础上开展工作. 1.1 主干特征提取网络 YOLO v4 算法的主干特征提取网络采用 CSPDarknet53，如图 1 所示. 该特征提取网络主要 · 2 · 工程科学学报，第 44 卷，第 X 期

由卷积块 CBM（Conv + Batchnorm + Mish）与通过 CSPnet 结构修改的残差块（Resblock_body）组成. YOLO v4 采用Mish 激活函数替换原有的LeakyReLU 激活函数，CSPnet 结构将原来的堆叠残差块拆分成两部分，主干部分继续进行原先的残差块堆叠的操作，而另一部分则通过一个大的残差边实现跨阶段层次合并，在减少计算量的同时保证了特征提取的完整. Input ZeroPadding CBM CONV BN Mish 1×1CBM 1×1CBM 1×1CBM DenseBlock×n Add 3×3CBM Output 3×3DBM×2 3×3CBM 3×3CBM 3×3CBM 3×3CBM ResBlock 3×3CBM ResBlock ResBlock ResBlock ResBlock×2 ResBlock×4 ResBlock×8 ResBlock×8 ResBlock ResBlock DenseBlock DenseBlock DenseBlock DenseBlock DenseBlock 图 1 CSPDarknet53 特征提取网络 Fig.1 CSPDarknet53 feature extraction network 1.2 激活函数激活函数将非线性的特性引入神经网络算法中，就是在神经元中运行的函数，负责神经元输入端与输出端之间的映射，其对于神经网络模型学习并理解非常复杂和非线性的输入特性具有重要的作用 . 目前广泛使用的激活函数 ReLU[17] 存在着负值时会被直接截断和梯度下降不够平滑的问题，因此 YOLO v4 采用 Mish 激活函数[18] 来代替 ReLU，图 2 为 Mish 与 ReLU 激活函数的图像. 5 (a) (b) f(x) 4 3 2 1 0 −4 −2 0 2 4 x 5 f(x) 4 3 2 1 0 −4 −2 0 2 4 x 图 2 两种激活函数图像. （a）Mish 激活函数；（b）ReLU 激活函数 Fig.2 Two kinds of activation function images: (a) Mish activation function; (b) ReLU activation function Mish 和 ReLU 激活函数的公式如下： Mish = x ∗ tanh(ln(1+e x )) （1） ReLU = max(0, x) （2）其中，x 表示输入节点的值. Mish 激活函数在负值时不是像 ReLU 一样完全不被激活，而是以较小的负梯度流入神经网络进而保证了信息的流动性. 并且 Mish 也保留了激活函数无边界的优点，巧妙避开了在两边极限梯度趋向于 1 而造成的饱和问题. 牟亮等：基于梯度压缩的 YOLO v4 算法车型识别 · 3 ·

工程科学学报，第44卷，第X期 1.3损失函数 IoU(Intersection over Union)就是所谓的交并 Gc(VwiL)= 〉VwL (6) V2πo 比，是目前检测中比较常用的指标，可以反映出预测检测框与真实检测框的检测效果. 其中，w:(i=1,2,,W)代表权重向量，VwL代表损 YOLO V4目标检测算法回归损失函数采用失函数对权重向量w:的梯度，μ为当前训练次数 CIoU Loss(Complete-IoU Loss),该回归损失函数将与总训练次数epochf的比值.在这里v(=, V2元d 目标与anchors之间的距离、重叠率、尺度及惩罚项都考虑进去，使得目标框回归变得更加稳定，不。-兮为梯度平滑曲线，选取σ的值为04，该曲线的图像如图3所示会出现训练中发散的问题，公式如下： p2(b,b8） 1.00 CIoU=IoU- -av (3) c2 0.95 0.90 = (4) 1-loU+v 0.85 V= π2 arctan (5) 复0.80 0.75 其中，gt为groundtruth的缩写，表示真实框的信 0.70 息，d为真实框的宽度，h为真实框的高度， 0.65 ρ（亿，b)代表了预测框和真实框中心点的欧式距 0.6 离，c表示同时包含预测框和真实框的最小闭包区 0 500 1000 1500 2000 Epoch 域的对角线距离，α为权重函数，v用来度量长宽比图3梯度平滑曲线的相似度 Fig.3 Gradient smoothing curve 2算法改进只需求得梯度矩阵的均值，在每个梯度的列向量中减掉该均值后再与梯度平滑系数相乘，就 2.1梯度压缩可以得到最优的权重更新方向.该方法的计算廉目前目标检测算法的优化方法主要有在激活价，不涉及除法运算，只需要几行代码就可以实函数中起作用的BN(Batch normalization)l和在现.实验表明，采用卷积神经网络模型来训练权重上操作的WS(Weight standardization)o,除了 Mnist数据集，每个epoch只需多花费0.5s左右的在这两方面操作外，本文考虑直接在梯度方面进时间行操作，来优化训练过程和检测精度将上述公式写成矩阵形式如下：目标检测算法中对梯度进行操作的优化算法 1 中，最常用的就是计算梯度的动量.借用物理中动 Gc(VwL)=- -e-Σ(PTwL (7) 量的概念，模拟物体运动时的惯性，在更新时一定程度上保留之前更新的方向，并根据梯度微调下 P=I-iiT (8) 一步的更新方向.利用动量思想的优化算法主要有 P2=P=P2 (9) SGDM(Stochastic gradient descent with momentum)211 iTPVwL=0 (10) 和Adam(Adaptive moment estimation)2.经过文献其中，P表示权值空间法向量为e的超平面的投影参考，Adam相比于SGDM算法具有更高的性能，矩阵，i=1/VN为N维单位向量，I为N维单位矩阵它利用梯度的一阶矩估计（即梯度的均值）与二阶 PvwL是在该平面上的投影梯度2)，在超平面上的矩估计（及梯度的方差）对更新步长进行动态调投影梯度会压缩权值空间，并且图3所示梯度平整.为进一步提高算法性能及方便操作者使用本滑曲线值的范围在0.6~1之间，会进一步缩小投文方法，提出了一种在Adam优化器上根据训练影梯度进而压缩权值空间.本文的梯度压缩方法的epoch自动更新梯度的方法，称为梯度压缩，改可以简单地在Adam优化算法中实施，带梯度压缩进后的优化器简称为Adam-GC. 的Adam优化算法的流程如下梯度压缩的公式如下： Input:Weight vector,w

1.3 损失函数 IoU（ Intersection over Union）就是所谓的交并比，是目前检测中比较常用的指标，可以反映出预测检测框与真实检测框的检测效果. YOLO v4 目标检测算法回归损失函数采用 CIoU Loss（Complete-IoU Loss），该回归损失函数将目标与 anchors 之间的距离、重叠率、尺度及惩罚项都考虑进去，使得目标框回归变得更加稳定，不会出现训练中发散的问题，公式如下： CIoU = IoU− ρ 2 ( b,b gt) c 2 −αv （3） α = v 1−IoU+v （4） v = 4 π 2 ( arctan d gt h gt −arctan d h ) （5） d gt h gt ρ 2 ( b,b gt) c α ν 其中， gt 为 groundtruth 的缩写，表示真实框的信息，为真实框的宽度，为真实框的高度，代表了预测框和真实框中心点的欧式距离，表示同时包含预测框和真实框的最小闭包区域的对角线距离，为权重函数，用来度量长宽比的相似度. 2 算法改进 2.1 梯度压缩目前目标检测算法的优化方法主要有在激活函数中起作用的 BN（Batch normalization） [19] 和在权重上操作的 WS（Weight standardization） [20] ，除了在这两方面操作外，本文考虑直接在梯度方面进行操作，来优化训练过程和检测精度. 目标检测算法中对梯度进行操作的优化算法中，最常用的就是计算梯度的动量. 借用物理中动量的概念，模拟物体运动时的惯性，在更新时一定程度上保留之前更新的方向，并根据梯度微调下一步的更新方向. 利用动量思想的优化算法主要有 SGDM(Stochastic gradient descent with momentum)[21] 和 Adam(Adaptive moment estimation)[22] . 经过文献参考，Adam 相比于 SGDM 算法具有更高的性能，它利用梯度的一阶矩估计（即梯度的均值）与二阶矩估计（及梯度的方差）对更新步长进行动态调整. 为进一步提高算法性能及方便操作者使用本文方法，提出了一种在 Adam 优化器上根据训练的 epoch 自动更新梯度的方法，称为梯度压缩，改进后的优化器简称为 Adam−GC. 梯度压缩的公式如下： φGC(∇wiL) = 1 √ 2πσ e − µ 2 2   ∇wiL− 1 N ∑ N j=1 ∇wi, jL   （6） wi(i = 1,2,...,N) ∇wiL wi µ t epoch φ(µ) = 1 √ 2πσ e − µ 2 2 σ 其中，代表权重向量，代表损失函数对权重向量的梯度，为当前训练次数与总训练次数的比值. 在这里为梯度平滑曲线，选取的值为 0.4，该曲线的图像如图 3 所示. 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0 500 1000 Epoch Value 1500 2000 图 3 梯度平滑曲线 Fig.3 Gradient smoothing curve 只需求得梯度矩阵的均值，在每个梯度的列向量中减掉该均值后再与梯度平滑系数相乘，就可以得到最优的权重更新方向. 该方法的计算廉价，不涉及除法运算，只需要几行代码就可以实现. 实验表明，采用卷积神经网络模型来训练 Mnist 数据集，每个 epoch 只需多花费 0.5 s 左右的时间. 将上述公式写成矩阵形式如下： φGC(∇wL) = 1 √ 2πσ e − µ 2 2 (P∇wL) （7） P = I− iiT （8） P 2= P =P 2 （9） i T P∇wL = 0 （10） P e i = 1/ √ N N I N P∇wL 其中，表示权值空间法向量为的超平面的投影矩阵，为维单位向量，为维单位矩阵是在该平面上的投影梯度[23] ，在超平面上的投影梯度会压缩权值空间，并且图 3 所示梯度平滑曲线值的范围在 0.6～1 之间，会进一步缩小投影梯度进而压缩权值空间. 本文的梯度压缩方法可以简单地在 Adam 优化算法中实施，带梯度压缩的 Adam 优化算法的流程如下. w 0 Input: Weight vector, · 4 · 工程科学学报，第 44 卷，第 X 期

点击进入文档下载页（PDF格式）

共12页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录