当前位置：和泉文库 > 电气与自动化 > 浏览文档

【人工智能基础】基于部件关注DenseNet的细粒度车型识别

文件格式：PDF，文件大小：1.46MB，售价：3.51元

文档详细内容（约9页）

第17卷第2期智能系统学报 Vol.17 No.2 2022年3月 CAAI Transactions on Intelligent Systems Mar.2022 D0:10.11992/tis.202012012 网络出版地址：https:/kns.cnki.net/kcms/detail/23.1538.TP.20210622.1126.006.html 基于部件关注DenseNet的细粒度车型识别陈立潮，朝昕，潘理虎'，曹建芳2，张睿 (1.太原科技大学计算机科学与技术学院，山西太原030024：2.忻州师范学院计算机科学与技术系，山西析州034000) 摘要：针对细粒度车型识别率低，车型区别主要集中在鉴别性部件上以及深度学习不能有效对部件进行关注的问题，提出一种基于部件关注DenseNet(part-focused DenseNet,PF-DenseNet)的细粒度车型识别模型。该模型可以基于细粒度车型的车灯、车标等区分性部件进行有效分类，通过处理层(process layer)对车型部件信息反复加强提取并进行最大池化下采样，获取更多的车型部件信息，然后通过密集卷积对特征通道进一步复用提取，密集卷积前嵌入独立组件(independent component,.IC)层，获得相对独立的神经元，增强网络独立性，提高模型的收敛极限。实验结果表明，该模型在Stanford cars-I96数据集上的识别准确率、查全率和F,分别达到 95.0%、94.9%和94.8%，高于经典卷积神经网络，并具有较小的参数量，与其他方法相比实现了最高准确率，验证了该车型识别模型的有效性。关键词：细粒度车型识别：部件关注：密集连接网络：独立组件：数据增强：深度学习：特征提取；特征复用中图分类号：TP391文献标志码：A文章编号：1673-4785(2022)02-0402-09 中文引用格式：陈立潮，朝昕，潘理虎，等.基于部件关注DenseNet的细粒度车型识别.智能系统学报，2022,17(2)： 402-410. 英文引用格式：CHEN Lichao,.CHAO Xin,,PAN Lihu,.et al Fine-grained vehicle-type identification based on partially--focused DenseNet [J].CAAI transactions on intelligent systems,2022,17(2):402-410. Fine-grained vehicle-type identification based on partially-focused DenseNet CHEN Lichao',CHAO Xin',PAN Lihu',CAO Jianfang,ZHANG Rui' (1.School of Computer Science and Technology,Taiyuan University of Science and Technology,Taiyuan 030024,China;2.Depart- ment of Computer Science and Technology,Xinzhou Teachers University,Xinzhou 034000,China) Abstract:Given that fine-grained model recognition rates are low and are mainly concentrated in the diagnostic model difference between parts and that deep learning cannot effectively concern parts,we put forward a fine-grained recogni- tion model-the partially-focused DenseNet.The model can be classified effectively based on its discriminative parts, such as lights and marks of fine-grained vehicle models.First,through the Process Layer,the vehicle part information is repeatedly extracted,and the maximum pool sampling is carried out to obtain more vehicle part information.Then,fea- ture channels are further extracted by multiplexing through dense convolution,and the independent component layer is embedded before dense convolution to obtain relatively independent neurons.This enhances network independence and improves the convergence limit of the model.Experiments show that the model's recognition accuracy,recall rate,and F on the Stanford cars-196 data set reach 95.0%,94.9%,and 94.8%,respectively,which are higher than the classic con- volutional neural network and have a smaller number of parameters.Compared with other methods,the highest accur- acy rate is achieved,verifying the effectiveness of the vehicle recognition model. Keywords:fine-grained vehicle type identification;part focus;dense connection network;independent component;data enhancement:deep learning:feature extraction:reuse of characteristics 细粒度车型识别是智能交通领域的重要组成车辆型号、制造商、生产年份等精准有用的车辆部分，旨在通过任意角度和光线环境下，识别出信息。通常粗粒度车型识别提供的车辆信息不充收稿日期：2020-12-03.网络出版日期：2021-06-22. 足，识别出的大类别数据，无法做到对车辆的有基金项目：山西省自然科学基金项目(201901D111258):山西省效标识和追踪，细粒度车型识别区别于一般车型应用基础研究项目(201801D221179). 通信作者：潘理虎.E-mail:panlh@tyust.edu..cn 识别，能够对粗粒度的大类别车型进行精细的子

DOI: 10.11992/tis.202012012 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20210622.1126.006.html 基于部件关注 DenseNet 的细粒度车型识别陈立潮1 ，朝昕1 ，潘理虎1 ，曹建芳1,2，张睿1 （1. 太原科技大学计算机科学与技术学院，山西太原 030024; 2. 忻州师范学院计算机科学与技术系，山西忻州 034000）摘要：针对细粒度车型识别率低，车型区别主要集中在鉴别性部件上以及深度学习不能有效对部件进行关注的问题，提出一种基于部件关注 DenseNet(part-focused DenseNet, PF-DenseNet) 的细粒度车型识别模型。该模型可以基于细粒度车型的车灯、车标等区分性部件进行有效分类，通过处理层 (process layer) 对车型部件信息反复加强提取并进行最大池化下采样，获取更多的车型部件信息，然后通过密集卷积对特征通道进一步复用提取，密集卷积前嵌入独立组件 (independent component, IC) 层，获得相对独立的神经元，增强网络独立性，提高模型的收敛极限。实验结果表明，该模型在 Stanford cars-196 数据集上的识别准确率、查全率和 F1 分别达到 95.0%、94.9% 和 94.8%，高于经典卷积神经网络，并具有较小的参数量，与其他方法相比实现了最高准确率，验证了该车型识别模型的有效性。关键词：细粒度车型识别；部件关注；密集连接网络；独立组件；数据增强；深度学习；特征提取；特征复用中图分类号：TP391 文献标志码：A 文章编号：1673−4785(2022)02−0402−09 中文引用格式：陈立潮, 朝昕, 潘理虎, 等. 基于部件关注 DenseNet 的细粒度车型识别 [J]. 智能系统学报, 2022, 17(2): 402–410. 英文引用格式：CHEN Lichao, CHAO Xin, PAN Lihu, et al. Fine-grained vehicle-type identification based on partially-focused DenseNet [J]. CAAI transactions on intelligent systems, 2022, 17(2): 402–410. Fine-grained vehicle-type identification based on partially-focused DenseNet CHEN Lichao1 ，CHAO Xin1 ，PAN Lihu1 ，CAO Jianfang1,2 ，ZHANG Rui1 (1. School of Computer Science and Technology, Taiyuan University of Science and Technology, Taiyuan 030024, China; 2. Department of Computer Science and Technology, Xinzhou Teachers University, Xinzhou 034000, China) Abstract: Given that fine-grained model recognition rates are low and are mainly concentrated in the diagnostic model difference between parts and that deep learning cannot effectively concern parts, we put forward a fine-grained recognition model—the partially-focused DenseNet. The model can be classified effectively based on its discriminative parts, such as lights and marks of fine-grained vehicle models. First, through the Process Layer, the vehicle part information is repeatedly extracted, and the maximum pool sampling is carried out to obtain more vehicle part information. Then, feature channels are further extracted by multiplexing through dense convolution, and the independent component layer is embedded before dense convolution to obtain relatively independent neurons. This enhances network independence and improves the convergence limit of the model. Experiments show that the model’s recognition accuracy, recall rate, and F1 on the Stanford cars-196 data set reach 95.0%, 94.9%, and 94.8%, respectively, which are higher than the classic convolutional neural network and have a smaller number of parameters. Compared with other methods, the highest accuracy rate is achieved, verifying the effectiveness of the vehicle recognition model. Keywords: fine-grained vehicle type identification; part focus; dense connection network; independent component; data enhancement; deep learning; feature extraction; reuse of characteristics 细粒度车型识别是智能交通领域的重要组成部分，旨在通过任意角度和光线环境下，识别出车辆型号、制造商、生产年份等精准有用的车辆信息。通常粗粒度车型识别提供的车辆信息不充足，识别出的大类别数据，无法做到对车辆的有效标识和追踪，细粒度车型识别区别于一般车型识别，能够对粗粒度的大类别车型进行精细的子收稿日期：2020−12−03. 网络出版日期：2021−06−22. 基金项目：山西省自然科学基金项目 (201901D111258)；山西省应用基础研究项目 (201801D221179). 通信作者：潘理虎. E-mail：panlh@tyust.edu.cn. 第 17 卷第 2 期智能系统学报 Vol.17 No.2 2022 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2022

第2期陈立潮，等：基于部件关注DenseNet的细粒度车型识别 ·403· 类别识别，精确标识车辆，在交通视频中有效地 DenseNet-l61获得较好的识别精度，DenseNet密进行车辆监控，不仅节省了人力资源，提高交通集连接]是2017年Huang等提出的一种全新的执法效率，而且能够快速分析套牌车辆和外观改卷积网铬连接模式，以密集连接的方式实现特征装车辆，在车牌信息无法获取时，细粒度的车型复用，使网络学习到更具鉴别性的特征，并通过信息尤其重要，提高了有关车辆刑事案件的侦破网络特征复用最大程度上降低参数的冗余，降低效率，在智能交通、交通数据分析、安防等领域具了网络随深度增加出现的网络退化等问题。相比有重要意义"。基于部件的方法，基于深度学习的方法操作简针对细粒度车型识别问题，国内外学者已经单，能够直接对二维图像进行处理，从大量训练做了大量研究，运用不同的方法提高细粒度车型样本中有效地学习到相应特征，避免了复杂的特识别准确率。主要有2种方法：基于车辆部件的征提取过程。但细粒度车型分类集中在微小但方法和基于深度学习的方法。重要的车型部件特征上，上述方法无法对部件特目前已经有许多基于车型部件的细粒度车型征进行有效关注。识别方法，Liao等四分析了车辆部件在细粒度车根据以上问题，结合部件和深度学习的方法，型分类中的辨别能力，提出了一种新的将各部件提出一种基于部件关注DenseNet的细粒度车型的区分能力整合到分类框架中的模型。Krause等) 识别网络。通过提出的处理层(Process Layer)对在局部特征外观和位置的层面上，将两种最先进车型部件信息进行重复加强提取关注，获取更多的的2D目标建模表示提升到3D,实现对车型精细部件信息，然后利用嵌人独立组件的密集连接网络识别。Fang等刊从整个车辆图像和检测区域中提进行特征复用，提取高维特征，独立组件降低模型取全局特征和局部部件特征，基于整体线索和局过拟合风险，有效提高模型的收敛极限。提出的部部件特征的隶属层次变化，采用一对一的支持 PF-DenseNet深度学习网络，能够有效获取细粒度向量机分类器进行分类。车型部件方法的分类效车型的鉴别性部件信息，利用部件特征进行分类。果主要取决于对车型鉴别性部件的提取能力，上述方法的部件提取能力有限，成为了制约识别性 1细粒度车型识别网络能提升的主要瓶颈。在细粒度车型识别领域，深度学习也得到广细粒度车型识别网络模型如图1所示，主体泛的研究与应用。Shi等提出GLM(generalized 框架采用DenseNet的密集卷积结构，并在框架前 large-margin)损失，并与Softmax损失级联训练明加入Process Layer,.利用Process Layer直接对输入显地减少了类间相似性和类内方差，增强模型对图像进行下采样处理，相对于一般DenseNet对输车型的表征能力。Ke等提出一种密集关注网入图像的处理，Process Layer首先通过步长为l 络(dense attention network,DA-Net),通过其密集的的卷积核对图像车辆细节特征重复提取加强，获连接和关注单元，使网络对车型的分类能力集中取更加清晰的车型图像特征，保留足够多的车型部在重要区域和特征，提高了模型的识别能力。u 件特征细节信息，然后用最大池化进行下采样，等)基于区域检测和细粒度特征学习的关联性，降低后续计算量。Process Layer后主体框架采用提出一种递归注意力卷积神经网络(recurrent at-. 密集连接网络中的密集卷积(Dense Block)和过渡 tention convolutional neural network,RA-CNN), 层(Transition Layer)),对图像特征进一步提取和复多尺度上以相互增强的方式递归学习区分区域注用，获得更加抽象高维的特征，Transition Layer引意力和基于区域的特征表示。马力等提出稀疏用在每一层Dense Block后面，对图像进一步下采化B-CNN,通过训练在特征通道中引入比例因子样，并在Dense Block和Transition Layer中嵌入的B-CNN,并采用正则化按比例因子大小对其稀 IC层，提高模型收敛极限。最后通过输出层(Out 疏，将不重要特征通道按比例裁剪，消除网络过 put Layer)和全连接层(fully connected layers,FC), 拟合提高关键特征的显著性。王阳等提出双线对图像进行分类，FC通过softmax激活函数对输性残差注意网络，用残差网络替换B-CNN的特征出作类别概率预测，模型训练采用交叉嫡损失函函数，并在残差单元间添加通道注意力和空间注数进行参数更新优化。部件关注DenseNet(part- 意力模块，获取更为丰富的注意力特征。Valev等o focused DenseNet,PF-DenseNet)的具体结构参数系统比较和总结了现有深度学习方法在细粒度车和输出大小如表1PF-DenseNet的具体网络结构型识别上的应用，在细粒度车型数据集Stanford 所示，层结构显示其对应名称的具体网络结构， Cars-196上进行训练测试，经典深度卷积网络如Process Layer的结构为7x7x96-BN-ReLu加上 (deep convolutional neural networks,DCNN) MaxPool(2×2/s=2),7×7×96表示一个核大小为

类别识别，精确标识车辆，在交通视频中有效地进行车辆监控，不仅节省了人力资源，提高交通执法效率，而且能够快速分析套牌车辆和外观改装车辆，在车牌信息无法获取时，细粒度的车型信息尤其重要，提高了有关车辆刑事案件的侦破效率，在智能交通、交通数据分析、安防等领域具有重要意义[1]。针对细粒度车型识别问题，国内外学者已经做了大量研究，运用不同的方法提高细粒度车型识别准确率。主要有 2 种方法：基于车辆部件的方法和基于深度学习的方法。目前已经有许多基于车型部件的细粒度车型识别方法，Liao 等 [2] 分析了车辆部件在细粒度车型分类中的辨别能力，提出了一种新的将各部件的区分能力整合到分类框架中的模型。Krause 等 [3] 在局部特征外观和位置的层面上，将两种最先进的 2D 目标建模表示提升到 3D，实现对车型精细识别。Fang 等 [4] 从整个车辆图像和检测区域中提取全局特征和局部部件特征，基于整体线索和局部部件特征的隶属层次变化，采用一对一的支持向量机分类器进行分类。车型部件方法的分类效果主要取决于对车型鉴别性部件的提取能力，上述方法的部件提取能力有限，成为了制约识别性能提升的主要瓶颈。在细粒度车型识别领域，深度学习也得到广泛的研究与应用。Shi 等 [5] 提出 GLM(generalized large-margin) 损失，并与 Softmax 损失级联训练明显地减少了类间相似性和类内方差，增强模型对车型的表征能力。Ke 等 [6] 提出一种密集关注网络 (dense attention network, DA-Net)，通过其密集的连接和关注单元，使网络对车型的分类能力集中在重要区域和特征，提高了模型的识别能力。Fu 等 [7] 基于区域检测和细粒度特征学习的关联性，提出一种递归注意力卷积神经网络 (recurrent attention convolutional neural network, RA-CNN)，在多尺度上以相互增强的方式递归学习区分区域注意力和基于区域的特征表示。马力等[8] 提出稀疏化 B-CNN，通过训练在特征通道中引入比例因子的 B-CNN，并采用正则化按比例因子大小对其稀疏，将不重要特征通道按比例裁剪，消除网络过拟合提高关键特征的显著性。王阳等[9] 提出双线性残差注意网络，用残差网络替换 B-CNN 的特征函数，并在残差单元间添加通道注意力和空间注意力模块，获取更为丰富的注意力特征。Valev 等 [10] 系统比较和总结了现有深度学习方法在细粒度车型识别上的应用，在细粒度车型数据集 Stanford Cars-196 上进行训练测试，经典深度卷积网络 (deep convolutional neural networks, DCNN) 中 DenseNet-161 获得较好的识别精度，DenseNet 密集连接[11] 是 2017 年 Huang 等提出的一种全新的卷积网络连接模式，以密集连接的方式实现特征复用，使网络学习到更具鉴别性的特征，并通过网络特征复用最大程度上降低参数的冗余，降低了网络随深度增加出现的网络退化等问题。相比基于部件的方法，基于深度学习的方法操作简单，能够直接对二维图像进行处理，从大量训练样本中有效地学习到相应特征，避免了复杂的特征提取过程[12]。但细粒度车型分类集中在微小但重要的车型部件特征上，上述方法无法对部件特征进行有效关注。根据以上问题，结合部件和深度学习的方法，提出一种基于部件关注 DenseNet 的细粒度车型识别网络。通过提出的处理层 (Process Layer) 对车型部件信息进行重复加强提取关注，获取更多的部件信息，然后利用嵌入独立组件的密集连接网络进行特征复用，提取高维特征，独立组件降低模型过拟合风险，有效提高模型的收敛极限。提出的 PF-DenseNet 深度学习网络，能够有效获取细粒度车型的鉴别性部件信息，利用部件特征进行分类。 1 细粒度车型识别网络 × × × × × 细粒度车型识别网络模型如图 1 所示，主体框架采用 DenseNet 的密集卷积结构，并在框架前加入 Process Layer，利用 Process Layer 直接对输入图像进行下采样处理，相对于一般 DenseNet 对输入图像的处理，Process Layer 首先通过步长为 1 的卷积核对图像车辆细节特征重复提取加强，获取更加清晰的车型图像特征，保留足够多的车型部件特征细节信息，然后用最大池化进行下采样，降低后续计算量。Process Layer 后主体框架采用密集连接网络中的密集卷积 (Dense Block) 和过渡层 (Transition Layer)，对图像特征进一步提取和复用，获得更加抽象高维的特征，Transition Layer 引用在每一层 Dense Block 后面，对图像进一步下采样，并在 Dense Block 和 Transition Layer 中嵌入 IC 层，提高模型收敛极限。最后通过输出层 (Output Layer) 和全连接层 (fully connected layers, FC)，对图像进行分类，FC 通过 softmax 激活函数对输出作类别概率预测，模型训练采用交叉熵损失函数进行参数更新优化。部件关注 DenseNet(partfocused DenseNet，PF-DenseNet) 的具体结构参数和输出大小如表 1 PF-DenseNet 的具体网络结构所示，层结构显示其对应名称的具体网络结构，如 Process Layer 的结构为 7 7 96-BN-ReLu 加上 MaxPool (2 2/s=2)，7 7 96 表示一个核大小为第 2 期陈立潮，等：基于部件关注 DenseNet 的细粒度车型识别 ·403·

·404· 智能系统学报第17卷 7×7通道数为96的卷积核，然后进行一个批归一 Dense Block x:Dense Block 1,Dense Block 2 化ul(batch normalization,.BN)和ReLu激活处 Dense Block3和Dense Block4,分别由6、12 理，最后经过一个核大小为2×2步长为2的最大 36和24个基础层结构块构成，如Dense 池化，输出(96,111,111)表示通道数为96、宽高尺 Block1由6个连续的基础层结构：IC-ReLu- 寸为111×111的输出特征图。表1中有4个 1×1x192加上IC-ReLu-3x3×48构成。密集卷积过渡层层层输出层处理层全连接层图1细粒度车型识别网络模型 Fig.1 Fine-grained vehicle identification network model 表1PF-DenseNet具体网络结构 cess Layer主要由一个核大小为7x7,步长为1的 Table 1 PF-DenseNet specific network structure 卷积层以及尺度为2×2，步长为2的最大池化层名称层结构输出组成，卷积层后面进行BN和ReLu激活处理。 7×7×96-BN-ReLu 图2所示为卷积层操作，输入特征图通过卷积核， Process Layer (96,111,111) MaxPool(2×2/s=2) 每次对特征图上卷积核大小区域进行卷积操作输 IC-ReLu-1×1×192 Dense Block 1 (384,111,111) 出一个像素值，每次操作移动一步，使特征图中 IC-ReLu-3×3×48 心部位车辆的9/10像素被重复卷积提取7次，加 IC-ReLu-1×1x192 Transition Layer (192,55,55) 强了对车型部件的特征提取。然后经过BN和 AvgPool(2×2/s=2) ReLu层处理，BN对数据归一化加快网络收敛， IC-ReLu-1×1×192 Dense Block 2 ×12 (768,55,55) ReLu激活函数增加网络稀疏性。最后利用最大 IC-ReLu-3×3×48 池化层进行下采样，特征图大小变为原来的1/2， IC-ReLu-1×1×384 Transition Layer (384,27,27) 降低后续网络计算量。 AvgPool(2×2/s=2) IC-ReLu-1×1×192 Dense Block 3 ×36 (2112,27,27) 输入特征图 IC-ReLu-3×3×48 卷积核 IC-ReLu-1×1×1056 Transition Layer (1056,13,13) AvgPool(2×2Is=2) fC-ReLu-1×1×192 Dense Block 4 ×24 (2208,13,13) 输出 1C-ReLu-3×3×48 Output Layer BN-ReLu-AvgPool(13x13) (2208,1,1) FC Softmax 196 图2卷积操作示意 l.1 Process Layer卷积特征 Fig.2 Convolution operation diagram 细粒度车型分类中，类别间的差异极其微小，如图3所示为不同DenseNet对同一车型图片相比粗粒度车型分类，更关注图像中微小但十分输入的不同特征提取效果图，图3(a)为PF-DenseNet 重要的局部特征，PF-DenseNet通过Process Lay- 中密集卷积前经过Process Layer提取的特征图， er对车型特征重复提取加强，获取了更加有效清图3(b)、3(c)分别为DenseNet201和DenseNetI61 晰的部件信息，使得网络能够基于车型部件像素密集卷积前对图像的特征提取图。图3(a)通过信息进行类别预测。 Process Layer对图像同一区域的重复卷积提取，特 Process Layer的组成结构如表1所示，Pro- 征图更加清晰，保存了更多的部件细节，车标、车

× × × 7 7 通道数为 96 的卷积核，然后进行一个批归一化 [13] (batch normalization, BN) 和 ReLu[14] 激活处理，最后经过一个核大小为 2 2 步长为 2 的最大池化，输出 (96,111,111) 表示通道数为 96、宽高尺寸为 111 111 的输出特征图。表 1 中有 4 个 × × × × Dense Block_x：Dense Block_1、Dense Block_2、 Dense Block_3 和 Dense Block_4，分别由 6、12、 3 6 和 2 4 个基础层结构块构成，如 Dense Block_1 由 6 个连续的基础层结构： IC-ReLu- 1 1 192 加上 IC-ReLu-3 3 48 构成。密集卷积 ... 输出层处理层全连接层过渡层过渡层过渡层过渡层图 1 细粒度车型识别网络模型 Fig. 1 Fine-grained vehicle identification network model 表 1 PF-DenseNet 具体网络结构 Table 1 PF-DenseNet specific network structure 名称层结构输出 Process Layer 7×7×96-BN-ReLu MaxPool(2×2/s=2) (96,111,111) Dense Block_1 IC-ReLu-1×1×192 IC-ReLu-3×3×48 ×6 (384,111,111) Transition Layer IC-ReLu-1×1×192 AvgPool(2×2/s=2) (192,55,55) Dense Block_2 IC-ReLu-1×1×192 IC-ReLu-3×3×48 ×12 (768,55,55) Transition Layer IC-ReLu-1×1×384 AvgPool(2×2/s=2) (384,27,27) Dense Block_3 IC-ReLu-1×1×192 IC-ReLu-3×3×48 ×36 (2112,27,27) Transition Layer IC-ReLu-1×1×1056 AvgPool(2×2/s=2) (1056,13,13) Dense Block_4 IC-ReLu-1×1×192 IC-ReLu-3×3×48 ×24 (2208,13,13) Output Layer BN-ReLu-AvgPool(13×13) (2208,1,1) FC Softmax 196 1.1 Process Layer 卷积特征细粒度车型分类中，类别间的差异极其微小，相比粗粒度车型分类，更关注图像中微小但十分重要的局部特征，PF-DenseNet 通过 Process Layer 对车型特征重复提取加强，获取了更加有效清晰的部件信息，使得网络能够基于车型部件像素信息进行类别预测。 Process Layer 的组成结构如表 1 所示，Pro- × × cess Layer 主要由一个核大小为 7 7，步长为 1 的卷积层以及尺度为 2 2，步长为 2 的最大池化层组成，卷积层后面进行 BN 和 ReLu 激活处理。图 2 所示为卷积层操作，输入特征图通过卷积核，每次对特征图上卷积核大小区域进行卷积操作输出一个像素值，每次操作移动一步，使特征图中心部位车辆的 9/10 像素被重复卷积提取 7 次，加强了对车型部件的特征提取。然后经过 BN 和 ReLu 层处理，BN 对数据归一化加快网络收敛， ReLu 激活函数增加网络稀疏性。最后利用最大池化层进行下采样，特征图大小变为原来的 1/2，降低后续网络计算量。输入特征图卷积核输出图 2 卷积操作示意 Fig. 2 Convolution operation diagram 如图 3 所示为不同 DenseNet 对同一车型图片输入的不同特征提取效果图，图 3(a) 为 PF-DenseNet 中密集卷积前经过 Process Layer 提取的特征图，图 3(b)、3(c) 分别为 DenseNet201 和 DenseNet161 密集卷积前对图像的特征提取图。图 3(a) 通过 Process Layer 对图像同一区域的重复卷积提取，特征图更加清晰，保存了更多的部件细节，车标、车 ·404· 智能系统学报第 17 卷

第2期陈立潮，等：基于部件关注DenseNet的细粒度车型识别 ·405· 灯等鉴别性部件信息被有效的提取出来，使网络模所示，在密集卷积前嵌入独立组件IC:{BN-Dro- 型最后能够有效地根据车型部件像素进行分类。 pout),获得相对独立的网络模型，提高模型收敛极限，增加识别准确率。 IC-Relu- IC-。Relu -Cat 图4独立密集连接网络 Fig.4 Independent dense connection network IC中，BN通过降低内部协变量偏移，减少内 (a)PF-DenseNet特征图部神经元分布的改变，加速网络的收敛，BN公式如式(1(4)所示： (1) =1- m (2) 首先通过式(1)求均值4，式(1)中x为第i 个神经元的输入，m表示神经元数目，然后通过式(2)得到方差2。 (b)DenseNet201特征图 =专u (3) vo2+s y:=y元+B (4) 然后式(3)将输入进行标准化处理，使输入服从均值为0，方差为1的正态分布，最后通过式 (4)对标准化后的值进行平移缩放处理，数据经过式(2)和式(3)的处理后，上一层网络所学习到的特征分布被破坏，式(4)引入可学习重构参数y 和B,让网络在训练时恢复出原始网络所要学习 (c)DenseNet166l特征图的特征分布。图3特征提取图 Dropout以概率P线性减弱任何一对神经元 Fig.3 Feature extraction diagram 之间的相关性，降低网络每次训练时的参数量， 1.2独立密集连接增强网络稀疏性，构造相对独立的神经元激活。密集连接基于跨层连接连通网络中前后层使将IC嵌入到Dense Block中以及Transition 得信号可以在输入层和输出层之间高速流通的思 Layer中，采用{IC-ReL-Conv的形式，能够有效想，将所有层都进行两两通道连接(Cat),使得网提取车型的高层次信息，提高模型收敛极限，获络中的每一层都接收前面所有层的特征作为输得更好的识别准确率。入，尽可能地提取到车型的细节信息，不仅大幅 2实验与分析度减少了网络的参数量，而且在一定程度上降低梯度消失的风险。神经科学家发现，神经系统的 2.1数据集表征能力与系统中独立神经元的数量呈正比，独 Stanford Cars-.l96数据集是目前最常用的细立神经元构成的独立神经网络具有更好的特征表粒度车型识别数据集，图像数据包含196类共16185 达能力和更高的收敛极限，在CNN中引入IC层张汽车图片，其中训练集8144张，测试集8041 是获得独立神经网络最快速有效的方式，通过在张。每张图片的标签有制造商、车辆型号和生产密集连接中嵌入C层构造独立密集连接，获得更年份3个信息。好的收敛极限。训练前对数据集进行了预处理，将所有图像独立密集连接的Dense Block基本结构如图4 裁剪为224×224大小，训练时对训练集做了顺时

灯等鉴别性部件信息被有效的提取出来，使网络模型最后能够有效地根据车型部件像素进行分类。 (a) PF-DenseNet 特征图 (b) DenseNet201 特征图 (c) DenseNet161 特征图图 3 特征提取图 Fig. 3 Feature extraction diagram 1.2 独立密集连接密集连接基于跨层连接连通网络中前后层使得信号可以在输入层和输出层之间高速流通的思想，将所有层都进行两两通道连接 (Cat)，使得网络中的每一层都接收前面所有层的特征作为输入，尽可能地提取到车型的细节信息，不仅大幅度减少了网络的参数量，而且在一定程度上降低梯度消失的风险。神经科学家发现，神经系统的表征能力与系统中独立神经元的数量呈正比，独立神经元构成的独立神经网络具有更好的特征表达能力和更高的收敛极限，在 CNN 中引入 IC 层是获得独立神经网络最快速有效的方式，通过在密集连接中嵌入 IC 层构造独立密集连接，获得更好的收敛极限。独立密集连接的 Dense Block 基本结构如图 4 所示，在密集卷积前嵌入独立组件 IC：{BN-Dropout}，获得相对独立的网络模型，提高模型收敛极限，增加识别准确率[15]。输入 IC Relu IC Relu Cat 图 4 独立密集连接网络 Fig. 4 Independent dense connection network IC 中，BN 通过降低内部协变量偏移，减少内部神经元分布的改变，加速网络的收敛，BN 公式如式 (1)~(4) 所示： µ = 1 m ∑m i=1 xi (1) σ 2 = 1 m ∑m i=1 (xi −µ) 2 (2) µ xi i m σ 2 首先通过式 (1) 求均值，式 (1) 中为第个神经元的输入，表示神经元数目，然后通过式 (2) 得到方差。 xˆ = xi −µ √ σ2 +ε (3) yi = γxˆi +β (4)γ β 然后式 (3) 将输入进行标准化处理，使输入服从均值为 0，方差为 1 的正态分布，最后通过式 (4) 对标准化后的值进行平移缩放处理，数据经过式 (2) 和式 (3) 的处理后，上一层网络所学习到的特征分布被破坏，式 (4) 引入可学习重构参数和，让网络在训练时恢复出原始网络所要学习的特征分布。 Dropout 以概率 P 线性减弱任何一对神经元之间的相关性，降低网络每次训练时的参数量，增强网络稀疏性，构造相对独立的神经元激活[16]。将 IC 嵌入到 Dense Block 中以及 Transition Layer 中，采用{IC-ReLu-Conv}的形式，能够有效提取车型的高层次信息，提高模型收敛极限，获得更好的识别准确率。 2 实验与分析 2.1 数据集 Stanford Cars-196[3] 数据集是目前最常用的细粒度车型识别数据集，图像数据包含 196 类共 16185 张汽车图片，其中训练集 8 144 张，测试集 8 041 张。每张图片的标签有制造商、车辆型号和生产年份 3 个信息。训练前对数据集进行了预处理，将所有图像裁剪为 224×224 大小，训练时对训练集做了顺时第 2 期陈立潮，等：基于部件关注 DenseNet 的细粒度车型识别 ·405·

·406· 智能系统学报第17卷针20°的角度旋转、水平翻转的在线数据增强，原的训练集为20360张，通过数据增强提升模型的图和增强后的图像样例分别如图5所示，扩充后泛化能力，增强网络的鲁棒性。 (a)原图 (b)角度旋转 (c)水平翻转图5数据增强示例 Fig.5 Sample data enhancement diagram 2.2实验细节 {IC-ReLu-Conv;,融合了独立组件，为了验证独立硬件环境：Intel((R)Xeon(R)Silver41l0CP处组件对提出的基于部件关注DenseNet在细粒度理器，内核数32，GeForce GTX1080Ti10GB显车型识别上的影响，对PF-DenseNet控制单一变量卡，单精度浮点数为11.34 TFLOPS,双精度浮点数 IC,在同一训练环境下，观察PF-DenseNet包含IC 为0.33 TFLOPS。软件环境：Ubuntu16操作系统，和不含C时，测试准确率随训练周期变化的情况。 Python3.6程序设计语言，PyTorch深度学习框架。如图6所示为独立组件对模型的影响，初始实验网络训练使用随机梯度下降(stochastic 阶段，两种模型的测试准确率变化基本相同，随 gradient descent,SGD)方法，在lamgeNet预训练权着训练周期不断增加，迭代10次后包含IC的模重上进行微调，每训练一个周期测试一次准确型具有更高的测试准确率，60次迭代后，不含率，批次大小为4，初始学习率(learning rate,Lr) IC的模型测试准确率基本稳定不再上升，而包含为0.001,10个训练周期测试准确率不再上升时， IC的模型依然缓慢上升，分析可知独立组件嵌入 Lr下降为原来的0.1，采用早停策略，50个训练周文中模型后，能够有效提高网络的收敛极限，增期测试准确率没有上升，训练自动结束。模型评加识别准确率。价指标为准确率(accuracy)、查全率(recall)和 F1。准确率公式如式（⑤）所示： accuracy=R (5) 蓝90 式中：T表示测试集中预测正确的样本数；R表示测试集样本总数。 85 包含IC 一不含IC 1TP recall n合R (6) 80L 0 4060 100 式中：TP表示第i类预测正确的样本数；R:表示训练周期/次第i类测试样本总数；n为样本类别数。查全率表图6独立组件对PF-DenseNet的影响示了样本类别的平均准确率。 Fig.6 Impact of individual components on the model 1 TP 2.3.2与普通密集连接网络的对比 precision = n名TP,+FE, (7) 图7给出了车型3种不同姿态下（侧面、正面 F1= 2xrecall x precision 和背面)的3种DenseNet热力图，观察不同密集 (8) recall +precision 连接网络DenseNet20l、DenseNet161和PF- 式中：precision表示查准率；FP,表示预测为第i类 DenseNet的热力图，图7(b)、7(c)分别为DenseN- 的非i类样本数。式(8)中F,是accuracy和recall et201、DenseNet161的热力图，通过训练关注车型的调和平均。的整体特征，无法对鉴别性部件进行有效的关 2.3实验与结果分析注，提出的基于部件关注的密集卷积网络模型能 2.3.1独立组件对实验的影响够关注车辆的车灯、车标等鉴别性部位，如图7() 提出的PF-DenseNet的密集卷积结构采用：所示，图7(d)侧面图中，热力图深红色区域主要

针 20°的角度旋转、水平翻转的在线数据增强，原图和增强后的图像样例分别如图 5 所示，扩充后的训练集为 20 360 张，通过数据增强提升模型的泛化能力，增强网络的鲁棒性。 (a) 原图 (b) 角度旋转 (c) 水平翻转图 5 数据增强示例 Fig. 5 Sample data enhancement diagram 2.2 实验细节硬件环境：Intel(R) Xeon(R) Silver 4 110 CP 处理器，内核数 32，GeForce GTX 1080Ti 10 GB 显卡，单精度浮点数为 11.34TFLOPS，双精度浮点数为 0.33TFLOPS。软件环境：Ubuntu 16 操作系统， Python3.6 程序设计语言，PyTorch 深度学习框架。 F1 实验网络训练使用随机梯度下降 (stochastic gradient descent, SGD) 方法，在 IamgeNet 预训练权重上进行微调，每训练一个周期测试一次准确率，批次大小为 4，初始学习率 (learning rate, Lr) 为 0.001，10 个训练周期测试准确率不再上升时， Lr 下降为原来的 0.1，采用早停策略，50 个训练周期测试准确率没有上升，训练自动结束。模型评价指标为准确率 (accuracy)、查全率 (recall) 和。准确率公式如式 (5) 所示： accuracy = T R (5) 式中： T 表示测试集中预测正确的样本数； R 表示测试集样本总数。 recall = 1 n ∑n i=1 TPi Ri (6) TP i Ri i n 式中：表示第类预测正确的样本数；表示第类测试样本总数；为样本类别数。查全率表示了样本类别的平均准确率。 precision = 1 n ∑n i=1 TPi TPi +FPi (7) F1 = 2×recall×precision recall+precision (8) FPi i i F1 式中：precision 表示查准率；表示预测为第类的非类样本数。式 (8) 中是 accuracy 和 recall 的调和平均。 2.3 实验与结果分析 2.3.1 独立组件对实验的影响提出的 PF-DenseNet 的密集卷积结构采用： {IC-ReLu-Conv}，融合了独立组件，为了验证独立组件对提出的基于部件关注 DenseNet 在细粒度车型识别上的影响，对 PF-DenseNet 控制单一变量 IC，在同一训练环境下，观察 PF-DenseNet 包含 IC 和不含 IC 时，测试准确率随训练周期变化的情况。如图 6 所示为独立组件对模型的影响，初始阶段，两种模型的测试准确率变化基本相同，随着训练周期不断增加，迭代 10 次后包含 IC 的模型具有更高的测试准确率，60 次迭代后，不含 IC 的模型测试准确率基本稳定不再上升，而包含 IC 的模型依然缓慢上升，分析可知独立组件嵌入文中模型后，能够有效提高网络的收敛极限，增加识别准确率。 0 20 40 60 80 100 80 85 90 95 测试准确度/% 训练周期/次不含 IC 包含 IC 图 6 独立组件对 PF-DenseNet 的影响 Fig. 6 Impact of individual components on the model 2.3.2 与普通密集连接网络的对比图 7 给出了车型 3 种不同姿态下 (侧面、正面和背面) 的 3 种 DenseNet 热力图，观察不同密集连接网络 DenseNet201、 DenseNet161 和 PFDenseNet 的热力图，图 7(b)、7(c) 分别为 DenseNet201、DenseNet161 的热力图，通过训练关注车型的整体特征，无法对鉴别性部件进行有效的关注，提出的基于部件关注的密集卷积网络模型能够关注车辆的车灯、车标等鉴别性部位，如图 7(d) 所示，图 7(d) 侧面图中，热力图深红色区域主要 ·406· 智能系统学报第 17 卷

点击进入文档下载页（PDF格式）

共9页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录