当前位置：和泉文库 > 工程 > 浏览文档

面向显微影像的多聚焦多图融合中失焦扩散效应消除方法

多聚焦图像融合是计算机视觉领域中的一个重要分支，旨在使用图像处理技术将同一场景下的聚焦不同目标的多张图像中各自的清晰区域进行融合，最终获得全清晰图像。随着以深度学习为代表的机器学习理论的突破，卷积神经网络被广泛应用于多聚焦图像融合领域，但大多数方法仅关注网络结构的改进，而使用简单的两两串行融合方式，降低了多图融合的效率，并且在融合过程中存在的失焦扩散效应也严重影响了融合结果的质量。针对上述问题，在显微成像分析的应用场景下，提出了一种最大特征图空间频率融合策略，通过在基于无监督学习的卷积神经网络中增加后处理模块，规避了两两串行融合中冗余的特征提取过程，实验证明该策略显著提高了多张图像的多聚焦图像融合效率。并且提出了一种矫正策略，在保证融合效率的情况下可有效缓解失焦扩散效应对融合图像质量的影响。

文件格式：PDF，文件大小：0.99MB，售价：3.24元

文档详细内容（约9页）

工程科学学报 Chinese Journal of Engineering 面向显微影像的多聚焦多图融合中失焦扩散效应消除方法印象马博渊班晓娟黄海友王宇李松岩 Defocus spread effect elimination method in multiple multi-focus image fusion for microscopic images YIN Xiang.MA Bo-yuan,BAN Xiao-juan,HUANG Hai-you,WANG Yu,LI Song-yan 引用本文：印象，马博渊，班晓娟，黄海友，王宇，李松岩.面向显微影像的多聚焦多图融合中失焦扩散效应消除方法工程科学学报， 2021,43(9y:1174-1181.doi:10.13374j.issn2095-9389.2021.01.12.002 YIN Xiang.MA Bo-yuan,BAN Xiao-juan,HUANG Hai-you,WANG Yu,LI Song-yan.Defocus spread effect elimination method in multiple multi-focus image fusion for microscopic images[J].Chinese Journal of Engineering,2021,43(9):1174-1181.doi: 10.13374/i.issn2095-9389.2021.01.12.002 在线阅读View online:https::/doi.org10.13374.issn2095-9389.2021.01.12.002 您可能感兴趣的其他文章 Articles you may be interested in 多模态学习方法综述 A survey of multimodal machine learning 工程科学学报.2020,42(5)：557 https:1doi.org/10.13374.issn2095-9389.2019.03.21.003 复杂环境下一种基于Siam Mask的时空预测移动目标跟踪算法 Design and implementation of multi-feature fusion moving target detection algorithms in a complex environment based on Siam Mask 工程科学学报.2020,423：381 https::/1doi.org/10.13374斩.issn2095-9389.2019.06.06.005 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报.2020.42(11)：1525 https:/1doi.org/10.13374斩.issn2095-9389.2019.12.05.001 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报.2019,41(6)：817 https:/1doi.org10.13374j.issn2095-9389.2019.06.014 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019,41(10)：1229 https:/1doi.org10.13374.issn2095-9389.2019.03.27.002 卷积神经网络在矿区预测中的研究与应用 Research and application of convolutional neural network in mining area prediction 工程科学学报.2020,42(12：1597 https:/doi.org10.13374.issn2095-9389.2020.01.02.001

面向显微影像的多聚焦多图融合中失焦扩散效应消除方法印象马博渊班晓娟黄海友王宇李松岩 Defocus spread effect elimination method in multiple multi-focus image fusion for microscopic images YIN Xiang, MA Bo-yuan, BAN Xiao-juan, HUANG Hai-you, WANG Yu, LI Song-yan 引用本文: 印象, 马博渊, 班晓娟, 黄海友, 王宇, 李松岩. 面向显微影像的多聚焦多图融合中失焦扩散效应消除方法[J]. 工程科学学报, 2021, 43(9): 1174-1181. doi: 10.13374/j.issn2095-9389.2021.01.12.002 YIN Xiang, MA Bo-yuan, BAN Xiao-juan, HUANG Hai-you, WANG Yu, LI Song-yan. Defocus spread effect elimination method in multiple multi-focus image fusion for microscopic images[J]. Chinese Journal of Engineering, 2021, 43(9): 1174-1181. doi: 10.13374/j.issn2095-9389.2021.01.12.002 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2021.01.12.002 您可能感兴趣的其他文章 Articles you may be interested in 多模态学习方法综述 A survey of multimodal machine learning 工程科学学报. 2020, 42(5): 557 https://doi.org/10.13374/j.issn2095-9389.2019.03.21.003 复杂环境下一种基于SiamMask的时空预测移动目标跟踪算法 Design and implementation of multi-feature fusion moving target detection algorithms in a complex environment based on SiamMask 工程科学学报. 2020, 42(3): 381 https://doi.org/10.13374/j.issn2095-9389.2019.06.06.005 基于深度学习的高效火车号识别 Efficient wagon number recognition based on deep learning 工程科学学报. 2020, 42(11): 1525 https://doi.org/10.13374/j.issn2095-9389.2019.12.05.001 基于深度学习的人体低氧状态识别 Recognition of human hypoxic state based on deep learning 工程科学学报. 2019, 41(6): 817 https://doi.org/10.13374/j.issn2095-9389.2019.06.014 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 卷积神经网络在矿区预测中的研究与应用 Research and application of convolutional neural network in mining area prediction 工程科学学报. 2020, 42(12): 1597 https://doi.org/10.13374/j.issn2095-9389.2020.01.02.001

工程科学学报.第43卷.第9期：1174-1181.2021年9月 Chinese Journal of Engineering,Vol.43,No.9:1174-1181,September 2021 https://doi.org/10.13374/j.issn2095-9389.2021.01.12.002;http://cje.ustb.edu.cn 面向显微影像的多聚焦多图融合中失焦扩散效应消除方法印象12,3)，马博渊2,34，班晓娟2,34，黄海友14，)，王宇6四，李松岩刀 1)北京科技大学北京材料基因工程高精尖创新中心，北京1000832)北京科技大学材料领域知识工程北京市重点实验室.北京100083 3)北京科技大学人工智能研究院，北京1000834)北京科技大学顺德研究生院，佛山5283005)北京科技大学新材料技术研究院，北京 1000836)北京理工大学网络空间安全学院，北京1000817)郑州大学医学院临床医学系，郑州450052 ☒通信作者，E-mail:hejohejo@126.com 摘要多聚焦图像融合是计算机视觉领域中的一个重要分支，旨在使用图像处理技术将同一场景下的聚焦不同目标的多张图像中各自的清晰区域进行融合，最终获得全清晰图像.随着以深度学习为代表的机器学习理论的突破，卷积神经网络被广泛应用于多聚焦图像融合领域，但大多数方法仅关注网络结构的改进，而使用简单的两两串行融合方式，降低了多图融合的效率，并且在融合过程中存在的失焦扩散效应也严重影响了融合结果的质量.针对上述问题，在显微成像分析的应用场景下，提出了一种最大特征图空间频率融合策略，通过在基于无监督学习的卷积神经网络中增加后处理模块，规避了两两串行融合中冗余的特征提取过程，实验证明该策略显著提高了多张图像的多聚焦图像融合效率.并且提出了一种矫正策略，在保证融合效率的情况下可有效缓解失焦扩散效应对融合图像质量的影响. 关键词多聚焦图像融合；失焦扩散效应：深度学习：卷积神经网路；多图融合分类号TP391 Defocus spread effect elimination method in multiple multi-focus image fusion for microscopic images YIN Xiang23),MA Bo-yuan 23),BAN Xiao-juan 234),HUANG Hai-you 45),WANG Yu LI Song-yan 1)Beijing Advanced Innovation Center for Materials Genome Engineering.University of Science and Technology Beijing.Beijing 100083,China 2)Beijing Key Laboratory of Knowledge Engineering for Materials Science,University of Science and Technology Beijing,Beijing 00083,China 3)Institute of Artificial Intelligence,University of Science and Technology Beijing,Beijing 100083,China 4)Shunde Graduate School,University of Science and Technology Beijing,Foshan 528300,China 5)Institute for Advanced Materials and Technology,University of Science and Technology Beijing,Beijing 100083,China 6)School of Cyberspace Science and Technology,Beijing Institute of Technology,Beijing 100081,China 7)Clinical Medicine,Zhengzhou University,Zhengzhou 450052,China Corresponding author,E-mail:hejohejo@126.com ABSTRACT For a microscopic imaging scene,an all-in-focus image of the observation object is needed.Because of the limitation of the depth of field of the camera and the typically uneven surface of the observation object,an all-in-focus image is obtained through one shot with relative difficulty.In this case,an alternative method for obtaining the all-in-focus image is usually used,which is to fuse several images focusing on different depths with the help of multi-focus image fusion technology.Multi-focus image fusion is an 收稿日期：2021-01-12 基金项目：海南省财政科技计划资助项目(ZDYF2019009):国家自然科学基金资助项目(6210020684.61873299)：中央高校基本科研业务费资助项目(00007467)：佛山市科技创新专项资金项目(BK21BF002,BK19AE034,BK20AF001)

面向显微影像的多聚焦多图融合中失焦扩散效应消除方法印象1,2,3)，马博渊1,2,3,4)，班晓娟1,2,3,4)，黄海友1,4,5)，王宇6) 苣，李松岩7) 1) 北京科技大学北京材料基因工程高精尖创新中心，北京 100083 2) 北京科技大学材料领域知识工程北京市重点实验室，北京 100083 3) 北京科技大学人工智能研究院，北京 100083 4) 北京科技大学顺德研究生院，佛山 528300 5) 北京科技大学新材料技术研究院，北京 100083 6) 北京理工大学网络空间安全学院，北京 100081 7) 郑州大学医学院临床医学系，郑州 450052 苣通信作者，E-mail：hejohejo@126.com 摘要多聚焦图像融合是计算机视觉领域中的一个重要分支，旨在使用图像处理技术将同一场景下的聚焦不同目标的多张图像中各自的清晰区域进行融合，最终获得全清晰图像. 随着以深度学习为代表的机器学习理论的突破，卷积神经网络被广泛应用于多聚焦图像融合领域，但大多数方法仅关注网络结构的改进，而使用简单的两两串行融合方式，降低了多图融合的效率，并且在融合过程中存在的失焦扩散效应也严重影响了融合结果的质量. 针对上述问题，在显微成像分析的应用场景下，提出了一种最大特征图空间频率融合策略，通过在基于无监督学习的卷积神经网络中增加后处理模块，规避了两两串行融合中冗余的特征提取过程，实验证明该策略显著提高了多张图像的多聚焦图像融合效率. 并且提出了一种矫正策略，在保证融合效率的情况下可有效缓解失焦扩散效应对融合图像质量的影响. 关键词多聚焦图像融合；失焦扩散效应；深度学习；卷积神经网路；多图融合分类号 TP391 Defocus spread effect elimination method in multiple multi-focus image fusion for microscopic images YIN Xiang1,2,3) ，MA Bo-yuan1,2,3,4) ，BAN Xiao-juan1,2,3,4) ，HUANG Hai-you1,4,5) ，WANG Yu6) 苣，LI Song-yan7) 1) Beijing Advanced Innovation Center for Materials Genome Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Beijing Key Laboratory of Knowledge Engineering for Materials Science, University of Science and Technology Beijing, Beijing 100083, China 3) Institute of Artificial Intelligence, University of Science and Technology Beijing, Beijing 100083, China 4) Shunde Graduate School, University of Science and Technology Beijing, Foshan 528300, China 5) Institute for Advanced Materials and Technology, University of Science and Technology Beijing, Beijing 100083, China 6) School of Cyberspace Science and Technology, Beijing Institute of Technology, Beijing 100081, China 7) Clinical Medicine, Zhengzhou University, Zhengzhou 450052, China 苣 Corresponding author, E-mail: hejohejo@126.com ABSTRACT For a microscopic imaging scene, an all-in-focus image of the observation object is needed. Because of the limitation of the depth of field of the camera and the typically uneven surface of the observation object, an all-in-focus image is obtained through one shot with relative difficulty. In this case, an alternative method for obtaining the all-in-focus image is usually used, which is to fuse several images focusing on different depths with the help of multi-focus image fusion technology. Multi-focus image fusion is an 收稿日期: 2021−01−12 基金项目: 海南省财政科技计划资助项目（ZDYF2019009）；国家自然科学基金资助项目（6210020684，61873299）；中央高校基本科研业务费资助项目（00007467）；佛山市科技创新专项资金项目（BK21BF002，BK19AE034，BK20AF001）工程科学学报，第 43 卷，第 9 期：1174−1181，2021 年 9 月 Chinese Journal of Engineering, Vol. 43, No. 9: 1174−1181, September 2021 https://doi.org/10.13374/j.issn2095-9389.2021.01.12.002; http://cje.ustb.edu.cn

印象等：面向显微影像的多聚焦多图融合中失焦扩散效应消除方法 ·1175 important branch in the field of computer vision.It aims to use image processing technology to fuse the clear regions of multiple images, focusing on different objects in the same scene,and finally to obtain an all-in-focus fusion result.With the breakthrough of machine learning theory represented by deep learning,the convolutional neural network is widely adopted in the field of multi-focus image fusion.However,most methods only focus on improving network structure and use the simple one-by-one serial fusion method,which reduces the efficiency of multiple image fusion.In addition,the defocus spread effect in the fusion process,which causes blurred artifacts in the areas near focus map boundaries,can severely affect the quality of fusion results.In the application of microscopic imaging analysis,we proposed a maximum spatial frequency in the feature map(MSFIFM)fusion strategy.By adding a post-processing module in the convolution neural network based on unsupervised learning,the redundant feature extraction process in the one-by-one serial fusion is avoided.Experiments demonstrate that this strategy can significantly improve the efficiency of multi-focus image fusion with multiple images.In addition,we presented a correction strategy that can effectively alleviate the effect of defocus spread on the fusion result under the condition of ensuring the efficiency of the algorithm fusion. KEY WORDS multi-focus image fusion:defocusing diffusion;deep learning;convolutional neural network;multiple image fusion 由于光学镜头自由度的限制，在成像过程中性进展，但是大多数图像融合方法仅针对两张图很难在一个镜头内将深度距离相差很大的物体全像融合任务设计网络结构剧因此在多张图像部聚焦山.因此，通常采用基于图像处理技术的多融合应用中仅能使用两两串行融合策略.并且由聚焦图像融合方法四，将同一场景下聚焦不同目标于失焦扩散效应在自然场景中图像融合应用较为的多张图像中各自的清晰区域进行融合，最终获少见，因此极少有相关工作对该效应带来的融合得全清晰图像) 质量退化现象进行处理随着计算机硬件以及图像处理技术的进步， 1 多聚焦图像融合方法在显微成像分析中多种基于不同理论的多聚焦图像融合方法如雨后的应用春笋般涌现，通常多聚焦图像融合方法可分为三大类：基于变换域的融合方法、基于空间域的融合多聚焦图像融合方法常应用于显微成像场景方法、以及基于深度学习的融合方法下的图像处理与分析任务中，图1所示为集成电基于变换域的融合方法通过多尺度变换理论路的微观多聚焦图像融合任务，由于观测物体表设计清晰度评价标准，如拉普拉斯金字塔、低通面高低不平，需通过调节显微镜焦距，以拍摄多张金字塔)、离散小波变换等.基于空间域的融合图像获得不同目标的聚焦图像，因此需要多聚焦方法使用梯度信息测量清晰度水平，如空间频率)、图像融合方法融合多张图像中各自的清晰区域，导向滤波⑧、多尺度加权梯度网和密集尺度不变特最终获得清晰的显微场景下的融合结果，以便于征变换算子o等研究人员清楚地观测微观结构近年来，随着以深度学习叫为代表的机器学当前，基于深度学习的多聚焦图像融合方法，习理论取得了革命性突破，深度学习方法开始被依托强大的特征表示能力，使其在融合质量和速应用于多聚焦图像融合领域.Lu等首次将卷积神度上超过了以往的传统融合方法，成为多聚焦图经网络(Convolutional neural network,CNN)引入到像融合领域的主流选择吻.但是，在实际应用中依多聚焦图像融合领域中，并提出了一种基于深度然存在多种挑战亟待解决：卷积网络的图像融合方法(CNN-Fuse),通过有监 (1)多张多聚焦图像融合效率低.当前，大多督的深度学习模型识别图像的聚焦区域)Ma等数图像融合方法在模型设计时仅考虑了两张图像提出一种基于挤压-激励与空间频率的无监督融的融合情况，并简单地采用两两串行融合方法融合方法(SESF-Fuse),通过无监督的训练策略获得合多张图像，即当图像数目为N时，需要执行图像的高维空间特征，并依托空间频率方法提取 2(N-1)次特征提取过程，在实际的显微成像分析高维空间特征的梯度表征清晰度，以此进行图像应用中，通常拍摄数十张融合图像，使用简单的两融合]，该方法避免了复杂且繁重的图像标注工两串行融合方法严重降低了多图融合速度作，可方便应用于工程实践 (2)失焦扩散效应严重降低融合质量.在实际尽管基于深度学习的多聚焦图像融合方法在应用中，如果观测目标区域内存在高度/深度差过自然场景中的多聚焦图像融合任务中取得了突破大的凸起或凹陷，这些位置将会由于深度距离超

important branch in the field of computer vision. It aims to use image processing technology to fuse the clear regions of multiple images, focusing on different objects in the same scene, and finally to obtain an all-in-focus fusion result. With the breakthrough of machine learning theory represented by deep learning, the convolutional neural network is widely adopted in the field of multi-focus image fusion. However, most methods only focus on improving network structure and use the simple one-by-one serial fusion method, which reduces the efficiency of multiple image fusion. In addition, the defocus spread effect in the fusion process, which causes blurred artifacts in the areas near focus map boundaries, can severely affect the quality of fusion results. In the application of microscopic imaging analysis, we proposed a maximum spatial frequency in the feature map (MSFIFM) fusion strategy. By adding a post-processing module in the convolution neural network based on unsupervised learning, the redundant feature extraction process in the one-by-one serial fusion is avoided. Experiments demonstrate that this strategy can significantly improve the efficiency of multi-focus image fusion with multiple images. In addition, we presented a correction strategy that can effectively alleviate the effect of defocus spread on the fusion result under the condition of ensuring the efficiency of the algorithm fusion. KEY WORDS multi-focus image fusion；defocusing diffusion；deep learning；convolutional neural network；multiple image fusion 由于光学镜头自由度的限制，在成像过程中很难在一个镜头内将深度距离相差很大的物体全部聚焦[1] . 因此，通常采用基于图像处理技术的多聚焦图像融合方法[2] ，将同一场景下聚焦不同目标的多张图像中各自的清晰区域进行融合，最终获得全清晰图像[3] . 随着计算机硬件以及图像处理技术的进步，多种基于不同理论的多聚焦图像融合方法如雨后春笋般涌现，通常多聚焦图像融合方法可分为三大类：基于变换域的融合方法、基于空间域的融合方法、以及基于深度学习的融合方法. 基于变换域的融合方法通过多尺度变换理论设计清晰度评价标准，如拉普拉斯金字塔[4]、低通金字塔[5]、离散小波变换[6] 等. 基于空间域的融合方法使用梯度信息测量清晰度水平，如空间频率[7]、导向滤波[8]、多尺度加权梯度[9] 和密集尺度不变特征变换算子[10] 等. 近年来，随着以深度学习[11] 为代表的机器学习理论取得了革命性突破，深度学习方法开始被应用于多聚焦图像融合领域. Liu 等首次将卷积神经网络（Convolutional neural network, CNN）引入到多聚焦图像融合领域中，并提出了一种基于深度卷积网络的图像融合方法（CNN−Fuse），通过有监督的深度学习模型识别图像的聚焦区域[12] . Ma 等提出一种基于挤压−激励与空间频率的无监督融合方法（SESF−Fuse），通过无监督的训练策略获得图像的高维空间特征，并依托空间频率方法提取高维空间特征的梯度表征清晰度，以此进行图像融合[13] ，该方法避免了复杂且繁重的图像标注工作，可方便应用于工程实践. 尽管基于深度学习的多聚焦图像融合方法在自然场景中的多聚焦图像融合任务中取得了突破性进展，但是大多数图像融合方法仅针对两张图像融合任务设计网络结构[14−18] ，因此在多张图像融合应用中仅能使用两两串行融合策略. 并且由于失焦扩散效应在自然场景中图像融合应用较为少见，因此极少有相关工作对该效应带来的融合质量退化现象进行处理. 1 多聚焦图像融合方法在显微成像分析中的应用多聚焦图像融合方法常应用于显微成像场景下的图像处理与分析任务中，图 1 所示为集成电路的微观多聚焦图像融合任务，由于观测物体表面高低不平，需通过调节显微镜焦距，以拍摄多张图像获得不同目标的聚焦图像，因此需要多聚焦图像融合方法融合多张图像中各自的清晰区域，最终获得清晰的显微场景下的融合结果，以便于研究人员清楚地观测微观结构. 当前，基于深度学习的多聚焦图像融合方法，依托强大的特征表示能力，使其在融合质量和速度上超过了以往的传统融合方法，成为多聚焦图像融合领域的主流选择[19] . 但是，在实际应用中依然存在多种挑战亟待解决：（1）多张多聚焦图像融合效率低. 当前，大多数图像融合方法在模型设计时仅考虑了两张图像的融合情况，并简单地采用两两串行融合方法融合多张图像，即当图像数目为 N 时，需要执行 2（N−1）次特征提取过程. 在实际的显微成像分析应用中，通常拍摄数十张融合图像，使用简单的两两串行融合方法严重降低了多图融合速度. （2）失焦扩散效应严重降低融合质量. 在实际应用中，如果观测目标区域内存在高度/深度差过大的凸起或凹陷，这些位置将会由于深度距离超印象等：面向显微影像的多聚焦多图融合中失焦扩散效应消除方法 · 1175 ·

.1176 工程科学学报，第43卷，第9期 Multiple multi-focus images Feature extraction feature map, Maximum spatial Fusion result with defocus spread MSFIFM frequency in Rectification strategy Image fusion method Fusion result without defocus spread 图1显微成像场景中多张多聚焦图像融合技术路线（图中红色箭头为失焦扩散效应.融合结果中的黄色虚线框为放大后的局部区域，以方便读者查看) Fig.I Flow chart of multiple multi-focus image fusion in a microscopic imaging scene(The red arrow in the figure shows the defocus spread effect.The yellow dotted line box in the fusion result is the enlarged local area,which is convenient for readers to view) 过成像装置景深，造成在调焦范围内无法聚焦全线框所示部位置，必然在该区域内呈现持续的失焦状态.以 2方法图1中红色箭头所指的深凹情况为例，失焦成像状态下产生前景失焦扩散效应将影响到深凹区域 2.1基于深度学习和最大特征图空间频率的融合的像素值分布，最终在融合结果中的背景深凹区策略域处产生失真的伪影效果20，如图1中的黄色虚在对所有待融合图像进行图像配准后1-四采线框示意.针对上述问题，通常采用基于硬件或软用传统两两串行融合方法融合多张图像时，当待件的解决方法，基于硬件的优化方法主要有以下融合的图像数目为N时，需要执行2(N-1)次特征两种：第一是通过扩大聚焦拍摄区间，即通过拍摄提取过程，而采用本文提出的最大特征图空间频更多的不同焦距的图像，以期找到背景深凹处的率融合策略，仅需要执行N次特征提取过程即可聚焦结果，最终形成清晰的融合结果.这种方法会进行多图融合，因此提高了多张图像融合效率造成拍摄时间的延长、电耗的增加和硬件运作的本文在图像特征提取时使用编码器-解码器磨损，最终降低成像效率甚至降低精密镜头的使结构)，如图2(a)所示.编码器中C1包含了一个用寿命.第二是通过抑制成像中的光强以减弱深 3x3卷积层.DC1、DC2以及DC3为密集链接模凹区域以外物体的失焦扩散效应.这种方法虽然块，分别包含一个3×3的卷积层，同时每个模块的可以减弱失焦扩散效应，但会造成整体上的亮度输出与其他模块跨层级联.SE为挤压-激发模块2，降低，最终导致整体成像质量较差.并且基于硬件可以通过自适应的特征通道维度校准来增强有用的解决方法除上述缺陷外，还存在硬件改造成本的特征.为了保证图像重建的准确性，在编码器与高、技术升级难度大的问题.因此，如何通过基于解码器中并没有加入池化层.解码器中C2、C3、图像处理的软件方法缓解多聚焦图像融合中的失 C4以及C5结构与C1相同，用以重建输入图像焦扩散效应是本领域中研究的难点. 在训练过程中利用文献[13)]中的像素损失以针对以上显微成像场景中多张多聚焦图像融及结构相似性损失同时训练编码器与解码器.像合问题，本文提出如下的相应解决方案：素损失与结构相似性损失为图像融合领域常用的 (1)本文提出一种最大特征图空间频率融合损失函数.像素损失衡量了两张图像的距离，通过策略(Maximum spatial frequency in feature map, 优化像素损失可以使输入输出图像在欧氏空间上 MSFIFM),在基于无监督学习的卷积神经网络中具有更近的距离.结构相似性衡量了两张图像在增加后处理模块，如图1所示，实验证明该策略显亮度、对比度以及结构相关性三个方面的相似程著提高了多张图像的多聚焦图像融合速度度，通过优化结构相似性损失可以降低输出图像 (2)本文提出了一种矫正策略，可缓解失焦扩视觉效果上的失真.当网络训练完成后，在推理时散效应对融合图像质量的影响，如图1中黄色虚仅利用编码器部分实现图像特征提取，并进行多

过成像装置景深，造成在调焦范围内无法聚焦全部位置，必然在该区域内呈现持续的失焦状态. 以图 1 中红色箭头所指的深凹情况为例，失焦成像状态下产生前景失焦扩散效应将影响到深凹区域的像素值分布，最终在融合结果中的背景深凹区域处产生失真的伪影效果[20] ，如图 1 中的黄色虚线框示意. 针对上述问题，通常采用基于硬件或软件的解决方法. 基于硬件的优化方法主要有以下两种：第一是通过扩大聚焦拍摄区间，即通过拍摄更多的不同焦距的图像，以期找到背景深凹处的聚焦结果，最终形成清晰的融合结果. 这种方法会造成拍摄时间的延长、电耗的增加和硬件运作的磨损，最终降低成像效率甚至降低精密镜头的使用寿命. 第二是通过抑制成像中的光强以减弱深凹区域以外物体的失焦扩散效应. 这种方法虽然可以减弱失焦扩散效应，但会造成整体上的亮度降低，最终导致整体成像质量较差. 并且基于硬件的解决方法除上述缺陷外，还存在硬件改造成本高、技术升级难度大的问题. 因此，如何通过基于图像处理的软件方法缓解多聚焦图像融合中的失焦扩散效应是本领域中研究的难点. 针对以上显微成像场景中多张多聚焦图像融合问题，本文提出如下的相应解决方案：（1）本文提出一种最大特征图空间频率融合策略（ Maximum spatial frequency in feature map, MSFIFM），在基于无监督学习的卷积神经网络中增加后处理模块，如图 1 所示，实验证明该策略显著提高了多张图像的多聚焦图像融合速度. （2）本文提出了一种矫正策略，可缓解失焦扩散效应对融合图像质量的影响，如图 1 中黄色虚线框所示. 2 方法 2.1 基于深度学习和最大特征图空间频率的融合策略在对所有待融合图像进行图像配准后[21−22] ，采用传统两两串行融合方法融合多张图像时，当待融合的图像数目为 N 时，需要执行 2（N−1）次特征提取过程，而采用本文提出的最大特征图空间频率融合策略，仅需要执行 N 次特征提取过程即可进行多图融合，因此提高了多张图像融合效率. 本文在图像特征提取时使用编码器−解码器结构[13] ，如图 2（a）所示. 编码器中 C1 包含了一个 3×3 卷积层. DC1、DC2 以及 DC3 为密集链接模块，分别包含一个 3×3 的卷积层，同时每个模块的输出与其他模块跨层级联. SE 为挤压−激发模块[23] ，可以通过自适应的特征通道维度校准来增强有用的特征. 为了保证图像重建的准确性，在编码器与解码器中并没有加入池化层. 解码器中 C2、C3、 C4 以及 C5 结构与 C1 相同，用以重建输入图像. 在训练过程中利用文献 [13] 中的像素损失以及结构相似性损失同时训练编码器与解码器. 像素损失与结构相似性损失为图像融合领域常用的损失函数. 像素损失衡量了两张图像的距离，通过优化像素损失可以使输入输出图像在欧氏空间上具有更近的距离. 结构相似性衡量了两张图像在亮度、对比度以及结构相关性三个方面的相似程度，通过优化结构相似性损失可以降低输出图像视觉效果上的失真. 当网络训练完成后，在推理时仅利用编码器部分实现图像特征提取，并进行多 Multiple multi-focus images Image fusion method Rectification strategy Fusion result with defocus spread Fusion result without defocus spread Maximum spatial frequency in feature map, MSFIFM Feature extraction 图 1 显微成像场景中多张多聚焦图像融合技术路线（图中红色箭头为失焦扩散效应. 融合结果中的黄色虚线框为放大后的局部区域，以方便读者查看） Fig.1 Flow chart of multiple multi-focus image fusion in a microscopic imaging scene (The red arrow in the figure shows the defocus spread effect. The yellow dotted line box in the fusion result is the enlarged local area, which is convenient for readers to view) · 1176 · 工程科学学报，第 43 卷，第 9 期

印象等：面向显微影像的多聚焦多图融合中失焦扩散效应消除方法 .1177 (a) i(b) One by one serial; MSFIFM Legend fusion strategy strategy Encoder Spatial frequency fusion Spatial frequency calculation Channel wise concatenation Channel wise maximum L,=0-L2 LSSIM=1-SSIM(O,/ Image Fusion result 图2本文方法的网络结构和执行流程.()为网络结构：(b)为两种多图融合策路对比（左侧为两两串行融合策略，右侧为最大特征图空间颜率融合策略) Fig.2 Network structure and implementation process of this method:(a)Network structure:(b)two fusion strategies(the left side is the one-by-one serial fusion strategy,and the right side is the MSFIFM strategy) 张图像融合够有效提高多图融合的效率传统的两两串行融合策略的流程如图2(b)左 2.2面向显微成像场景失焦扩散效应的矫正策略侧所示，其中图像特征提取操作以及融合操作会失焦扩散效应具有以下主要特点2o1:(1)当拍因为不同的算法设计而略有差异，以利用编码器摄前景失焦，背景聚焦时会出现失焦扩散效应；进行特征提取操作，并利用空间频率融合1进行 (2)失焦扩散效应往往出现在聚焦边界处，导致前融合操作为例，在融合多张图像时首先选取图像景的伪影侵入背景区域造成边界处背景模糊. 1与图像2作为待融合图像，分别利用编码器提取在进行显微成像场景下多张多聚焦图像融合特征后利用空间频率融合得到融合图像1，然后再任务时，由于观测目标区域内往往会存在高度深将融合图像1与图像3作为待融合图像，分别利用度差过大的凸起或凹陷，这些位置将会由于深度编码器提取特征并利用空间频率融合得到融合图距离超过成像装置景深，造成在调焦范围内无法像2.重复上述步骤直到所有待融合图像都融合完聚焦全部位置，因此必然会出现前景区域持续不毕，得到最终的融合结果图像.这种方式当图像数同程度失焦状态.因此在进行多图融合时不管是目为N时，需要执行2(N-1)次特征提取过程利用两两串行融合策略还是本文提出的最大特征本文提出的最大特征图空间频率融合策略的图空间频率融合策略都会在聚焦边界处出现不同流程图如图2(b)右侧所示.在融合多张图像时首程度的失焦扩散效应，严重影响了融合结果图像先对每张待融合图像分别提取特征并计算特征的的质量空间频率.由于特征的空间频率反映了待融合图由于显微成像场景背景深凹处往往具有较深像的聚焦信息，因此我们先将待融合图像中尺寸的颜色，如图1中红色箭头所示，因此失焦扩散现为(w,h)的特征空间频率图在通道维度拼接得到象在显微成像场景中往往表现为在融合图像中原尺寸为(m,h,n)的拼接图.之后通过获取拼接图通本失焦边界处的深色背景区域中出现较亮的前景道维度n个像素最大值的索引的方式得到最终的伪影，如图1中放大区域所示.针对这个特点本文尺寸为(，)的融合决策图，融合决策图中不同位提出了一种矫正策略，能够有效去除显微成像场置像素值代表了待融合图像中不同位置聚焦程度景下的失焦扩散效应最高的图像编号，最后利用融合决策图对待融合本文提出的面向显微成像场景失焦扩散效应图像进行加权求和，得到融合图像.这种方式当图的矫正策略流程如图3所示.首先利用待融合图像数目为N时，仅需要执行N次特征提取过程，能像的特征空间频率图(Spatial frequency of feature)

张图像融合. 传统的两两串行融合策略的流程如图 2（b）左侧所示，其中图像特征提取操作以及融合操作会因为不同的算法设计而略有差异. 以利用编码器进行特征提取操作，并利用空间频率融合[13] 进行融合操作为例，在融合多张图像时首先选取图像 1 与图像 2 作为待融合图像，分别利用编码器提取特征后利用空间频率融合得到融合图像 1，然后再将融合图像 1 与图像 3 作为待融合图像，分别利用编码器提取特征并利用空间频率融合得到融合图像 2. 重复上述步骤直到所有待融合图像都融合完毕，得到最终的融合结果图像. 这种方式当图像数目为 N 时，需要执行 2（N−1）次特征提取过程. 本文提出的最大特征图空间频率融合策略的流程图如图 2（b）右侧所示. 在融合多张图像时首先对每张待融合图像分别提取特征并计算特征的空间频率. 由于特征的空间频率反映了待融合图像的聚焦信息，因此我们先将待融合图像中尺寸为 (w,h) 的特征空间频率图在通道维度拼接得到尺寸为 (w,h,n) 的拼接图. 之后通过获取拼接图通道维度 n 个像素最大值的索引的方式得到最终的尺寸为 (w,h) 的融合决策图，融合决策图中不同位置像素值代表了待融合图像中不同位置聚焦程度最高的图像编号. 最后利用融合决策图对待融合图像进行加权求和，得到融合图像. 这种方式当图像数目为 N 时，仅需要执行 N 次特征提取过程，能够有效提高多图融合的效率. 2.2 面向显微成像场景失焦扩散效应的矫正策略失焦扩散效应具有以下主要特点[20] ：（1）当拍摄前景失焦，背景聚焦时会出现失焦扩散效应；（2）失焦扩散效应往往出现在聚焦边界处，导致前景的伪影侵入背景区域造成边界处背景模糊. 在进行显微成像场景下多张多聚焦图像融合任务时，由于观测目标区域内往往会存在高度/深度差过大的凸起或凹陷，这些位置将会由于深度距离超过成像装置景深，造成在调焦范围内无法聚焦全部位置，因此必然会出现前景区域持续不同程度失焦状态. 因此在进行多图融合时不管是利用两两串行融合策略还是本文提出的最大特征图空间频率融合策略都会在聚焦边界处出现不同程度的失焦扩散效应，严重影响了融合结果图像的质量. 由于显微成像场景背景深凹处往往具有较深的颜色，如图 1 中红色箭头所示，因此失焦扩散现象在显微成像场景中往往表现为在融合图像中原本失焦边界处的深色背景区域中出现较亮的前景伪影，如图 1 中放大区域所示. 针对这个特点本文提出了一种矫正策略，能够有效去除显微成像场景下的失焦扩散效应. 本文提出的面向显微成像场景失焦扩散效应的矫正策略流程如图 3 所示. 首先利用待融合图像的特征空间频率图（Spatial frequency of feature） (a) (b) L=λLSSIM+Lp LSSIM=1−SSIM(O, I) Lp=||O−I||2 Input Output Encoder SEDense Block Decoder Image 1 Image 2 Image 3 Image N Fusion result SE SE SE SE C1 3×3×1×16 DC1 3×3×16×16 DC2 3×3×32×16 DC3 3×3×48×16 C2 3×3×64×64 C3 3×3×64×32 C4 3×3×32×16 C5 3×3×16×1 One by one serial fusion strategy MSFIFM strategy Legend Channel wise concatenation Channel wise maximum Encoder Spatial frequency fusion Spatial frequency calculation 图 2 本文方法的网络结构和执行流程. （a）为网络结构；（b）为两种多图融合策略对比（左侧为两两串行融合策略，右侧为最大特征图空间频率融合策略） Fig.2 Network structure and implementation process of this method: (a) Network structure; (b) two fusion strategies (the left side is the one-by-one serial fusion strategy, and the right side is the MSFIFM strategy) 印象等：面向显微影像的多聚焦多图融合中失焦扩散效应消除方法 · 1177 ·

点击进入文档下载页（PDF格式）

共9页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录