第15卷第3期 智能系统学报 Vol.15 No.3 2020年5月 CAAI Transactions on Intelligent Systems May 2020 D0L:10.11992tis.202004026 海底声呐图像智能底质分类技术研究综述 赵玉新,赵廷 (哈尔滨工程大学自动化学院,黑龙江哈尔滨150001) 摘要:海底声呐图像底质分类技术是指利用多波束、侧扫声呐等设备获取海底图像进行浅表层地质属性信息 的反演和预测。综合运用水声学、图像处理以及机器学习的相关理论,声学海底底质分类技术能够快速、淮确 地识别海底底质类型。通过回顾国内外发展历程,对利用声学图像进行海底底质分类的关键技术进行了总结, 从声学海底底质分类的关系模型、海底声呐图像的特征表达和分类模型构建三个方面介绍了领域内的研究进 展和主要方法,重点分析了不同模型和方法的原理、技术特点和适用场合,并结合卷积神经网络对深度学习方 法在海底底质分类中的应用进行了讨论。最后,对海底声呐图像底质分类技术的研究方向和发展趋势进行了 归纳和展望。 关键词:声学探测:声呐图像:底质类型:特征提取:图像分类:监督学习:无监督学习:深度学习:卷积神经网 络:海底底质分类 中图分类号:TP753文献标志码:A文章编号:1673-4785(2020)03-0587-14 中文引用格式:赵玉新,赵廷.海底声呐图像智能底质分类技术研究综述.智能系统学报,2020,15(3):587-600. 英文引用格式:ZHAO Yuxin,,ZHAO Ting.Survey of the intelligent seabed sediment classification technology based on sonar im- ages[J].CAAI transactions on intelligent systems,2020,15(3):587-600. Survey of the intelligent seabed sediment classification technology based on sonar images ZHAO Yuxin,ZHAO Ting (College of Automation,Harbin Engineering University,Harbin 150001,China) Abstract:Image-based acoustic seabed sediment classification refers to the technology of inversion and prediction of the marine geological attributes of the shallow strata using seabed sonar image obtained using a multi-beam,side-scan sonar.As the multidisciplinary branch of oceanology,this technology is able to quickly identify a sediment type based on the relevant knowledge of underwater acoustics,image processing,and machine learning.Based on the review on the history and development of the technology at home and abroad,this article summarizes the key techniques in the frame- work of seabed sediment classification using sonar image and makes an introduction to the progress in research and main algorithms used in the domain,including the geoacoustic relationship model,the feature expression of the seabed sonar image,and the building of classification model.The emphasis is put on the analysis of the principles,technical features,and applications for various models and algorithms.Deep learning is also discussed for exploring proper ap- plication in the acoustic seabed classification with the case of convolutional neural network.The deep learning al- gorithms are applied on the sonar images and analyzed.Finally,acoustic image-based seabed sediment classification is completed and forecast is done. Keywords:acoustic detection;sonar image;sediment type;feature extraction;image classification;supervized learning; unsupervized learning:deep learning;convolutional neural network;seabed sediment classification 收稿日期:2020-04-24. 随着人类海上活动空间的进一步拓展,海洋 基金项目:国家重点基础研究发展计划(613317):国家自然科 学基金面上项目(41676088). 矿产资源勘探、地球生命系统演化等一系列重要 通信作者:赵廷.E-mail:zhaoting@hrbeu.edu.cn. 的科学问题都对海底科学的发展提出了新的要
DOI: 10.11992/tis.202004026 海底声呐图像智能底质分类技术研究综述 赵玉新,赵廷 (哈尔滨工程大学 自动化学院,黑龙江 哈尔滨 150001) 摘 要:海底声呐图像底质分类技术是指利用多波束、侧扫声呐等设备获取海底图像进行浅表层地质属性信息 的反演和预测。综合运用水声学、图像处理以及机器学习的相关理论,声学海底底质分类技术能够快速、准确 地识别海底底质类型。通过回顾国内外发展历程,对利用声学图像进行海底底质分类的关键技术进行了总结, 从声学海底底质分类的关系模型、海底声呐图像的特征表达和分类模型构建三个方面介绍了领域内的研究进 展和主要方法,重点分析了不同模型和方法的原理、技术特点和适用场合,并结合卷积神经网络对深度学习方 法在海底底质分类中的应用进行了讨论。最后,对海底声呐图像底质分类技术的研究方向和发展趋势进行了 归纳和展望。 关键词:声学探测;声呐图像;底质类型;特征提取;图像分类;监督学习;无监督学习;深度学习;卷积神经网 络;海底底质分类 中图分类号:TP753 文献标志码:A 文章编号:1673−4785(2020)03−0587−14 中文引用格式:赵玉新, 赵廷. 海底声呐图像智能底质分类技术研究综述 [J]. 智能系统学报, 2020, 15(3): 587–600. 英文引用格式:ZHAO Yuxin, ZHAO Ting. Survey of the intelligent seabed sediment classification technology based on sonar images[J]. CAAI transactions on intelligent systems, 2020, 15(3): 587–600. Survey of the intelligent seabed sediment classification technology based on sonar images ZHAO Yuxin,ZHAO Ting (College of Automation, Harbin Engineering University, Harbin 150001, China) Abstract: Image-based acoustic seabed sediment classification refers to the technology of inversion and prediction of the marine geological attributes of the shallow strata using seabed sonar image obtained using a multi-beam, side-scan sonar. As the multidisciplinary branch of oceanology, this technology is able to quickly identify a sediment type based on the relevant knowledge of underwater acoustics, image processing, and machine learning. Based on the review on the history and development of the technology at home and abroad, this article summarizes the key techniques in the framework of seabed sediment classification using sonar image and makes an introduction to the progress in research and main algorithms used in the domain, including the geoacoustic relationship model, the feature expression of the seabed sonar image, and the building of classification model. The emphasis is put on the analysis of the principles, technical features, and applications for various models and algorithms. Deep learning is also discussed for exploring proper application in the acoustic seabed classification with the case of convolutional neural network. The deep learning algorithms are applied on the sonar images and analyzed . Finally, acoustic image-based seabed sediment classification is completed and forecast is done. Keywords: acoustic detection; sonar image; sediment type; feature extraction; image classification; supervized learning; unsupervized learning; deep learning; convolutional neural network; seabed sediment classification 随着人类海上活动空间的进一步拓展,海洋 矿产资源勘探、地球生命系统演化等一系列重要 的科学问题都对海底科学的发展提出了新的要 收稿日期:2020−04−24. 基金项目:国家重点基础研究发展计划 (613317);国家自然科 学基金面上项目 (41676088). 通信作者:赵廷. E-mail:zhaoting@hrbeu.edu.cn. 第 15 卷第 3 期 智 能 系 统 学 报 Vol.15 No.3 2020 年 5 月 CAAI Transactions on Intelligent Systems May 2020
·588· 智能系统学报 第15卷 求,海底科学理论水平与探测技术亟需得到进 海底声反射特性对海底底质类型进行识别成为海 步提升。海底科学的主要研究内容包括海底形 底探测的重要手段。 态、组成、结构、地球物理场及其演化历史、海底 声学海底底质分类以声呐系统获取的反向散 各圈层间及海底与其他海洋圈层之间的相互作用四。 射强度数据为基础,结合机械取样方法获得的真 海底探测的目标则是利用一定的技术手段获取海 实海底底质样品数据,利用多种分类算法建立底 底地质的空间分布特性及其随时间的变化规律, 质类型自动分析模型,进而实现高效、准确的海 是一种基于连续时空系统的模式研究。由于海底 底底质分类。从20世纪60年代起,以Hamilton 圈层中不同的岩层介质在密度、弹性、磁性等方 为代表的国外研究学者首先从海底的力学结构特 面存在差异,通过综合运用声、光、电、磁、重力 性、声传播特性以及海底地声模型等多个角度开 等多种技术手段来观测地球物理场的变化,能够 展了相关研究与测试,奠定了声学海底底质探测 有效地掌握地层的物理特性、内部构造等信息口。 技术的物理学基础-20。此后,国内外研究学者 声波在海水中具有非常优越的传播特性,逐渐成 尝试利用多种方法构建海底反向散射强度与底质 为海底探测的主要技术手段。在现代海底科学研 类型之间的相关性模型,主要研究焦点可以归结 究中,已经发展出多种海底声学探测技术,如海 为海底物理参数反演模型川、海底回波空间分布 洋地震仪、多波束测深仪、侧扫声呐、海底地 关系模型22)、海底回波波形关系模型。 层剖面仪、水下声学定位等m,快速发展的水下 1.1海底物理参数反演模型 声学技术为探测海底浅部剖面乃至深部地层结构 海底底质是具有多重物理属性、特征变化明 发挥了重要的作用。 显的固体层,反映力学结构特性的参量包括孔隙 海底底质是海洋环境的要素之一,主要指海 度、密度、粒径、饱和度等,反映声学特性的参量 底表面的组成物质,包括海底岩石和水动力作用 有声速、声衰减系数、声反射系数、声阻抗等,力 过程中沉积下来的表层沉积物。研究海底底质物 学结构参量与声学结构参量之间具有很强的相关 理特性,探索高效、精确的海底底质分类方法,对 性。Biot等2s-2提出了以流体饱和多孔介质为基 于提升海上活动的环境信息保障能力具有十分重 础的声传播模型,该模型利用分析力学的方法给 要的意义。声学海底底质分类是一种高效的海底 出了流体饱和多孔介质的声波方程,建立了介质 探测技术,涉及海洋地质、海洋测绘、水声学、模 声速、声衰减、频率和孔隙度等参数之间的关 式识别等学科的庞大的知识体系,国内外研究学 系。Hamilton2-2通过研究海底声波在一定频段 者相继提出了许多新颖的算法和研究思路,本文 上的反射和折射特性,构建了水深、沉积层密度 从模式识别的角度出发对现有的声学海底底质识 声速和声衰减系数等参量之间的关系,以海洋沉 别方法进行梳理和归纳,对基于声呐图像的海底 积层弹性和黏弹性模型为基础提出了浅海和深海 底质分类技术的未来发展趋势进行分析和展望。 地声模型。Jackson等Bo提出的高频海底散射模 型中将反向散射强度的计算归结为粗糙界面散射 1声学海底底质探测技术 和沉积物体积散射两部分,为海底反向散射的物 理过程提供了合理精确的描述。经过众多研究学 早期的海底底质探测主要采用直接法8),通 者的发展和完善313,海底物理结构参数与声学 过站点式的机械取样获得底质样本,再经过实验 参数之间的数学关系模型逐步建立。基于该关系 室测定9或原位分析0)确定底质类型。常用的 模型演化出的海底底质分类方法,首先利用单波 取样方法包括重力取样器、冲击式取样器、原位 束和多波束测深仪的回波强度数据反演底质的地 采样器等,普遍存在效率低、成本高、无法在深水 声参数33,如根据回声振幅计算的反射系数3可 区取样、作业点离散等弊端,难以满足现代大面 以及根据多层介质声学理论估计的各层沉积物的 积海洋调查的需求。随着声呐信号处理技术的 声阻抗等,然后依据海底底质物理特性参数的 快速发展,利用声学方法探测海底底质信息展现 分布区间或经验公式推断海底底质类型。以该关 出巨大的潜力和优势,利用多波束、侧扫声呐、浅 系模型为基础的海底底质分类方法的优点是:有 地层剖面等勘测设备不仅可以获取高精度水深测 确定的物理学模型,计算的模型参数具有实际的 量数据,还能采集到海底反向散射强度数据,为 物理意义,分类规则具有可解释性。其缺点是: 精确推断海底地质结构提供了丰富的观测信息3。 地声模型理论复杂,底质物理参数分布和经验计 由于不同类型底质的声吸收系数、反射系数、表 算公式有较强的区域性,声学参量计算存在一定 面粗糙度等参数具有显著差异性,从多角度利用 误差
求,海底科学理论水平与探测技术亟需得到进一 步提升。海底科学的主要研究内容包括海底形 态、组成、结构、地球物理场及其演化历史、海底 各圈层间及海底与其他海洋圈层之间的相互作用[1]。 海底探测的目标则是利用一定的技术手段获取海 底地质的空间分布特性及其随时间的变化规律, 是一种基于连续时空系统的模式研究。由于海底 圈层中不同的岩层介质在密度、弹性、磁性等方 面存在差异,通过综合运用声、光、电、磁、重力 等多种技术手段来观测地球物理场的变化,能够 有效地掌握地层的物理特性、内部构造等信息[2]。 声波在海水中具有非常优越的传播特性,逐渐成 为海底探测的主要技术手段。在现代海底科学研 究中,已经发展出多种海底声学探测技术,如海 洋地震仪[3] 、多波束测深仪[4] 、侧扫声呐[5] 、海底地 层剖面仪[6] 、水下声学定位等[7] ,快速发展的水下 声学技术为探测海底浅部剖面乃至深部地层结构 发挥了重要的作用。 海底底质是海洋环境的要素之一,主要指海 底表面的组成物质,包括海底岩石和水动力作用 过程中沉积下来的表层沉积物。研究海底底质物 理特性,探索高效、精确的海底底质分类方法,对 于提升海上活动的环境信息保障能力具有十分重 要的意义。声学海底底质分类是一种高效的海底 探测技术,涉及海洋地质、海洋测绘、水声学、模 式识别等学科的庞大的知识体系,国内外研究学 者相继提出了许多新颖的算法和研究思路,本文 从模式识别的角度出发对现有的声学海底底质识 别方法进行梳理和归纳,对基于声呐图像的海底 底质分类技术的未来发展趋势进行分析和展望。 1 声学海底底质探测技术 早期的海底底质探测主要采用直接法[8] ,通 过站点式的机械取样获得底质样本,再经过实验 室测定[9] 或原位分析[10-11] 确定底质类型。常用的 取样方法包括重力取样器、冲击式取样器、原位 采样器等,普遍存在效率低、成本高、无法在深水 区取样、作业点离散等弊端,难以满足现代大面 积海洋调查的需求[12]。随着声呐信号处理技术的 快速发展,利用声学方法探测海底底质信息展现 出巨大的潜力和优势,利用多波束、侧扫声呐、浅 地层剖面等勘测设备不仅可以获取高精度水深测 量数据,还能采集到海底反向散射强度数据,为 精确推断海底地质结构提供了丰富的观测信息[13-16]。 由于不同类型底质的声吸收系数、反射系数、表 面粗糙度等参数具有显著差异性,从多角度利用 海底声反射特性对海底底质类型进行识别成为海 底探测的重要手段。 声学海底底质分类以声呐系统获取的反向散 射强度数据为基础,结合机械取样方法获得的真 实海底底质样品数据,利用多种分类算法建立底 质类型自动分析模型,进而实现高效、准确的海 底底质分类。从 20 世纪 60 年代起,以 Hamilton 为代表的国外研究学者首先从海底的力学结构特 性、声传播特性以及海底地声模型等多个角度开 展了相关研究与测试,奠定了声学海底底质探测 技术的物理学基础[17-20]。此后,国内外研究学者 尝试利用多种方法构建海底反向散射强度与底质 类型之间的相关性模型,主要研究焦点可以归结 为海底物理参数反演模型[21] 、海底回波空间分布 关系模型[22-23] 、海底回波波形关系模型[24]。 1.1 海底物理参数反演模型 海底底质是具有多重物理属性、特征变化明 显的固体层,反映力学结构特性的参量包括孔隙 度、密度、粒径、饱和度等,反映声学特性的参量 有声速、声衰减系数、声反射系数、声阻抗等,力 学结构参量与声学结构参量之间具有很强的相关 性。Biot 等 [25-26] 提出了以流体饱和多孔介质为基 础的声传播模型,该模型利用分析力学的方法给 出了流体饱和多孔介质的声波方程,建立了介质 声速、声衰减、频率和孔隙度等参数之间的关 系。Hamilton[27-29] 通过研究海底声波在一定频段 上的反射和折射特性,构建了水深、沉积层密度、 声速和声衰减系数等参量之间的关系,以海洋沉 积层弹性和黏弹性模型为基础提出了浅海和深海 地声模型。Jackson 等 [30] 提出的高频海底散射模 型中将反向散射强度的计算归结为粗糙界面散射 和沉积物体积散射两部分,为海底反向散射的物 理过程提供了合理精确的描述。经过众多研究学 者的发展和完善[31-32] ,海底物理结构参数与声学 参数之间的数学关系模型逐步建立。基于该关系 模型演化出的海底底质分类方法,首先利用单波 束和多波束测深仪的回波强度数据反演底质的地 声参数[33-36] ,如根据回声振幅计算的反射系数[37] 以及根据多层介质声学理论估计的各层沉积物的 声阻抗[38] 等,然后依据海底底质物理特性参数的 分布区间或经验公式推断海底底质类型。以该关 系模型为基础的海底底质分类方法的优点是:有 确定的物理学模型,计算的模型参数具有实际的 物理意义,分类规则具有可解释性。其缺点是: 地声模型理论复杂,底质物理参数分布和经验计 算公式有较强的区域性,声学参量计算存在一定 误差。 ·588· 智 能 系 统 学 报 第 15 卷
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·589· 1.2海底回波空间分布关系模型 提出的方法可以归纳为三大类:空间域方法、频 海底回波空间分布特征以多波束和侧扫声呐 率域方法以及其他变换域方法。 为主要探测设备,通过综合分析一定空间范围内 2.1空间域特征 的反向散射强度特征,判断海底底质的类型和表 空间域特征是指基于声呐图像灰度空间分布 层结构。Clarke等B.o提出利用反向散射强度随 特性的统计量。海底声呐图像的灰度变化在局部 波束入射角的变化曲线进行海底底质分类,实验 区域内具有不规则性,而在整体上又呈现出一定 证实不同类型的海底底质角度响应曲线的形状、 的规律性,这使图像中的不同区域可以依据概率 方差和幅值特征具有区分性,该方法在多波束底 统计特征和纹理特征进行识别,兼顾图像的宏观 质识别研究中受到广泛关注。Pace等山提出了 和微观结构特征6。 基于侧扫声呐图像纹理特征的海底沉积学类型自 2.1.1概率统计特征 动识别方法,初步验证了图像法在海底地质特征 声呐系统将接收到的回波强度转换为图像灰 分析中的有效性。此后,基于声呐图像的海底表 度,由于海底底质的反射系数有所差异,不同底 层地质属性识别技术迅速发展,谱特征)、灰度 质的声呐图像会呈现出一定的明暗变化。通常情 共生矩阵4)、参数化反射概率密度模型、神经 况下,声波反射能力强的底质类型回波强度值 网络及其优化模型、支持向量机、决策树6个 大,区域呈现亮色,声波吸收能力强的底质类型 等方法被应用在海底声呐图像识别中,显著提升 回波强度值小,区域呈现阴影区。为了表示海底 了海底底质识别的效率和准确度。 图像灰度值的平均水平和起伏情况,选取均值、 1.3海底回波波形关系模型 标准差、偏度、峰度、分位数描述海底声阻抗和界 海底回波波形特征以单波束测深仪和浅地层 面粗糙度变化s。假设样本图像1(x,y)的分辨率 剖面仪为主要的探测设备,声波到达海底后受硬 为N,×Ne,则各项统计量计算如下: 度、粗糙度、声阻抗等因素的影响,经过反射和散 1)均值。不同底质类型会形成起伏变化的反 射回到换能器,回波信号的振幅和相位发生变 向散射强度分布,可利用灰度均值表征底质对声 化,不同类型底质的回波呈现出独有特征。通过 波反射特性的平均水平: 分析入射海底的声脉冲信号的幅值、波形特征, 1 推断海底底质的类型和结构特性7。孟金生等s0 μ=1 N. 扫1扫1 提出利用高频正入射声脉冲估测海底表层沉积物 2)标准差。受海底起伏和表面粗糙度不均匀 的声衰减系数,从回波包络的形状提取声波传播 衰减的指数因子。Prager等s利用回声测深仪回 的影响,海底底质图像呈现出明暗变化,灰度值 标准差反映了反向散射强度相对平均值的总离 波的形状信息,提取直方图统计特征、能量特征、 散度: 谱特征和小波系数特征共166维的全特征向量, 利用主成分分析法对特征进行融合,在海试中验 证了该类方法的有效性。万宏俊2将多波束声 呐信号时域波形进行EMD分解,得到了信号瞬 NN 时频率分布图,并提取希尔伯特边际谱特征进行 3)偏度与峰度。偏度(s)是图像灰度分布偏 海底底质分类。 斜方向和程度的度量,用于表征概率密度曲线相 对于平均值不对称程度。峰度(k)表征了数据概 2海底声呐图像特征提取方法 率密度分布曲线在平均值处峰值高低的特性,描 述了分布形态的陡缓程度。 对海底反向散射强度数据按照地理位置信息 进行处理和拼接,可以得到海底的声呐图像,进 N,Ne (1(i,)-) 而以更加直观的形式对海底反向散射数据的空间 i=l l 特性进行分析。海洋环境噪声随机性强,水声信 NNσ3 道受到诸多时变和空变因素的影响,目标边界或 结构有较大的不规则性,仅利用单一的特征值难 i.- l 以准确地描述海底观测数据的特征,因此在水声 k= NN 图像识别中特征提取成为最为关键的技术。目 4)分位数。对海底底质图像灰度值分布函 前针对海底图像的特征提取问题,相关研究学者 数,采用四分位数作为分类特征量,包括第一四
1.2 海底回波空间分布关系模型 海底回波空间分布特征以多波束和侧扫声呐 为主要探测设备,通过综合分析一定空间范围内 的反向散射强度特征,判断海底底质的类型和表 层结构。Clarke 等 [39-40] 提出利用反向散射强度随 波束入射角的变化曲线进行海底底质分类,实验 证实不同类型的海底底质角度响应曲线的形状、 方差和幅值特征具有区分性,该方法在多波束底 质识别研究中受到广泛关注。Pace 等 [41] 提出了 基于侧扫声呐图像纹理特征的海底沉积学类型自 动识别方法,初步验证了图像法在海底地质特征 分析中的有效性。此后,基于声呐图像的海底表 层地质属性识别技术迅速发展,谱特征 [42] 、灰度 共生矩阵[43] 、参数化反射概率密度模型[44] 、神经 网络及其优化模型[44] 、支持向量机[45] 、决策树[46] 等方法被应用在海底声呐图像识别中,显著提升 了海底底质识别的效率和准确度。 1.3 海底回波波形关系模型 海底回波波形特征以单波束测深仪和浅地层 剖面仪为主要的探测设备,声波到达海底后受硬 度、粗糙度、声阻抗等因素的影响,经过反射和散 射回到换能器,回波信号的振幅和相位发生变 化,不同类型底质的回波呈现出独有特征。通过 分析入射海底的声脉冲信号的幅值、波形特征, 推断海底底质的类型和结构特性[47]。孟金生等[48-50] 提出利用高频正入射声脉冲估测海底表层沉积物 的声衰减系数,从回波包络的形状提取声波传播 衰减的指数因子。Prager 等 [51] 利用回声测深仪回 波的形状信息,提取直方图统计特征、能量特征、 谱特征和小波系数特征共 166 维的全特征向量, 利用主成分分析法对特征进行融合,在海试中验 证了该类方法的有效性。万宏俊[52] 将多波束声 呐信号时域波形进行 EMD 分解,得到了信号瞬 时频率分布图,并提取希尔伯特边际谱特征进行 海底底质分类。 2 海底声呐图像特征提取方法 对海底反向散射强度数据按照地理位置信息 进行处理和拼接,可以得到海底的声呐图像,进 而以更加直观的形式对海底反向散射数据的空间 特性进行分析。海洋环境噪声随机性强,水声信 道受到诸多时变和空变因素的影响,目标边界或 结构有较大的不规则性,仅利用单一的特征值难 以准确地描述海底观测数据的特征,因此在水声 图像识别中特征提取成为最为关键的技术[53]。目 前针对海底图像的特征提取问题,相关研究学者 提出的方法可以归纳为三大类:空间域方法、频 率域方法以及其他变换域方法。 2.1 空间域特征 空间域特征是指基于声呐图像灰度空间分布 特性的统计量。海底声呐图像的灰度变化在局部 区域内具有不规则性,而在整体上又呈现出一定 的规律性,这使图像中的不同区域可以依据概率 统计特征和纹理特征进行识别,兼顾图像的宏观 和微观结构特征[54]。 2.1.1 概率统计特征 I(x, y) Nr ×Nc 声呐系统将接收到的回波强度转换为图像灰 度,由于海底底质的反射系数有所差异,不同底 质的声呐图像会呈现出一定的明暗变化。通常情 况下,声波反射能力强的底质类型回波强度值 大,区域呈现亮色,声波吸收能力强的底质类型 回波强度值小,区域呈现阴影区。为了表示海底 图像灰度值的平均水平和起伏情况,选取均值、 标准差、偏度、峰度、分位数描述海底声阻抗和界 面粗糙度变化[55]。假设样本图像 的分辨率 为 ,则各项统计量计算如下: 1) 均值。不同底质类型会形成起伏变化的反 向散射强度分布,可利用灰度均值表征底质对声 波反射特性的平均水平: µ = 1 NrNc ∑Nr i=1 ∑Nc j=1 I(i, j) 2) 标准差。受海底起伏和表面粗糙度不均匀 的影响,海底底质图像呈现出明暗变化,灰度值 标准差反映了反向散射强度相对平均值的总离 散度: σ = vuuuuuut ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 2 NrNc s k 3) 偏度与峰度。偏度 ( ) 是图像灰度分布偏 斜方向和程度的度量,用于表征概率密度曲线相 对于平均值不对称程度。峰度 ( ) 表征了数据概 率密度分布曲线在平均值处峰值高低的特性,描 述了分布形态的陡缓程度。 s = ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 3 NrNcσ3 k = ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 4 NrNcσ4 4) 分位数。对海底底质图像灰度值分布函 数,采用四分位数作为分类特征量,包括第一四 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·589·
·590· 智能系统学报 第15卷 分位数、中位数、第三四分位数。 D=lgN, Ig(1/r) (1) 2.1.2灰度共生矩阵 灰度共生矩阵是建立在图像二阶联合条件概 利用式(1)定义的分形维数可以通过多种方 率密度函数基础上的一种重要的纹理分析方法, 法进行计算,常用的方法有Peleg法、微分盒计数 通过统计图像中在特定距离和倾角上具有指定灰 法、标准差盒计数法等。 度级的像素对的数目或者概率,揭示图像灰度关 2.2频率域特征 于方向、相邻间隔、变化幅度等的综合信息,是底 频率域特征是指通过傅里叶变换等方式将声 质分类中使用最多的声呐图像特征。 呐图像在频域进行分解,获取图像在频率域的表 首先在底质图像中选取一个窗口,给定方向 示系数或其统计量作为图像特征。 角6和距离d,在方向角为0的直线上有一个像 2.2.1谱特征 素点的灰度值为i,若存在另一个与其相距d的 谱特征是图像处理与分析领域的重要工具, 像素点的灰度值为,则这样的灰度对同时出现 也是较早引入声呐图像底质分类中的特征提取方 的频数即为灰度共生矩阵P(i,,d,)的第(i,)个 法,最具代表性的是功率谱特征和倒频谱特征。 阵元的数值,0通常取0°、45°、90°、135°。 功率谱描述了信号功率在频域的分布状况。 在生成灰度共生矩阵的基础上,可以计算多 声呐接收信号是时间的准谐随机函数,每ping回 个特征统计量,选择其中不相关的统计量进行底 波划分为个等距窗口,将声呐回波强度表示为 质图像特征的表示,其中包括角二阶距(ASM)、 时间窗口函数w(t)和区间信号幅值a:(t)的乘积: 对比度(CON)、相关性(COR)和逆差矩(DM, g;(t)=w(t)a;(t) 计算如下: 对窗口信号幅值进行傅里叶变换并取模的平 方,则第i个窗口区间的功率谱为 ASM= Pi,id, P(ω)=Fg()川 扫1归1 对n个功率谱在各个频率处取均值得到平均 NG NG CoN=∑∑i-Pi,id,0 功率谱: 1面 COR= 99ixj×Pi,,d,)-44 F()=n>P.(0) l Oj Pm为平均功率谱的最大值,A为常量因子, 声呐图像的对数功率谱可以表示为 IDM= 99Pi,jd,四 台台1+-羽 (AP)+1/(A+1) 其中参数NG表示底质图像的灰度级数,角二阶 Pi(0)-lg Pace等s]将对数功率谱进行标准化并定义 矩反映图像灰度分布的均匀程度以及纹理粗细程 了3个积分函数表示海底底质的图像特征。 度,对比度主要反映图像清晰度与纹理深浅的程 度,相关性是用来衡量元素在灰度共生矩阵的行 倒频谱定义为:信号功率谱对数的傅里叶变 换,在某些声信号处理应用中比功率谱和自相关 或列方向上的相似度,逆差矩反映了图像的局部 函数具有更好的应用效果。对平均功率谱的对数 同质性。 进行傅里叶逆变换并取幅值的模的平方即为图像 2.1.3分形雏 的倒频谱C(r),t为倒频率。 分形几何能够准确刻画自然中广泛存在的、 不规则的自然现象,判断分形几何的一个准则是 C()=logP() 其自相似性。由于粒径、孔隙度等物理特性的差 Reut等21对声呐图像的倒频谱定义了积分 异,各类型底质的声呐图像蕴含了海底起伏和表 函数并引入斜率、截距两个参数表征倒频谱积分 面结构特征,具有统计意义上的自相似性,利用 的特性,以此作为海底底质识别的特征量。谱特 声呐图像的分形维特征可以描述海底底质表面纹 征独立于信号的幅值水平和系统增益,但是对样 理的不规则性和粗糙程度。 本的区分性严重依赖声波脉冲长度和载波频率,其 对于n维欧氏空间中的有界集合F,能够以 分类性能容易受到声呐类型及其工况参数的影响。 尺度因子r分割为N,个独立的子集的联合,每个 2.2.2小波变换 子集与原集合保持自相似性。分形集合通过分形 小波变换是利用小波函数对信号进行多尺度 维数进行特征量化,集合F的分形维数定义为 分解,进而对信号进行时频域局部分析的一种数
分位数、中位数、第三四分位数。 2.1.2 灰度共生矩阵 灰度共生矩阵是建立在图像二阶联合条件概 率密度函数基础上的一种重要的纹理分析方法, 通过统计图像中在特定距离和倾角上具有指定灰 度级的像素对的数目或者概率,揭示图像灰度关 于方向、相邻间隔、变化幅度等的综合信息,是底 质分类中使用最多的声呐图像特征。 θ d θ i d j P(i, j,d, θ) (i, j) θ 首先在底质图像中选取一个窗口,给定方向 角 和距离 ,在方向角为 的直线上有一个像 素点的灰度值为 ,若存在另一个与其相距 的 像素点的灰度值为 ,则这样的灰度对同时出现 的频数即为灰度共生矩阵 的第 个 阵元的数值, 通常取 0°、45°、90°、135°。 在生成灰度共生矩阵的基础上,可以计算多 个特征统计量,选择其中不相关的统计量进行底 质图像特征的表示,其中包括角二阶距 (ASM)、 对比度 (CON)、相关性 (COR) 和逆差矩 (IDM)[56] , 计算如下: ASM = ∑NG i=1 ∑NG j=1 P(i, j,d, θ) 2 CON = ∑NG i=1 ∑NG j=1 (i− j) 2P(i, j,d, θ) COR = ∑NG i=1 ∑NG j=1 i× j× P(i, j,d, θ)−µiµj σiσj IDM = ∑NG i=1 ∑NG j=1 P(i, j,d, θ) 1+(i− j) 2 其中参数 NG 表示底质图像的灰度级数,角二阶 矩反映图像灰度分布的均匀程度以及纹理粗细程 度,对比度主要反映图像清晰度与纹理深浅的程 度,相关性是用来衡量元素在灰度共生矩阵的行 或列方向上的相似度,逆差矩反映了图像的局部 同质性。 2.1.3 分形维 分形几何能够准确刻画自然中广泛存在的、 不规则的自然现象,判断分形几何的一个准则是 其自相似性。由于粒径、孔隙度等物理特性的差 异,各类型底质的声呐图像蕴含了海底起伏和表 面结构特征,具有统计意义上的自相似性,利用 声呐图像的分形维特征可以描述海底底质表面纹 理的不规则性和粗糙程度[57]。 n F r Nr F 对于 维欧氏空间中的有界集合 ,能够以 尺度因子 分割为 个独立的子集的联合,每个 子集与原集合保持自相似性。分形集合通过分形 维数进行特征量化,集合 的分形维数定义为 D = lgNr lg(1/r) (1) 利用式 (1) 定义的分形维数可以通过多种方 法进行计算,常用的方法有 Peleg 法、微分盒计数 法、标准差盒计数法等[58]。 2.2 频率域特征 频率域特征是指通过傅里叶变换等方式将声 呐图像在频域进行分解,获取图像在频率域的表 示系数或其统计量作为图像特征。 2.2.1 谱特征 谱特征是图像处理与分析领域的重要工具, 也是较早引入声呐图像底质分类中的特征提取方 法,最具代表性的是功率谱特征和倒频谱特征。 n w(t) ai(t) 功率谱描述了信号功率在频域的分布状况。 声呐接收信号是时间的准谐随机函数,每 ping 回 波划分为 个等距窗口,将声呐回波强度表示为 时间窗口函数 和区间信号幅值 的乘积: gi(t) = w(t)ai(t) i 对窗口信号幅值进行傅里叶变换并取模的平 方,则第 个窗口区间的功率谱为 Pi(ω) = |F {gi(t)}| 2 对 n 个功率谱在各个频率处取均值得到平均 功率谱: P(ω) = n −1∑n i=1 Pi(ω) Pm 为平均功率谱的最大值, A 为常量因子, 声呐图像的对数功率谱可以表示为 PL(ω) = lg( AP(ω) Pm +1 ) / lg(A+1) Pace 等 [59] 将对数功率谱进行标准化并定义 了 3 个积分函数表示海底底质的图像特征。 C(τ) τ 倒频谱定义为:信号功率谱对数的傅里叶变 换,在某些声信号处理应用中比功率谱和自相关 函数具有更好的应用效果。对平均功率谱的对数 进行傅里叶逆变换并取幅值的模的平方即为图像 的倒频谱 , 为倒频率。 C(τ) = F { logP(ω) } 2 Reut 等 [42] 对声呐图像的倒频谱定义了积分 函数并引入斜率、截距两个参数表征倒频谱积分 的特性,以此作为海底底质识别的特征量。谱特 征独立于信号的幅值水平和系统增益,但是对样 本的区分性严重依赖声波脉冲长度和载波频率,其 分类性能容易受到声呐类型及其工况参数的影响。 2.2.2 小波变换 小波变换是利用小波函数对信号进行多尺度 分解,进而对信号进行时频域局部分析的一种数 ·590· 智 能 系 统 学 报 第 15 卷
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·591· 学工具。图像小波分解处理的实质是分频处理, 波分析的基础上提出的一种非自适应的多尺度分 海底声呐图像中的粗纹理和细纹理空间能量分别 析方法,能够在任意尺度上实现任意方向的分 集中分布在低频段和高频段,因此不同底质类型 解,在捕捉图像轮廓、纹理特征方面具有优越的 的声呐图像在高低频段的能量占比存在着一定 性能。 差异60。 李庆武等I6]提出的基于Contourlet变换的 利用小波变换提取声呐图像特征首先要选取 声呐图像特征提取方法,首先,利用多尺度分 合适的小波基,对声呐图像进行二值图转化,利 解提取边缘奇异点,根据方向信息将相近的奇 用小波分解函数计算图像阈值并对图像进行分 异点汇集成轮廓段;然后,利用拉普拉斯塔式 解;然后获取各层各分解通道系数的均值、标准 滤波器将图像进行多分辨率分解提取奇异点, 差和能量等;计算不同底质不同层次信号能量百 采用二维方向滤波器组将同向的奇异点连接成 分比,归纳能量百分比分布特性,评估获取的各 线,使生成的基结构逼近原图像;最后,分别针 个指标在海底底质分类中的分离性。 对高频子带和低频子带获取不同的统计特征 Hatanaka等6对不同类型底质的纹理特征进 量,对具有显著方向特性的底质类型实现了较 行分析,结果显示底质纹理结构的差异显著体现 好的识别率。 在小波变换的低频分量中。此外,在小波变换基 2.3其他变换域方法 础上建立的曲波变换61、轮廓波变换6刷具有多分 相关研究学者还提出利用其他方法描述海底 辨、多尺度、各向异性等特点,对图像进行不同方 底质特征,如SIFT特征、Weyl变换等64,由于 向的分解时灵活性更强,提取的特征参数也更加 篇幅有限不再详述。 细致。 表1中总结了常用的海底底质分类特征提取 2.2.3 Contourlet变换 方法,在主要思想、特征量、方法、特点等方面进 Contourlet变换是由Donoho和Vetterli在小 行了对比。 表1常用的海底底质特征提取方法对比 Table 1 Various seabed sediment feature extraction methods 方法 主要思想 特征量 尺度 特点 应用范例 利用概率统计的方法表示反向散射均值、标准差 计算简单,性能稳 概率统计 文献66)] 强度的平均水平、波动性、概率分布偏度、峰度 可变尺度定,直观描述海底 文献[67列 的偏斜程度和峰态特性 分位数、直方图 声反射特性 利用二阶联合条件概率密度 计算量大,反映海 角二阶矩、对比度 文献[41] 灰度共生矩阵 表示海底底质分布的均匀程 可变尺度 底声反射的空间分 相关性、逆差矩等 文献68] 度以及纹理粗细程度 布相关性 定量表示海底地形以及海床 表征海底表面的粗 文献I69] 分形维 分形维数 可变尺度 表面粗糙度的分形特性 糙度和复杂度 文献[57刀 表征灰度变化剧烈 将图像的灰度分布变换为图 功率谱频段 程度,一定程度上 文献59 功率谱 多ping 像的频率分布 分量比 反映底质边界特征 文献70] 和混杂程度 分析原频谱上的细微周期成 表征海底粗糙度和 倒频谱积分的 倒频谱 分,能够分离出主声源和传 多ping 硬度,依赖声波脉 文献[42] 斜率和截距 播噪声的频带 冲长度和频率 利用小波函数对图像进行多 分别对图像高、低 小波分解系 文献71川 小波变换 尺度分解,在多个分解层上 可变尺度 频段进行分析,去 数统计量 文献[60] 分析图像时频域特征 噪性能好 非自适应的多尺度分析方法, 高低频子 对边缘、轮廓和方 文献72] Contourlet?变换 能够在任意尺度上实现任意方 可变尺度 带统计量 向特征识别性好 文献63] 向的分解
学工具。图像小波分解处理的实质是分频处理, 海底声呐图像中的粗纹理和细纹理空间能量分别 集中分布在低频段和高频段,因此不同底质类型 的声呐图像在高低频段的能量占比存在着一定 差异[60]。 利用小波变换提取声呐图像特征首先要选取 合适的小波基,对声呐图像进行二值图转化,利 用小波分解函数计算图像阈值并对图像进行分 解;然后获取各层各分解通道系数的均值、标准 差和能量等;计算不同底质不同层次信号能量百 分比,归纳能量百分比分布特性,评估获取的各 个指标在海底底质分类中的分离性。 Hatanaka 等 [61] 对不同类型底质的纹理特征进 行分析,结果显示底质纹理结构的差异显著体现 在小波变换的低频分量中。此外,在小波变换基 础上建立的曲波变换[62] 、轮廓波变换[63] 具有多分 辨、多尺度、各向异性等特点,对图像进行不同方 向的分解时灵活性更强,提取的特征参数也更加 细致。 2.2.3 Contourlet 变换 Contourlet 变换是由 Donoho 和 Vetterli 在小 波分析的基础上提出的一种非自适应的多尺度分 析方法,能够在任意尺度上实现任意方向的分 解,在捕捉图像轮廓、纹理特征方面具有优越的 性能。 李庆武等[63] 提出的基于 Contourlet 变换的 声呐图像特征提取方法,首先,利用多尺度分 解提取边缘奇异点,根据方向信息将相近的奇 异点汇集成轮廓段;然后,利用拉普拉斯塔式 滤波器将图像进行多分辨率分解提取奇异点, 采用二维方向滤波器组将同向的奇异点连接成 线,使生成的基结构逼近原图像;最后,分别针 对高频子带和低频子带获取不同的统计特征 量,对具有显著方向特性的底质类型实现了较 好的识别率。 2.3 其他变换域方法 相关研究学者还提出利用其他方法描述海底 底质特征,如 SIFT 特征、Weyl 变换等[64-65] ,由于 篇幅有限不再详述。 表 1 中总结了常用的海底底质分类特征提取 方法,在主要思想、特征量、方法、特点等方面进 行了对比。 表 1 常用的海底底质特征提取方法对比 Table 1 Various seabed sediment feature extraction methods 方法 主要思想 特征量 尺度 特点 应用范例 概率统计 利用概率统计的方法表示反向散射 强度的平均水平、波动性、概率分布 的偏斜程度和峰态特性 均值、标准差、 偏度、峰度、 分位数、直方图 可变尺度 计算简单,性能稳 定,直观描述海底 声反射特性 文献[66] 文献[67] 灰度共生矩阵 利用二阶联合条件概率密度 表示海底底质分布的均匀程 度以及纹理粗细程度 角二阶矩、对比度、 相关性、逆差矩等 可变尺度 计算量大,反映海 底声反射的空间分 布相关性 文献[41] 文献[68] 分形维 定量表示海底地形以及海床 表面粗糙度的分形特性 分形维数 可变尺度 表征海底表面的粗 糙度和复杂度 文献[69] 文献[57] 功率谱 将图像的灰度分布变换为图 像的频率分布 功率谱频段 分量比 多ping 表征灰度变化剧烈 程度,一定程度上 反映底质边界特征 和混杂程度 文献[59] 文献[70] 倒频谱 分析原频谱上的细微周期成 分,能够分离出主声源和传 播噪声的频带 倒频谱积分的 斜率和截距 多ping 表征海底粗糙度和 硬度,依赖声波脉 冲长度和频率 文献[42] 小波变换 利用小波函数对图像进行多 尺度分解,在多个分解层上 分析图像时频域特征 小波分解系 数统计量 可变尺度 分别对图像高、低 频段进行分析,去 噪性能好 文献[71] 文献[60] Contourlet变换 非自适应的多尺度分析方法, 能够在任意尺度上实现任意方 向的分解 高低频子 带统计量 可变尺度 对边缘、轮廓和方 向特征识别性好 文献[72] 文献[63] 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·591·