工程科学学报 Chinese Journal of Engineering 结合多尺度分割和随机森林的变质矿物提取 唐淑兰孟勇王国强卜涛 Extraction of metamorphic minerals by multiscale segmentation combined with random forest TANG Shu-lan,MENG Yong.WANG Guo-qiang.BU Tao 引用本文: 唐淑兰,孟勇,王国强,卜涛.结合多尺度分割和随机森林的变质矿物提取.工程科学学报,2022,44(2):170-179.doi: 10.13374j.issn2095-9389.2020.09.08.004 TANG Shu-lan,MENG Yong,WANG Guo-qiang,BU Tao.Extraction of metamorphic minerals by multiscale segmentation combined with random forest[J].Chinese Journal of Engineering,2022,44(2):170-179.doi:10.13374/j.issn2095- 9389.2020.09.08.004 在线阅读View online:https::/doi.org10.13374j.issn2095-9389.2020.09.08.004 您可能感兴趣的其他文章 Articles you may be interested in 基于监督学习的前列腺MR/TRUS图像分割和配准方法 Prostate MR/TRUS image segmentation and registration methods based on supervised learning 工程科学学报.2020,42(10:1362htps:/doi.org/10.13374.issn2095-9389.2019.10.10.006 基于改进CV模型的金相图像分割 Segmentation of metallographic images based on improved CV model 工程科学学报.2017,3912:1866htps:1doi.org10.13374.issn2095-9389.2017.12.013 基于自动多种子区域生长的遥感影像面向对象分割方法 Object-oriented remote sensing image segmentation based on automatic multiseed region growing algorithm 工程科学学报.2017,3911):1735 https:/1doi.org10.13374j.issn2095-9389.2017.11.017 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 Grinding process particle size modeling method using robust RVFLN-based ensemble learning 工程科学学报.2019,41(1:67htps:/1doi.org/10.13374.issn2095-9389.2019.01.007 基于周期势系统随机共振的轴承故障诊断 Bearing fault diagnosis by stochastic resonance method in periodical potential system 工程科学学报.2018,40(8:989htps:/oi.org10.13374.issn2095-9389.2018.08.013 陡脉冲干扰下的心电信号滤波及QRS提取 ECG filtering and QRS extraction under steep pulse interference 工程科学学报.2020,42(5):654 https:/1doi.org10.13374.issn2095-9389.2019.06.20.004
结合多尺度分割和随机森林的变质矿物提取 唐淑兰 孟勇 王国强 卜涛 Extraction of metamorphic minerals by multiscale segmentation combined with random forest TANG Shu-lan, MENG Yong, WANG Guo-qiang, BU Tao 引用本文: 唐淑兰, 孟勇, 王国强, 卜涛. 结合多尺度分割和随机森林的变质矿物提取[J]. 工程科学学报, 2022, 44(2): 170-179. doi: 10.13374/j.issn2095-9389.2020.09.08.004 TANG Shu-lan, MENG Yong, WANG Guo-qiang, BU Tao. Extraction of metamorphic minerals by multiscale segmentation combined with random forest[J]. Chinese Journal of Engineering, 2022, 44(2): 170-179. doi: 10.13374/j.issn2095- 9389.2020.09.08.004 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.09.08.004 您可能感兴趣的其他文章 Articles you may be interested in 基于监督学习的前列腺MR/TRUS图像分割和配准方法 Prostate MR/TRUS image segmentation and registration methods based on supervised learning 工程科学学报. 2020, 42(10): 1362 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.006 基于改进CV模型的金相图像分割 Segmentation of metallographic images based on improved CV model 工程科学学报. 2017, 39(12): 1866 https://doi.org/10.13374/j.issn2095-9389.2017.12.013 基于自动多种子区域生长的遥感影像面向对象分割方法 Object-oriented remote sensing image segmentation based on automatic multiseed region growing algorithm 工程科学学报. 2017, 39(11): 1735 https://doi.org/10.13374/j.issn2095-9389.2017.11.017 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 Grinding process particle size modeling method using robust RVFLN-based ensemble learning 工程科学学报. 2019, 41(1): 67 https://doi.org/10.13374/j.issn2095-9389.2019.01.007 基于周期势系统随机共振的轴承故障诊断 Bearing fault diagnosis by stochastic resonance method in periodical potential system 工程科学学报. 2018, 40(8): 989 https://doi.org/10.13374/j.issn2095-9389.2018.08.013 陡脉冲干扰下的心电信号滤波及QRS提取 ECG filtering and QRS extraction under steep pulse interference 工程科学学报. 2020, 42(5): 654 https://doi.org/10.13374/j.issn2095-9389.2019.06.20.004
工程科学学报.第44卷.第2期:170-179.2022年2月 Chinese Journal of Engineering,Vol.44,No.2:170-179,February 2022 https://doi.org/10.13374/j.issn2095-9389.2020.09.08.004;http://cje.ustb.edu.cn 结合多尺度分割和随机森林的变质矿物提取 唐淑兰”,孟勇)四,王国强),卜涛) 1)西安财经大学管理学院,西安7101002)中国地质调查局西安地质调查中心,西安710054 ☒通信作者,E-mail:16392800@qq.com 摘要为提高遥感影像变质矿旷物提取精度,提升变质带的识别效果,以甘肃北山ASTER影像为研究区,结合了比值运算、 多尺度分割、随机森林分类法进行变质矿物提取.首先,通过矿物特征性光谱特征构造比值运算公式、进行影像增强;然后, 对增强影像进行基于光谱及变差函数的多尺度分割:接着,采用随机森林法提取目标矿物:最后,通过野外勒查、采样、薄片 鉴定进行精度评价.结果表明,黑云母、白云母、角闪石在ASTE影像上具有鉴定性特征,提取精度分别为85.4088%、 84.7640%和85.7308%:其他含量较少的变质矿物提取精度可达到60%以上.多尺度分割能充分利用矿物的丛集特征:变差 函数纹理能增强形态特征对矿物的区分能力:随机森林分类法对矿物混合引起的噪声不敏感、提取结果稳定 关键词变差函数;多尺度分割;ASTER;矿物提取;随机森林 分类号 Extraction of metamorphic minerals by multiscale segmentation combined with random forest TANG Shu-lan,MENG Yong,WANG Guo-giang?,BU Tao) 1)School of Management,Xi'an University of Finance and Economics,Xi'an 710100,China 2)Xi'an Center of Geological Survey,China Geological Survey,Xi'an 710054,China Corresponding author,E-mail:16392800@qq.com ABSTRACT The identification of metamorphic minerals is the basis of metamorphic rock research.Extraction of mineral information by remote sensing technology has been widely used.Digital image processing technology is also effectively applied to remote sensing image processing.Results show that the band ratio of remote sensing images can enhance mineral information,while the variogram function can describe the spatial correlation and variability of image pixels and extract more detailed texture information.The metamorphic minerals are found to present a block or strip distribution.The object-oriented remote sensing image information extraction method can avoid the "salt and pepper phenomenon"based on pixel extraction.Meanwhile,the random forest classification method has a fast calculation speed and high parameter accuracy.It is not sensitive to the noise caused by more lithologic components and its classification effect is found to be stable.To improve the extraction accuracy of metamorphic minerals from remote sensing images and further improve the recognition effect of metamorphic zones,this paper combined the ratio operation,multiscale segmentation,and random forest classification to extract metamorphic mineral information from ASTER images in Beishan area in Gansu Province. Initially,the image was enhanced by the ratio formula of the characteristic spectral structure of the target mineral.Multiscale image segmentation was then performed based on the spectrum and variogram.Finally,the accuracy was evaluated by the thin film identification results of the field exploration samples after the extraction of the target mineral by random forest.Results show that biotite, 收稿日期:2020-09-08 基金项目:中国地质调查局资助项目(DD20179403.DD20190364,DD20190812):西安财经大学科学研究扶持计划资助项目(21FCH008): 陕西省自然科学基础研究计划资助项目(2020M-585)
结合多尺度分割和随机森林的变质矿物提取 唐淑兰1),孟 勇2) 苣,王国强2),卜 涛2) 1) 西安财经大学管理学院,西安 710100 2) 中国地质调查局西安地质调查中心,西安 710054 苣通信作者, E-mail:16392800@qq.com 摘 要 为提高遥感影像变质矿物提取精度,提升变质带的识别效果,以甘肃北山 ASTER 影像为研究区,结合了比值运算、 多尺度分割、随机森林分类法进行变质矿物提取. 首先,通过矿物特征性光谱特征构造比值运算公式、进行影像增强;然后, 对增强影像进行基于光谱及变差函数的多尺度分割;接着,采用随机森林法提取目标矿物;最后,通过野外勘查、采样、薄片 鉴定进行精度评价. 结果表明,黑云母、白云母、角闪石在 ASTER 影像上具有鉴定性特征,提取精度分别为 85.4088%、 84.7640% 和 85.7308%;其他含量较少的变质矿物提取精度可达到 60% 以上. 多尺度分割能充分利用矿物的丛集特征;变差 函数纹理能增强形态特征对矿物的区分能力;随机森林分类法对矿物混合引起的噪声不敏感、提取结果稳定. 关键词 变差函数;多尺度分割;ASTER;矿物提取;随机森林 分类号 Extraction of metamorphic minerals by multiscale segmentation combined with random forest TANG Shu-lan1) ,MENG Yong2) 苣 ,WANG Guo-qiang2) ,BU Tao2) 1) School of Management, Xi’an University of Finance and Economics, Xi’an 710100, China 2) Xi’an Center of Geological Survey, China Geological Survey, Xi’an 710054, China 苣 Corresponding author, E-mail: 16392800@qq.com ABSTRACT The identification of metamorphic minerals is the basis of metamorphic rock research. Extraction of mineral information by remote sensing technology has been widely used. Digital image processing technology is also effectively applied to remote sensing image processing. Results show that the band ratio of remote sensing images can enhance mineral information, while the variogram function can describe the spatial correlation and variability of image pixels and extract more detailed texture information. The metamorphic minerals are found to present a block or strip distribution. The object-oriented remote sensing image information extraction method can avoid the “salt and pepper phenomenon” based on pixel extraction. Meanwhile, the random forest classification method has a fast calculation speed and high parameter accuracy. It is not sensitive to the noise caused by more lithologic components and its classification effect is found to be stable. To improve the extraction accuracy of metamorphic minerals from remote sensing images and further improve the recognition effect of metamorphic zones, this paper combined the ratio operation, multiscale segmentation, and random forest classification to extract metamorphic mineral information from ASTER images in Beishan area in Gansu Province. Initially, the image was enhanced by the ratio formula of the characteristic spectral structure of the target mineral. Multiscale image segmentation was then performed based on the spectrum and variogram. Finally, the accuracy was evaluated by the thin film identification results of the field exploration samples after the extraction of the target mineral by random forest. Results show that biotite, 收稿日期: 2020−09−08 基金项目: 中国地质调查局资助项目(DD20179403,DD20190364,DD20190812);西安财经大学科学研究扶持计划资助项目(21FCJH008); 陕西省自然科学基础研究计划资助项目(2020JM-585) 工程科学学报,第 44 卷,第 2 期:170−179,2022 年 2 月 Chinese Journal of Engineering, Vol. 44, No. 2: 170−179, February 2022 https://doi.org/10.13374/j.issn2095-9389.2020.09.08.004; http://cje.ustb.edu.cn
唐淑兰等:结合多尺度分割和随机森林的变质矿物提取 171· muscovite,and amphibole have identification characteristics on the ASTER image with an extraction accuracy of 85.4088%,84.7640%, and 85.7308%,respectively.The extraction accuracy of other metamorphic minerals with less content are found to reach more than 60% Multiscale segmentation can make full use of the clustering features of minerals and the variogram texture can enhance the ability of morphological features to distinguish the minerals.Random forest is not sensitive to noise and the extraction results are observed to be stable. KEY WORDS variogram;multiscale segmentation;ASTER;mineral extraction;random forest 变质矿物的识别是变质岩研究的基础,造山带 本研究旨在提高变质矿物提取精度,为变质带的 中的变质岩是造山带不同演化阶段动力学过程的直 遥感解译提供技术参考 接记录,其中,中-低压变质带的分布是研究造山过 1地质背景 程和地壳演化等地球科学问题的重要参考依据川 遥感技术作为对传统实地调查的补充,已广 研究区(图1)位于甘肃省玉门市地区,大地构 泛应用于矿产勘查和岩性识别中-习一些矿物提 造隶属于北山造山带.出露的主要地层有:晚太古 取方法得到了快速发展:如比值法、主成分分析 界、长城系、蓟县系、石炭系、二叠系、侏罗系、白 (Principal component analysis,PCA)、支持向量机 垩系和第四系,发育有石炭纪和二叠纪中酸性侵 (Support vector machine,SVM)、光谱角(Spectral 入岩.其中,晚太古界主要岩性组合为:(云母)石 angle mapping,SAM)、混合像元分解、随机森林 英片岩、(石榴石、黑云母、白云母)斜长片麻岩、 (Random forest,RF)等W-].同时,图像处理技术也 (石榴石、黑云母)斜长角闪片麻岩、二长片麻岩、 被结合到遥感矿物提取中:如多尺度分割、小波变 斜长变粒岩、钠长绿帘绿泥片岩和大理岩等;长城 换等?0具有较高分辨率的ASTER传感器通过 系主要岩性为:大理岩、石英岩、长石石英岩和绿 14个波段的波谱数据,提供了更加精细的矿物及 泥石石英千枚岩等;蓟县系主要为大理岩,局部见 岩石信息 蛇纹石、透辉石和阳起石化:石炭系和二叠系主要 矿物信息在遥感影像上表现为弱信息,利用 为浅变质碎屑岩,局部可见绿泥石化,石炭系碎屑 反射带和吸收带的比值,可增强各地质信息之间 岩中夹少量灰岩:侏罗系和白垩系主要为未变质 的光谱差异.可根据各矿物的特征性光谱特征,选 的陆源碎屑岩沉积 择合适的ASTER波段进行比值增强.基于高分辨 Q h 率遥感影像的光谱特征提取矿物信息,会出现“椒 盐现象”山:而遥感影像上变质矿物呈现块状或条 带状分布,可使用面向对象思想,通过多尺度分割 得到相似的对象块,利用影像的光谱、形状、大 小、色调、纹理等特征,提高矿物提取精度.为 了使遥感影像矿物提取更加精确,各种非参数监 山ass1 督分类法得到了发展,应用较为广泛的包括神经 网络(Neural network,NN)、SVM和RFll-RF是 ixian system 一个集成分类器,将复杂的分类过程分解为一系 Ar Late Archean 列决策过程(树).由于计算速度快、参数要求少、 对训练数据的统计假设少、对噪声或过拟合的敏 感性较低,RF分类器在遥感信息提取中得到了越 Unconformity Fault 来越多的关注).但是,由于部分矿物的光谱相似 图1研究区地质简图 性、变质矿物与主要造岩矿物的混合性,仅基于光 Fig.I Geological sketch of the study area 谱特征提取变质矿物精度有限. 2数据与方法 本文以ASTER数据为研究对象,利用波段比 值增强各变质矿物的光谱特征;接着,结合光谱特 2.1数据 征和变差函数纹理进行多尺度分割;然后,利用 2.1.1 ASTER数据 RF提取变质矿物:最后,通过野外调查验证精度. ASTER具有14个波段的波谱数据,近红外及可
muscovite, and amphibole have identification characteristics on the ASTER image with an extraction accuracy of 85.4088%, 84.7640%, and 85.7308%, respectively. The extraction accuracy of other metamorphic minerals with less content are found to reach more than 60%. Multiscale segmentation can make full use of the clustering features of minerals and the variogram texture can enhance the ability of morphological features to distinguish the minerals. Random forest is not sensitive to noise and the extraction results are observed to be stable. KEY WORDS variogram;multiscale segmentation;ASTER;mineral extraction;random forest 变质矿物的识别是变质岩研究的基础,造山带 中的变质岩是造山带不同演化阶段动力学过程的直 接记录,其中,中−低压变质带的分布是研究造山过 程和地壳演化等地球科学问题的重要参考依据[1] . 遥感技术作为对传统实地调查的补充,已广 泛应用于矿产勘查和岩性识别中[2−3] . 一些矿物提 取方法得到了快速发展:如比值法、主成分分析 ( Principal component analysis, PCA)、支持向量机 ( Support vector machine, SVM) 、光谱角 ( Spectral angle mapping, SAM)、混合像元分解、随机森林 (Random forest,RF) 等[4−8] . 同时,图像处理技术也 被结合到遥感矿物提取中:如多尺度分割、小波变 换等[9−10] . 具有较高分辨率的 ASTER 传感器通过 14 个波段的波谱数据,提供了更加精细的矿物及 岩石信息. 矿物信息在遥感影像上表现为弱信息,利用 反射带和吸收带的比值,可增强各地质信息之间 的光谱差异. 可根据各矿物的特征性光谱特征,选 择合适的 ASTER 波段进行比值增强. 基于高分辨 率遥感影像的光谱特征提取矿物信息,会出现“椒 盐现象” [11] ;而遥感影像上变质矿物呈现块状或条 带状分布,可使用面向对象思想,通过多尺度分割 得到相似的对象块,利用影像的光谱、形状、大 小、色调、纹理等特征[12] ,提高矿物提取精度. 为 了使遥感影像矿物提取更加精确,各种非参数监 督分类法得到了发展,应用较为广泛的包括神经 网络(Neural network, NN)、SVM 和 RF[13−14] . RF 是 一个集成分类器,将复杂的分类过程分解为一系 列决策过程(树). 由于计算速度快、参数要求少、 对训练数据的统计假设少、对噪声或过拟合的敏 感性较低,RF 分类器在遥感信息提取中得到了越 来越多的关注[15] . 但是,由于部分矿物的光谱相似 性、变质矿物与主要造岩矿物的混合性,仅基于光 谱特征提取变质矿物精度有限. 本文以 ASTER 数据为研究对象,利用波段比 值增强各变质矿物的光谱特征;接着,结合光谱特 征和变差函数纹理进行多尺度分割;然后,利用 RF 提取变质矿物;最后,通过野外调查验证精度. 本研究旨在提高变质矿物提取精度,为变质带的 遥感解译提供技术参考. 1 地质背景 研究区(图 1)位于甘肃省玉门市地区,大地构 造隶属于北山造山带. 出露的主要地层有:晚太古 界、长城系、蓟县系、石炭系、二叠系、侏罗系、白 垩系和第四系. 发育有石炭纪和二叠纪中酸性侵 入岩. 其中,晚太古界主要岩性组合为:(云母)石 英片岩、(石榴石、黑云母、白云母)斜长片麻岩、 (石榴石、黑云母)斜长角闪片麻岩、二长片麻岩、 斜长变粒岩、钠长绿帘绿泥片岩和大理岩等;长城 系主要岩性为:大理岩、石英岩、长石石英岩和绿 泥石石英千枚岩等;蓟县系主要为大理岩,局部见 蛇纹石、透辉石和阳起石化;石炭系和二叠系主要 为浅变质碎屑岩,局部可见绿泥石化,石炭系碎屑 岩中夹少量灰岩;侏罗系和白垩系主要为未变质 的陆源碎屑岩沉积. Cretaccous Quaternary Unconformity Jurassic Permian Carboniferous Jixian system Changcheng system Late Archean Permian granite Carboniferous granite Gcological boundary Fault Q Q Q K J P C Jx Ch Ar Pγ Cγ Q Q Q Ar Ar Ar Ar Ar Pγ Pγ Pγ Cγ Cγ Pγ P P P K Pγ C Ch Ch Ch Ch J J J J Jx 图 1 研究区地质简图 Fig.1 Geological sketch of the study area 2 数据与方法 2.1 数据 2.1.1 ASTER 数据 ASTER 具有 14 个波段的波谱数据,近红外及可 唐淑兰等: 结合多尺度分割和随机森林的变质矿物提取 · 171 ·
.172 工程科学学报,第44卷.第2期 见光3个波段,可提取铁及稀土元素:短波红外6个 波段,可提取含羟基及碳酸盐化蚀变信息:热红外 Biotite 5个波段,可识别石榴石、黑云母及长石等.本文选 择甘肃中盐池地区ASTER数据进行变质矿物提取, 图像为拍摄于2003-8-15日的L1T级数据,图像清 晰,无积雪、植被覆盖,有云覆盖.数据预处理包括串 扰校正、辐射定标、大气定标及去云处理,大气定标 Muscovite 采用FLAASH模块进行,去云处理是鉴于近红外波 段的异常高值即为云覆盖,进行掩膜运算 2.1.2变质矿物光谱特征 Chlorite 研究区需提取的标志性矿物为:黑云母(B)、 白云母(Mus)、角闪石(Am)、绿泥石(Chl)、石榴 石(Gt)、阳起石(Act).根据野外岩石样品光谱测 Actinolite 试数据(图2),获得各变质矿物的吸收谱带与 ASTER波段的对应关系(表I) Amphibole 2.2方法 因矿物具有丛集特征,本文基于面向对象思 想,采用多尺度分割和F分类法提取变质矿物 Garnet 对预处理之后的影像通过比值运算,得到各矿物 增强影像;选取矿物特征,构造分类特征向量;利 6 8 1012 用RF筛选特征并提取矿物;野外采样、薄片鉴定, Wavelength/um 通过鉴定结果对矿物提取结果进行精度评价.技 图2标志性矿物反射率曲线 术流程如图3所示 Fig.2 Reflectance curve of marker minerals 表1矿物的吸收谱带与ASTER波段的对应关系 Table I Correspondence relation between the absorption bands of the minerals and ASTER bands ASTER band Mineral 5 6 8 9 10 11 12 13 Bi Reflex Absorption Reflex Mus Absorption Reflex Absorption Reflex Am Reflex Absorption Reflex Chl Absorption Reflex Absorption Reflex Gt Absorption Reflex Act Reflex Absorption Reflex Crosstalk correction ASTER Feature selection Spectral features Radiometric calibration Texture features Atmospheric calibration Pretreatment Geometric features Cloud removal Band ratio Mineral extraction RF Gray value Variogram function Multiscale segmentation Accuracy evaluation Field verification 图3技术流程 Fig.3 Technical process 2.2.1比值运算 角闪石在波段7、波段9处强反射,而在波段8强 黑云母在8.6m处(波段11)强吸收,8.0m 吸收.绿泥石在波段1和波段8处有较强吸收谷, (波段10)和9.0m处(波段12)强反射.白云母在 在波段5和波段9有强反射、石榴石在热红外 波段1和波段6强吸收,波段5和波段7强反射 9.25m处(波段12)有强吸收,10.21um处(波段
见光 3 个波段,可提取铁及稀土元素;短波红外 6 个 波段,可提取含羟基及碳酸盐化蚀变信息;热红外 5 个波段,可识别石榴石、黑云母及长石等. 本文选 择甘肃中盐池地区 ASTER 数据进行变质矿物提取, 图像为拍摄于 2003-8-15 日的 L1T 级数据,图像清 晰,无积雪、植被覆盖,有云覆盖. 数据预处理包括串 扰校正、辐射定标、大气定标及去云处理,大气定标 采用 FLAASH 模块进行,去云处理是鉴于近红外波 段的异常高值即为云覆盖,进行掩膜运算. 2.1.2 变质矿物光谱特征 研究区需提取的标志性矿物为:黑云母(Bi)、 白云母(Mus)、角闪石(Am)、绿泥石(Chl)、石榴 石(Gt)、阳起石(Act). 根据野外岩石样品光谱测 试数据 ( 图 2) ,获得各变质矿物的吸收谱带 与 ASTER 波段的对应关系(表 1). 2.2 方法 因矿物具有丛集特征,本文基于面向对象思 想,采用多尺度分割和 RF 分类法提取变质矿物. 对预处理之后的影像通过比值运算,得到各矿物 增强影像;选取矿物特征,构造分类特征向量;利 用 RF 筛选特征并提取矿物;野外采样、薄片鉴定, 通过鉴定结果对矿物提取结果进行精度评价. 技 术流程如图 3 所示. Wavelength/μm Garnet Amphibole Actinolite Reflectivity Chlorite Muscovite Biotite 2 4 6 8 10 12 14 图 2 标志性矿物反射率曲线 Fig.2 Reflectance curve of marker minerals 表 1 矿物的吸收谱带与 ASTER 波段的对应关系 Table 1 Correspondence relation between the absorption bands of the minerals and ASTER bands Mineral ASTER band 1 5 6 7 8 9 10 11 12 13 Bi Reflex Absorption Reflex Mus Absorption Reflex Absorption Reflex Am Reflex Absorption Reflex Chl Absorption Reflex Absorption Reflex Gt Absorption Reflex Act Reflex Absorption Reflex Crosstalk correction Radiometric calibration Atmospheric calibration Cloud removal Gray value Variogram function ASTER Pretreatment Band ratio Multiscale segmentation Feature selection Mineral extraction RF Accuracy evaluation Spectral features Texture features Geometric features Field verification 图 3 技术流程 Fig.3 Technical process 2.2.1 比值运算 黑云母在 8.6 μm 处(波段 11)强吸收,8.0 μm (波段 10)和 9.0 μm 处(波段 12)强反射. 白云母在 波段 1 和波段 6 强吸收,波段 5 和波段 7 强反射. 角闪石在波段 7、波段 9 处强反射,而在波段 8 强 吸收. 绿泥石在波段 1 和波段 8 处有较强吸收谷, 在波段 5 和波段 9 有强反射. 石榴石在热红外 9.25 μm 处(波段 12)有强吸收,10.21 μm 处(波段 · 172 · 工程科学学报,第 44 卷,第 2 期
唐淑兰等:结合多尺度分割和随机森林的变质矿物提取 ·173· 13)有强反射.阳起石在2.3m处(波段8)有吸 向像素数(α)的一半,即去掉小数部分保留整数部 收谷,2.2um(波段6)、2.35um(波段9)处有反 分(用a表示).因不规则对象块的各方向变差函 射峰.增强各变质矿物信息的波段比值公式见 数向量维数不同,取各方向不同步长变差函数的 表2,其中b表示ASTER影像第波段的光谱反 累计平均值: 射率 1 lal/2 y(0= (3) 表2各矿物比值公式 aW2台 y0,i) Table 2 Ratio formula of minerals 将各方向变差函数累计平均值顺序连接得到 Bi Mus Am Chl Gt Act 最终纹理特征向量: (b12+b1ob (bs+b)/b6 (b6+b9M(bs+b)(b+bsybs b1/b12 (b6+baVbs T=ty0),y45),y(90°),y(135) (4) 2.2.2多尺度分割 设两个相邻对象块纹理向量分别为a和, 比值法增强的影像有很多伪信息,需进一步 通过卡方距离式(5)来评价两块的相似度,当距离 处理.因矿物信息多呈块状和条带状,面向对象的 小于设定值时合并这两块.其中,k为变差函数向 分析法可利用高分辨率影像相邻像素之间的关系 量的维度,这里=4 面向对象特征提取的基础是影像分割,其目的是 X2(ya,y%)= -)2 (5) 将影像分割成若干均匀的区域,分割性能至关重 台+为) 要.分割算法需指定尺度参数来控制对象的大小, 通过分割指数(Global scare.,GS)选择最优多尺 多尺度策略较单尺度参数更能满足分割的需要 度分割结果,GS指数是衡量对象块内部同质性和 较为有效的方法是从多尺度分割结果中选择全局 块间异质性的参数,该值越小说明分割效果越好 最优尺度,然后改进欠分割和过分割区域,最后结 22.3随机森林(RF) 合最优分割结果与改进后的分割区域.本文先给 RF通过集成多个弱分类器(树),采用平均或投 定一个尺度参数进行过分割,然后使用区域合并 票法得到最终分类结果,精度和泛化能力较高,擅于 细化分割结果,合并的约束条件为变差函数.比值 处理高维数据.具体过程:每颗树采用有放回的抽样 影像为单波段影像.进行初分割时区域合并的依 (Bagging)随机选择原始样本集的子样本集,利用 据为光谱相似性,DX,)为两个相邻区域X和 分类和回归树(Classification and regression trees, Y的平均灰度的欧式距离式(1),n、m分别为X、 CART)算法训练二叉决策树,构建弱分类器,对各分 Y区域的像素总数 类器的分类结果采用多数投票法输出结果.原始样本 D(X,Y)= 集的2/3用于分类,1/3用于验证.RF有2个重要参 n∠- (1) m 数:分类的特征数量和决策树的数量.没有被 计算每一个初分割对象块的变差函数,得到 Bagging采用的数据称为袋外(Out of bag,.OOB)数 变差函数矩阵.变差函数可描述影像像素的空间 据,利用OOB预测结果平均错误率来表征不同特征 的重要性.RF特征数量一般选输人变量总数的平方 相关性和变异性,提取更详细纹理信息,有3个参 数:方向0、步长d、窗口大小d7,可表示为: 根决策树数量的上限一般设置为1000, 根据已有地质资料,以多尺度分割之后的各 N(0d) y0,d)=2N0.d >[FO)-Fi+d) (2) 对象块为单位进行特征选择,共选择特征3类, 9个维度: 式中,0,d)为像元在方向0,步长为d的变差函 (1)光谱特征:各矿物在ASTER影像的光谱 数;N(0,d)为影像在O方向的步长为d的像素对 范围具有特征性光谱特征,选择各对象块的平均 的数量,0取0°、45°、90°、135°4个方向;F0y)和 灰度(Sp)及标准差(De)作为光谱特征. Fy+d山分别为y,和y+d的灰度值.像素灰度值具 (2)纹理特征:选择各对象块的变差函数纹理 有空间自相关性,自相关性随距离增大而变小,所 4个(Val、Va2、Va3、Va4分别代表0°、45°、90°、 以变差函数的步长d不应超过窗口大小a的一半. 135°变差函数纹理). 本文各对象块为不规则形状,不使用传统的a×a (3)几何特征:选择面积特征(Ar)、形状指数 移动窗口,而是以各对象块覆盖范围作为各自的 (Sh)、走向特征(Tr).Ar是指对象块的像素总数 计算窗口.步长d的上限设为不规则对象块各方 (T).对象边缘的平滑性指标即Sh:s=/4vT9,其
bi i 13)有强反射. 阳起石在 2.3 μm 处(波段 8)有吸 收谷 , 2.2 μm (波 段 6)、 2.35 μm (波 段 9) 处有反 射峰. 增强各变质矿物信息的波段比值公式见 表 2,其中 表 示 ASTER 影像第 波段的光谱反 射率. 表 2 各矿物比值公式 Table 2 Ratio formula of minerals Bi Mus Am Chl Gt Act (b12+b10)/b11 (b5+b7 )/b6 (b6+b9 )/(b8+b7 ) (b1+b9 )/b8 b13/b12 (b6+ b9 )/b8 2.2.2 多尺度分割 比值法增强的影像有很多伪信息,需进一步 处理. 因矿物信息多呈块状和条带状,面向对象的 分析法可利用高分辨率影像相邻像素之间的关系[16] . 面向对象特征提取的基础是影像分割,其目的是 将影像分割成若干均匀的区域,分割性能至关重 要. 分割算法需指定尺度参数来控制对象的大小, 多尺度策略较单尺度参数更能满足分割的需要. 较为有效的方法是从多尺度分割结果中选择全局 最优尺度,然后改进欠分割和过分割区域,最后结 合最优分割结果与改进后的分割区域. 本文先给 定一个尺度参数进行过分割,然后使用区域合并 细化分割结果,合并的约束条件为变差函数. 比值 影像为单波段影像. 进行初分割时区域合并的依 据为光谱相似性 , D(X, Y) 为两个相邻区域 X 和 Y 的平均灰度的欧式距离式( 1) , n、m 分别为 X、 Y 区域的像素总数. D(X,Y) = 1 n ∑n i=1 xi − 1 m ∑m j=1 yj (1) 计算每一个初分割对象块的变差函数,得到 变差函数矩阵. 变差函数可描述影像像素的空间 相关性和变异性,提取更详细纹理信息,有 3 个参 数:方向 θ、步长 d、窗口大小 α [17] ,可表示为: γ(θ,d) = 1 2N(θ,d) N ∑ (θ,d) i=1 [ F(yi)− F(yi +d) ]2 (2) 式中, γ(θ,d) 为像元在方向 θ,步长为 d 的变差函 数 ;N(θ,d) 为影像在 θ 方向的步长为 d 的像素对 的数量 , θ 取 0°、 45°、 90°、 135°4 个方向 ; F(yi ) 和 F(yi+d) 分别为 yi 和 yi+d 的灰度值. 像素灰度值具 有空间自相关性,自相关性随距离增大而变小,所 以变差函数的步长 d 不应超过窗口大小 α 的一半. 本文各对象块为不规则形状,不使用传统的 a×a 移动窗口,而是以各对象块覆盖范围作为各自的 计算窗口. 步长 d 的上限设为不规则对象块各方 向像素数(α)的一半,即去掉小数部分保留整数部 分(用|α|表示). 因不规则对象块的各方向变差函 数向量维数不同,取各方向不同步长变差函数的 累计平均值: γ(θ) = 1 |α|/2 | ∑α|/2 i=1 γ(θ,i) (3) 将各方向变差函数累计平均值顺序连接得到 最终纹理特征向量: T = t(γ(0◦ ), γ(45◦ ), γ(90◦ ), γ(135◦ )) (4) 设两个相邻对象块纹理向量分别为 γa 和 γb, 通过卡方距离式(5)来评价两块的相似度,当距离 小于设定值时合并这两块. 其中,k 为变差函数向 量的维度,这里 k=4. χ 2 (γa,γb) = ∑ k i=1 (γ i a −γ i b ) 2 (γ i a +γ i b ) (5) 通过分割指数 ( Global scare, GS)选择最优多尺 度分割结果,GS 指数是衡量对象块内部同质性和 块间异质性的参数,该值越小说明分割效果越好. 2.2.3 随机森林 (RF) RF 通过集成多个弱分类器(树),采用平均或投 票法得到最终分类结果,精度和泛化能力较高,擅于 处理高维数据. 具体过程:每颗树采用有放回的抽样 (Bagging)随机选择原始样本集的子样本集,利用 分 类 和 回 归 树 ( Classification and regression trees, CART) 算法训练二叉决策树,构建弱分类器,对各分 类器的分类结果采用多数投票法输出结果. 原始样本 集的 2/3 用于分类,1/3 用于验证. RF 有 2 个重要参 数 :分类的特征数量和决策树的数量. 没有被 Bagging 采用的数据称为袋外 (Out of bag,OOB) 数 据,利用 OOB 预测结果平均错误率来表征不同特征 的重要性. RF 特征数量一般选输入变量总数的平方 根[18] . 决策树数量的上限一般设置为 1000. 根据已有地质资料,以多尺度分割之后的各 对象块为单位进行特征选择,共选择特征 3 类 , 9 个维度: (1)光谱特征:各矿物在 ASTER 影像的光谱 范围具有特征性光谱特征,选择各对象块的平均 灰度(Sp)及标准差(De)作为光谱特征. (2)纹理特征:选择各对象块的变差函数纹理 4 个 (Va1、Va2、Va3、Va4 分别代表 0°、45°、90°、 135°变差函数纹理). s=l/4 √ T (3)几何特征:选择面积特征(Ar)、形状指数 (Sh)、走向特征(Tr). Ar 是指对象块的像素总数 (T). 对象边缘的平滑性指标即 Sh: [19] ,其 唐淑兰等: 结合多尺度分割和随机森林的变质矿物提取 · 173 ·