工程科学学报 Chinese Journal of Engineering 一维卷积神经网络特征提取下微展能级时序预测 裴艳宇杨小彬传金平吴学松程虹铭吕祥锋 Time series prediction of microseismic energy level based on feature extraction of one-dimensional convolutional neural network PEI Yan-yu,YANG Xiao-bin,CHUAN Jin-ping,WU Xue-song,CHENG Hong-ming,L Xiang-feng 引用本文: 裴艳宇,杨小彬,传金平,吴学松,程虹铭,吕祥锋.一维卷积神经网络特征提取下微震能级时序预测).工程科学学报, 2021,43(7:1003-1009.doi:10.13374.issn2095-9389.2020.11.22.001 PEI Yan-yu,YANG Xiao-bin,CHUAN Jin-ping,WU Xue-song,CHENG Hong-ming,L Xiang-feng.Time series prediction of microseismic energy level based on feature extraction of one-dimensional convolutional neural network[J].Chinese Journal of Engineering,2021,43(7):1003-1009.doi10.13374.issn2095-9389.2020.11.22.001 在线阅读View online::htps/ldoi.org/10.13374/.issn2095-9389.2020.11.22.001 您可能感兴趣的其他文章 Articles you may be interested in 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报.2020.42(10:1372htps:doi.org/10.13374.issn2095-9389.2019.10.10.005 卷积神经网络在矿区预测中的研究与应用 Research and application of convolutional neural network in mining area prediction 工程科学学报.2020.42(12:1597htps:/doi.org/10.13374.issn2095-9389.2020.01.02.001 基于卷积神经网络的反无人机系统声音识别方法 Sound recognition method of an anti-UAV system based on a convolutional neural network 工程科学学报.2020,42(11):1516 https:/doi.org10.13374.issn2095-9389.2020.06.30.008 基于深度卷积神经网络的地磁导航方向适配性分析 Direction-matching-suitability analysis for geomagnetic navigation based on convolutional neural networks 工程科学学报.2017,39(10:1584htps:1doi.org/10.13374.issn2095-9389.2017.10.018 BP神经网络F钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报.2017,394:511htps:/doi.org10.13374.issn2095-9389.2017.04.005 岩爆结构面强度的弱化特征 Strength weakening characteristic of rock burst structural planes 工程科学学报.2018.40(3):269 https:1doi.org/10.13374.issn2095-9389.2018.03.002
一维卷积神经网络特征提取下微震能级时序预测 裴艳宇 杨小彬 传金平 吴学松 程虹铭 吕祥锋 Time series prediction of microseismic energy level based on feature extraction of one-dimensional convolutional neural network PEI Yan-yu, YANG Xiao-bin, CHUAN Jin-ping, WU Xue-song, CHENG Hong-ming, L Xiang-feng 引用本文: 裴艳宇, 杨小彬, 传金平, 吴学松, 程虹铭, 吕祥锋. 一维卷积神经网络特征提取下微震能级时序预测[J]. 工程科学学报, 2021, 43(7): 1003-1009. doi: 10.13374/j.issn2095-9389.2020.11.22.001 PEI Yan-yu, YANG Xiao-bin, CHUAN Jin-ping, WU Xue-song, CHENG Hong-ming, L Xiang-feng. Time series prediction of microseismic energy level based on feature extraction of one-dimensional convolutional neural network[J]. Chinese Journal of Engineering, 2021, 43(7): 1003-1009. doi: 10.13374/j.issn2095-9389.2020.11.22.001 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.11.22.001 您可能感兴趣的其他文章 Articles you may be interested in 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报. 2020, 42(10): 1372 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.005 卷积神经网络在矿区预测中的研究与应用 Research and application of convolutional neural network in mining area prediction 工程科学学报. 2020, 42(12): 1597 https://doi.org/10.13374/j.issn2095-9389.2020.01.02.001 基于卷积神经网络的反无人机系统声音识别方法 Sound recognition method of an anti-UAV system based on a convolutional neural network 工程科学学报. 2020, 42(11): 1516 https://doi.org/10.13374/j.issn2095-9389.2020.06.30.008 基于深度卷积神经网络的地磁导航方向适配性分析 Direction-matching-suitability analysis for geomagnetic navigation based on convolutional neural networks 工程科学学报. 2017, 39(10): 1584 https://doi.org/10.13374/j.issn2095-9389.2017.10.018 BP神经网络IF钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报. 2017, 39(4): 511 https://doi.org/10.13374/j.issn2095-9389.2017.04.005 岩爆结构面强度的弱化特征 Strength weakening characteristic of rock burst structural planes 工程科学学报. 2018, 40(3): 269 https://doi.org/10.13374/j.issn2095-9389.2018.03.002
工程科学学报.第43卷,第7期:1003-1009.2021年7月 Chinese Journal of Engineering,Vol.43,No.7:1003-1009,July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.11.22.001;http://cje.ustb.edu.cn 一维卷积神经网络特征提取下微震能级时序预测 裴艳宇),杨小彬四,传金平2),吴学松2),程虹铭,吕祥锋) 1)中国矿业大学(北京)应急管理与安全工程学院,北京1000832)华亭煤业公司砚北煤矿,华亭7441053)北京科技大学土木与资源工 程学院,北京100083 ☒通信作者,E-mail:yangxiaobin02@126.com 摘要微震能级随时间发生变化,高能级微震事件与冲击地压有良好的对应关系,为预测矿山微震能量时序变化,基于一 维卷积神经网络(Convolutional neural networks.CNN).建立微震能级时间序列预测模型:通过模型训练,实现以前十次微震事 件的能量级别作为输人来预测下一次微震事件的能量级别.由于微震样本数据类间不平衡问题,导致模型测试时将10能量 级别的微震事件全部判断为10能量级别的微震事件,为进一步提高模型对10°能级微震事件预测的准确率,对模型进行改 进并使用混合采样方法训练改进后的模型:利用砚北煤矿250202工作面微震能级实测部分数据,改进后模型的总体测试正 确率达到98.4%.其中10°能量级别的微震事件测试正确率提升到99%.将模型应用于砚北煤矿250202工作面进行微震能级 时序预测,模型的预测正确率整体达到93.5%,且对高能级微震事件的预测正确率接近100% 关键词微震能级时序预测:一维卷积神经网络:类间不平衡:混合采样:冲击地压 分类号TD76 Time series prediction of microseismic energy level based on feature extraction of one- dimensional convolutional neural network PEI Yan-yu,YANG Xiao-bin,CHUAN Jin-ping,WU Xue-song,CHENG Hong-ming,LU Xiang-feng 1)School of Emergency Management and Safety Engineering,China University of Mining and Technology(Beijing),Beijing 100083,China 2)Yanbei Coal Mine,Huating Coal Industry Company,Huating 744105,China 3)School of Civil and Resource Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:yangxiaobin02@126.com ABSTRACT With the gradual transition of coal mining to deep mining,the number and intensity of rock burst events in the deep mining process are gradually increasing.Thus,it is of great significance to study the change of rock burst precursor signal for the prediction of rock burst.Microseismic signal monitoring plays an important role in rock burst prediction.The microseismic energy level changes with time,a good corresponding relationship exists between the high-energy microseismic events and rock burst.To advance the time node of rock burst prediction and provide more time guarantee for rock burst prevention and control,a time series prediction model of mine microseismic energy based on the one-dimensional convolutional neural network(CNN)was established to predict the temporal variation of mine microseismic energy.Through model training,the energy level of the previous 10 microseismic events can be used as input to predict the energy level of the next microseismic event.Due to the imbalance of the microseismic sample data,the microseismic events of the 10-energy level were all judged as 10-energy level microseismic events in the model test.To improve the prediction accuracy of the model for the 10-energy level microseismic events,a hybrid sampling method was used to train the improved model. Using the microseismic energy level data of 250202 working face in Yanbei coal mine,the overall test accuracy of the improved model 收稿日期:2020-11-22 基金项目:国家自然科学基金资助项目(51774015.51774048):中央高校基本科研业务费资助项目(2021 YJSAQ03)
一维卷积神经网络特征提取下微震能级时序预测 裴艳宇1),杨小彬1) 苣,传金平2),吴学松2),程虹铭1),吕祥锋3) 1) 中国矿业大学(北京)应急管理与安全工程学院,北京 100083 2) 华亭煤业公司砚北煤矿,华亭 744105 3) 北京科技大学土木与资源工 程学院,北京 100083 苣通信作者,E-mail:yangxiaobin02@126.com 摘 要 微震能级随时间发生变化,高能级微震事件与冲击地压有良好的对应关系,为预测矿山微震能量时序变化,基于一 维卷积神经网络(Convolutional neural networks,CNN),建立微震能级时间序列预测模型;通过模型训练,实现以前十次微震事 件的能量级别作为输入来预测下一次微震事件的能量级别. 由于微震样本数据类间不平衡问题,导致模型测试时将 106 能量 级别的微震事件全部判断为 105 能量级别的微震事件,为进一步提高模型对 106 能级微震事件预测的准确率,对模型进行改 进并使用混合采样方法训练改进后的模型;利用砚北煤矿 250202 工作面微震能级实测部分数据,改进后模型的总体测试正 确率达到 98.4%,其中 106 能量级别的微震事件测试正确率提升到 99%. 将模型应用于砚北煤矿 250202 工作面进行微震能级 时序预测,模型的预测正确率整体达到 93.5%,且对高能级微震事件的预测正确率接近 100%. 关键词 微震能级时序预测;一维卷积神经网络;类间不平衡;混合采样;冲击地压 分类号 TD76 Time series prediction of microseismic energy level based on feature extraction of onedimensional convolutional neural network PEI Yan-yu1) ,YANG Xiao-bin1) 苣 ,CHUAN Jin-ping2) ,WU Xue-song2) ,CHENG Hong-ming1) ,LÜ Xiang-feng3) 1) School of Emergency Management and Safety Engineering, China University of Mining and Technology (Beijing), Beijing 100083, China 2) Yanbei Coal Mine, Huating Coal Industry Company, Huating 744105, China 3) School of Civil and Resource Engineering, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E-mail: yangxiaobin02@126.com ABSTRACT With the gradual transition of coal mining to deep mining, the number and intensity of rock burst events in the deep mining process are gradually increasing. Thus, it is of great significance to study the change of rock burst precursor signal for the prediction of rock burst. Microseismic signal monitoring plays an important role in rock burst prediction. The microseismic energy level changes with time, a good corresponding relationship exists between the high-energy microseismic events and rock burst. To advance the time node of rock burst prediction and provide more time guarantee for rock burst prevention and control, a time series prediction model of mine microseismic energy based on the one-dimensional convolutional neural network (CNN) was established to predict the temporal variation of mine microseismic energy. Through model training, the energy level of the previous 10 microseismic events can be used as input to predict the energy level of the next microseismic event. Due to the imbalance of the microseismic sample data, the microseismic events of the 106 -energy level were all judged as 105 -energy level microseismic events in the model test. To improve the prediction accuracy of the model for the 106 -energy level microseismic events, a hybrid sampling method was used to train the improved model. Using the microseismic energy level data of 250202 working face in Yanbei coal mine, the overall test accuracy of the improved model 收稿日期: 2020−11−22 基金项目: 国家自然科学基金资助项目(51774015,51774048);中央高校基本科研业务费资助项目(2021YJSAQ03) 工程科学学报,第 43 卷,第 7 期:1003−1009,2021 年 7 月 Chinese Journal of Engineering, Vol. 43, No. 7: 1003−1009, July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.11.22.001; http://cje.ustb.edu.cn
·1004 工程科学学报,第43卷,第7期 reaches 98.4%and the test accuracy of the 10-energy level microseismic events increased to 99%.The improved prediction model of the microseismic energy level time series based on the one-dimensional convolution neural network was applied to 250202 working face of Yanbei coal mine to predict the microseismic energy level time series.The overall prediction accuracy of the model is 93.5%,and the prediction accuracy of high-energy microseismic events is close to 100%. KEY WORDS time series prediction of microseismic energy levels;one-dimensional convolution neural network;class imbalance; hybrid sampling;rock burst 我国煤矿开采逐渐转入深部开采,深部开采 应用卷积神经网络对一维数据进行处理,并展现 过程中冲击地压事件发生的数量和强度逐渐增加叫, 了其优势.赵康宁等四利用一维卷积神经网络的 研究冲击地压前兆信号的变化对预测冲击地压有 时序数据特征提取能力,将其与贝叶斯神经网络 重要意义 结合,对光伏出力进行时序预测;金列俊等四建立 微震信号监测作为一种重要技术手段对冲击 一维卷积神经网络的钻杆故障诊断模型,根据钻 地压预测有重要作用,高能级微震事件与冲击 杆的加速度信号对钻杆工作状态进行识别:高佳 地压的发生有良好的对应关系.陆菜平等从分 豪等2!使用一维卷积神经网络对包含轴承故障特 析微震信号的功率谱和幅频特性入手,对冲击地 征的随机信号成分进行特征提取以对齿轮箱轴承 压的预测预报进行研究;蔡武等9综合考虑微震 故障进行辨识.一维卷积神经网络在时序数据特 的“时、空、强”特征,从时间、空间角度分别对冲 征提取和预测方面都展示了良好的能力 击危险状态和冲击危险区域及危险等级进行预 为此,本文为了实现微震能级时序预测,利用 测;郭来功等则通过微震成像和微震云图等方 一维卷积神经网络建立微震能级时序预测模型, 式发掘微震事件时空规律,为冲击地压预测提供 以前若干次微震的能量级别作为输入来预测下一 判据:田向辉等山通过对微震能量、频次的分析 次微震事件的能量级别:分析微震数据时序特征, 来预测冲击地压的危险等级.以上研究结果对冲 对模型进行优化改进,对比现场微震监测数据,验 击地压判识提供了手段支持,但在微震能级随时 证建立的一维卷积神经网络微震能级时序预测模 间变化规律及基于现有的微震能级如何对后期的 型的可行性 微震能级进行预测等方面还需要进一步的研究, 尤其对高能级的微震事件进行预测尤为重要.对 1微震能级序列预测原理 微震信号的变化进行预测,将微震事件时间节点 某一区域的能量与微震之间存在地震震级- 前移,以实现对冲击地压的提前预测,为冲击地压 频度关系,即G-R关系式2: 防控提供更多时间保障 IgN=a-bM (1) 机器学习相关技术和模型的发展为井下序列 数据的预测提供了更广阔的视野.乔美英等应 其中,N为微震累积次数;M为区域性震级的最小 用遗传算法优化的支持向量机模型对矿井涌水量 值;a,b为与区域有关的经验常数,b值刻画了震 进行短期预测,预测最大相对误差为2.62%;赵毅 源区的介质与应力情况 鑫等)利用长短时记忆模型对矿压进行预测并在 文献研究已表明微震能级随时间存在一定的 其他矿井应用,预测结果较佳:李树刚等4利用循 变化规律,那么,未来微震事件的能量与前几次微 环神经网络对煤矿工作面的瓦斯浓度进行预测, 震事件的能量存在关联.基于此假设,一定存在一 瓦斯体积分数预测结果误差为0.006%.以上学者 个映射g,使得可通过前若干次的微震事件能量 应用机器学习模型对时序数据进行预测,在各自 E、E#、Ev得到第N+1次的微震事件能量 研究方面取得了较大进展,但这些传统机器学习 Ew+,如式(2)式所示 模型存在一点不足,即特征提取和分类分开难以 EN+1=8(Ei,Ei+1,...EN) (2) 得到最优解I,而卷积神经网络(Convolutional 式中,+1<N. neural networks.CNN)作为一种深度学习模型,同 由于微震事件的能量量级差别较大,为了便 时具备特征提取和分类输出的能力.卷积神经网 于模型输入及特征提取,对微震事件的能量值取 络特征提取能力出色,在故障诊断618、地质遥感 对数,所得结果四舍五入取整后,记为微震事件能 检测90等方面应用广泛且效果较佳,一些学者 量级别,如式(3)所示:
reaches 98.4% and the test accuracy of the 106 -energy level microseismic events increased to 99%. The improved prediction model of the microseismic energy level time series based on the one-dimensional convolution neural network was applied to 250202 working face of Yanbei coal mine to predict the microseismic energy level time series. The overall prediction accuracy of the model is 93.5%, and the prediction accuracy of high-energy microseismic events is close to 100%. KEY WORDS time series prediction of microseismic energy levels;one-dimensional convolution neural network;class imbalance; hybrid sampling;rock burst 我国煤矿开采逐渐转入深部开采,深部开采 过程中冲击地压事件发生的数量和强度逐渐增加[1] , 研究冲击地压前兆信号的变化对预测冲击地压有 重要意义[2] . 微震信号监测作为一种重要技术手段对冲击 地压预测有重要作用[3−6] ,高能级微震事件与冲击 地压的发生有良好的对应关系[7] . 陆菜平等[8] 从分 析微震信号的功率谱和幅频特性入手,对冲击地 压的预测预报进行研究;蔡武等[9] 综合考虑微震 的“时、空、强”特征,从时间、空间角度分别对冲 击危险状态和冲击危险区域及危险等级进行预 测;郭来功等[10] 则通过微震成像和微震云图等方 式发掘微震事件时空规律,为冲击地压预测提供 判据;田向辉等[11] 通过对微震能量、频次的分析 来预测冲击地压的危险等级. 以上研究结果对冲 击地压判识提供了手段支持,但在微震能级随时 间变化规律及基于现有的微震能级如何对后期的 微震能级进行预测等方面还需要进一步的研究, 尤其对高能级的微震事件进行预测尤为重要. 对 微震信号的变化进行预测,将微震事件时间节点 前移,以实现对冲击地压的提前预测,为冲击地压 防控提供更多时间保障. 机器学习相关技术和模型的发展为井下序列 数据的预测提供了更广阔的视野. 乔美英等[12] 应 用遗传算法优化的支持向量机模型对矿井涌水量 进行短期预测,预测最大相对误差为 2.62%;赵毅 鑫等[13] 利用长短时记忆模型对矿压进行预测并在 其他矿井应用,预测结果较佳;李树刚等[14] 利用循 环神经网络对煤矿工作面的瓦斯浓度进行预测, 瓦斯体积分数预测结果误差为 0.006%. 以上学者 应用机器学习模型对时序数据进行预测,在各自 研究方面取得了较大进展,但这些传统机器学习 模型存在一点不足,即特征提取和分类分开难以 得到最优解 [15] ,而卷积神经网络 ( Convolutional neural networks,CNN)作为一种深度学习模型,同 时具备特征提取和分类输出的能力. 卷积神经网 络特征提取能力出色,在故障诊断[16−18]、地质遥感 检测[19−20] 等方面应用广泛且效果较佳,一些学者 应用卷积神经网络对一维数据进行处理,并展现 了其优势. 赵康宁等[21] 利用一维卷积神经网络的 时序数据特征提取能力,将其与贝叶斯神经网络 结合,对光伏出力进行时序预测;金列俊等[22] 建立 一维卷积神经网络的钻杆故障诊断模型,根据钻 杆的加速度信号对钻杆工作状态进行识别;高佳 豪等[23] 使用一维卷积神经网络对包含轴承故障特 征的随机信号成分进行特征提取以对齿轮箱轴承 故障进行辨识. 一维卷积神经网络在时序数据特 征提取和预测方面都展示了良好的能力. 为此,本文为了实现微震能级时序预测,利用 一维卷积神经网络建立微震能级时序预测模型, 以前若干次微震的能量级别作为输入来预测下一 次微震事件的能量级别;分析微震数据时序特征, 对模型进行优化改进,对比现场微震监测数据,验 证建立的一维卷积神经网络微震能级时序预测模 型的可行性. 1 微震能级序列预测原理 某一区域的能量与微震之间存在地震震级− 频度关系,即 G−R 关系式[24] : lgN = a−bM (1) 其中,N 为微震累积次数;M 为区域性震级的最小 值;a,b 为与区域有关的经验常数,b 值刻画了震 源区的介质与应力情况. 、···、 文献研究已表明微震能级随时间存在一定的 变化规律,那么,未来微震事件的能量与前几次微 震事件的能量存在关联. 基于此假设,一定存在一 个映射 g,使得可通过前若干次的微震事件能量 Ei、 Ei+1 EN 得 到 第 N+1 次的微震事件能 量 EN+1,如式(2)式所示. EN+1 = g(Ei ,Ei+1,··· ,EN) (2) 式中,i+1<N. 由于微震事件的能量量级差别较大,为了便 于模型输入及特征提取,对微震事件的能量值取 对数,所得结果四舍五入取整后,记为微震事件能 量级别,如式(3)所示: · 1004 · 工程科学学报,第 43 卷,第 7 期
裴艳字等:一维卷积神经网络特征提取下微震能级时序预测 ·1005· Ki=Ig E; (3) 显著降低.考虑到学习率对模型训练效果影响较 其中,K表示第i次微震的能量级别. 大,人工确定最佳参数具有较大难度,故选用一种 基于以上内容构造模型,以前若干次的微震 学习率自适应算法Adam作为模型优化算法2阿. 事件能量级别为输入预测下一次微震事件能量 若设卷积神经网络模型为f(G:),则Cw+1与前 级别 N次微震能量关系如式(5)所示: CN+1=f(任:K1,K2,…,KN) (5) 2 基于一维卷积神经网络的微震能级时序 预测模型 其中,为模型内部权值参数0使得损失函数值最 小的最优估计,求解的过程即为模型的训练过 2.1模型构建 程.具体过程如式(6)所示: 为有效提取微震能量数据特征,预测微震能 0=arg min0Loss[f(0:E1.E2.....EN),CN+1](6) 量级别的时序变化规律,现构建基于一维卷积神 其中,Loss(•)为人为指定的损失函数,用于衡量模 经网络的微震能级时序预测模型,具体步骤如下: 型预测的微震能量数量级与真实值之间的误差 (1)模型输入、输出 由于难以直接求得a,故通过求损失函数的最 模型输入时直接输入前若干次的微震能量值, 小值,间接使得给定标准的权值参数0最小.同时 本文中模型输出值代表微震能量级别,由于相邻 模型使用Softmax分类器作为输出层激活函数,模 的两个能量级别差异较大,若输出按十进制标量 型输出的是第i个样本点的预测类别的概率分布, 形式表示能量级别,模型训练结果会出现较大偏 因而选择分类交叉嫡函数(Categorical cross-entropy) 差.因此,采用一维有效编码方法(One-hot encode) 作为损失函数,分类交叉嫡函数能够度量预测 将标量转化为一维向量,即将预测的对应微震能 分布和真实分布之间的差距,其数学形式如式(7) 级表示为1,其他级别均为0 所示: (2)模型特征提取 Li=->(mlgyim) (7) 检测信号对某种特定模式的响应是卷积的本 质.卷积核通过遍历整段输人向量,对能量序列中 其中,L,为第i个样本的误差;n为样本数;m为类 某些发生突变的点或阶段等细微特征进行检测. 别数;m为第i个样本属于第m类的预测概率; 而池化层将卷积层输出的特征数据进行缩减以降 ym为第i个样本属于第m类的真实概率 低模型计算负担.由于微震能量序列是广义一维 2.2模型训练及测试结果 时间数据,相比于图像、视频等多维数据其包含信 考虑到采掘活动、地应力条件、地质条件等因 息量较少,为减少特征提取过程中数据信息的丢 素对微震事件的发生有一定影响,在选择输入数 失,模型使用卷积层进行特征提取而删去池化层 据维度时,经大量预试验,发现以前十次微震能级 模型先通过多个卷积层对微震数据提取特征,激 作为输入来预测下一次微震能级时正确率较高, 活函数采用Relu函数,最后由全连接层对最后一 相应的模型结构如图1所示,模型超参数经多次 层卷积层的输出加权平均.卷积层对上一层输出 试验迭代得,如表1所示. 利用砚北煤矿250202工作面2017年1月1日 在第j个卷积核处的值,按以下公式进行处理: 至2018年9月30日记录的10343次微震数据对 E;I(m)H j(i-m) (4) 一维卷积神经网络微震能级序列预测模型进行训 i=l 练和测试.选取9次10°级别微震中前6次微震, 其中,I为卷积层的一维输入向量;0为卷积层的 10级别微震中前66%的微震和其他级别前90% 一维输出向量:∫则为该层的激活函数;H为长度 的微震事件,混合、打乱组成训练集;其余的微震 为m的一维向量,又称为卷积核.同时,同一卷积 事件混合、打乱组成测试集,模型测试结果如表2 层内可有多个卷积核同时对输入值进行运算 所示 (3)模型分类与优化 由表2可知,模型对102、103、10低能级的微 为方便现场人员更好地了解预测类别的概率 震事件预测正确率和对10级别的高能级微震事 值,模型输出层选择Softmax分类器进行最终分类. 件的预测正确率均超过了98%,并且总体正确率也 为优化人工神经网络模型,寻找一组神经网络 达到了97.9%,说明基于一维卷积神经网络建立模 的权值参数O,并采用特定算法使损失函数Loss() 型对微震能级进行时序数据进行预测是可行的
Ki = lgEi (3) 其中,Ki 表示第 i 次微震的能量级别. 基于以上内容构造模型,以前若干次的微震 事件能量级别为输入预测下一次微震事件能量 级别. 2 基于一维卷积神经网络的微震能级时序 预测模型 2.1 模型构建 为有效提取微震能量数据特征,预测微震能 量级别的时序变化规律,现构建基于一维卷积神 经网络的微震能级时序预测模型,具体步骤如下: (1)模型输入、输出. 模型输入时直接输入前若干次的微震能量值, 本文中模型输出值代表微震能量级别,由于相邻 的两个能量级别差异较大,若输出按十进制标量 形式表示能量级别,模型训练结果会出现较大偏 差. 因此,采用一维有效编码方法(One-hot encode) 将标量转化为一维向量,即将预测的对应微震能 级表示为 1,其他级别均为 0. (2)模型特征提取. 检测信号对某种特定模式的响应是卷积的本 质. 卷积核通过遍历整段输入向量,对能量序列中 某些发生突变的点或阶段等细微特征进行检测. 而池化层将卷积层输出的特征数据进行缩减以降 低模型计算负担. 由于微震能量序列是广义一维 时间数据,相比于图像、视频等多维数据其包含信 息量较少,为减少特征提取过程中数据信息的丢 失,模型使用卷积层进行特征提取而删去池化层[25] . 模型先通过多个卷积层对微震数据提取特征,激 活函数采用 Relu 函数,最后由全连接层对最后一 层卷积层的输出加权平均. 卷积层对上一层输出 在第 j 个卷积核处的值,按以下公式进行处理: O(i) = f ∑m i=1 EiI(m)Hj(i−m) (4) 其中,I 为卷积层的一维输入向量;O 为卷积层的 一维输出向量;f 则为该层的激活函数;Hj 为长度 为 m 的一维向量,又称为卷积核. 同时,同一卷积 层内可有多个卷积核同时对输入值进行运算. (3)模型分类与优化. 为方便现场人员更好地了解预测类别的概率 值,模型输出层选择 Softmax 分类器进行最终分类. 为优化人工神经网络模型,寻找一组神经网络 的权值参数 θ,并采用特定算法使损失函数 Loss(θ) 显著降低. 考虑到学习率对模型训练效果影响较 大,人工确定最佳参数具有较大难度,故选用一种 学习率自适应算法 Adam 作为模型优化算法[26] . 若设卷积神经网络模型为 f(θ;·),则 CN+1 与前 N 次微震能量关系如式(5)所示: CN+1 = f(θˆ;K1,K2,··· ,KN) (5) θˆ θˆ 其中, 为模型内部权值参数 θ 使得损失函数值最 小的最优估计,求解 的过程即为模型的训练过 程. 具体过程如式(6)所示: θˆ = argminθLoss[f(θ;E1,E2,··· ,EN),CN+1] (6) 其中,Loss(•) 为人为指定的损失函数,用于衡量模 型预测的微震能量数量级与真实值之间的误差. 由于难以直接求得 θˆ,故通过求损失函数的最 小值,间接使得给定标准的权值参数 θ 最小. 同时 模型使用 Softmax 分类器作为输出层激活函数,模 型输出的是第 i 个样本点的预测类别的概率分布, 因而选择分类交叉熵函数(Categorical cross-entropy) 作为损失函数,分类交叉熵函数能够度量预测 分布和真实分布之间的差距,其数学形式如式(7) 所示: Li = − ∑n 1 (ˆyim lgyim) (7) yˆim 其中,Li 为第 i 个样本的误差;n 为样本数;m 为类 别数; 为第 i 个样本属于第 m 类的预测概率; yim 为第 i 个样本属于第 m 类的真实概率. 2.2 模型训练及测试结果 考虑到采掘活动、地应力条件、地质条件等因 素对微震事件的发生有一定影响,在选择输入数 据维度时,经大量预试验,发现以前十次微震能级 作为输入来预测下一次微震能级时正确率较高, 相应的模型结构如图 1 所示,模型超参数经多次 试验迭代所得,如表 1 所示. 利用砚北煤矿 250202 工作面 2017 年 1 月 1 日 至 2018 年 9 月 30 日记录的 10343 次微震数据对 一维卷积神经网络微震能级序列预测模型进行训 练和测试. 选取 9 次 106 级别微震中前 6 次微震, 105 级别微震中前 66% 的微震和其他级别前 90% 的微震事件,混合、打乱组成训练集;其余的微震 事件混合、打乱组成测试集,模型测试结果如表 2 所示. 由表 2 可知,模型对 102、103、104 低能级的微 震事件预测正确率和对 105 级别的高能级微震事 件的预测正确率均超过了 98%,并且总体正确率也 达到了 97.9%,说明基于一维卷积神经网络建立模 型对微震能级进行时序数据进行预测是可行的. 裴艳宇等: 一维卷积神经网络特征提取下微震能级时序预测 · 1005 ·
·1006 工程科学学报,第43卷,第7期 01 Input Convolution Convolution Convolution Convolution Convolution Fully Output data layer 1 layer 2 layer 3 layer 4 layer 5 connected data layer 图1一维卷积神经网络微震能级时序预测模型结构 Fig.1 Structure of the prediction model of the microseismic energy level time series based on the one-dimensional convolution neural network 表1各卷积层超参数 发生的,因而有必要提高模型对10能级微震事件 Table 1 Hyperparametric table of each convolution layer 的预测准确率 Convolution layer Convolution kemel Convolution kemel 3.1微震数据类间不平衡特征及解决方法 number number length ’ 通过分析发现,模型对10能级微震事件预测 32 3 2 64 J 正确率低的原因是微震事件各个能量级别的数量 3 128 3 不平衡,其他能级事件数量远远多于10°能级微震 4 64 3 事件数量.本次用于模型训练和测试的数据中, 5 32 2 102、103、10级别的微震上千次,10级别微震9 次,如图2所示 表2250202工作面微震能量级别测试结果 6000 5421 Table 2 Test results of the microseismic energy level of the 250202 三5000 working face % Class Test accuracy 4000 3492 10,103,10心 98.7 3000 10 98.3 105 0 2000 Total 97.9 1066 1000 353 但需要注意的是,模型预测结果中对10°级别 2 4 6 的高能级微震事件的预测正确率为0,有必要进一 Microseismic energy level 步对模型进行讨论、研究以提高对该级别微震事 图2微震各能量级别数量 件的预测正确率 Fig.2 Number of each microseismic energy level 3改进的基于一维卷积神经网络的微震能 因此,解决模型对10能级微震事件预测准确率 级时序预测模型 低的问题,需从微震事件各能级数据的不平衡特征入 手.在机器学习领域的分类问题中,样本量较多的类 虽然模型在测试集中预测正确率较高,但对 别称为负样本,样本量较少的类别称为正样本.用存 10级别微震的预测正确率为0,通过分析发现模 在正、负样本的数据集训练的模型会倾向于将正样本 型将10级别微震全部预测为10级别的微震.砚 分类为负样本,导致正样本事件分类正确率降低 北煤矿250202工作面记录的2017年1月至2018年 目前处理正负样本类间不平衡问题的主要方法 10月的10343次微震中,10级别的微震353次, 有欠采样、过采样和混合采样2刃欠采样会丢弃有 冲击地压引起或伴随的微震只有11次,而10级 价值的样本点,导致人工神经网络无法学习到有 别的微震有9次,但全部是冲击地压引起或伴随 效的特征:过采样会放大正样本中噪声的影响,容
但需要注意的是,模型预测结果中对 106 级别 的高能级微震事件的预测正确率为 0,有必要进一 步对模型进行讨论、研究以提高对该级别微震事 件的预测正确率. 3 改进的基于一维卷积神经网络的微震能 级时序预测模型 虽然模型在测试集中预测正确率较高,但对 106 级别微震的预测正确率为 0,通过分析发现模 型将 106 级别微震全部预测为 105 级别的微震. 砚 北煤矿 250202 工作面记录的 2017 年 1 月至 2018 年 10 月的 10343 次微震中, 105 级别的微震 353 次 , 冲击地压引起或伴随的微震只有 11 次,而 106 级 别的微震有 9 次,但全部是冲击地压引起或伴随 发生的,因而有必要提高模型对 106 能级微震事件 的预测准确率. 3.1 微震数据类间不平衡特征及解决方法 通过分析发现,模型对 106 能级微震事件预测 正确率低的原因是微震事件各个能量级别的数量 不平衡,其他能级事件数量远远多于 106 能级微震 事件数量. 本次用于模型训练和测试的数据中, 102、103、104 级别的微震上千次, 106 级别微震 9 次,如图 2 所示. 因此,解决模型对 106 能级微震事件预测准确率 低的问题,需从微震事件各能级数据的不平衡特征入 手. 在机器学习领域的分类问题中,样本量较多的类 别称为负样本,样本量较少的类别称为正样本. 用存 在正、负样本的数据集训练的模型会倾向于将正样本 分类为负样本,导致正样本事件分类正确率降低. 目前处理正负样本类间不平衡问题的主要方法 有欠采样、过采样和混合采样[27] . 欠采样会丢弃有 价值的样本点,导致人工神经网络无法学习到有 效的特征;过采样会放大正样本中噪声的影响,容 表 1 各卷积层超参数 Table 1 Hyperparametric table of each convolution layer Convolution layer number Convolution kernel number Convolution kernel length 1 32 3 2 64 3 3 128 3 4 64 3 5 32 2 表 2 250202 工作面微震能量级别测试结果 Table 2 Test results of the microseismic energy level of the 250202 working face % Class Test accuracy 102 , 103 , 104 98.7 105 98.3 106 0 Total 97.9 0 0 0 1 0 0 Input data Convolution layer 1 Convolution layer 2 Convolution layer 3 Convolution layer 4 Convolution layer 5 Fully connected layer Output data 图 1 一维卷积神经网络微震能级时序预测模型结构 Fig.1 Structure of the prediction model of the microseismic energy level time series based on the one-dimensional convolution neural network 6000 5000 4000 3000 2000 Microseismic energy level Numbers of microseismic event 1000 0 1 2 3 4 5 6 2 1066 5421 3492 353 9 图 2 微震各能量级别数量 Fig.2 Number of each microseismic energy level · 1006 · 工程科学学报,第 43 卷,第 7 期