工程科学学报.第41卷.第11期:1412-1421.2019年11月 Chinese Journal of Engineering,Vol.41,No.11:1412-1421,November 2019 D0L:10.13374.issn2095-9389.2019.06.03.004,http://journals.ustb.edu.cn 基于PCA和MCMC的贝叶斯方法的海下矿山水害源识 别分析 颜丙乾2),任奋华1,2)四,蔡美峰12),郭奇峰1,2,王培涛12) 1)北京科技大学土木与资源工程学院,北京1000832)北京科技大学城市与地下空间工程北京市重点实验室,北京100083 ☒通信作者.E-mail:renfh2001@163.com 摘要海底金矿矿山水害对矿山生产、人员施工及矿山设备等产生较大威胁,是矿山开采中的自然灾害之一,快速有效的 判别出矿山水害水源对于事故的防治有重要意义,三山岛金矿的巷道围岩裂隙普遍并长期存在涌水现象,矿区开采中矿井 水害的水源主要有海水、第四系水、基岩裂隙水、地下水等,为了准确快速的判别矿井水水源,有效预防矿井水突水及水害威 胁,本研究结合监测点水样的水文地质条件与不同监测点水样的水化学成分分析,选取Mg+、Na+K、Ca、SO2、CI和 HCO共6项指标作为判别因子,通过主成分分析得出不同水样的矿化程度.在贝叶斯算法分析原理的基础上,将马尔可夫链 蒙特卡洛(Markov Chain Monte Carlo,MCMC)引入到贝叶斯方法中,运用统计软件SPSS统计,构建贝叶斯判别分析模型,得 出基于水样样本信息的算法估计的后验分布,得出矿山水害水源的分析方法.运用三山岛金矿水害取水点的水样分析数据 进行详细的分析验证,建立矿井突水水源模型,进行不同水样的信息分析,得出贝叶斯统计函数并进行水源判别结果分析,验 证了贝叶斯矿山水害水源判别模型的准确性和实用性,对现场工作的开展和水害防治有一定的指导意义 关键词矿井水害水源:贝叶斯方法:马尔可夫链蒙特卡洛:主成分分析:水样分析:矿山突水 分类号TD741.7 Application of PCA and Bayesian MCMC to discriminate between water sources in seabed gold mines YAN Bing-qian)REN Fen-hua CAl Mei-feng2GUO Qi-feng2),WANG Pei-tao2 1)School of Civil and Resource Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Beijing Key Laboratory of Urban Underground Space Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:renfh 2001@163.com ABSTRACT Water hazards in submarine gold mines pose a great threat to mine production,construction personnel,and mining equipment,and represent one of the natural disasters that occur in mining.To prevent and control accidents,it is critical to quickly and effectively identify water sources.Cracks in the rocks surrounding the roadway in the Sanshandao Gold Mine are a widespread and long- term water gushing phenomenon.The main sources of mine water hazards in mining areas are seawater,Quaternary water,bedrock fissure water,and groundwater.To accurately and quickly identify mine water sources and effectively prevent inrushes of mine water and water-hazard threats,the hydrogeological conditions and chemical composition of water samples from different monitoring points were analyzed and six indicators,i.e.,Mg",Na+K',Ca,SO,CI,and HCO,were selected as discriminant factors.Based on the analysis principle of the Bayesian algorithm,the Markov chain Monte Carlo(MCMC)approach was introduced into the Bayesian method.A Bayesian discriminant analysis model was then constructed using SPSS Statistics and the MCMC Bayesian method.The 收稿日期:2019-06-03 基金项目:国家自然科学基金面上资助项目(51774022):国家重点研发计划资助项目(2017YFC0804101)
基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识 别分析 颜丙乾1,2),任奋华1,2) 苣,蔡美峰1,2),郭奇峰1,2),王培涛1,2) 1) 北京科技大学土木与资源工程学院,北京 100083 2) 北京科技大学城市与地下空间工程北京市重点实验室,北京 100083 苣通信作者,E-mail:renfh_2001@163.com 摘 要 海底金矿矿山水害对矿山生产、人员施工及矿山设备等产生较大威胁,是矿山开采中的自然灾害之一,快速有效的 判别出矿山水害水源对于事故的防治有重要意义. 三山岛金矿的巷道围岩裂隙普遍并长期存在涌水现象,矿区开采中矿井 水害的水源主要有海水、第四系水、基岩裂隙水、地下水等,为了准确快速的判别矿井水水源,有效预防矿井水突水及水害威 胁,本研究结合监测点水样的水文地质条件与不同监测点水样的水化学成分分析,选取 Mg2+、Na++K+、Ca2+、SO4 2−、Cl−和 HCO3 −共 6 项指标作为判别因子,通过主成分分析得出不同水样的矿化程度. 在贝叶斯算法分析原理的基础上,将马尔可夫链 蒙特卡洛 (Markov Chain Monte Carlo, MCMC) 引入到贝叶斯方法中,运用统计软件 SPSS 统计,构建贝叶斯判别分析模型,得 出基于水样样本信息的算法估计的后验分布,得出矿山水害水源的分析方法. 运用三山岛金矿水害取水点的水样分析数据 进行详细的分析验证,建立矿井突水水源模型,进行不同水样的信息分析,得出贝叶斯统计函数并进行水源判别结果分析,验 证了贝叶斯矿山水害水源判别模型的准确性和实用性,对现场工作的开展和水害防治有一定的指导意义. 关键词 矿井水害水源;贝叶斯方法;马尔可夫链蒙特卡洛;主成分分析;水样分析;矿山突水 分类号 TD741.7 Application of PCA and Bayesian MCMC to discriminate between water sources in seabed gold mines YAN Bing-qian1,2) ,REN Fen-hua1,2) 苣 ,CAI Mei-feng1,2) ,GUO Qi-feng1,2) ,WANG Pei-tao1,2) 1) School of Civil and Resource Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Beijing Key Laboratory of Urban Underground Space Engineering, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E-mail: renfh_2001@163.com ABSTRACT Water hazards in submarine gold mines pose a great threat to mine production, construction personnel, and mining equipment, and represent one of the natural disasters that occur in mining. To prevent and control accidents, it is critical to quickly and effectively identify water sources. Cracks in the rocks surrounding the roadway in the Sanshandao Gold Mine are a widespread and longterm water gushing phenomenon. The main sources of mine water hazards in mining areas are seawater, Quaternary water, bedrock fissure water, and groundwater. To accurately and quickly identify mine water sources and effectively prevent inrushes of mine water and water-hazard threats, the hydrogeological conditions and chemical composition of water samples from different monitoring points were analyzed and six indicators, i.e., Mg2+, Na++K+ , Ca2+, SO4 2−, Cl− , and HCO3 − , were selected as discriminant factors. Based on the analysis principle of the Bayesian algorithm, the Markov chain Monte Carlo (MCMC) approach was introduced into the Bayesian method. A Bayesian discriminant analysis model was then constructed using SPSS Statistics and the MCMC Bayesian method. The 收稿日期: 2019−06−03 基金项目: 国家自然科学基金面上资助项目(51774022);国家重点研发计划资助项目(2017YFC0804101) 工程科学学报,第 41 卷,第 11 期:1412−1421,2019 年 11 月 Chinese Journal of Engineering, Vol. 41, No. 11: 1412−1421, November 2019 DOI:10.13374/j.issn2095-9389.2019.06.03.004; http://journals.ustb.edu.cn
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 ·1413 posterior distribution estimated by the algorithm is based on water-sample information,which enables the analysis of the mine water source.Based on the water-sample data from a water intake point at the Sanshandao Gold Mine,detailed analysis and verification were performed,and a water-source model for the inrush of mine water was established.An analysis of different water samples was then performed.Through the selection of variables,variables with a strong discriminant ability and high degree of correlation were introduced into the discriminant function to obtain the Bayesian statistical function,thus enabling a discriminatory analysis of the water sources.The accuracy and practicability of the proposed Bayesian mine-water-source identification model were verified.This model has certain significance for guiding future field work and water-hazard prevention and control efforts KEY WORDS mine water source;Bayes method;Markov Chain Monte Carlo (MCMC);principal component analysis(PCA);water sample analysis:mine water inrush 矿产资源是人类生产活动的重要物质基础, 叶斯方法只考虑了参数不确定性的影响,近年来, 多年来,资源的开发和利用导致金属矿山开采方 贝叶斯方法中综合考虑输入不确定性、数据不确 向转变到深部矿体、破碎松软矿体、高寒地区矿 定性和结构不确定性在参数率定中的影响 体及低品位矿体等复杂难采矿体和“三下一上”矿 本文基于不同监测点水样的水化学分析,选 体.三山岛金矿是我国第一个海下采矿的金属矿 取六项指标作为判别因子,运用SPSS软件通过基 山,属于水体下开采的范畴,其独特的自然环境及 于MCMC的贝叶斯方法,得出水样样本信息的算 开采技术条件是矿山灾害预防和治理的难点,采 法估计的后验分布,经过分析验证得出水源判别 矿对矿山围岩应力场和渗流场的扰动导致矿山存 模型的准确性和实用性 在高渗透压甚至海水馈入的风险-]因此竖井施 1贝叶斯算法分析基本原理 工及采矿活动中的注浆堵水、海水突涌的预测 及多场耦合下岩体力学性质的改变等问题值得深 1.1贝叶斯统计原理 入研究,用以减少矿井涌水对矿山生产的影响,降 贝叶斯方法源于Thomas Bayes发表于1763年 低高盐卤离子对井下工作人员和设备的威胁和破坏 的遗作,文中根据二项分布的观测值对其参数进 矿区开采中矿井水害的水源主要有海水、第 行概率推断,之后经过多人研究完善了其基本理 四系水、基岩裂隙水、地下水等.与煤矿普遍存在 论和基本框架.贝叶斯算法是一种概率统计算法, 的“湿帮-涌水一淋水一流水-突水”突水先兆不同, 根据概率论和随机变量,利用人们主观判断的先 三山岛金矿的巷道围岩裂隙普遍并长期存在涌水 验概率和样本信息,利用似然函数,经过反演得到 现象山因此,充分利用和揭示矿山不同水源水样 后验分布,进而判别水样水源类别,其中各阶段的 所携带的信息及其变化对开展矿山水文地质结构 不确定性因素可以通过概率分布表达.因此贝叶 相关研究及水害防治具有重要的意义为了防止 斯分布具有更可信、精度高、信息量大等特点1 矿井水害,及时准确判别矿井水害的水源尤为重 对于A和B两个事件,在B事件发生前,人们 要,水化学分析可以反映水样的水质特性,用以快 主观判断得出事件A的发生概率的基本判断是 速准确的判别水源类型.目前,根据水化学成分判 A的先验概率(prior probability)P(A):而在事件 别矿山突水水源的方法有很多种,常用的不确定 B发生之后,由于受B事件的影响需要对A事件 性数学方法有模糊综合评判法、灰色聚类分析法)、 重新进行概率评估,这种评估结果是事件A的后 多组逐步贝叶斯法、Fisher判别法、距离判别法 验概率(posterior probability)P(AB).P(BlA)/P(B)是 等G刀,非线性识别方法有支持向量机法和BP神 事件A的发生对事件B的支持程度,即似然函数 经网络法等.以上每种方法都得到了一定程度的 (likelihood function). 应用,同时也存在一定的局限性 贝叶斯公式主要通过先验信息与样本信息的 贝叶斯方法结构体系较为完备、结构灵活,与 耦合分析得出后验信息山,即: 贝叶斯统计相关的采样方法一马尔可夫链蒙特 P(AIB)=P(BIA)P(A) (1) 卡洛方法(Markov chain Monte Carlo,MCMC)ys-近 P(B) 年来发展迅速.贝叶斯方法主要是根据选定参数 将上述中的A设定为样本(sample)X,把B设 的先验信息和参数在测定的数据下总结似然信 定为参数(parameter))0,样本x=(Xi,…,X)的密度函 息,进而得到参数的后验信息及概率分布.早期贝 数属于参数族F={f(x;0:0∈⊙,X(=l,…,m)是
posterior distribution estimated by the algorithm is based on water-sample information, which enables the analysis of the mine water source. Based on the water-sample data from a water intake point at the Sanshandao Gold Mine, detailed analysis and verification were performed, and a water-source model for the inrush of mine water was established. An analysis of different water samples was then performed. Through the selection of variables, variables with a strong discriminant ability and high degree of correlation were introduced into the discriminant function to obtain the Bayesian statistical function, thus enabling a discriminatory analysis of the water sources. The accuracy and practicability of the proposed Bayesian mine-water-source identification model were verified. This model has certain significance for guiding future field work and water-hazard prevention and control efforts. KEY WORDS mine water source;Bayes method;Markov Chain Monte Carlo (MCMC);principal component analysis (PCA);water sample analysis;mine water inrush 矿产资源是人类生产活动的重要物质基础, 多年来,资源的开发和利用导致金属矿山开采方 向转变到深部矿体、破碎松软矿体、高寒地区矿 体及低品位矿体等复杂难采矿体和“三下一上”矿 体. 三山岛金矿是我国第一个海下采矿的金属矿 山,属于水体下开采的范畴,其独特的自然环境及 开采技术条件是矿山灾害预防和治理的难点,采 矿对矿山围岩应力场和渗流场的扰动导致矿山存 在高渗透压甚至海水馈入的风险[1−2] . 因此竖井施 工及采矿活动中的注浆堵水、海水突涌[3−4] 的预测 及多场耦合下岩体力学性质的改变等问题值得深 入研究,用以减少矿井涌水对矿山生产的影响,降 低高盐卤离子对井下工作人员和设备的威胁和破坏. 矿区开采中矿井水害的水源主要有海水、第 四系水、基岩裂隙水、地下水等. 与煤矿普遍存在 的“湿帮−涌水−淋水−流水−突水”突水先兆不同, 三山岛金矿的巷道围岩裂隙普遍并长期存在涌水 现象[1] . 因此,充分利用和揭示矿山不同水源水样 所携带的信息及其变化对开展矿山水文地质结构 相关研究及水害防治具有重要的意义[4] . 为了防止 矿井水害,及时准确判别矿井水害的水源尤为重 要,水化学分析可以反映水样的水质特性,用以快 速准确的判别水源类型. 目前,根据水化学成分判 别矿山突水水源的方法有很多种,常用的不确定 性数学方法有模糊综合评判法、灰色聚类分析法[5]、 多组逐步贝叶斯法、Fisher 判别法、距离判别法 等[6−7] ,非线性识别方法有支持向量机法和 BP 神 经网络法等. 以上每种方法都得到了一定程度的 应用,同时也存在一定的局限性. 贝叶斯方法结构体系较为完备、结构灵活,与 贝叶斯统计相关的采样方法−马尔可夫链蒙特 卡洛方法 (Markov chain Monte Carlo, MCMC)[8−9] 近 年来发展迅速. 贝叶斯方法主要是根据选定参数 的先验信息和参数在测定的数据下总结似然信 息,进而得到参数的后验信息及概率分布. 早期贝 叶斯方法只考虑了参数不确定性的影响,近年来, 贝叶斯方法中综合考虑输入不确定性、数据不确 定性和结构不确定性在参数率定中的影响. 本文基于不同监测点水样的水化学分析,选 取六项指标作为判别因子,运用 SPSS 软件通过基 于 MCMC 的贝叶斯方法,得出水样样本信息的算 法估计的后验分布,经过分析验证得出水源判别 模型的准确性和实用性. 1 贝叶斯算法分析基本原理 1.1 贝叶斯统计原理 贝叶斯方法源于 Thomas Bayes 发表于 1763 年 的遗作,文中根据二项分布的观测值对其参数进 行概率推断,之后经过多人研究完善了其基本理 论和基本框架. 贝叶斯算法是一种概率统计算法, 根据概率论和随机变量,利用人们主观判断的先 验概率和样本信息,利用似然函数,经过反演得到 后验分布,进而判别水样水源类别,其中各阶段的 不确定性因素可以通过概率分布表达. 因此贝叶 斯分布具有更可信、精度高、信息量大等特点[10] . 对于 A 和 B 两个事件,在 B 事件发生前,人们 主观判断得出事件 A 的发生概率的基本判断是 A 的 先 验 概 率 (prior probability)P(A); 而 在 事 件 B 发生之后,由于受 B 事件的影响需要对 A 事件 重新进行概率评估,这种评估结果是事件 A 的后 验概率 (posterior probability)P(A|B). P(B|A)/P(B) 是 事件 A 的发生对事件 B 的支持程度,即似然函数 (likelihood function). 贝叶斯公式主要通过先验信息与样本信息的 耦合分析得出后验信息[11] ,即: P(A|B) = P(B|A)P(A) P(B) (1) F = {f (x; θ) : θ ∈ Θ} 将上述中的 A 设定为样本 (sample)X,把 B 设 定为参数 (parameter)θ,样本 x=(X1 , …, Xi ) 的密度函 数属于参数族 ,Xi (i=1, …, n) 是 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1413 ·
.1414 工程科学学报,第41卷,第11期 相互独立的样本,其中参数0是一个未知的常数 E[h(©x=∫h(eπ(dB (6) 得到贝叶斯公式: 在后验概率分布π(x)中抽取大量的独立分布 f(xe)π(0) π(x)= (2) 样本观测值0其中=l,2,…,m,可得下式: ∑:f(axe)π(o)de 该公式中,参数0的分布是离散的.如果参数 =∑ (7) 0的分布是连续的,则贝叶斯公式则变为如下所示: 根据选择的似然函数、先验分布(y为独立分 f(xπ(0 π(x)= (3) 布样本)等,利用Proposal分布py)与不变分布 「f(x0π(0d0 q(ybyXy"为MCMC抽样后的建议新样本值),从当 前位置抽取候选值Markov链从y转移到y的可能 其中,其中π指的是参数的概率分布,π()和π(x) 性是1: 分别指的是0的先验概率和后验概率,x)指的 是观测到的样本信息,也就是似然函数,日是0的 A(y.y)= p(y")qly) (8) p(y)g(yly) 参数空间 先验分布是贝叶斯理论的重要一环,是对事 当Proposal分布函数满足对称随机q6ly)= 件的主观经验和主观判断,先验分布的构造主要 q0y时,接受概率简化为 有扩散先验分布和共扼先验分布两类.扩散先验 A0y)=1, (9) p(vi) 分布的构造方法除最大嫡法外,还包括相对似然 函数法、蒙特卡洛方法、积累函数法等) 式中,(*)为似然度算子,其值越小表示模拟值与 似然函数是贝叶斯方法的重要基础,其理论 观测值相似程度越高,为独立样本,=1,2,…,m 发展主要得益于Fisher提出的似然原理]贝叶 通过以上公式,产生一个[0,1]间均匀分布的随机 斯方法极大后验估计方法来源于似然原理中的极 数R,如果R<A,y),则接受该测试参数并设定为 大似然估计法,目前该方法仍然广泛应用在各学 当前模型参数o,即y+)=y;否则不接收该测试 科中 参数,y+1山)=i. 若样本X,(=1,…,n)的每个样本信息相互独 通过迭代重复上述步骤,这样对足够大的 立,则样本x=(X,…,X)的似然函数x0可用下 k值,序列yk+)yk+2·ym可以认为是后验分布的 式计算 抽样2四.和独立样本一样,可以用这个序列来估 计一些数字特征,比如后验均值.这种方法可以完 f(x0= (4) 全不考虑所选的q(yy)(当然必须服从某些正则 i=l 条件)2四 1.2贝叶斯统计推断模型的求解方法 在多参数问题的反演分析中,虽然已知其后 2矿井突水水源模型样本 验分布,但是很难用显式表示,更难以用数值分析 2.1突水水源判别指标的确定 方法进行参数估计]因此,需要采用舍选法、重 各含水层中的水化学成分众多,而各含水层 要抽样法或马尔可夫链蒙特卡洛法(Markov chain 又是受天然、人为因素共同影响的统一体.水中 Monte Carlo,MCMC)等方法在后验分布空间抽样4-1, 主要离子有:Na+K*、Ca2+、Mg2+、HCO、C、SO2 进行参数估计. (这6项是水中的主要离子,也是常用分析离子), 马尔可夫链蒙特卡洛法(MCMC)方法的样本 以及Fe、Fe2+、CO}、NO5、Mn2+等.但是,考虑每 是通过Markov链搜索变量空间u,Markov链在最 一种化学离子是不现实的,也是不经济的,必须综 可能的区间进行搜索通过迭代产生模拟序列 合考虑离子的重要性和数据的有效性4因此,本 Yo,Yi,Y2,…,Yn,其中Yo为任意初始值,Yn+的转移 文选取了Mg2+、Na+K*、Ca2+、SO、CI和HCO共 概率只与其前一个状态Yn有关,即: 6项指标作为判别因子 P(Yn+I=ylYn,Yn-1,..,Yo)=P(Yn+ilYn) (5) 2.2贝叶斯判别样本的建立 蒙特卡洛抽样方法刀基本思想是通过大量取 根据各含水层的水质特征和实际的判别需 样近似得到预期结果.根据后验概率π(x,如果 要,将矿区的突水水源分为4类:海水为I类、第 h()=0.那么h()的后验概率为 四系孔隙水为Ⅱ类、基岩裂隙水为Ⅲ类、淡水为
相互独立的样本,其中参数 θ 是一个未知的常数. 得到贝叶斯公式: π(θi |x) = f (x|θi)π(θi) ∑ i f (x|θi)π(θ)dθi (2) 该公式中,参数 θ 的分布是离散的. 如果参数 θ 的分布是连续的,则贝叶斯公式则变为如下所示: π(θ|x) = f (x|θ)π(θ) r Θ f (x|θ)π(θ)dθ (3) 其中,其中 π 指的是参数的概率分布,π(θ) 和 π(θ|x) 分别指的是 θ 的先验概率和后验概率,f(x|θ) 指的 是观测到的样本信息,也就是似然函数,Θ 是 θ 的 参数空间[12] . 先验分布是贝叶斯理论的重要一环,是对事 件的主观经验和主观判断,先验分布的构造主要 有扩散先验分布和共扼先验分布两类. 扩散先验 分布的构造方法除最大熵法外,还包括相对似然 函数法、蒙特卡洛方法、积累函数法等[13] . 似然函数是贝叶斯方法的重要基础,其理论 发展主要得益于 Fisher 提出的似然原理[13] . 贝叶 斯方法极大后验估计方法来源于似然原理中的极 大似然估计法,目前该方法仍然广泛应用在各学 科中. 若样本 Xi (i=1, …, n) 的每个样本信息相互独 立,则样本 x =(X1 , …, Xi ) 的似然函数 f(x|θ) 可用下 式计算. f (x|θ) = ∏n i=1 f (x; θ) (4) 1.2 贝叶斯统计推断模型的求解方法 在多参数问题的反演分析中,虽然已知其后 验分布,但是很难用显式表示,更难以用数值分析 方法进行参数估计[13] . 因此,需要采用舍选法、重 要抽样法或马尔可夫链蒙特卡洛法(Markov chain Monte Carlo, MCMC)等方法在后验分布空间抽样[14−15] , 进行参数估计. Y0 Y1 Y2 Yn Y0 Yn+1 Yn 马尔可夫链蒙特卡洛法(MCMC)方法的样本 是通过 Markov 链搜索变量空间[16] ,Markov 链在最 可能的区间进行搜索[10] . 通过迭代产生模拟序列 , , ,…, ,其中 为任意初始值, 的转移 概率只与其前一个状态 有关,即: P(Yn+1 = y|Yn,Yn−1,· · ·,Y0) = P(Yn+1|Yn) (5) π(θ|x) h(θ) = θ h(θ) 蒙特卡洛抽样方法[17] 基本思想是通过大量取 样近似得到预期结果. 根据后验概率 ,如果 ,那么 的后验概率为 E [h(θ)|x] = ∫ h(θ)π(θ)dθ (6) π(θ|x) θi 在后验概率分布 中抽取大量的独立分布 样本观测值 其中 i=1, 2, …, m,可得下式: hm = 1 m ∑m i=1 h(θi) (7) p(y) q(y ∗ |y) y ∗ y ∗ 根据选择的似然函数、先验分布(y 为独立分 布样本 )等 ,利 用 Proposal 分 布 与不变分布 ( 为 MCMC 抽样后的建议新样本值),从当 前位置抽取候选值 Markov 链从 转移到 y 的可能 性是[18] : A(y, y ∗ ) = { 1, p(y ∗ )q(y|y ∗ ) p(y)q(y ∗ |y) } (8) q(y ∗ |y) = q(y|y ∗ ) 当 Proposal 分布函数满足对称随机 时,接受概率简化为[19] : A(yi , y ∗ ) = { 1, p(y ∗ ) p(yi) } (9) R < A(yi , y ∗ ) y(i+1) = y ∗ y(i+1) = yi 式中,p(*) 为似然度算子,其值越小表示模拟值与 观测值相似程度越高,yi 为独立样本,i=1, 2, …, m. 通过以上公式,产生一个 [0, 1] 间均匀分布的随机 数 R,如果 ,则接受该测试参数并设定为 当前模型参数[20] ,即 ;否则不接收该测试 参数, . y(k+1) , y(k+2) ,··· , yn q(y ∗ |y) 通过迭代重复上述步骤. 这样对足够大的 k 值,序列 可以认为是后验分布的 抽样[21] . 和独立样本一样,可以用这个序列来估 计一些数字特征,比如后验均值. 这种方法可以完 全不考虑所选的 (当然必须服从某些正则 条件)[22] . 2 矿井突水水源模型样本 2.1 突水水源判别指标的确定 各含水层中的水化学成分众多,而各含水层 又是受天然、人为因素共同影响的统一体. 水中 主要离子有:Na++K+、Ca2+、Mg2+、HCO3 −、Cl−、SO4 2−[23] (这 6 项是水中的主要离子,也是常用分析离子), 以及 Fe3+、Fe2+、CO3 2−、NO3 −、Mn2+等. 但是,考虑每 一种化学离子是不现实的,也是不经济的,必须综 合考虑离子的重要性和数据的有效性[24] . 因此,本 文选取了 Mg2+、Na++K+、Ca2+、SO4 2−、Cl−和 HCO3 −共 6 项指标作为判别因子. 2.2 贝叶斯判别样本的建立 根据各含水层的水质特征和实际的判别需 要,将矿区的突水水源分为 4 类:海水为Ⅰ类、第 四系孔隙水为Ⅱ类、基岩裂隙水为Ⅲ类、淡水为 · 1414 · 工程科学学报,第 41 卷,第 11 期
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 ·1415 Ⅳ类从参考文献[26]所提供的从大量的矿井 p统计表),其中突(涌)水水源为I类水层的有17个, 突水案例中选取40个典型突水水样作为训练样本 Ⅱ类含水层的有4个,Ⅲ类含水层的有15个,W类 (如表1所示为不同水样的主要离子成分质量浓度 含水层的有4个 表1矿井突水水源判别的变量资料 Table 1 Variable data for discrimination of water inrush sources in mine 序号pHCO)MmgL)p(C)mgL-)pSO方)(mgL)p(K+Na)/(mgL-)p(Ca)(mgL-)pMg(mgL-)水样水源结果贝叶斯法判别结果 268.4 20585.5 2713.7 11707.5 716.4 1175.5 I 2 295.3 23158.4 3097.9 13025.5 651.3 1427.6 I 244.0 22644.0 3001.9 13025.5 676.4 1412.4 237.9 24702.3 2977.9 13442.5 876.8 1576.5 5 262.3 21408.6 2929.8 11957.5 651.3 1366.9 6 274.5 23981.9 3122.0 13783 751.5 1549.1 I 244.0 39112.3 4418.8 19692.5 2204.4 3049.7 m Ⅲ 8 268.4 21099.8 2881.8 11957.5 576.2 1351.7 274.5 21614.6 2833.8 12395.5 626.3 1369.9 10 286.7 24393.5 3314.1 13783 776.6 1582.5 11 268.4 27790.3 3362.1 16362.5 891.8 1767.8 12 317.3 32936.6 4130.6 18505 1052.1 2126.3 Ⅲ 13 323.4 36024.3 4514.8 19448 1262.5 2423.9 Ⅲ 14 329.5 38082.9 4682.9 21295 1067.1 2530.2 Ⅲ 15 335.6 33965.7 4156.0 19365 926.9 2098.9 m Ⅲ 16 268.4 46317.2 5283.3 25574 1703.4 3462.8 ) Ⅲ 少 280.6 29848.9 3001.9 15760 1392.8 1889.3 《 Ⅱ 18 207.4 39626.7 4755.0 21170 1853.7 3007.1 Ⅲ 19 280.6 31392.7 3962.5 17490 1112.2 2272.1 Ⅲ 219.6 33348.2 3266.0 16582 2148.3 2196.7 M 21 286.7 33183.7 3746.3 17362 1242.5 2308.5 ⑧ Ⅲ 22 250.1 28654.9 3688.7 15928 1042.1 1905.1 I 23 195.2 26184.4 3073.9 13518 1162.3 1715.6 I 24 250.1 23467.2 2881.8 12912 681.4 1458.0 25 244.0 23467.2 2881.8 12692 825.6 1492.0 250.1 23879.1 3035.5 12892 881.8 1569.8 27 250.1 43641,1 4956.7 23226 1603.2 3134.7 Ⅲ 225.7 35406.8 4169.0 19250 1362.7 2478.6 Ⅲ Ⅲ 29 268.4 34171.7 4265.1 18910 1162.3 2269.6 四 30 323.4 37053.8 4514.8 20530.8 1202.4 2527.2 ⑧ Ⅲ 31 274.5 39112.3 4923.1 21270 1468.9 2694.3 Ⅲ 32 158.6 16468.3 2439.9 9412.5 380.8 1125.1 33 152.5 16303.5 2267.1 9150 392.8 1122.7 I 1 34 317.3 20585.5 2881.8 12847.5 551.1 1184.6 I 35 225.7 19762.0 2473.5 11098.8 551.1 1233.2 I 36 176.9 17456.3 2228.6 10112.5 320.6 1093.5 37 140.3 89.0 76.8 61.2 100.2 14.6 N W 38 256.2 212.3 405.4 200 138.3 42.5 N W 39 209.9 21.3 55.7 322 81.0 4.4 V W 40 219.6 257.0 134.5 133.7 144.3 26.7 N
Ⅳ类[25] . 从参考文献 [26] 所提供的从大量的矿井 突水案例中选取 40 个典型突水水样作为训练样本 (如表 1 所示为不同水样的主要离子成分质量浓度 ρ 统计表),其中突(涌)水水源为Ⅰ类水层的有 17 个, Ⅱ类含水层的有 4 个,Ⅲ类含水层的有 15 个,Ⅳ类 含水层的有 4 个. 表 1 矿井突水水源判别的变量资料[26] Table 1 Variable data for discrimination of water inrush sources in mine[26] 序号 ρ(HCO3 − )/(mg·L−1) ρ(Cl− )/(mg·L−1) ρ(SO4 2−)/(mg·L−1) ρ(K++Na+ )/(mg·L−1) ρ(Ca2+)/(mg·L−1) ρ(Mg2+)/(mg·L−1) 水样水源结果 贝叶斯法判别结果 1 268.4 20585.5 2713.7 11707.5 716.4 1175.5 Ⅰ Ⅰ 2 295.3 23158.4 3097.9 13025.5 651.3 1427.6 Ⅰ Ⅰ 3 244.0 22644.0 3001.9 13025.5 676.4 1412.4 Ⅰ Ⅰ 4 237.9 24702.3 2977.9 13442.5 876.8 1576.5 Ⅰ Ⅰ 5 262.3 21408.6 2929.8 11957.5 651.3 1366.9 Ⅰ Ⅰ 6 274.5 23981.9 3122.0 13783 751.5 1549.1 Ⅱ Ⅱ 7 244.0 39112.3 4418.8 19692.5 2204.4 3049.7 Ⅲ Ⅲ 8 268.4 21099.8 2881.8 11957.5 576.2 1351.7 Ⅰ Ⅰ 9 274.5 21614.6 2833.8 12395.5 626.3 1369.9 Ⅰ Ⅰ 10 286.7 24393.5 3314.1 13783 776.6 1582.5 Ⅱ Ⅱ 11 268.4 27790.3 3362.1 16362.5 891.8 1767.8 Ⅱ Ⅱ 12 317.3 32936.6 4130.6 18505 1052.1 2126.3 Ⅲ Ⅲ 13 323.4 36024.3 4514.8 19448 1262.5 2423.9 Ⅲ Ⅲ 14 329.5 38082.9 4682.9 21295 1067.1 2530.2 Ⅲ Ⅲ 15 335.6 33965.7 4156.0 19365 926.9 2098.9 Ⅲ Ⅲ 16 268.4 46317.2 5283.3 25574 1703.4 3462.8 Ⅲ Ⅲ 17 280.6 29848.9 3001.9 15760 1392.8 1889.3 Ⅱ Ⅱ 18 207.4 39626.7 4755.0 21170 1853.7 3007.1 Ⅲ Ⅲ 19 280.6 31392.7 3962.5 17490 1112.2 2272.1 Ⅲ Ⅲ 20 219.6 33348.2 3266.0 16582 2148.3 2196.7 Ⅲ Ⅲ 21 286.7 33183.7 3746.3 17362 1242.5 2308.5 Ⅲ Ⅲ 22 250.1 28654.9 3688.7 15928 1042.1 1905.1 Ⅰ Ⅰ 23 195.2 26184.4 3073.9 13518 1162.3 1715.6 Ⅰ Ⅰ 24 250.1 23467.2 2881.8 12912 681.4 1458.0 Ⅰ Ⅰ 25 244.0 23467.2 2881.8 12692 825.6 1492.0 Ⅰ Ⅰ 26 250.1 23879.1 3035.5 12892 881.8 1569.8 Ⅰ Ⅰ 27 250.1 43641.1 4956.7 23226 1603.2 3134.7 Ⅲ Ⅲ 28 225.7 35406.8 4169.0 19250 1362.7 2478.6 Ⅲ Ⅲ 29 268.4 34171.7 4265.1 18910 1162.3 2269.6 Ⅲ Ⅲ 30 323.4 37053.8 4514.8 20530.8 1202.4 2527.2 Ⅲ Ⅲ 31 274.5 39112.3 4923.1 21270 1468.9 2694.3 Ⅲ Ⅲ 32 158.6 16468.3 2439.9 9412.5 380.8 1125.1 Ⅰ Ⅰ 33 152.5 16303.5 2267.1 9150 392.8 1122.7 Ⅰ Ⅰ 34 317.3 20585.5 2881.8 12847.5 551.1 1184.6 Ⅰ Ⅰ 35 225.7 19762.0 2473.5 11098.8 551.1 1233.2 Ⅰ Ⅰ 36 176.9 17456.3 2228.6 10112.5 320.6 1093.5 Ⅰ Ⅰ 37 140.3 89.0 76.8 61.2 100.2 14.6 Ⅳ Ⅳ 38 256.2 212.3 405.4 200 138.3 42.5 Ⅳ Ⅳ 39 209.9 21.3 55.7 32.2 81.0 4.4 Ⅳ Ⅳ 40 219.6 257.0 134.5 133.7 144.3 26.7 Ⅳ Ⅳ 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1415 ·
·1416 工程科学学报,第41卷,第11期 3 矿井突水水源模型建立及应用 荷PC1和PC2的解释方差,结果如表2所示.综合 成分指标可以通过主成分元素数值与对应主成分 3.1不同水样的信息分析 解释方差百分数的乘积之和计算获得27,水样的 表1所示为文献26]中在三山岛金矿开展的 主成分经过计算的综合成分指标分布结果如图1 矿山深部巷道水样采集分析数据,按照图1下方 所示 公式对表1中的水样进行主要成分综合分析 从图中可以看出Ⅲ类水样的矿化度(TDS)较 (PCA),经过抽样适当性检验,可以得出主成分载 高,与其他水样相比,含有较高浓度的Na、Mg+阳 2.5 离子和C1、S042-阴离子,与I类海水水样同属 2.0 Na-C类型水样.I类水样和Ⅱ类水样矿化程度类 1.5 似,属于中等矿化度.Ⅳ类淡水矿化程度最低山 1.0- 根据表1所示三山岛金矿所取水样的样本信 0.5 息绘制的PIPER三线图如图2所示,图中所示为 0 0.5 主要阳离子(Mg2、Na+K、Ca2)和主要阴离子 -1.0 (CT、HCO3、SO,2)的质量浓度分布散点图 -1.5- 分析图2可得,选取的水样除了淡水水样外, -2.0 其他水样均表现出明显的Na+Mg2+C1-+SO42-类 型,水质较为稳定,I类水样、Ⅱ类水样和Ⅲ类水 主成分1综合指标 PC1(Principal Component1)=-0.004[O]-0.034FH]+0.208[TDS]+ 样各含水层之间的水质区别不明显,存在明显的 0.209[C1]+0.141[S04]+0.047HC03]+0.193Na+0.140Ca]+ 0.205Mgl 表2主成分载荷解释方差 PC2(Principal Component2)=0.306[1%O]+0.034[H]+0.015[TDS]+ Table 2 Interpretation variance of principal component load 0.034[C]+0.155S0]+0.239[HC0]+0.035Na+0.251[Ca]+ 主成分载荷 特征值 解释方差% 累计解释方差% 0.042Mg] 图1水样主成分分析结果 PC1 4.952 72.694 75.627 PC2 1.338 17.354 80.735 Fig.1 Principal component analysis of water samples Cr+SO,2的质量浓度mgL) 'A0 "y 00 Mg2的质量浓度(mgL-) 8 *+K的质量浓度mg HCO,的质量浓度(mgL) 20 40 60 SO,的质量浓度1mg 0 20 80 00 0 100 60 40 0 0 20 40 60 80 100 Ca的质量浓度/(mgL-) C的质量浓度(mgL 图2 三山岛金矿水样的PIPER图 Fig.2 PIPER diagram of water samples from Sanshandao gold mine
3 矿井突水水源模型建立及应用 3.1 不同水样的信息分析 表 1 所示为文献 [26] 中在三山岛金矿开展的 矿山深部巷道水样采集分析数据,按照图 1 下方 公式对 表 1 中的水样进行主要成分综合分 析 (PCA),经过抽样适当性检验,可以得出主成分载 荷 PC1 和 PC2 的解释方差,结果如表 2 所示. 综合 成分指标可以通过主成分元素数值与对应主成分 解释方差百分数的乘积之和计算获得[27] ,水样的 主成分经过计算的综合成分指标分布结果如图 1 所示. 从图中可以看出Ⅲ类水样的矿化度 (TDS) 较 高,与其他水样相比,含有较高浓度的 Na+、Mg2+阳 离子和 Cl-、SO4 2-阴离子,与Ⅰ类海水水样同属 Na-Cl 类型水样. Ⅰ类水样和Ⅱ类水样矿化程度类 似,属于中等矿化度. Ⅳ类淡水矿化程度最低[1] . 根据表 1 所示三山岛金矿所取水样的样本信 息绘制的 PIPER 三线图如图 2 所示,图中所示为 主要阳离子(Mg2+、Na++K+、Ca2+)和主要阴离子 (Cl−、HCO3 −、SO4 2−)的质量浓度分布散点图. 分析图 2 可得,选取的水样除了淡水水样外, 其他水样均表现出明显的 Na++Mg2++Cl-+SO4 2-类 型,水质较为稳定,Ⅰ类水样、Ⅱ类水样和Ⅲ类水 样各含水层之间的水质区别不明显,存在明显的 表 2 主成分载荷解释方差 Table 2 Interpretation variance of principal component load 主成分载荷 特征值 解释方差/% 累计解释方差/% PC1 4.952 72.694 75.627 PC2 1.338 17.354 80.735 −6 −4 −2 0 2 4 −2.0 −1.5 −1.0 −0.5 0 0.5 1.0 1.5 2.0 2.5 主成分2综合指标 主成分1综合指标 Ⅳ Ⅱ Ⅲ Ⅰ PC1(Principal Component1) = −0.004[18O] -0.034[2H] + 0.208[TDS] + 0.209[Cl] + 0.141[SO4 ] + 0.047[HCO3 ] + 0.193[Na] + 0.140[Ca] + 0.205[Mg] PC2(Principal Component2) = 0.306[18O] + 0.034[2H] + 0.015[TDS] + 0.034[Cl] + 0.155[SO4 ] + 0.239[HCO3 ] + 0.035[Na] + 0.251[Ca] + 0.042[Mg] 图 1 水样主成分分析结果 Fig.1 Principal component analysis of water samples 100 80 60 40 20 0 100 80 60 40 20 0 Cl −+SO4 2−的质量浓度/(mg·L −1 ) Ca 2++Mg 2+的质量浓度/(mg·L −1 ) 100 80 60 40 20 0 0 20 40 60 80 100 0 20 40 60 80 100 Mg 2+的质量浓度/(mg·L −1 ) Na ++K 的质量浓度 + /(mg·L −1 ) Ca2+的质量浓度/(mg·L−1) 0 20 40 60 80 100 0 20 40 60 80 0 100 20 40 60 80 100 SO4 2−的质量浓度/(mg·L −1 ) HCO3 −的质量浓度/(mg·L −1 ) Cl−的质量浓度/(mg·L−1) 图 2 三山岛金矿水样的 PIPER 图 Fig.2 PIPER diagram of water samples from Sanshandao gold mine · 1416 · 工程科学学报,第 41 卷,第 11 期