第10卷第1期 智能系统学报 Vol.10 No.1 2015年2月 CAAI Transactions on Intelligent Systems Feb.2015 D0I:10.3969/j.issn.1673-4785.201310070 网络出版地址:http:/www.cnki.net/kcms/detail/23.1538.TP.20150113.1130.002.html 基于FCM与集成高斯过程回归的赖氨酸发酵软测量 嵇小辅,张翔 (江苏大学电气信息工程学院,江苏镇江212013) 摘要:为解决赖氨酸发酵过程中菌体浓度难以在线检测的难题,提出一种基于模糊C均值聚类(℉CM)与集成高斯 过程回归(GPR)的软测量建模方法。针对典型生物发酵过程可分为延滞期、指数生长期、稳定期、死亡期4个反应 周期的特点,采用模糊C均值聚类算法对样本集进行聚类分析以形成若干子样本集:对每个子样本集分别采用高斯 过程回归训练时,为提高GPR模型的泛化能力,利用Adaboost算法提升GPR模型,分别在各子集建立集成GPR软 测量子模型:采用欧氏距离计算新样本点对应于每一子模型的隶属度:加权求和获得最终的软测量模型的预测输 出。基于氨基酸类典型菌种L-赖氨酸反应过程菌体浓度参数预测的试验研究表明:与全局单一GP模型、集成 GPR模型和基于FCM与多GPR模型相比,所建立的基于FCM与集成GPR软测量模型拟合精度高,泛化能力强,较 好地满足了赖氨酸发酵过程的控制要求。 关键词:高斯过程回归(GPR):模糊C均值聚类(FCM):Adaboost算法;L-赖氨酸;软测量:欧氏距离;隶属度;加权求和 中图分类号:TP274文献标志码:A文章编号:1673-4785(2015)01-0156-07 中文引用格式:嵇小辅,张翔.基于FCM与集成高斯过程回归的赖氨酸发酵软测量[J].智能系统学报,2015,10(1):156-162 英文引用格式:JI Xiaofu,ZHANG Xiang..Soft measurement of lysine fermentation based on FCM and integrated Gaussian process regression [J].CAAI Transactions on Intelligent Systems,2015,10(1):156-162. Soft measurement of lysine fermentation based on FCM and integrated Gaussian process regression JI Xiaofu,ZHANG Xiang (School of Electrical and Information Engineering,Jiangsu University,Zhenjiang 212013,China) Abstract:In order to solve the problem that cell concentration is difficult to directly measure in the lysine fermenta- tion process,a kind of soft measurement modeling method is proposed on the basis of fuzzy C-mean clustering (FCM)and integrated Gaussian process regression (GPR).The characteristics of typical biological fermentation process can be divided into 4 reaction cycles,including lag phase,exponential growth phase,stable phase,and dead phase.The cluster analysis is conducted for a sample set by applying fuzzy C-mean clustering algorithm,so as to form several sub-sample sets.In order to improve the generalization performance of the GPR,each group is trained through Gaussian Process Regression based on Adaboost and the corresponding integrated sub-models are established.The memberships between each new sample and each group are set as the weights through Euclidean distance and the predicted result is obtained by weighted sum by using typical bacterium of amino acid-L-lysine fermentation as an example.The simulation results showed that compared with the global single GPR model,inte- grated GPR model and the model based on FCM and multiple GPR,the soft measurement model based on integrat- ed GPR and FCM has high fitting precision.It also had strong generalization ability,which meets the control re- quirements of lysine fermentation process Keywords:Gaussian process regression(GPR);fuzzy C-mean clustering (FCM);Adaboost algorithm;L-lysine; soft measurement;Euclidean distance;membership;weighted sum 收稿日期:2013-10-27.网络出版日期:2015-01-13. 基金项目:国家863计划资助项目(2011AA09070301):江苏高校建设 生物发酵过程是一个具有高度非线性与不确定 优势学科工程资助项目(苏政办发[2011]6号):江苏省科 性和兼有生物、化学、物理和热力变化的复杂生化反 技支撑计划资助项目(BE2010354):江苏省自然科学基金 资助项目(BK2011465). 应过程。一些反映发酵过程品质的重要参量,如菌 通信作者:张翔.E-mail:zhangxiang_mail@126.com
第 员园 卷第 员 期摇摇摇摇摇摇摇摇摇摇摇 摇摇摇 智 能 系 统 学 报摇摇摇摇摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 灾燥造援员园 翼援员 圆园员缘 年 圆 月摇摇摇摇摇摇摇摇摇摇摇 悦粤粤陨 栽则葬灶泽葬糟贼蚤燥灶泽 燥灶 陨灶贼藻造造蚤早藻灶贼 杂赠泽贼藻皂泽 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 云藻遭援 圆园员缘 阅韵陨院员园援猿怨远怨 辕 躁援蚤泽泽灶援员远苑猿鄄源苑愿缘援圆园员猿员园园苑园 网络出版地址院澡贼贼责院 辕 辕 憎憎憎援糟灶噪蚤援灶藻贼 辕 噪糟皂泽 辕 凿藻贼葬蚤造 辕 圆猿援员缘猿愿援栽孕援圆园员缘园员员猿援员员猿园援园园圆援澡贼皂造 基于 云悦酝 与集成高斯过程回归的赖氨酸发酵软测量 嵇小辅袁张翔 渊江苏大学 电气信息工程学院袁江苏 镇江 圆员圆园员猿冤 摘 要院为解决赖氨酸发酵过程中菌体浓度难以在线检测的难题袁提出一种基于模糊 悦 均值聚类渊 云悦酝冤与集成高斯 过程回归渊郧孕砸冤的软测量建模方法遥 针对典型生物发酵过程可分为延滞期尧指数生长期尧稳定期尧死亡期 源 个反应 周期的特点袁采用模糊 悦 均值聚类算法对样本集进行聚类分析以形成若干子样本集曰对每个子样本集分别采用高斯 过程回归训练时袁为提高 郧孕砸 模型的泛化能力袁利用 粤凿葬遭燥燥泽贼 算法提升 郧孕砸 模型袁分别在各子集建立集成 郧孕砸 软 测量子模型曰采用欧氏距离计算新样本点对应于每一子模型的隶属度曰加权求和获得最终的软测量模型的预测输 出遥 基于氨基酸类典型菌种 蕴原赖氨酸反应过程菌体浓度参数预测的试验研究表明院与全局单一 郧孕砸 模型尧集成 郧孕砸 模型和基于 云悦酝 与多 郧孕砸 模型相比袁所建立的基于 云悦酝 与集成 郧孕砸 软测量模型拟合精度高袁泛化能力强袁较 好地满足了赖氨酸发酵过程的控制要求遥 关键词院高斯过程回归渊郧孕砸冤曰模糊 悦 均值聚类渊云悦酝冤曰粤凿葬遭燥燥泽贼 算法曰蕴原赖氨酸曰软测量曰欧氏距离曰隶属度曰加权求和 中图分类号院 栽孕圆苑源 摇 文献标志码院粤摇 文章编号院员远苑猿鄄源苑愿缘渊圆园员缘冤园员鄄园员缘远鄄园苑 中文引用格式院嵇小辅袁张翔援基于 云悦酝 与集成高斯过程回归的赖氨酸发酵软测量咱允暂援 智能系统学报袁 圆园员缘袁 员园渊员冤 院员缘远鄄员远圆援 英文引用格式院允陨 载蚤葬燥枣怎袁在匀粤晕郧 载蚤葬灶早援 杂燥枣贼 皂藻葬泽怎则藻皂藻灶贼 燥枣 造赠泽蚤灶藻 枣藻则皂藻灶贼葬贼蚤燥灶 遭葬泽藻凿 燥灶 云悦酝 葬灶凿 蚤灶贼藻早则葬贼藻凿 郧葬怎泽泽蚤葬灶 责则燥糟藻泽泽 则藻早则藻泽泽蚤燥灶 咱允暂援 悦粤粤陨 栽则葬灶泽葬糟贼蚤燥灶泽 燥灶 陨灶贼藻造造蚤早藻灶贼 杂赠泽贼藻皂泽袁 圆园员缘袁 员园渊员冤 院 员缘远鄄员远圆援 杂燥枣贼 皂藻葬泽怎则藻皂藻灶贼 燥枣 造赠泽蚤灶藻 枣藻则皂藻灶贼葬贼蚤燥灶 遭葬泽藻凿 燥灶 云悦酝 葬灶凿 蚤灶贼藻早则葬贼藻凿 郧葬怎泽泽蚤葬灶 责则燥糟藻泽泽 则藻早则藻泽泽蚤燥灶 允陨 载蚤葬燥枣怎袁 在匀粤晕郧 载蚤葬灶早 渊 杂糟澡燥燥造 燥枣 耘造藻糟贼则蚤糟葬造 葬灶凿 陨灶枣燥则皂葬贼蚤燥灶 耘灶早蚤灶藻藻则蚤灶早袁允蚤葬灶早泽怎 哉灶蚤增藻则泽蚤贼赠袁 在澡藻灶躁蚤葬灶早 圆员圆园员猿袁 悦澡蚤灶葬冤 粤遭泽贼则葬糟贼院陨灶 燥则凿藻则 贼燥 泽燥造增藻 贼澡藻 责则燥遭造藻皂 贼澡葬贼 糟藻造造 糟燥灶糟藻灶贼则葬贼蚤燥灶 蚤泽 凿蚤枣枣蚤糟怎造贼 贼燥 凿蚤则藻糟贼造赠 皂藻葬泽怎则藻 蚤灶 贼澡藻 造赠泽蚤灶藻 枣藻则皂藻灶贼葬鄄 贼蚤燥灶 责则燥糟藻泽泽袁 葬 噪蚤灶凿 燥枣 泽燥枣贼 皂藻葬泽怎则藻皂藻灶贼 皂燥凿藻造蚤灶早 皂藻贼澡燥凿 蚤泽 责则燥责燥泽藻凿 燥灶 贼澡藻 遭葬泽蚤泽 燥枣 枣怎扎扎赠 悦 鄄皂藻葬灶 糟造怎泽贼藻则蚤灶早 渊云悦酝冤 葬灶凿 蚤灶贼藻早则葬贼藻凿 郧葬怎泽泽蚤葬灶 责则燥糟藻泽泽 则藻早则藻泽泽蚤燥灶 渊 郧孕砸冤 援 栽澡藻 糟澡葬则葬糟贼藻则蚤泽贼蚤糟泽 燥枣 贼赠责蚤糟葬造 遭蚤燥造燥早蚤糟葬造 枣藻则皂藻灶贼葬贼蚤燥灶 责则燥糟藻泽泽 糟葬灶 遭藻 凿蚤增蚤凿藻凿 蚤灶贼燥 源 则藻葬糟贼蚤燥灶 糟赠糟造藻泽袁 蚤灶糟造怎凿蚤灶早 造葬早 责澡葬泽藻袁 藻曾责燥灶藻灶贼蚤葬造 早则燥憎贼澡 责澡葬泽藻袁 泽贼葬遭造藻 责澡葬泽藻袁 葬灶凿 凿藻葬凿 责澡葬泽藻援 栽澡藻 糟造怎泽贼藻则 葬灶葬造赠泽蚤泽 蚤泽 糟燥灶凿怎糟贼藻凿 枣燥则 葬 泽葬皂责造藻 泽藻贼 遭赠 葬责责造赠蚤灶早 枣怎扎扎赠 悦鄄皂藻葬灶 糟造怎泽贼藻则蚤灶早 葬造早燥则蚤贼澡皂袁 泽燥 葬泽 贼燥 枣燥则皂 泽藻增藻则葬造 泽怎遭鄄泽葬皂责造藻 泽藻贼泽援 陨灶 燥则凿藻则 贼燥 蚤皂责则燥增藻 贼澡藻 早藻灶藻则葬造蚤扎葬贼蚤燥灶 责藻则枣燥则皂葬灶糟藻 燥枣 贼澡藻 郧孕砸袁 藻葬糟澡 早则燥怎责 蚤泽 贼则葬蚤灶藻凿 贼澡则燥怎早澡 郧葬怎泽泽蚤葬灶 孕则燥糟藻泽泽 砸藻早则藻泽泽蚤燥灶 遭葬泽藻凿 燥灶 粤凿葬遭燥燥泽贼 葬灶凿 贼澡藻 糟燥则则藻泽责燥灶凿蚤灶早 蚤灶贼藻早则葬贼藻凿 泽怎遭鄄皂燥凿藻造泽 葬则藻 藻泽贼葬遭造蚤泽澡藻凿援 栽澡藻 皂藻皂遭藻则泽澡蚤责泽 遭藻贼憎藻藻灶 藻葬糟澡 灶藻憎 泽葬皂责造藻 葬灶凿 藻葬糟澡 早则燥怎责 葬则藻 泽藻贼 葬泽 贼澡藻 憎藻蚤早澡贼泽 贼澡则燥怎早澡 耘怎糟造蚤凿藻葬灶 凿蚤泽贼葬灶糟藻 葬灶凿 贼澡藻 责则藻凿蚤糟贼藻凿 则藻泽怎造贼 蚤泽 燥遭贼葬蚤灶藻凿 遭赠 憎藻蚤早澡贼藻凿 泽怎皂 遭赠 怎泽蚤灶早 贼赠责蚤糟葬造 遭葬糟贼藻则蚤怎皂 燥枣 葬皂蚤灶燥 葬糟蚤凿要蕴鄄造赠泽蚤灶藻 枣藻则皂藻灶贼葬贼蚤燥灶 葬泽 葬灶 藻曾葬皂责造藻援 栽澡藻 泽蚤皂怎造葬贼蚤燥灶 则藻泽怎造贼泽 泽澡燥憎藻凿 贼澡葬贼 糟燥皂责葬则藻凿 憎蚤贼澡 贼澡藻 早造燥遭葬造 泽蚤灶早造藻 郧孕砸 皂燥凿藻造袁 蚤灶贼藻鄄 早则葬贼藻凿 郧孕砸 皂燥凿藻造 葬灶凿 贼澡藻 皂燥凿藻造 遭葬泽藻凿 燥灶 云悦酝 葬灶凿 皂怎造贼蚤责造藻 郧孕砸袁 贼澡藻 泽燥枣贼 皂藻葬泽怎则藻皂藻灶贼 皂燥凿藻造 遭葬泽藻凿 燥灶 蚤灶贼藻早则葬贼鄄 藻凿 郧孕砸 葬灶凿 云悦酝 澡葬泽 澡蚤早澡 枣蚤贼贼蚤灶早 责则藻糟蚤泽蚤燥灶援 陨贼 葬造泽燥 澡葬凿 泽贼则燥灶早 早藻灶藻则葬造蚤扎葬贼蚤燥灶 葬遭蚤造蚤贼赠袁 憎澡蚤糟澡 皂藻藻贼泽 贼澡藻 糟燥灶贼则燥造 则藻鄄 择怎蚤则藻皂藻灶贼泽 燥枣 造赠泽蚤灶藻 枣藻则皂藻灶贼葬贼蚤燥灶 责则燥糟藻泽泽 运藻赠憎燥则凿泽院郧葬怎泽泽蚤葬灶 责则燥糟藻泽泽 则藻早则藻泽泽蚤燥灶渊郧孕砸冤 曰 枣怎扎扎赠 悦 鄄皂藻葬灶 糟造怎泽贼藻则蚤灶早 渊 云悦酝冤 曰 粤凿葬遭燥燥泽贼 葬造早燥则蚤贼澡皂曰 蕴鄄造赠泽蚤灶藻曰 泽燥枣贼 皂藻葬泽怎则藻皂藻灶贼曰 耘怎糟造蚤凿藻葬灶 凿蚤泽贼葬灶糟藻曰 皂藻皂遭藻则泽澡蚤责曰 憎藻蚤早澡贼藻凿 泽怎皂 收稿日期院圆园员猿鄄员园鄄圆苑援 摇 网络出版日期院圆园员缘鄄园员鄄员猿援 基金项目院国家 愿远猿 计划资助项目 渊圆园员员粤粤园怨园苑园猿园员冤 曰 江苏高校建设 优势学科工程资助项目渊苏政办发咱 圆园员员暂 远 号冤 曰 江苏省科 技支撑计划资助项目 渊 月耘圆园员园猿缘源冤 曰 江苏省自然科学基金 资助项目渊月运圆园员员源远缘冤援 通信作者院张翔援耘鄄皂葬蚤造院 扎澡葬灶早曾蚤葬灶早赃皂葬蚤造岳 员圆远援糟燥皂援 摇 摇 生物发酵过程是一个具有高度非线性与不确定 性和兼有生物尧化学尧物理和热力变化的复杂生化反 应过程遥 一些反映发酵过程品质的重要参量袁如菌
第1期 嵇小辅,等:基于FCM与集成高斯过程回归的赖氨酸发酵软测量 ·157 体浓度、基质浓度、产物浓度等,目前还缺乏在线测 习理论基础上发展起来的一种新型机器学习方法, 量的仪器与手段,影响了在线优化控制的实施。对 它描述了一类随机过程:其任意有限变量集合的分 于这些重要过程参量的测量,目前主要采取在线取 布都是高斯过程,即对任意整数n≥1及任意一族 样、离线分析的方法,但这种方法时间间隔长、数据 随机变量X,与其对应的t时刻过程状态(X)的联 滞后大,难以满足生物反应过程在线控制的要求,同 合概率分布服从n维高斯分布。GP的全部统计特 时在线取样容易造成反应过程菌体污染,降低反应 征完全由其均值m(t)与协方差函数k(t,t')确定, 过程的质量。为了解决这一难题,人们提出软测量 定义表示如下: 的理论与方法。 f(X)-GP(m(t),k(t,t')) 软测量技术起源于20世纪70年代Brosillow提 式中:t为时间变量。为了符号描述方便起见,通常 出的推断控制思想),其基本原理是构造以直接可 对数据作预处理,使其均值函数等于0。 测的辅助变量为输入的数学模型来估计难以直接测 1.2高斯过程回归 量的主导变量。软测量建模方法可分为机理建模 给定样本训练集D={(x,:)1i=1,2,…,n}, 数据驱动建模、混合建模3种,其中数据驱动建模是 其中x:∈R是d维输入向量,y:∈R是相应的输出 从大量过程数据中提取过程信息从而建立软测量模 量。为了符号描述方便,用X表示输入向量构成的 型,不需要获得对象过程的精确数学模型,它尤其适 d×n维输入矩阵,y表示输出标量构成的输人矢 用于生物反应过程这一类内部机理尚不明确的复杂 量,那么训练集可表示为D=(X,y)。对于新样本 过程。数据驱动建模主要有神经网络、支持向量机、 x·,GP模型根据先验知识预测与x·相对应的输出 高斯过程回归(GPR)等方法,其中高斯过程回归将 值y°。 高斯先验分布运用于非参数回归函数空间,通过推 假设观察目标值y被噪声腐蚀,它与真实输出 导预测目标的后验分布建立统计模型,高斯过程回 值t相差e,即 归可以同时获得预测输出与预测精度,显著提高软 y=t+s 测量模型的性能。与神经网络、支持向量机等回归 式中:ε为独立的随机变量,满足均值为0、方差为 方法相比,高斯过程回归具有优化参数少、收敛速度 σ的高斯分布,即 快、模型精度高、泛化能力强等优点,在实际生物发 酵工业中具有较好的应用效果[26]。 e~N(0,c) 文中给出一种生物反应过程关键参量的基于模糊 观测目标值y的先验分布为 C均值聚类(FCM)与集成高斯过程回归建模方法。针 y~N(0,K+σI) 对生物发酵过程可分为延滞期、指数生长期、稳定期 式中:K=K(X,X)=(K).xa为对称正定的协方差 死亡期4个反应周期的特点,采用模糊C均值聚类方 矩阵,元素K度量了x:和x,的相关度。 法将过程数据样本分成4个子类,分别对每个子样本 由此,n个训练样本输出y和1个新样本输出 集采用高斯过程回归训练,训练过程采用Adaboost算 y·构成的联合高斯先验分布为 法以进一步提高软测量模型的泛化能力。对于新样 K(X,X)+o21 K(X,x) 本,通过计算样本点到各聚类中心的距离确定新样本 K(X,x)T k(x,x) 点对每个GPR模型的隶属度,通过加权综合给出软测 式中:K(X,x·)是新样本x·与训练集样本X的 量模型的预测输出。针对氨基酸类典型菌种L赖氨酸 n×1阶协方差矩阵,k(x·,x·)是新样本x·的自 反应过程的菌体浓度参量,建立软测量模型并开展相 协方差。 关的仿真实验研究。仿真结果表明,与单一高斯过程 GP的协方差函数需要满足对任一点集都能够 模型、集成GPR模型和基于FCM与多GPR模型方法 保证产生一个非负正定协方差矩阵。常用的协方差 相比,基于FCM与集成GPR的软测量模型具有更好地 函数为 逼近精度与泛化能力,较好地满足了赖氨酸发酵过程 +28。 软测量的要求。 式中:超参数l,σ、σ.对预测效果的影响很大。最 1高斯过程及其回归算法 优超参数可通过极大似然法获得,即通过建立训练 1.1 高斯过程原理 样本条件概率的对数似然函数对超参数求偏导,再 高斯过程(GP)是在高斯随机过程与贝叶斯学 采用共轭梯度优化方法搜索出超参数的最优解。该
体浓度尧基质浓度尧产物浓度等袁目前还缺乏在线测 量的仪器与手段袁影响了在线优化控制的实施遥 对 于这些重要过程参量的测量袁目前主要采取在线取 样尧离线分析的方法袁但这种方法时间间隔长尧数据 滞后大袁难以满足生物反应过程在线控制的要求袁同 时在线取样容易造成反应过程菌体污染袁降低反应 过程的质量遥 为了解决这一难题袁人们提出软测量 的理论与方法遥 软测量技术起源于 圆园 世纪 苑园 年代 月则燥泽蚤造造燥憎 提 出的推断控制思想咱员暂 袁其基本原理是构造以直接可 测的辅助变量为输入的数学模型来估计难以直接测 量的主导变量遥 软测量建模方法可分为机理建模尧 数据驱动建模尧混合建模 猿 种袁其中数据驱动建模是 从大量过程数据中提取过程信息从而建立软测量模 型袁不需要获得对象过程的精确数学模型袁它尤其适 用于生物反应过程这一类内部机理尚不明确的复杂 过程遥 数据驱动建模主要有神经网络尧支持向量机尧 高斯过程回归渊郧孕砸冤等方法袁其中高斯过程回归将 高斯先验分布运用于非参数回归函数空间袁通过推 导预测目标的后验分布建立统计模型袁高斯过程回 归可以同时获得预测输出与预测精度袁显著提高软 测量模型的性能遥 与神经网络尧支持向量机等回归 方法相比袁高斯过程回归具有优化参数少尧收敛速度 快尧模型精度高尧泛化能力强等优点袁在实际生物发 酵工业中具有较好的应用效果咱圆鄄远暂 遥 文中给出一种生物反应过程关键参量的基于模糊 悦 均值聚类渊云悦酝冤与集成高斯过程回归建模方法遥 针 对生物发酵过程可分为延滞期尧指数生长期尧稳定期尧 死亡期 源 个反应周期的特点袁采用模糊 悦 均值聚类方 法将过程数据样本分成 源 个子类袁分别对每个子样本 集采用高斯过程回归训练袁训练过程采用 粤凿葬遭燥燥泽贼 算 法以进一步提高软测量模型的泛化能力遥 对于新样 本袁通过计算样本点到各聚类中心的距离确定新样本 点对每个 郧孕砸 模型的隶属度袁通过加权综合给出软测 量模型的预测输出遥 针对氨基酸类典型菌种 蕴鄄赖氨酸 反应过程的菌体浓度参量袁建立软测量模型并开展相 关的仿真实验研究遥 仿真结果表明袁与单一高斯过程 模型尧集成 郧孕砸 模型和基于 云悦酝 与多 郧孕砸 模型方法 相比袁基于 云悦酝 与集成 郧孕砸 的软测量模型具有更好地 逼近精度与泛化能力袁较好地满足了赖氨酸发酵过程 软测量的要求遥 员摇 高斯过程及其回归算法 员援员摇 高斯过程原理 高斯过程渊郧孕冤是在高斯随机过程与贝叶斯学 习理论基础上发展起来的一种新型机器学习方法袁 它描述了一类随机过程院其任意有限变量集合的分 布都是高斯过程袁即对任意整数 灶 逸 员 及任意一族 随机变量 载 袁与其对应的 贼 时刻过程状态 枣渊载冤 的联 合概率分布服从 灶 维高斯分布遥 郧孕 的全部统计特 征完全由其均值 皂渊贼冤 与协方差函数 噪渊贼袁贼忆冤 确定袁 定义表示如下院 枣渊载冤 耀 郧孕渊皂渊贼冤 袁噪渊贼袁贼忆冤 冤 式中院 贼 为时间变量遥 为了符号描述方便起见袁通常 对数据作预处理袁使其均值函数等于 园遥 员援圆摇 高斯过程回归 给定样本训练集 阅 越 喳 渊曾蚤袁赠蚤冤 渣 蚤 越 员袁圆袁噎袁灶札 袁 其中 曾蚤 沂 砸凿 是 凿 维输入向量袁 赠蚤 沂 砸 是相应的输出 量遥 为了符号描述方便袁用 载 表示输入向量构成的 凿 伊 灶 维输入矩阵袁 赠 表示输出标量构成的输入矢 量袁那么训练集可表示为 阅 越 渊载袁赠冤 遥 对于新样本 曾鄢 袁郧孕 模型根据先验知识预测与 曾鄢 相对应的输出 值 赠鄢 遥 假设观察目标值 赠 被噪声腐蚀袁它与真实输出 值 贼 相差 着 袁即 赠 越 贼 垣 着 式中院 着 为独立的随机变量袁满足均值为 园尧方差为 滓圆 灶 的高斯分布袁即 着耀晕渊园袁滓圆 灶 冤 摇 摇 观测目标值 赠 的先验分布为 赠耀晕渊园袁运 垣 滓圆 灶 陨冤 式中院 运 越 运渊载袁载冤 越 渊运蚤躁冤灶伊灶 为对称正定的协方差 矩阵袁元素 运蚤躁 度量了 曾蚤 和 曾躁 的相关度遥 由此袁 灶 个训练样本输出 赠 和 员 个新样本输出 赠鄢 构成的联合高斯先验分布为 赠 赠鄢 ⎡ ⎣ ⎢ ⎢ ⎤ ⎦ ⎥ ⎥ 耀 晕 园袁 运渊载袁载冤 垣 滓圆 灶 陨 摇 摇 运渊载袁曾鄢冤 运渊载袁曾鄢冤 栽 摇摇摇 噪渊曾鄢袁曾鄢冤 ⎡ ⎣ ⎢ ⎢ ⎤ ⎦ ⎥ ⎥ ⎛ ⎝ ⎜ ⎜ ⎞ ⎠ ⎟ ⎟ 式中院 运渊载袁曾鄢冤 是新样本 曾鄢 与训练集样本 载 的 灶 伊 员 阶协方差矩阵袁 噪渊曾鄢袁曾鄢冤 是新样本 曾鄢 的自 协方差遥 郧孕 的协方差函数需要满足对任一点集都能够 保证产生一个非负正定协方差矩阵遥 常用的协方差 函数为 噪赠渊曾责袁曾择冤 越 滓圆 枣 藻曾责 原 员 圆造 圆 渊曾责 原 曾择冤 ⎛ 圆 ⎝ ⎜ ⎞ ⎠ ⎟ 垣 滓圆 灶 啄责择 式中院超参数 造尧滓枣尧滓灶 对预测效果的影响很大遥 最 优超参数可通过极大似然法获得袁即通过建立训练 样本条件概率的对数似然函数对超参数求偏导袁再 采用共轭梯度优化方法搜索出超参数的最优解遥 该 第 员 期摇摇摇摇摇摇摇摇摇摇摇 嵇小辅袁等院基于 云悦酝 与集成高斯过程回归的赖氨酸发酵软测量 窑员缘苑窑
·158· 智能系统学报 第10卷 对数似然函数可以表示为 射,在实际计算中通常采用如下的隶属度更新公式: L=Inp(yI X)= N-I -之(K+0-y-之1k+1-2 2 对于新的输入样本x·,根据贝叶斯原理可以获 (2) 得对应的预测值y·,其预测分布是高斯型: 05≠0,ie1 p(y°1x°,X,y)~N((x),G(x) 0,1≠☑,i年1 式中:均值(x°)和方差(x·)分别为 FCM算法先初始化类中心或隶属度矩阵,然后 (x)=k(x·)(K+σI)-y 利用式(1)和式(2)进行迭代直至满足设定的终止 G(x)=k(x°,x)-k(x)(K+σI)k(x) 条件,其具体实现步骤如下: 1)设定聚类个数c和模糊指数m;初始化类中 2模糊C均值聚类算法 心Vo,:设置收敛精度E>0:令迭代次数k=0。 FCM算法[.是由Dunn提出,经由Bezdek应 2)利用式(2)计算+) 用发展起来的一种模糊聚类算法,其原理是通过最 3)利用式(1)计算V+”,令k=k+1。 小化基于范数与聚类原型的目标函数将无标签的数 4)重复2)和3),直到满足如下的终止条件: 据进行分类。对于给定的样本集合X={x1,x2,…, ‖V)-V-)‖≤E,k≥1 xn}CR,其中s是样本空间的维数,n是样本个数 3 Adaboost算法 令c(c>1)是对X进行划分的聚类个数,则FCM算 法的优化目标为 Adaboost(Adaptive boost)算法[2i]是Boosting min/(U,V)= 算法的一种,这种思想源于Valiant提出的PACUS] 台台 (probably approximately correct)学习模型。其主要 约束条件为 内容是获取各学习样本的权重分布,所有权重被赋 ∑=1,1≤j≤n 予相等的初始数值,但在训练过程中,这些样本权重 被不断调整,预测精度低的样本权重得到加强,预测 4>0.1≤i≤C 精度高的样本权重则被减弱。最终,弱预测器加强 =1 g≥0,1≤i≤c,1≤j≤n 了对难以预测的样本的学习。这样以后,达到一定 式中:m>1是模糊系数,U=(u)cxn是模糊划分 预测精度的弱预测器,经组合后形成的强预测器就 矩阵,“是样本x属于第i类的隶属度值,V= 具有很高的预测精度。文中利用此算法对高斯过程 [心2…]是由c个聚类中心向量构成的矩 回归模型的学习能力进行提升,以提高模型的泛化 阵;d-I川x-:I川表示样本点x到中心心的欧式 能力和预测性能。 距离。本质而言,FCM算法是一个关于自变量(U, 4基于FCM与集成GPR的软测量 V)的约束优化问题,利用极值点的KT必要条件可 模型构建 以得到对应的迭代方程为 这里以氨基酸类典型菌种L-赖氨酸反应过程 ∑ U:= ,i=1,2,…,c (1) 的菌体浓度软测量为例,阐述基于FCM与集成GPR 的软测量模型构建步骤。考虑到赖氨酸反应过程中 记l={(i,)|x=:,1≤i≤c,若=☑,则: 微生物生长可分为延滞期、指数生长期、稳定期和死 (图 亡期4个阶段,将预处理后的样本集依据F℃M算法 ,i=1,2,…,c;j=1,2,…,n 分成4个子类,即c=4,根据经验取m=2[16,然后 若!≠☑,则u:是满足如下条件的任意非负 采用基于Adaboost算法的集成GPR方法对每个子 实数: 集建立软测量模型。具体建模步骤为 1)根据赖氨酸反应实验过程的实测值建立训 ,=1,%=0,4≠0 练样本(xy:),i=1,2,…,k,其中x∈R是d维 关于隶属度的迭代公式是一个从点到集合的映 输入矢量,表示反应过程中影响菌体浓度的主要因
对数似然函数可以表示为 蕴 越 造灶责渊赠 渣 载冤 越 原 员 圆 赠栽 渊运 垣 陨冤 原 员赠 原 员 圆 造灶 渣 运 垣 滓圆 灶 陨 渣 原 灶 圆 造灶圆仔 摇 摇 对于新的输入样本 曾鄢袁根据贝叶斯原理可以获 得对应的预测值 赠鄢袁其预测分布是高斯型院 责渊赠鄢 渣 曾鄢袁载袁赠冤 耀 晕渊赠赞渊曾鄢冤 袁滓赞 渊曾鄢冤 冤 式中院均值 赠赞渊曾鄢冤 和方差 滓赞 渊曾鄢冤 分别为 赠赞渊曾鄢冤 越 噪栽 渊曾鄢冤 渊运 垣 滓圆 灶 陨冤 原员 赠 滓赞 渊曾鄢冤 越 噪渊曾鄢袁曾鄢冤 原 噪栽 渊曾鄢冤 渊运 垣 滓圆 灶 陨冤 原员 噪渊曾鄢冤 圆摇 模糊 悦 均值聚类算法 云悦酝 算法咱苑鄄员员暂 是由 阅怎灶灶 提出袁经由 月藻扎凿藻噪 应 用发展起来的一种模糊聚类算法袁其原理是通过最 小化基于范数与聚类原型的目标函数将无标签的数 据进行分类遥 对于给定的样本集合 载 越 喳曾员 袁曾圆 袁噎袁 曾灶 札 奂 砸泽 袁其中 泽 是样本空间的维数袁灶 是样本个数袁 令 糟渊糟 跃 员冤 是对 载 进行划分的聚类个数袁则 云悦酝 算 法的优化目标为 皂蚤灶允枣糟皂渊哉袁灾冤 越 移 糟 蚤 越 员 移 灶 躁 越 员 怎皂 蚤躁 凿圆 蚤躁 约束条件为 移 糟 蚤 越 员 怎蚤躁 越 员袁员 臆 躁 臆 灶 移 灶 躁 越 员 怎蚤躁 跃 园袁 员 臆 蚤 臆 糟 怎蚤躁 逸 园袁 员 臆 蚤 臆 糟袁员臆 躁 臆 灶 式中院 皂 跃 员 是模糊系数袁 哉 越 渊怎蚤躁冤糟伊灶 是模糊划分 矩阵袁 怎蚤躁 是样本 曾躁 属于第 蚤 类的隶属度值袁 灾 越 咱增员 增圆 摇 噎摇 增糟暂 是由 糟 个聚类中心向量构成的矩 阵曰 凿蚤躁 越 渣渣 曾躁 原 增蚤 渣 渣 表示样本点 曾躁 到中心 增蚤 的欧式 距离遥 本质而言袁云悦酝 算法是一个关于自变量 渊哉袁 灾冤 的约束优化问题袁利用极值点的 运栽 必要条件可 以得到对应的迭代方程为 增蚤 越 移灶 躁 越 员 怎皂 蚤躁 曾躁 移灶 躁 越 员 怎皂 蚤躁 袁蚤 越 员袁圆袁噎袁糟 渊员冤 记 陨躁 越 喳 渊蚤袁躁冤 曾躁 越 增蚤袁员 臆 蚤 臆 糟札 袁若 陨躁 越 堙 袁则院 怎蚤躁 越 移 糟 则 越 员 凿蚤躁 凿则躁 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 圆 皂原员 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 原员 袁蚤 越 员袁圆袁噎袁糟曰 躁 越 员袁圆袁噎袁灶 摇 摇 若 陨躁 屹堙袁则 怎蚤躁 是满足如下条件的任意非负 实数院 移 糟 蚤 越 员 怎蚤躁 越 员袁怎蚤躁 越 园袁凿蚤躁 屹 园 摇 摇 关于隶属度的迭代公式是一个从点到集合的映 射袁在实际计算中通常采用如下的隶属度更新公式院 怎蚤躁 越 移 糟 则 越 员 凿蚤躁 凿则躁 圆 皂原 员 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 原员 袁 陨躁 越 堙 员 陨躁 袁陨躁 屹 堙袁 蚤 沂 陨躁 园袁 陨躁 屹 堙袁 蚤 埸 陨躁 ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 渊圆冤 摇 摇 云悦酝 算法先初始化类中心或隶属度矩阵袁然后 利用式渊员冤和式渊圆冤进行迭代直至满足设定的终止 条件袁其具体实现步骤如下院 员冤设定聚类个数 糟 和模糊指数 皂 曰初始化类中 心 灾渊园冤 曰设置收敛精度 着 跃 园曰令迭代次数 噪 越 园遥 圆冤利用式渊圆冤计算 哉渊噪垣员冤 遥 猿冤利用式渊员冤计算 灾渊噪垣员冤 袁令 噪 越 噪 垣 员遥 源冤重复 圆冤和 猿冤袁直到满足如下的终止条件院 椰灾渊噪冤 原 灾渊噪原员冤椰 臆 着袁噪 逸 员 猿摇 粤凿葬遭燥燥泽贼 算法 粤凿葬遭燥燥泽贼渊 粤凿葬责贼蚤增藻 遭燥燥泽贼冤 算法咱员圆鄄员源暂 是 月燥燥泽贼蚤灶早 算法的一种袁这种思想源于 灾葬造蚤葬灶贼 提出的 孕粤悦咱员缘暂 渊 责则燥遭葬遭造赠 葬责责则燥曾蚤皂葬贼藻造赠 糟燥则则藻糟贼冤 学习模型遥 其主要 内容是获取各学习样本的权重分布袁所有权重被赋 予相等的初始数值袁但在训练过程中袁这些样本权重 被不断调整袁预测精度低的样本权重得到加强袁预测 精度高的样本权重则被减弱遥 最终袁弱预测器加强 了对难以预测的样本的学习遥 这样以后袁达到一定 预测精度的弱预测器袁经组合后形成的强预测器就 具有很高的预测精度遥 文中利用此算法对高斯过程 回归模型的学习能力进行提升袁以提高模型的泛化 能力和预测性能遥 源摇 基于 云悦酝 与集成 郧孕砸 的软测量 模型构建 摇 摇 这里以氨基酸类典型菌种 蕴鄄赖氨酸反应过程 的菌体浓度软测量为例袁阐述基于 云悦酝 与集成 郧孕砸 的软测量模型构建步骤遥 考虑到赖氨酸反应过程中 微生物生长可分为延滞期尧指数生长期尧稳定期和死 亡期 源 个阶段袁将预处理后的样本集依据 云悦酝 算法 分成 源 个子类袁即 糟 越 源袁根据经验取 皂 越 圆 咱员远暂 袁然后 采用基于 粤凿葬遭燥燥泽贼 算法的集成 郧孕砸 方法对每个子 集建立软测量模型遥 具体建模步骤为 员冤根据赖氨酸反应实验过程的实测值建立训 练样本 渊曾蚤袁赠蚤冤 袁蚤 越 员袁圆袁噎袁噪 袁其中 曾蚤 沂 砸凿 是 凿 维 输入矢量袁表示反应过程中影响菌体浓度的主要因 窑员缘愿窑 智 能 系 统 学 报摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇 第 员园 卷
第1期 嵇小辅,等:基于FCM与集成高斯过程回归的赖氨酸发酵软测量 ·159· 素:相应的输出标量y:∈R,为菌体浓度值。 误差。 2)为进一步提高建模精度,对所有数据进行噪 13)选取a,= 更新样本权重: 声滤波和归一化预处理,得到样本矩阵0=(立)。 2 3)构造模糊关系矩阵R=(ra),其中r为描 D+1(u)= D,(u)e,h,(x)=y= 述样本i和q之间相似程度的系数,采用欧式距离 Ze,h,(x)≠y 表示: D.(u)exp[-a,y.h,(x.) Z rig =1-c (3) 台 (-x)2 4)计算模糊关系等价矩阵R'。利用平方法对 式中:乙为归一化因子,以使立D()=1。 模糊关系矩阵R进行2,4,…,2幂次计算,直到 14)输出最终的预测函数为 R4=R2-1,则得到R'=R。 5)在模糊关系等价矩阵R'中,根据设定的分类 =sie(含aA) 数c=4,采用入-截距阵法得到样本的初始聚类,然 其结构如图2所示。 后,以各子类平均值为初始聚类中心,记为V, 强预测机 V,和。 6)用式(3)计算样本与初始聚类中心的近似程 度。 强预测机1 强预测机U 强预测机☑ 7)计算归一化后的样本矩阵0的隶属度矩阵 D D Uo。Uo=(ug),g0=r/ ∑rgo 子样本集 8)利用FCM聚类算法进行迭代,直至达到收敛 图2基于Adaboost的GPR软测量模型结构 精度。 Fig.2 Model structure of GPR based on Adaboost 9)样本聚类完成后,针对每个子类的样本数据 15)确定输入数据对于每个子模型的隶属度 分别训练子模型,结构如图1所示。 山:,根据隶属度将每个子模型的输出为f(x),最 后得到赖氨酸发酵过程的菌体浓度预测值Y为 类别1子模型 类别2子模型 FCM 加权 5实验与仿真分析 句量 算法 求和 类别子模型 5.1实验数据说明 类别4子模型 实验采用WKT-30L型液态发酵装备及其控制 系统。根据赖氨酸发酵过程的工艺要求,发酵过程 图1基于FCM与多集成GPR软测量模型结构 中的罐压保持在0.11MPa,温度控制在31℃,搅拌 Fig.I Model structure of multiple integrated GPR 电机转速为330r/min。根据前期对赖氨酸反应过 based on FCM 程的机理和数据分析20】,赖氨酸反应过程的菌体 10)针对训练子模型,采用基于Adaboost算法 浓度值与溶解氧值、发酵液pH值、空气流等参量紧 的集成高斯过程回归模型,给定子学习样本为 密相关。因此,本实验选取发酵液pH值、溶解氧Do (x1y1),…,(x。yn),x。∈x,y。∈,u=1,2,…p 与空气流量F3个参量作为辅助变量:关键生物参 从子类的样本空间中随机选择d组训练数据,初始 量菌体浓度Y作为主导变量,则赖氨酸发酵过程中 化测试数据的分布权值D,(u)=1/d、GPR模型的 菌体浓度软测量模型可描述为 最大迭代次数t=1,2,…,T。 Y=f(pH,Do,F) 11)利用样本权重D,训练弱GPR学习器。 式中:f(·)表示主导变量与辅助变量之间的复杂非 12)获取弱GPR学习器的预测函数h,:X→Y, 线性关系。 并用e,=Pr-w[h,(x.)≠y.]用来表示对应的预测 每批次反应周期为72h,采样周期为15min,通
素曰相应的输出标量 赠蚤 沂 砸 袁为菌体浓度值遥 圆冤为进一步提高建模精度袁对所有数据进行噪 声滤波和归一化预处理袁得到样本矩阵 哉 赞 越 渊怎赞 蚤择冤 遥 猿冤构造模糊关系矩阵 砸 越 渊则蚤择冤 袁 其中 则蚤择 为描 述样本 蚤 和 择 之间相似程度的系数袁 采用欧式距离 表示院 则蚤择 越 员 原 糟 移 皂 噪 越 员 渊曾蚤择 原 曾躁噪冤圆 渊猿冤 摇 摇 源冤计算模糊关系等价矩阵 砸忆遥 利用平方法对 模糊关系矩阵 砸 进行 圆袁源袁噎袁圆噪 幂次计算袁 直到 砸圆噪 越 砸圆噪原员 袁则得到 砸忆 越 砸圆噪 遥 缘冤在模糊关系等价矩阵 砸忆 中袁根据设定的分类 数 糟 越 源袁采用 姿 鄄 截距阵法得到样本的初始聚类袁然 后袁以各子类平均值为初始聚类中心袁记为 灾渊园冤 员 袁 灾渊园冤 圆 袁灾渊园冤 猿 和 灾渊园冤 源 遥 远冤用式渊猿冤计算样本与初始聚类中心的近似程 度遥 苑冤计算归一化后的样本矩阵 哉 赞 的隶属度矩阵 哉渊园冤 遥 哉渊园冤 越 渊怎渊园冤 蚤躁 冤 袁怎渊园冤 蚤躁 越 则蚤躁 辕移 源 躁 越 员 则蚤躁 遥 愿冤利用 云悦酝 聚类算法进行迭代袁直至达到收敛 精度遥 怨冤样本聚类完成后袁针对每个子类的样本数据 分别训练子模型袁结构如图 员 所示遥 图 员摇 基于 云悦酝 与多集成 郧孕砸 软测量模型结构 云蚤早援 员 摇 酝燥凿藻造 泽贼则怎糟贼怎则藻 燥枣 皂怎造贼蚤责造藻 蚤灶贼藻早则葬贼藻凿 郧孕砸 遭葬泽藻凿 燥灶 云悦酝 员园冤针对训练子模型袁采用基于 粤凿葬遭燥燥泽贼 算法 的集成高斯过程回归模型袁给定子学习样本为 渊曾员 袁赠员 冤袁噎袁渊曾责袁赠责冤 袁曾怎 沂 曾蚤袁赠怎 沂 赠蚤袁怎 越 员袁圆袁噎袁责 从子类的样本空间中随机选择 凿 组训练数据袁初始 化测试数据的分布权值 阅贼 渊怎冤 越 员 辕 凿 尧郧孕砸 模型的 最大迭代次数 贼 越 员袁圆袁噎袁栽 遥 员员冤利用样本权重 阅贼 训练弱 郧孕砸 学习器遥 员圆冤获取弱 郧孕砸 学习器的预测函数 澡贼院载 寅 再 袁 并用 着贼 越 孕则怎原阅贼咱澡贼 渊曾怎 冤 屹 赠怎 暂 用来表示对应的预测 误差遥 员猿冤选取 琢贼 越 员 圆 造灶 员 原 着贼 着贼 ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ 袁更新样本权重院 阅贼垣员渊怎冤 越 阅贼 渊怎冤 在贼 伊 藻 原琢贼 袁澡贼 渊曾怎 冤 越 赠怎 藻琢贼 袁澡贼 渊曾怎 冤 屹 赠怎 { 越 阅贼 渊怎冤藻曾责咱 原 琢贼赠怎 澡贼 渊曾怎 冤 暂 在贼 式中院 在贼 为归一化因子袁以使 移 凿 怎 越 员 阅贼 垣员渊怎冤 越 员遥 员源冤输出最终的预测函数为 枣枣蚤灶渊曾冤 越 泽蚤早灶 移 栽 贼 越 员 ( ) 琢贼澡贼 渊曾冤 其结构如图 圆 所示遥 图 圆摇 基于 粤凿葬遭燥燥泽贼 的 郧孕砸 软测量模型结构 云蚤早援圆摇 酝燥凿藻造 泽贼则怎糟贼怎则藻 燥枣 郧孕砸 遭葬泽藻凿 燥灶 粤凿葬遭燥燥泽贼 员缘冤确定输入数据对于每个子模型的隶属度 怎蚤 袁根据隶属度将每个子模型的输出为 枣枣蚤灶渊曾冤 袁最 后得到赖氨酸发酵过程的菌体浓度预测值 再 为 再 越 移 糟 蚤 越 员 怎蚤 枣枣蚤灶渊曾冤 缘摇 实验与仿真分析 缘援员摇 实验数据说明 实验采用 宰运栽鄄猿园蕴 型液态发酵装备及其控制 系统遥 根据赖氨酸发酵过程的工艺要求袁发酵过程 中的罐压保持在 园援员员 酝孕葬袁温度控制在 猿员 益 袁搅拌 电机转速为 猿猿园 则 辕 皂蚤灶遥 根据前期对赖氨酸反应过 程的机理和数据分析咱员苑鄄圆园暂 袁赖氨酸反应过程的菌体 浓度值与溶解氧值尧发酵液 责匀 值尧空气流等参量紧 密相关遥 因此袁本实验选取发酵液 责匀 值尧溶解氧 阅燥 与空气流量 云 猿 个参量作为辅助变量曰关键生物参 量菌体浓度 再 作为主导变量袁则赖氨酸发酵过程中 菌体浓度软测量模型可描述为 再 越 枣渊责匀袁阅燥袁云冤 式中院 枣渊窑冤 表示主导变量与辅助变量之间的复杂非 线性关系遥 每批次反应周期为 苑圆 澡袁采样周期为 员缘 皂蚤灶袁通 第 员 期摇摇摇摇摇摇摇摇摇摇摇 嵇小辅袁等院基于 云悦酝 与集成高斯过程回归的赖氨酸发酵软测量 窑员缘怨窑
·160 智能系统学报 第10卷 过测试仪器对发酵液H值、溶解氧值、空气流量参 5.2实验结果分析及讨论 量进行实时采集,每2min取样并离线化验得到菌 基于FCM与集成GPR的软测量算法是在GP: 体浓度。菌体浓度采用细胞干重法计算得到,即取 stuf.4.1基础上用MATLAB语言编写。为了验证 10mL发酵液于离心管中,在3000r·min1下离心 该种方法的性能,将其与传统的单一GPR、集成 5min,弃上清,蒸馏水洗涤2次,在105℃干燥至恒 GPR软测量模型和基于FCM与多GPR软测量模型 相比,其中选取菌体浓度参量为预测目标,样本数据 质量后称量。 经过FCM聚类以后,分别建立采用Adaboost算法的 考虑5个批次培养数据以检验赖氨酸反应过程 集成GPR子模型,式中:设定算法的最大迭代次数t 的基于FCM与集成GPR软测量模型。为增强各批 为10,初始误差为ε,=0,针对测试样本集检验软测 次间的差异性,每批次间初始条件不同,补料策略亦 量模型的泛化能力。图5所示为基于FCM与集成 有相应变化。采用WKT-30L自动控制系统,将发 GPR软测量模型的预测值与样本真实值。 酵罐温度控制在(0~50±0.5)℃。获得批次数据的 10 前4批次作为训练样本集,离线训练获得基于FCM 9 与集成GPR软测量模型,第5个批次用于测试样本 8 集,检验基于FCM与集成GPR软测量模型的泛化 7 能力。 6 5 数据样本的3D聚类效果如图3所示,训练样 4 本集被分成4类,分别用4个椭圆标记。目标函数 3 值的变化曲线如图4所示。结果分析可知,整体分 2 预测值 类经过44次迭代,达到预设收敛精度,得到最终的 真实值 目标函数值。 10 20304050 6070 赖氨酸发酵翻时间M 图5基于FCM-Adaboost-GPR的软测量模型预测值与真实值 800 5600 Fig.5 Comparison between the predictive value and true value using integrated GPR soft sensor model based on FCM 200 图6显示了弱高斯过程回归模型(传统的单一 100 10 高斯过程回归模型)与强高斯过程回归模型(集成 50 空气流量(m)067 8 9 pH 高斯过程回归模型)针对测试样本集的泛化能力, 经过Adaboost算法,弱高斯过程回归模型提升为强 图3样本的3D聚类结果 高斯过程回归模型,误差明显减小,泛化能力也大幅 Fig.3 3D cluster results in training set 度提高。 ×10的 18 9 16 8 14 1 12 6 10 5 6 3 4 2 -强GPR预测值 真实值 0 一弱GPR预测值 051015202530354045 0 10 203040506070 赖氨酸发酵时间h 迭代数 图6强GPR预测器与弱GPR预测器的预测值与真实值 图4目标函数值变化曲线 Fig.6 Comparison between the predictive value and Fig.4 Variation curves of the objective function value true value using strong GPR predictor and weak GPR predictor
过测试仪器对发酵液 责匀 值尧溶解氧值尧空气流量参 量进行实时采集袁每 圆 皂蚤灶 取样并离线化验得到菌 体浓度遥 菌体浓度采用细胞干重法计算得到袁即取 员园 皂蕴 发酵液于离心管中袁在 猿 园园园 则窑皂蚤灶鄄员下离心 缘 皂蚤灶袁弃上清袁蒸馏水洗涤 圆 次袁在 员园缘 益干燥至恒 质量后称量遥 考虑 缘 个批次培养数据以检验赖氨酸反应过程 的基于 云悦酝 与集成 郧孕砸 软测量模型遥 为增强各批 次间的差异性袁每批次间初始条件不同袁补料策略亦 有相应变化遥 采用 宰运栽鄄猿园 蕴 自动控制系统袁将发 酵罐温度控制在渊园 耀 缘园依园援缘冤 益 遥 获得批次数据的 前 源 批次作为训练样本集袁离线训练获得基于 云悦酝 与集成 郧孕砸 软测量模型袁第 缘 个批次用于测试样本 集袁检验基于 云悦酝 与集成 郧孕砸 软测量模型的泛化 能力遥 数据样本的 猿阅 聚类效果如图 猿 所示袁训练样 本集被分成 源 类袁分别用 源 个椭圆标记遥 目标函数 值的变化曲线如图 源 所示遥 结果分析可知袁整体分 类经过 源源 次迭代袁达到预设收敛精度袁得到最终的 目标函数值遥 图 猿摇 样本的 猿阅 聚类结果 云蚤早援猿摇 猿阅 糟造怎泽贼藻则 则藻泽怎造贼泽 蚤灶 贼则葬蚤灶蚤灶早 泽藻贼 图 源摇 目标函数值变化曲线 云蚤早援源摇 灾葬则蚤葬贼蚤燥灶 糟怎则增藻泽 燥枣 贼澡藻 燥遭躁藻糟贼蚤增藻 枣怎灶糟贼蚤燥灶 增葬造怎藻 缘援圆摇 实验结果分析及讨论 基于 云悦酝 与集成 郧孕砸 的软测量算法是在 郧孕鄄 泽贼怎枣枣鄄 源援 员 基础上用 酝粤栽蕴粤月 语言编写遥 为了验证 该种方法的性能袁将其与传统的单一 郧孕砸尧集成 郧孕砸 软测量模型和基于 云悦酝 与多 郧孕砸 软测量模型 相比袁其中选取菌体浓度参量为预测目标袁样本数据 经过 云悦酝 聚类以后袁分别建立采用 粤凿葬遭燥燥泽贼 算法的 集成 郧孕砸 子模型袁式中院设定算法的最大迭代次数 贼 为 员园袁初始误差为 着贼 越 园袁针对测试样本集检验软测 量模型的泛化能力遥 图 缘 所示为基于 云悦酝 与集成 郧孕砸 软测量模型的预测值与样本真实值遥 图 缘摇 基于 云悦酝鄄粤凿葬遭燥燥泽贼鄄郧孕砸 的软测量模型预测值与真实值 云蚤早援 缘 摇 悦燥皂责葬则蚤泽燥灶 遭藻贼憎藻藻灶 贼澡藻 责则藻凿蚤糟贼蚤增藻 增葬造怎藻 葬灶凿 贼则怎藻 增葬造怎藻 怎泽蚤灶早 蚤灶贼藻早则葬贼藻凿 郧孕砸 泽燥枣贼 泽藻灶泽燥则 皂燥凿藻造 遭葬泽藻凿 燥灶 云悦酝 图 远 显示了弱高斯过程回归模型渊传统的单一 高斯过程回归模型冤与强高斯过程回归模型渊集成 高斯过程回归模型冤 针对测试样本集的泛化能力袁 经过 粤凿葬遭燥燥泽贼 算法袁弱高斯过程回归模型提升为强 高斯过程回归模型袁误差明显减小袁泛化能力也大幅 度提高遥 图 远摇 强 郧孕砸 预测器与弱 郧孕砸 预测器的预测值与真实值 云蚤早援 远 摇 悦燥皂责葬则蚤泽燥灶 遭藻贼憎藻藻灶 贼澡藻 责则藻凿蚤糟贼蚤增藻 增葬造怎藻 葬灶凿 贼则怎藻 增葬造怎藻 怎泽蚤灶早 泽贼则燥灶早 郧孕砸 责则藻凿蚤糟贼燥则 葬灶凿 憎藻葬噪 郧孕砸 责则藻凿蚤糟贼燥则 窑员远园窑 智 能 系 统 学 报摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇 第 员园 卷