第8卷第2期 智能系统学报 Vol.8 No.2 2013年4月 CAAI Transactions on Intelligent Systems Apr.2013 D0I:10.3969/i.issn.16734785.201209026 网络出版t地址:htp://www.cnki.net/kcma/detail/23.1538.TP.20130326.0906.003.html 自适应概率神经网络及其在白酒电子鼻中的应用 周红标,张宇林,丁友威,刘佳佳2 (1.淮阴工学院电子与电气工程学院,江苏淮安223003;2.南京师范大学电气与自动化工程学院,江苏南京210042) 摘要:为了探索电子鼻对白酒品质鉴别的可能性,利用自制的新型无线白酒电子鼻对洋河海之蓝、今世缘省接待、 安徽迎驾大曲和牛栏山陈酿进行了分析.对所采集的数据进行平滑处理后提取稳态响应值和斜率值,利用主成分分 析对特征向量进行降维处理,并将获得的前2个主元得分作为概率神经网络识别模型的输入参量.针对传统概率神 经网络平滑因子σ单一易导致分类错误的缺陷,利用差异演化算法优化σ参数集,建立了自适应概率神经网络识别 模型.实验结果表明,DE-PNN相比BP-PWNN、PSO-PNN和SVM等,识别精度更高,抗噪性能更好,同时也证明了电子 鼻能有效地检出不同品牌的白酒。 关键词:差异演化算法;自适应概率神经网络;电子鼻;白酒识别 中图分类号:TP183:1TS262.3文献标志码:A文章编号:16734785(2013)02-017706 Application of adaptive probabilistic neural network in Chinese liquor E-Nose ZHOU Hongbiao',ZHANG Yulin',DING Youwei',LIU Jiajia2 (1.Faculty of Electronic and Electrical Engineering,Huaiyin Institute of Technology,Huai'an 223003,China;2.School of Electrical and Automation Engineering,Nanjing Normal University,Nanjing 210042,China) Abstract:In order to explore the possibility of hard liquor quality recognition by an electronic nose,the Chinese liquor of Yanghe Haizhilan,Jinshiyuan Shengjiedai,Anhui Yingjiadaqu,and Niulanshan Chenniang were analyzed by using self-made new wireless electronic nose for recognition of hard liquor quality.Firstly,the steady-state re- sponse and slope values were extracted after smoothing the collected data.Secondly,principal component analysis PCA was used to reduce the dimension of the eigenvector,and the obtained first two principal components scores were then used as the input parameters of the probabilistic neural network recognition model.Next,the aim was to overcome defect of traditional probabilistic neural network smoothing factor which would cause classification error easily.The method of adaptive probabilistic neural network identification model was presented,utilizing differential evolution algorithm to optimize the set of parameters.The results show that differential evolution-probabilistic neural network obtained a high recognition accuracy and noise immunity compared to back propagation,particle swarm op- timization-probabilistic neural network and support vector machine.The experiment also proved that the electronic nose can effectively detect different liquor brands in China. Keywords:differential evolution algorithm;adaptive probabilistic neural network;electronic nose;hard liquor quality recognition 白酒电子鼻最主要的应用场合是对白酒生产过别.目前,白酒品质识别主要是使用电子鼻对不同品 程进行质量监控,以保证白酒的品质,其核心要 牌、不同酒精度和不同香型的白酒进行识别23],期 求就是要实现基于计算机技术的白酒品质智能鉴 望能够通过气味数据的处理将它们区分开来.传感 器所测量的信号与被测量的气体之间并没有直接对 收稿日期:201209-12.网络出版日期:201303-26. 基金项目:国家自然科学基金资助项目(61203056):准安市科技公共 应关系,因而需要通过模式识别算法对其进行处理. 服务平台资助项目(HAP201107). 目前,电子鼻数据分析中的模式识别算法主要 通信作者:周红标.E-mail:bihb@163.com
·178 智能系统学报 第8卷 有k-近邻法(k-nearest neighbor,k-NN)、聚类分析 各层的功能如下78): (clustering analysis,CA)、判别分析(discriminant a 1)输入层:输人样本为 nalysis,DA)、主成分分析(principal component analy- X1=(1,x2,…,x,…,xa),YL=XI sis,PCA)、反传人工神经网络(back-propagation arti- 式中:江:和Y1:分别为输入层第(i=1,2,…,d)个 ficial neural network,BP-ANN)、概率神经网络(prob- 神经元的输入和输出. abilistic neural network,PNN)、学习向量量化(leam- 2)模式层:X迎,=”j=1,2,…,d,第i类模式的第 ing vector quantization,LVQ)、自组织映射(sef-or j个模式层神经元所确定的输入输出关系定义为 ganizing maps,SOM)和支持向量机4(support vector YP(XP)= machine,SVM)等.上述模式识别算法按输入输出之 间的关系可分为线性算法和非线性算法2类.线性 2non(”-(p-凸 算法只能实现输入到输出的线性映射,它们都是基 (1) 于统计理论而发展起来的.非线性算法,顾名思义, 式中:d为输入样本的维数;o为平滑因子;i=1,2, 可实现输入到输出的非线性映射,与神经网络理论 ,M=1,2“,G,N=宫G,M为训练样本集总 有关,由于这类算法能实现更复杂的映射关系,所以 类别数,G:为第i类训练样本数;XP,为第i类训练 通常其识别效果要优于线性算法例 样本第j个数据,XP为模式层的输入,YP,(XP)为 本文提出的自适应概率神经网络电子鼻白酒识 模式层第i类模式的第j个神经元输出. 别模型的主要步骤是:首先求取传感器阵列的稳态 响应值、响应阶段斜率、恢复阶段斜率及温湿度值作 0求和层:x灯,=P,(XP),T=名含X灯,式中 为原始特征向量;然后利用主成分分析法对输入量 XT,和YT:为求和层的第i类神经元的输入和输出. 进行降维,获取2个主元作为识别模型的输入;再进 4)输出层:XE:=YT,由基于最小误分率的 ·步利用遗传算法和粒子群算法优化概率神经网络 叶斯决策规则可知 的σ参数集;最后运用优化的自适应概率神经网络 YE arg max [XE. 进行白酒品牌的鉴别.本文以不同品牌、不同酒精度 式中:XE:和YE分别为输出层神经元的输入和输 的4种白酒电子鼻气味数据为样本,进行电子鼻的 出,YE为样本的类别号 模式识别算法研究, 1.2自适应概率神经网络 1自适应概率神经网络 模式层中采用径向基函数作为输入输出的传递 函数,平滑因子σ决定了高斯曲线的宽度,由于在 1.1概率神经网络 传统的概率神经网络中其值固定不变,影响了网络 概率神经网络(probabilistic neural network, 识别性能].因此,采用自适应的平滑参数将能提 PNN)是一种前馈型神经网络,是D.F.Specht博士 升网络的性能0.即式(1)变为 于1989年根据贝叶斯决策理论(即贝叶斯最小风 YP(XP)= 险准则)首先提出的6.PNN由输入层、模式层、求 1 (XP-XP (XP -XP) 和层和输出层组成,如图1所示. (2)ozexp j=1,2,…,d 差异演化算法(DE)与遗传算法(GA)、粒子群 算法(PS0)一样,都是一种优化算法,不同的是DE 是基于群体差异的演化算法,具有稳定性高、算法简 单、收敛速度快的优点,能克服GA、PSO等优化算法 的早熟现象].利用差异演化算法对径向基传递函 数进行优化的主要步骤如下: 1)种群初始化在D维空间随机产生V。个个体 输入层 求和层 输出层 (0)=+rand(0,1)() 模式层 式中:rand(0,1)是[0,1]上服从均匀分布的随机数 图1PNN拓朴结构 2)变异操作.其主要是生成扰动矢量,从当前代中 Fig.1 The topology of PNN 随机选择3个互不相同的个体,,,则
第2期 周红标,等:自适应概率神经网络及其在白酒电子鼻中的应用 ·179 hg(g+1)=v+F(x-),变异因子Fe[0,2], 白酒作为实验样品.实验时,每次准确取量样本 3)交叉操作,其主要是用来增加种群的多样 2mL,注人样本池中.每个样本的检测时间为60s, 性.其对变异后的扰动量和父代个体按式(2)进行 为了消除测量数据的漂移现象,每次检测前后,传感 交叉 器阵列都需要清洗和标淮准化(即加热处理),时间不 0(g+1)= 少于1008,这将能有效保证测量数据的准确性和稳 rh,(g+1),rand(0,l)≤Cg或j=rand(i); 定性.每种样品重复检测20次,4种不同白酒总计 Lxg(g),rand(0,l)>Cg或j≠rand(i). 得80个样本,建立一个小型的白酒气味指纹图谱 (2) 库.图3所示为洋河海之蓝的传感器阵列信号响应 式中:CR为交叉概率,rand(i)是[1,D]之间随机整数 强度图(取自编号haizhilan_6),其中横坐标是数据 4)选择操作对新矢量和预定矢量进行比较选择 采集点数(3000点,1808),纵坐标是响应强度,每 x:(g+1)= 条曲线代表一个传感器在采样时间内的响应值变 :(g+1),f:(g+1)<fx:(g)); 化,5个传感器共有5条响应曲线,此外还有温湿度 Lx;(g),f(v(g+1))f(x;(g)). 传感器显示当前的温度值和湿度值.数据采集过程 反复执行2)~4),直至满足最大进化代数或预 中由于仪器的影响(电子鼻与上位机采用一问一答 先设定的收敛精度, 的Modbus通信协议,采样点间隔60ms),曲线有抖 动,不光滑,故需要进行平滑处理.本文采用移动平 2 实验数据获取 均法对信号进行平滑处理,处理后的信号如图4所 2.1实验系统及方案 示,平滑滤波后的曲线光滑、干净,消除了锯齿状的 课题组以STM32为核心处理器,将Zigbee无线 失真,便于进一步的特征提取 通讯和虚拟仪器等技术融为一体,设计了无线白酒 3.5r 3.0 电子鼻.硬件电路主要实现信号采集、信号调理、A/ >2.5 TGS2600 D转换、无线通信、数据传输、人机对话等功能,主要 2.0 TGS2620 TGS2602 包括气敏传感器阵列(TGS2600、TGS2602 竖1.5引 TGS2610号 TGS2610、TGS2611、TGS2620)、AM2302温湿度传感 1.0 TGS261H 器模块、信号调理模块、STM32F103控制器模块、电 10 10 15202530 源模块、键盘模块、液晶显示模块、CC2430 Zigbee无 点数 线通信模块、RS232转USB通讯模块等.在上位机 图3传感器阵列信号响应强度 采用虚拟仪器软件Labview设计一套能对数据进行 Fig.3 Signal response intensity of sensor array 实时显示、存储、回放和分析等操作的平台.算法采 用数据处理能力更强的Matlab平台实现,并通过 3.5 ActiveX技术将预处理、特征提取和模式识别算法集 3.0l 成到Labview当中.硬件实物图如图2所示 >2.5 g2.0 JGS2602 要1.5 TGS2611 10202方3610 点数 图4数据平滑后信号响应强度 Fig.4 Signal response intensity after smoothing 2.2气味数据特征提取 图2电子鼻硬件实物 目前电子鼻中使用的数据特征提取方法主要有 Fig.2 The diagram of electronic nose hardware 稳态响应值、响应和恢复阶段的斜率、对数法、一阶 在超市购置了洋河海之蓝42480mL、牛栏山陈 差分法、二阶差分法等.目前大都数都只采用稳态响 酿36°400mL、今世缘省接待40°500mL和安徽迎 应值.本文在选择稳态响应值的基础上,还计算出响 驾大曲45°500mL共4种不同酒精度不同品牌的 应阶段和恢复阶段的斜率作为特征值,其计算公式
·180 智能系统学报 第8卷 如下: 限度地表征原变量的数据信息,是原变量的线性组 斥=y-b 合.从每种白酒中随机选择5个样本组成20组样本 %-d' 进行主成分分析,样本前2个主成分得分图如图6 ba-yh kn=Gh - 所示,前5个主成分的贡献率分别为70.73%、 12.39%、8.23%、6.76%和1.04%,累计贡献率为 式中:k,和k分别是响应阶段斜率和恢复阶段斜 70.73%、83.12%、91.35%、98.11%和99.15%. 率,(a,b)和(x,y)分别是曲线响应阶段起始点 表1部分特征值数据 和响应稳定点,(,ya)和(a6,b.)分别是曲线恢复 Table 1 Some of the eigenvalue data 阶段稳定点和恢复阶段起始点,可通过ime= 斜率 温度湿度 (180s/3000)×dianshu公式将点数转换成时间.斜 编号 稳态值 响应 恢复 /℃ /RH 率计算中各点坐标采用差值法自动获取.稳态响应 值及斜率特征自动计算示意图如图5所示. 2.497 0.046 -0.027 H1 24.471.6 TGS2611 TGS2611 TGS2600 3.5 w,3.1069 3.107 0.045 -0.059 H6 25.457.7 TGS2620 TGS2610 TGS2611 k=-0.028 >2.5 2.585 0.061 -0.061 2.0H =0.0724 N5 25.258.2 TGS2610 TGS2602 TGS2611 1.5 1.0 3.152 0.048 -0.034 N17 25.459.3 0.20 2023010 TGS2600 TGS2611 TGS2600 1015 点数 2.454 0.096 -0.027 S8 25.556.3 图5稳态响应值及斜率特征值提取 TGS2611 TGS2620 TGS2620 Fig.5 The steady state response values and feature ex- 2.404 0.082 -0.031 traction of gradient S20 25.459.2 TGS2602 TGS2610 TGS2620 从图5可以发现,由于横、纵坐标的不对应,斜 率值很小,比如k.=0.0724与0.=3.1069相差40 2.835 0.110 -0.053 Y_18 25.467.6 多倍;如果不对其进行处理,直接将它们作为识别模 TGS2602 TGS2600 TGS2611 型的输入数据,必定影响识别结果的准确性.因此, 3.120 0.110 -0.024 Y_19 25.567.6 对斜率值扩大100倍,并将负值取正,如:0.0724调 TGS2620 TGS2600 TGS2600 整后为7.24,-0.0281调整后为2.81. 此外,系统显示的温湿度值数值较大.如H_1 样本分别为24.4℃和71.6RH,与稳态值和处理后 的斜率值不匹配,因此,对它们进行单独归一化处 理.对80个样本数据采取前述的预处理和特征提取 方法进行处理,每个样本获得5个稳态响应值、10 -1 个斜率值2个温湿度数值,总共形成17个输入参 +牛栏山 尔 -2 量.从4种白酒中每种随机选择2个样本,每个样本 *省接行 ?迎驾人曲 列出阵列中某一个传感器的稳态值、响应阶段斜率 210】234 和恢复阶段斜率及温湿度共5个数据,如表1所示 第一主成分(贡献*70.7307%) (H编号代表海之蓝、N_编号代表牛栏山、S_编号代 图6P℃1和PC2主成分得分 表省接待、Y编号代表迎驾,为了显示的直观性,表 Fig.6 The chart of principal component score 1数据未处理,均为原始数据) 由图6可见,前2个主成分累计贡献率达 2.3气味数据主成分分析 83.12%,已能达到分类要求.而这之后,随着主成分 17个输人量之间存在一定的相关性,可以利用 数量的增加,累计贡献率增加相当缓慢,所以每个白 主成分分析实现降维,即通过对数目较多的特征向 酒样本的电子鼻气味数据可以用前2个主成分代替. 量进行变换得到数目较少的新变量,新变量能最大
第2期 周红标,等:自适应概率神经网络及其在白酒电子鼻中的应用 181 从表3可以看出,3种PNN算法的留一交叉分 3 实验结果分析 类准确率要远高于BP和RBF神经网络;参数集经 在建立识别模型之前,首先给特征数据集中的 过DE优化后的PNN识别模型得到的准确率最高 每个样本附上标签,其中海之蓝定义为1号标签,牛 (训练集为100%、测试集为97.5%),优于PS0、GA 栏山陈酿定义为2号标签,省接待定义为3号标签, 优化的和未经优化的PNN;未经优化的PNN耗时较 迎驾大曲定义为4号标签.从白酒气味指纹图谱库 短,远低于BP,能够满足在线分析的要求,但由于优 中随机选择40个作为训练集,剩余40个作为测试 化算法寻求过程复杂,GA-PNN和PSO-PNN耗时较 集,先进行PCA处理,然后将每个样本的前2个主 长;本文还对SVM模型进行测试,发现其在白酒识 成分得分输入到DE-PNN模型进行识别,识别结果 别中的效果并不理想(经过简单分析,可能的原因 如表2所示. 是SVM需要整体归一化,而本文数据集特征值采取 表2DE-PNN识别结果 的是分属性归一化) Table 2 The recognition results of DE-PNN 4 预测结果 H 特异度/% 结束语 N 识别出H 10 1 0 0 90.9 电子鼻技术融合了传感器技术、嵌入式技术、信 识别出N 0 9 0 1 90.0 息处理技术和模式识别技术等,目前在农学、工学、 医学和生物学等多个领域都有着广泛应用.利用电 识别出S 1 0 8 80.0 子鼻技术识别白酒种类、检测白酒品质、监控白酒生 识别出Y 1 0 0 P 80.9 产质量是目前研究的主要方向,本文正是针对白酒 灵敏度/%83.390100 80 87.5/92.1 分类提出一种基于APNN的识别模型,其利用DE、 从表2可见,DE-PNN识别算法的总体敏感度 GA、PSO优化PNN的σ参数集.实验结果表明,与 和特异度分别为87.5%和92.1%,证实了模型具有 其他神经网络以及未优化的PNN相比,基于DE 较好的分类性能.径向基函数的扩展速度SPREAD PNN的方法具有较好的分类效果和较快的收敛速 对网络有影响,当SPREAD在0.002~0.007之间取 度 值时,模型的分类和泛化能力较好。 表2只是一次随机性的测试,可能存在误差.为 参考文献: 了全面评价分类器的性能,本文采取了留一交叉验 [1]杨国强,张淑娟.电子鼻技术在酒类识别应用中的研究 证法(leave-one-out cross-validation,LOOCV).该方 进展[J].山西农业大学学报:自然科学版,2010,30 法能够弥补样本不足的缺陷,其原理是:每次从样本 (1):92-96. 集中随机抽取1个作为测试样本,剩余的n-1个作 YANG Guogiang,ZHANG Shujuan.Development of the e- 为训练样本;然后,再轮流提取另一个样本,直到所 lectronic nose technology on the identification of spirit]. Journal of Shanxi Agric ultural University:Natural Science 有样本都轮完,最终由准确分类的样本与样本总数 Edition,2010,30(1):92-96. 之比来决定分类器的分类准确率.表3给出了在不 [2]YU Huichun,WANG Jun.Discrimination of longjing green- 同的分类方法下,全部80个样本采用L00CV进行 tea grade by electronic nose[J].Sensors and Actuators B, 验证对应的识别结果。 2007,122:134-140. 表3各种分类方法的识别结果 [3]ALEIXANDRE M,LOZANO J,GUITERREZ J,et al. Table 3 The recognition results of different methods Portable e-nose to classify different kinds of wine[J].Sen- 分类准确率 建模时间/ sors and Actuators B,2008,131:71-76. 算法 训练样本 测试样本 (8·次-1) [4]刘红秀,李洪波,李卫东,等.基于电子鼻的鱼类新鲜度 估计研究[J].中山大学学报:自然科学版,2010,49 BP 4578/6320 62/80 125.4 (2):2830. RBF 4895/6320 68/80 5.8 LIU Hongxiu,LI Hongbo,LI Weidong,et al.Research on PNN 6125/6320 71/80 2.6 the fish freshness assessment based on electronic nose[J]. GA-PNN 6288/6320 75/80 12.5 Acta Scientiarum Natralium Universitatis Sunyatseni,2010, 49(2):28-30. PSO-PNN 6320/6320 76/80 8.5 [5]李纯,卢志茂,杨朋.基于快速谱聚类的图像分割算法 DE-PNN 6320/6320 78/80 3.7 [J].应用科技,2012,39(2):26-30