基于二叉树支持向量机的小麦碰撞声分类研究 李璟民,郭敏 (陕西师范大学计算机科学学院,陕西西安710062) 摘要:小麦颗粒存在虫害、霉变和发芽问题,为了实现小麦颗粒的自动分类,采用二叉树和支持向量 机相结合方法对小麦碰撞声进行识别分类。首先从时域和频域对小麦碰撞声信号进行分析和处理,提取 信号特征,然后利用二叉树支持向量机分类器进行分类,对小麦完好粒、虫害粒、霉变粒和发芽粒4 类麦粒的识别均达到840%以上。实验结果表明,该项研究具有较强的实用价值,为小麦的自动识别分 类提供了一种可行方法。 关键词:小麦碰撞声:二叉树;支持向量机;识别分类 中图分类号:1P39142文献标志码: A PACS: Study on the classification of wheat impact acoustic signals based on b tree SvM LI Jingmin GUO Min College of Computer Science, Shaanxi Normal University, Xian 710062, Shaanxi, China) Abstract: Several problems exist in wheat kernels such as insect infestation, mold-damaged kernel and sprout-damaged kernel. In order to sort the wheat kernels into different types automatically, a novel approach which integrates binary tree and support vector machine(SVM)is proposed to discriminate between four different types of wheat kernels by impact acoustic signals. At first, the impact acoustic signals were analyzed and potential features were exacted from them in both time and frequency domains. Then the svm based on binary tree was used for pattern recognition. Detection accuracy rates of the presented system for undamaged kernel, insect damage, moldy and sprout damage were above 84.0%. The experimental results show that our research has a high value on application and provides a feasible method for automatic classification of wheat kernels Key words: wheat impact acoustic signals; binary tree; support vector machine 注意:1摘要的撰写:摘要内容(200字左右),不要论及论文的基础和背景知识:直奔目的、方法、结果、 结论;不要进行自我评价 目的——本研究要达到的核心目标。 方法——所用的原理、理论、条件、对象、材料、工艺、结构、手段、装备、程序等。 结果——实验的、研究的最重要结果和数据,被确定的关系等。 结论结果的分析和意义 2中图分类号需准确。 3作者信息完整(见页脚)。 4收稿日期即是本文首次投稿日期(见投稿平台) 5英文摘要需语句通顺,可参考同领域的英文文献。 6全文请单栏排版。 收稿日期:2012-1031: 基金项目:国家自然科学基金资助项目(10974130):陕西省自然科学基金资助项目(2012M1005) 第一作者:李璟民,男,硕士研究生,主要研究方向为数字信号处理、模式识别 E-mail: li jingmin@126com 通讯作者:郭敏,女,教授,博士研究生导师,主要从事数字信号处理及模式识别研究E-mail:guomin@)sonu.edu.cn
收稿日期:2012-10-31; 基金项目:国家自然科学基金资助项目(10974130);陕西省自然科学基金资助项目(2012JM1005) 第一作者:李璟民,男,硕士研究生,主要研究方向为数字信号处理、模式识别. E-mail:li_jingmin@126.com *通讯作者:郭敏,女,教授,博士研究生导师,主要从事数字信号处理及模式识别研究. E-mail: guomin@snnu.edu.cn 基于二叉树支持向量机的小麦碰撞声分类研究 李璟民, 郭 敏* (陕西师范大学 计算机科学学院,陕西 西安 710062) 摘 要:小麦颗粒存在虫害、霉变和发芽问题,为了实现小麦颗粒的自动分类,采用二叉树和支持向量 机相结合方法对小麦碰撞声进行识别分类。首先从时域和频域对小麦碰撞声信号进行分析和处理,提取 信号特征,然后利用二叉树支持向量机分类器进行分类,对小麦完好粒、虫害粒、霉变粒和发芽粒 4 类麦粒的识别均达到 84.0%以上。实验结果表明,该项研究具有较强的实用价值,为小麦的自动识别分 类提供了一种可行方法。 关键词:小麦碰撞声;二叉树;支持向量机;识别分类 中图分类号:TP391.42 文献标志码:A PACS: Study on the classification of wheat impact acoustic signals based on binary tree SVM LI Jingmin, GUO Min* (College of Computer Science, Shaanxi Normal University, Xi’an 710062, Shaanxi, China) Abstract: Several problems exist in wheat kernels such as insect infestation, mold-damaged kernel and sprout-damaged kernel. In order to sort the wheat kernels into different types automatically, a novel approach which integrates binary tree and support vector machine (SVM) is proposed to discriminate between four different types of wheat kernels by impact acoustic signals. At first, the impact acoustic signals were analyzed and potential features were exacted from them in both time and frequency domains. Then the SVM based on binary tree was used for pattern recognition. Detection accuracy rates of the presented system for undamaged kernel, insect damage, moldy and sprout damage were above 84.0%. The experimental results show that our research has a high value on application and provides a feasible method for automatic classification of wheat kernels. Key words: wheat impact acoustic signals; binary tree; support vector machine 注意:1 摘要的撰写:摘要内容(200 字左右),不要论及论文的基础和背景知识;直奔目的、方法、结果、 结论;不要进行自我评价。 目的——本研究要达到的核心目标。 方法——所用的原理、理论、条件、对象、材料、工艺、结构、手段、装备、程序等。 结果——实验的、研究的最重要结果和数据,被确定的关系等。 结论——结果的分析和意义。 2 中图分类号需准确。 3 作者信息完整(见页脚)。 4 收稿日期即是本文首次投稿日期(见投稿平台) 5 英文摘要需语句通顺,可参考同领域的英文文献。 6 全文请单栏排版
引言 小麦受储藏方式的影响,容易发生霉变、发芽和虫害现象,严重影响储藏小麦的品级,有效地检测和防治工 作显得尤为重要。常用的检测方法包括光学技术检测法、机械技术检测法、电子技术检测法等,但是这些检测方 法存在劳动强度大,费用高的缺点2。因此,利用电子计算机将声学技术与模式识别技术相结合,实现高效率、 低成本的储粮自动检测成为该领域研究的热点 2001年, Pearson提出利用碰撞声发射方法检测开心果的开口情况,碰撞声检测系统首先采集开心果的碰撞 声信号,然后对声信号进行时频域特征提取,采用线性判别分析方法筛选未开口的开心果,其吞吐量约为40颗 秒,分类准确率接近970%門。2005年, Pearson等利用碰撞声检测小麦的完好性,通过对声音信号时域和频域 的分析处理,成功地实现了小麦完好粒和虫害粒( Insect Damaged Kernel,IDK)的分类,完好粒的正确识别率为 980%,IDK的正确识别率为870%阳。2006年, Onaran等利用碰撞声检测系统采集榛子的碰撞声,提取信号的 时域最大幅值和线性谱频率,采用支持向量机( Support Vector Machines,SⅤM)进行分类,成功的从发育完好的 榛子中筛选出未完全发育的榛子,分类准确率达970%65。201l年,Omid开发了基于专家系统的碰撞声分类器, 采用J48决策树从开心果碰撞声信号中选择最优分类统计特征,形成IF-THEN规则,然后利用模糊逻辑分类器 分类准确率为95.56%。2011年, Hosainpour等设计了土豆和泥块的智能分拣系统,提取碰撞声的时频特征 利用多层BP神经网络,实现土豆和泥块的自动识别、分类,吞吐量可达到20吨/小时,且成功分类比例达970%71 2012年, Khalesi等利用碰撞声检测两种类型的胡桃,采集到的声信号进行时频特征提取,PCA特征向量降维处 理后,采用多层前馈神经网络进行分类,识别准确率分别为96.56%和9964%8。 从以上研究成果可以看出,利用碰撞声检测法可以实现农产品颗粒的品级检测与自动分类,且具有较高的识 别率。本文采用二叉树和支持向量机相结合的方法对小麦碰撞声进行识别分类,首先选取小麦完好粒、IDK、霉 变粒和发芽粒样本各300粒,采集碰撞声信号,从时域和频域对碰撞声信号进行分析和处理,提取信号特征,设 计二叉树支持向量机分类器进行分类,较好地实现对小麦完好粒、IDK、霉变粒和发芽粒4类麦粒的识别,为小 麦的自动分类提供了一种新方法 注意:引言应概述前人在该领堿所作的相关工作,并提岀进行本研究的动机。指出论文研究工作 与他人的异同、重点及其在哪些方面取得成果和突破。 1支持向量机原理 支持向量机是以统计学习理论为基础,针对有限样本的一种通用学习方法,能有效解决小样本、高维数、非线 性等问题。支持向量机基于结构风险最小原理,利用最大化分类边界的思想,寻求最优超平面解决线性可分情况 下的模式识别问题φ。而对于线性不可分情况,则又通过使用非线性映射算法将低维输入空间线性不可分的样 本转化为高维特征空间使其线性可分,从而在高维特征空间采用线性分析方法进行问题求解。 设给定的训练集为{(x,y),,(xk2y)},其中xk∈R,y∈{-1,1},k为训练样本总数,n为模式空间的维数 x为训练样本,y为样本的类标。如果第个样本x属于第1类则y=1,如果x属于第2类,则y=-1。支持向 量机就是要寻找一个满足要求的超平面ν‘x+b=0(ν为分割平面的法向量,b为分割平面的偏移量),使得训练 集中的正类输入和负类输入分别位于该超平面的两侧,既能把训练集中的数据正确分类,又能使分类后的数据集 的间隔尽可能最大。用数学模型描述如下
引言 小麦受储藏方式的影响,容易发生霉变、发芽和虫害现象,严重影响储藏小麦的品级,有效地检测和防治工 作显得尤为重要。常用的检测方法包括光学技术检测法、机械技术检测法、电子技术检测法等,但是这些检测方 法存在劳动强度大,费用高的缺点[1-2]。因此,利用电子计算机将声学技术与模式识别技术相结合,实现高效率、 低成本的储粮自动检测成为该领域研究的热点。 2001 年,Pearson 提出利用碰撞声发射方法检测开心果的开口情况,碰撞声检测系统首先采集开心果的碰撞 声信号,然后对声信号进行时频域特征提取,采用线性判别分析方法筛选未开口的开心果,其吞吐量约为 40 颗/ 秒,分类准确率接近 97.0% [3]。2005 年,Pearson 等利用碰撞声检测小麦的完好性,通过对声音信号时域和频域 的分析处理,成功地实现了小麦完好粒和虫害粒(Insect Damaged Kernel, IDK)的分类,完好粒的正确识别率为 98.0%,IDK 的正确识别率为 87.0% [4]。2006 年,Onaran 等利用碰撞声检测系统采集榛子的碰撞声,提取信号的 时域最大幅值和线性谱频率,采用支持向量机(Support Vector Machines, SVM)进行分类,成功的从发育完好的 榛子中筛选出未完全发育的榛子,分类准确率达 97.0%[5]。2011 年,Omid 开发了基于专家系统的碰撞声分类器, 采用 J4.8 决策树从开心果碰撞声信号中选择最优分类统计特征,形成 IF-THEN 规则,然后利用模糊逻辑分类器, 分类准确率为 95.56%[6]。2011 年,Hosainpour 等设计了土豆和泥块的智能分拣系统,提取碰撞声的时频特征, 利用多层 BP 神经网络,实现土豆和泥块的自动识别、分类,吞吐量可达到 20 吨/小时,且成功分类比例达 97.0%[7]。 2012 年,Khalesi 等利用碰撞声检测两种类型的胡桃,采集到的声信号进行时频特征提取,PCA 特征向量降维处 理后,采用多层前馈神经网络进行分类,识别准确率分别为 96.56%和 99.64%[8]。 从以上研究成果可以看出,利用碰撞声检测法可以实现农产品颗粒的品级检测与自动分类,且具有较高的识 别率。本文采用二叉树和支持向量机相结合的方法对小麦碰撞声进行识别分类,首先选取小麦完好粒、IDK、霉 变粒和发芽粒样本各 300 粒,采集碰撞声信号,从时域和频域对碰撞声信号进行分析和处理,提取信号特征,设 计二叉树支持向量机分类器进行分类,较好地实现对小麦完好粒、IDK、霉变粒和发芽粒 4 类麦粒的识别,为小 麦的自动分类提供了一种新方法。 注意:引言应概述前人在该领域所作的相关工作,并提出进行本研究的动机。指出论文研究工作 与他人的异同、重点及其在哪些方面取得成果和突破。 1 支持向量机原理 支持向量机是以统计学习理论为基础,针对有限样本的一种通用学习方法,能有效解决小样本、高维数、非线 性等问题。支持向量机基于结构风险最小原理,利用最大化分类边界的思想,寻求最优超平面解决线性可分情况 下的模式识别问题[9-10]。而对于线性不可分情况,则又通过使用非线性映射算法将低维输入空间线性不可分的样 本转化为高维特征空间使其线性可分,从而在高维特征空间采用线性分析方法进行问题求解。 设给定的训练集为{(x1, y1 ), ..., (xk, yk)},其中 xk∈Rn, yk∈{-1,1},k 为训练样本总数,n 为模式空间的维数, x 为训练样本,y 为样本的类标。如果第 i 个样本 xi 属于第 1 类,则 yi =1,如果 xi 属于第 2 类,则 yi = -1。支持向 量机就是要寻找一个满足要求的超平面 w·x+b =0 (w 为分割平面的法向量,b 为分割平面的偏移量),使得训练 集中的正类输入和负类输入分别位于该超平面的两侧,既能把训练集中的数据正确分类,又能使分类后的数据集 的间隔尽可能最大。用数学模型描述如下:
注意:公式公式若在文中叙述常用请连续编号,并且公式末尾要有标点符号。 其中,C为惩罚因子,它用来控制错分样本惩罚的程度 对于非线性SM,则可根据泛函的有关理论,设计一种满足 Mercer条件的核函数,将原始线性不可分样本据 映射到某一高维特征空间,在特征空间运用内积函数实现线性不可分数据集的分类。假设利用核函数 K(x;-y)=屮(x)·邺υ)把原始数据映射到高维特征空间,那么特征空间的核函数SvM为 maxQ(a)=∑a1- 吗yK(x· 通过对式(2)问题的求解,可得到最终判别函数为: f(x)=sgn∠∑a'yK(x·x)+b} 注意:表示向量和矩阵的符号用黑斜体 2材料与方法 2.1实验装置 实验装置如图1所示,主要由计算机、麦克风和不锈钢板组成。不锈钢板大小为24cm×11cm×0.06cm且与水 平成30°的夹角,钢板尺寸和安装角度的合适选择可使钢板震动干扰声降到最低。当麦粒从钢板正上方50cm下 落时,用型号舒尔BG4.1高灵敏麦克风采集麦粒碰撞 2-6an 图1.小麦碰撞声采集装置 Fig 1 Schematic of experimental apparatus of collecting impact acoustics from wheat kemels 注意:图应有中英文图题 钢盘产生的碰撞声信号,并将声信号传送至装有MAYA44声卡的计算机,进行数字化处理,采样频率为48000Hz。 对采集的碰撞声信号进行分析处理,分别提取声信号时域和频域统计特征参量,然后使用二叉树SM分类识别, 实验流程如图2所示。 特时域特特 频域特卻集 策树机分类器 计算识别率 图2.实验流程图 Fig 2 Flow process diagram of the experimental method
2 1 1 min( ) 2 k i i c = w + . (1) 注意:公式公式若在文中叙述常用请连续编号,并且公式末尾要有标点符号。 其中,C 为惩罚因子,它用来控制错分样本惩罚的程度。 对于非线性 SVM,则可根据泛函的有关理论,设计一种满足 Mercer 条件的核函数,将原始线性不可分样本据 映射到某一高维特征空间,在特征空间运用内积函数实现线性不可分数据集的分类。假设利用核函数 K(xi·yi)=Ψ(xi)·Ψ(yi)把原始数据映射到高维特征空间,那么特征空间的核函数 SVM 为: 1 1 1 1 max ( ) ( ) 2 k k k i i j i j j i i i Q a a a a y y K = = = = − i x x• . (2) 通过对式(2)问题的求解,可得到最终判别函数为: * * 1 ( ) sgn{ ( ) } k i i i i f a y K b = x x x = + • . (3) 注意: 表示向量和矩阵的符号用黑斜体 2 材料与方法 2.1 实验装置 实验装置如图 1 所示,主要由计算机、麦克风和不锈钢板组成。不锈钢板大小为 24cm×11cm×0.06cm 且与水 平成 30°的夹角,钢板尺寸和安装角度的合适选择可使钢板震动干扰声降到最低。当麦粒从钢板正上方 50cm 下 落时,用型号舒尔 BG 4.1 高灵敏麦克风采集麦粒碰撞 50cm 1 2 3 4 5 1—PC 2—不 不 不 不 3—不 不 不 4—不 不 不 5—不 不 图 1. 小麦碰撞声采集装置 Fig.1 Schematic of experimental apparatus of collecting impact acoustics from wheat kernels 注意:图应有中英文图题 钢盘产生的碰撞声信号,并将声信号传送至装有 MAYA44 声卡的计算机,进行数字化处理,采样频率为 48 000Hz。 对采集的碰撞声信号进行分析处理,分别提取声信号时域和频域统计特征参量,然后使用二叉树 SVM 分类识别, 实验流程如图 2 所示。 碰 撞 声 采 集 预 处 理 特 征 提 取 特 征 向 量 集 决 策 树 SVM 分 类 器 计 算 识 别 率 时域特征 频域特征 图 2. 实验流程图 Fig.2 Flow process diagram of the experimental method
2.2特征提取 本文选取小麦完好粒、IDK、霉变粒和发芽粒各300粒用于实验。IDK的害虫洞穴改变了麦粒的结构:受到 真菌感染的麦粒,会使胚乳多孔,麦粒收缩,重量减轻:;而小麦发芽会使淀粉转化为糖,伴随着幼芽的出现,麦 粒会裂开,这些物理结构上的不同,导致碰撞声信号的不同,由此认为,通过分析碰撞声信号可以区别4种类型 的麦粒,实现受损粒与完好粒的分拣 2.2.1时域特征提取 1)最大幅值 小麦碰撞声信号的幅值和麦粒本身的物理结构密切相关,物理结构上的不同导致小麦碰撞声信号强弱不同, 直接表现在信号振幅上的波动,由此得知,最大幅值是麦粒类别的一个重要特征。 2)幅值总和 每一类小麦碰撞声信号的幅值总和是不同的。经反复实验,从最大幅值前第50个开始连续取250个采样点 作为统计区间,计算这250个采样点碰撞声信号在时域所对应的幅值总和。 3)峰度 峰度系数是用来刻画信号分布密度曲线的陡峭程度。所以在小麦碰撞声信号的统计区间上,通过峰度系 数就可以反映不同类型小麦碰撞声信号在时域空间分布密度曲线的变化快慢 4)偏度 偏度系数是用来刻画信号取值关于均值的对称程度。可以度量时域空间上不同类型小麦碰撞声信号在曲线对 称性上存在的差异 5)方差 方差刻画了信号观测值相对于其均值的离散程度。若小麦碰撞声信号的取值比较集中则方差较小;反之, 则方差较大。以上各参数的计算公式如表1所示。 如上的5个碰撞声音信号特征参数的具体计算公式见表1 Tab. 1 Extracting features from impact acoustic signal 计算公式 最大幅值Max=max(x(n) 幅值总和Smn=∑x(n) Kurt= n=l N×(Ia) (n-1)(n-2) 方差 注:其中,n=1,2,3,为采样点,N为统计区间采样点的个数,本文实验中N取250 x(m)为实验过程中采集的小麦碰撞声信号第n个采样点所对应的时域幅值,x表示统计区间内xm的平均值 注意:表采用三线表,并且要有中英文表题,表注不需要英文。 22.2频域特征提取
2.2 特征提取 本文选取小麦完好粒、IDK、霉变粒和发芽粒各 300 粒用于实验。IDK 的害虫洞穴改变了麦粒的结构;受到 真菌感染的麦粒,会使胚乳多孔,麦粒收缩,重量减轻;而小麦发芽会使淀粉转化为糖,伴随着幼芽的出现,麦 粒会裂开,这些物理结构上的不同,导致碰撞声信号的不同,由此认为,通过分析碰撞声信号可以区别 4 种类型 的麦粒,实现受损粒与完好粒的分拣。 2.2.1 时域特征提取 1) 最大幅值 小麦碰撞声信号的幅值和麦粒本身的物理结构密切相关,物理结构上的不同导致小麦碰撞声信号强弱不同, 直接表现在信号振幅上的波动,由此得知,最大幅值是麦粒类别的一个重要特征。 2)幅值总和 每一类小麦碰撞声信号的幅值总和是不同的。经反复实验,从最大幅值前第 50 个开始连续取 250 个采样点 作为统计区间,计算这 250 个采样点碰撞声信号在时域所对应的幅值总和。 3)峰度 峰度系数是用来刻画信号分布密度曲线的陡峭程度。所以在小麦碰撞声信号的统计区间上,通过峰度系 数就可以反映不同类型小麦碰撞声信号在时域空间分布密度曲线的变化快慢。 4) 偏度 偏度系数是用来刻画信号取值关于均值的对称程度。可以度量时域空间上不同类型小麦碰撞声信号在曲线对 称性上存在的差异。 5)方差 方差刻画了信号观测值相对于其均值的离散程度。若小麦碰撞声信号的取值比较集中则方差较小;反之, 则方差较大。以上各参数的计算公式如表 1 所示。 如上的 5 个碰撞声音信号特征参数的具体计算公式见表 1。 表1. 碰撞声音信号特征参数计算公式 Tab. 1 Extracting features from impact acoustic signal 特征参数 计算公式 最大幅值 Max x n = max( ( )) 幅值总和 ( ) 1 N Sum x n i = = 峰度 4 ( ( ) ) 1 2 ( ) N x n X n Kurt N Var − = = 偏度 ( ) 3 ( ) ( 1)( 2) 1 n x n N X Skew n n n Var − = − − = 方差 2 2 ( ( ) ( ( )) 1 1 ( 1) N N n x n x n n n Var n n − = = = − 注:其中,n =1,2,3,…为采样点,N为统计区间采样点的个数,本文实验中N取250, x(n)为实验过程中采集的小麦碰撞声信号第n个采样点所对应的时域幅值, X 表示统计区间内x(n)的平均值。 注意:表采用三线表,并且要有中英文表题,表注不需要英文。 2.2.2 频域特征提取
采用直接谱估计 Bartlett法,快速傅里叶变换的点数为1024,采样频率为48000Hz,窗函数采用汉宁窗,长 度为1024。典型的完好粒、IDK、霉变粒和发芽粒相对功率谱如图3所示。可以看出,4类碰撞声信号的功率谱 曲线整体走势不同,能量的分布存在明显差异,所以在频域提取功率谱最大能量值及其对应频率作为碰撞声信号 识别特征。 唱 50 频率/z 频率/Hz 图3.2类麦粒的相对功率谱 Fig 3 The relative power spectral estimated for two different types of wheat kemel impact acoustics 注意:子图用a、b区分,并且图线需清晰,照片需要较好的分辨率。图中的坐标名尽量用中文表示。本刊 采用黑白印刷,故请将彩色图片转化为灰度图,并且在图中和文中不要用彩色去区分图中的各种线条。 略 下两图为图线和照片的例子
采用直接谱估计 Bartlett 法,快速傅里叶变换的点数为 1024,采样频率为 48 000Hz,窗函数采用汉宁窗,长 度为 1024。典型的完好粒、IDK、霉变粒和发芽粒相对功率谱如图 3 所示。可以看出,4 类碰撞声信号的功率谱 曲线整体走势不同,能量的分布存在明显差异,所以在频域提取功率谱最大能量值及其对应频率作为碰撞声信号 识别特征。 0 0.5 1 1.5 2 2.5 x 104 -90 -80 -70 -60 -50 -40 -30 频率 /Hz 相对功率谱幅值 /dB a 0 0.5 1 1.5 2 2.5 x 104 -90 -80 -70 -60 -50 -40 -30 频率 /Hz 相对功率谱幅值 /dB b 图 3. 2 类麦粒的相对功率谱 Fig.3 The relative power spectral estimated for two different types of wheat kernel impact acoustics a.完好粒; b.IDK; 注意:子图用 a、b 区分,并且图线需清晰,照片需要较好的分辨率。图中的坐标名尽量用中文表示。本刊 采用黑白印刷,故请将彩色图片转化为灰度图,并且在图中和文中不要用彩色去区分图中的各种线条。 略 下两图为图线和照片的例子