量化问题之“支持向量” 被红色和蓝色的线圈出来的点就是所谓的 支持向量( support vector) 22
量化问题之“支持向量” • 被红色和蓝色的线圈出来的点就是所谓的 支持向量(support vector) 22
量化问题之“最大化间隔” Maximum Marginal原则 Predict Class = +1 Plus-Plane Classifier Boundary Minus-Plane "Predict Class =-1 Classifier boundary就是f(x),红色和蓝色的线( plus plane 与 minus plane)就是 support vector所在的面,红色、蓝色 线之间的间隔就是我们要最大化的分类间的间隔 23
量化问题之“最大化间隔” • Maximum Marginal原则 • Classifier Boundary就是f(x),红色和蓝色的线(plus plane 与minus plane)就是support vector所在的面,红色、蓝色 线之间的间隔就是我们要最大化的分类间的间隔。 23
量化问题之“最大化间隔” Maximum Margin原则 M=Margin Width I=q+XM 0=q+×M "Predict Class =-1 ·几何间隔 //(c) 62=m M=2 24
量化问题之“最大化间隔” • Maximum Margin原则 • 几何间隔 24
何间隔的现实含义 H是分类面,而H1和H2是平行于H,且过离H最近的两类样 本的直线,H1与H,H2与H之间的距离就是几何间隔 H margin- 图2线性可分情况下的最优分类线
几何间隔的现实含义 • H是分类面,而H1和H2是平行于H,且过离H最近的两类样 本的直线,H1与H,H2与H之间的距离就是几何间隔 25
几何间隔的存在意义 ·几何间隔与样本的误分次数间存在关系 21\2 Error number s ·其中的δ是样本集合到分类面的间隔,R=max lxi|li=1…,n,即R是所有样本中向量长度最长的 值(也就是说代表样本的分布有多么广 ·误分次数一定程度上代表分类器的误差。(证明略) 误分次数的上界由几何间隔决定(样本已知的时候)
几何间隔的存在意义 • 几何间隔与样本的误分次数间存在关系 • 其中的δ是样本集合到分类面的间隔,R=max ||xi|| i=1,...,n,即R是所有样本中向量长度最长的 值(也就是说代表样本的分布有多么广) • 误分次数一定程度上代表分类器的误差。(证明略) • 误分次数的上界由几何间隔决定(样本已知的时候) 26