分类面的决定 分离超平面不是唯 上面的N直线都可以对点正确分类 分离超平面存在一个最好的
分类面的决定 • 分离超平面不是唯一 • 上面的N直线都可以对点正确分类 • 分离超平面存在一个最好的 17
分类面的“好坏”量化 一个很直观的感受是,让“离直线最近的点, 距离直线尽可能地远” 就是分割的间隙越大越好,把两个类别的点分 得越开越好
分类面的“好坏”量化 • 一个很直观的感受是,让“离直线最近的点, 距离直线尽可能地远” • 就是分割的间隙越大越好,把两个类别的点分 得越开越好 18
“分类间隔”的引入 文本分类分类时样本格式 abel(标示出这个样本属于哪个类别) feature(文本特征所组成的向量) 假设abel=±1,我们就可以定义一个样本 点到某个超平面的间隔为这是定义) -6=y(Wx+b)
“分类间隔”的引入 • 文本分类分类时样本格式 – label(标示出这个样本属于哪个类别) – feature(文本特征所组成的向量) • 假设label=±1,我们就可以定义一个样本 点到某个超平面的间隔为(这是定义) – δi=yi (wxi+b) 19 ^
分类间隔 8 =y wx +b) yx+b)总大于0的,而且它的值等于|Wx+b 如果某个样本属于该类别的话,Wx+b>0,而y也大 于0 反之,Wx+b<0,而y也小于0 现在把W和b进行一下归一化,即用w/|w|和 b/|W分别代替原来的W和b,那么间隔就可 以写成 1
分类间隔 • δi=yi (wxi+b) – yi (wxi+b)总大于0的,而且它的值等于|wxi+b| • 如果某个样本属于该类别的话,wxi+b>0,而yi也大 于0 • 反之,wxi+b<0,而yi也小于0 – 现在把w和b进行一下归一化,即用w/||w||和 b/||w||分别代替原来的w和b,那么间隔就可 以写成 20 ^
分类间隔→几何间隔 1 gi 解析几何中点x到直线g(x)=0的距离公式 推广一下,是到超平面g(x)=0的距离,g(x)=0就 是上节中提到的分类超平面 w|是什么符号?|W|叫做向量w的范数, 向量长度其实指的是它的2-范数 用归一化的w和b代替原值之后的间隔有一个专 门的名称,叫做几何间隔
分类间隔→几何间隔 • 解析几何中点xi到直线g(x)=0的距离公式 – 推广一下,是到超平面g(x)=0的距离, g(x)=0就 是上节中提到的分类超平面 – ||w||是什么符号?||w||叫做向量w的范数, 向量长度其实指的是它的2-范数 – 用归一化的w和b代替原值之后的间隔有一个专 门的名称,叫做几何间隔 21