第六章特征选择 966 模式识别的三大核心问题: 特征数据采集与预处理 分类识别 特征选择与提取 分类识别的正确率取决于对象的表示、训练学 习和分类识别算法,我们在前面各章的介绍中详细 讨论了第二方面的内容。本章介绍的特征提取与选 择问题则是对象表示的一个关键问题
模式识别的三大核心问题: •特征数据采集与预处理 •分类识别 •特征选择与提取 分类识别的正确率取决于对象的表示、训练学 习和分类识别算法,我们在前面各章的介绍中详细 讨论了第二方面的内容。本章介绍的特征提取与选 择问题则是对象表示的一个关键问题。 第六章 特征选择
第六章特征选择 J966 通常在得到实际对象的若干具体特征之后, 再由这些原始特征产生出对分类识别最有效、数 目最少的特征,这就是特征提取与选择的任务。 从本质上讲,我们的目的是使在最小维数特 征空间中异类模式点相距较远(类间距离较大) 而同类模式点相距较近(类内距离较小)
通常在得到实际对象的若干具体特征之后, 再由这些原始特征产生出对分类识别最有效、数 目最少的特征,这就是特征提取与选择的任务。 从本质上讲,我们的目的是使在最小维数特 征空间中异类模式点相距较远(类间距离较大) ,而同类模式点相距较近(类内距离较小)。 第六章 特征选择
966 特征选择与提取的任务: 选出最有代表性的特征,实现特征空间维数 的压缩,用最少的特征达到所要求的分类识别 正确率。 存在两个困难: ·获得的特征测量值不多。实现方法及经济上 的限制等提供的分类信息是否足够,是否能获得较 好的分类效果 ·获得的测量值太多。特征维数灾难
特征选择与提取的任务: 存在两个困难: 选出最有代表性的特征,实现特征空间维数 的压缩,用最少的特征达到所要求的分类识别 正确率。 •获得的特征测量值不多。实现方法及经济上 的限制等提供的分类信息是否足够,是否能获得较 好的分类效果 •获得的测量值太多。特征维数灾难
/96 错误的认识: 认为特征越多越好。当分类器不满足要求时, 想通过增加新的特征,来改善分类器性能。但实标 发现,特征数目达某限度后,不但不能改善分类器 性能,反而工作恶化一“特征维数灾难
错误的认识: 认为特征越多越好。当分类器不满足要求时, 想通过增加新的特征,来改善分类器性能。但实际 发现,特征数目达某限度后,不但不能改善分类器 性能,反而工作恶化——“特征维数灾难”
问题: /966 如何去掉冗余特征,如何保证分类识别精度的 前提下,减少特征维数,提高分类器运算效率和准 确度。 实际上,特征存在很多无用信息,即使有用, 有的也不能反映客体类别本质,'.要通过变换才 能得到更有意义的量。 例如:图像灰值分布中,提取反映纹理和几何形 状等性质的量,有利于分类器达最优性能。 '.需研究特征选择和提取方法→维数压缩
问题: 实际上,特征存在很多无用信息,即使有用, 有的也不能反映客体类别本质,∴要通过变换才 能得到更有意义的量。 例如:图像灰值分布中,提取反映纹理和几何形 状等性质的量,有利于分类器达最优性能。 ∴需研究特征选择和提取方法维数压缩 如何去掉冗余特征,如何保证分类识别精度的 前提下,减少特征维数,提高分类器运算效率和准 确度