特征子集选择的两种方法 1自底向上方法:从空集开始,然后从初始 特征集选择最相关的特征来写入此集。这 种方法采用一种基丁些试探式的特征评 估标准。 2.自顶向下方法:从原始特征的的完整集合 开始,然后根据所选的试探式评估尺度- 挑选出不相关的特征,并将其去除
特征子集选择的两种方法 1.自底向上方法:从空集开始,然后从初始 特征集选择最相关的特征来写入此集。这 种方法采用一种基于一些试探式的特征评 估标准。 2.自顶向下方法:从原始特征的的完整集合 开始,然后根据所选的试探式评估尺度一 个一个挑选出不相关的特征,并将其去除
·—种可行的特征选择技术是基于均值和方 差的比较。它适用于特征的分布是未知的 情况,实际情况也不知道特征的分布,如 果假设分布是正态,利用统计学可获得好 的结果。这种技术仅是一种试探式的、不 严密的数学建模工具。 ·如果一个特征描述了不同种类的实体,用 特征的方差对特征的均值进行标准化,进 不同类之间的比较。如果均值偏离很远 此特征具有分别两样本的能力,否则该特 征的意义不大
一种可行的特征选择技术是基于均值和方 差的比较。它适用于特征的分布是未知的 情况,实际情况也不知道特征的分布,如 果假设分布是正态,利用统计学可获得好 的结果。这种技术仅是一种试探式的、不 严密的数学建模工具。 如果一个特征描述了不同种类的实体,用 特征的方差对特征的均值进行标准化,进 行不同类之间的比较。如果均值偏离很远, 此特征具有分别两样本的能力,否则该特 征的意义不大
·基于均值和方差的检验公式 设A和B是两个不同类特征的值的集 合,n1和n2是相应的样本数 SE(A-B)=√a(A)/m+Ⅴan(B)/m) TEST:|meom(A)-meam(B)/SE(A-B)>阈值 ·上式基于这样一种假设,已知特征独 立于其他特征。主要用于分类问题
基于均值和方差的检验公式 设A和B是两个不同类特征的值的集 合,n1和n2是相应的样本数。 − − 阈值 − = + : ( ) ( ) / ( ) ( ) (var( )/ 1 var( )/ 2) TEST mean A mean B SE A B SE A B A n B n 上式基于这样一种假设,已知特征独 立于其他特征。主要用于分类问题