数据降维 样本字段数较多容易产生维度灾难,使得模型训练时间超长,冗余数据影 响模型准确性,所以大多数情况下需要对数据进行降维处理 可使用分析软件附带的字段重要性评估模块或逻辑回归等模型评估实现 SPSS Modeler中“特征选择”节点 在模式中选择所有列的字段 字段模型选项注解 y重要 使用预定义角色( 分界值 使用定材字分数 回不重 分界值 目标①D排车鼓 Q字段总数 人D按殊数 O重要性大于 保火险数量 通过分类日标,英预变量的p值(重要性)的基甜为 控保船险数量 控保时产趋数量 投保社食安全数量 分区(A) 一息用(△[重置B
数据降维 议程 • 样本字段数较多容易产生维度灾难,使得模型训练时间超长,冗余数据影 响模型准确性,所以大多数情况下需要对数据进行降维处理 • 可使用分析软件附带的字段重要性评估模块或逻辑回归等模型评估实现 • SPSS Modeler中“特征选择”节点
数据降维 特征选择结果 横型搞要技解 233控额 ★木★★★★丸 000900 2#盒警理安2 ②非熟练劳工标 999998 33分无宗教比例 34侵农场主 35单身占比标记 0.969 3零革教一2 83 定字段数36可用字段总数:85 >095团<=0.9回<0.9 单个卖别过大 单个卖别法夫 应用(△)[置(R
数据降维 议程 • 特征选择结果