信息增益 离散属性a的取值:{al,a2,,a) D:D中在a上取值=a的样本集合 以属性a对数据集D进行划分所获得的信息增益为: Gain(D,d)-Ebmt(D)-∑ Ent(D) 划分前的信息熵 划分后的信息熵 第)个分支的权重, 样本越多越重要 ID3算法中使用
$ % a # Dv: D a = av #. a . D ,) (#$ #! #! & v #-, ++-* ID3' "