分集增益可以包含下面哪几种?
编辑:自学文库
时间:2024年09月22日
2. 负分集增益:当在一个特征上划分数据集后,获得一种更差的分类结果,即不纯度增加,分集增益为负。
3. 零分集增益:当在一个特征上划分数据集后,得到的分类结果与划分前相同,即不纯度没有发生变化,分集增益为零。
4. 最大分集增益:在所有特征上进行划分,找到最大的分集增益,用于选择最优的特征划分数据集。
5. 分集增益比:为了克服分集增益对特征取值较多时的偏好,引入了分集增益比的概念,即分集增益与划分信息的比值。
分集增益比可以避免选择取值较多的特征作为划分依据。