标签:好的 机器学习 tle 实现 类别 权重 过多 ora 选择
在机器学习中,我们在使用模型训练数据时,时常会遇到一个问题,那就是数据不平衡,而且可能是极其不平衡。比如电商中的购买与否,金融欺诈等这种二分类中,往往数 据不仅稀疏且还极不平衡,可能其中某一类数据过多。很多模型对于处理这种不平衡数据来説是非常敏感的,往往造成效果不好。
那么在进行模型训练前,我们会做一起数据处理或改进模型的过程,怎么去缓解这种不平衡数据造成的后果。通过有以下方法:
5.总而言之:
分类在不平衡数据的训练中会出现问题
要不采样,要不生成。尽量保留正确的类别样本,因为它更具有价值。
还有在评估时,有的评估指标对不平衡数据是很敏感的。而auc通常对于不平衡数据的评估有较好的健强性。
标签:好的 机器学习 tle 实现 类别 权重 过多 ora 选择
原文地址:https://www.cnblogs.com/little-horse/p/12543141.html