×

班级不平衡问题的系统研究。 (英语) 邮编:1085.68628

摘要:在机器学习问题中,先前的类概率差异(或类不平衡)已经被报告阻碍了一些标准分类器的性能,例如决策树。本文旨在回答三个不同的问题。首先,我们试图通过建立概念复杂度、训练集大小和班级不平衡程度之间的关系来理解班级不平衡问题的本质。其次,我们讨论了以前提出的解决类不平衡问题的几种基本的重抽样或成本修正方法,并比较了它们的有效性。这些方法在人工领域得到的结果与现实世界中的结果相联系。最后,我们研究了一个假设,即类不平衡问题不仅影响决策树系统,而且也影响到其他分类系统,如神经网络和支持向量机。

理学硕士:

68T05型 人工智能中的学习与自适应系统

软件:

C4.5款
PDF格式 BibTeX公司 XML 引用
全文: 链接