纳塔利·贾普科维奇;斯蒂芬,沙朱 阶级失衡问题:一项系统研究。 (英语) Zbl 1085.68628号 智力。数据分析。6,第5期,429-449(2002)。 摘要:在机器学习问题中,据报道,先验类概率的差异或类不平衡会阻碍一些标准分类器(如决策树)的性能。本文提出了一项系统研究,旨在回答三个不同的问题。首先,我们试图通过建立概念复杂性、训练集大小和班级不平衡水平之间的关系来理解班级不平衡问题的本质。其次,我们讨论了以前为处理类不平衡问题而提出的几种基本的重新采样或成本修正方法,并比较了它们的有效性。通过这种方法在人工领域获得的结果与真实世界领域的结果相关联。最后,我们研究了一个假设,即类不平衡问题不仅影响决策树系统,还影响其他分类系统,如神经网络和支持向量机。 引用于45文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 关键词:概念学习;阶级不平衡;重新取样;误分类成本;C5.0,多层感知器;支持向量机 软件:4.5条 PDF格式BibTeX公司 XML格式 全文: 链接