纳塔利·贾普科维奇;斯蒂芬,沙朱 阶级失衡问题:一项系统研究。 (英语) Zbl 1085.68628号 智力。数据分析。 6,第5期,429-449(2002). 摘要:在机器学习问题中,据报道,先验类概率的差异或类不平衡会阻碍一些标准分类器(如决策树)的性能。本文提出了一项系统研究,旨在回答三个不同的问题。首先,我们试图通过建立概念复杂性、训练集大小和班级不平衡水平之间的关系来理解班级不平衡问题的本质。其次,我们讨论了以前提出的几种基本的重新抽样或成本修正方法,以处理类别不平衡问题,并比较了它们的有效性。通过这种方法在人工领域获得的结果与真实世界领域的结果相关联。最后,我们研究了一个假设,即类不平衡问题不仅影响决策树系统,还影响其他分类系统,如神经网络和支持向量机。 引用于37文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 关键词:概念学习;阶级不平衡;重新取样;误分类成本;C5.0,多层感知器;支持向量机 软件:4.5条 PDF格式 BibTeX公司 XML格式 引用 \textit{N.Japkowicz}和\textit{S.Stephen},《情报》。数据分析。6,第5号,429--449(2002;Zbl 1085.68628) 全文: 链接 打开URL