×

用几何有向图族对不平衡数据进行分类。 (英语) Zbl 1392.62190号

摘要:我们使用一个称为类覆盖捕获有向图(CCCD)的几何有向图族来解决统计分类中的类不平衡问题。CCCD为类覆盖问题提供了图论解决方案,并已用于分类。我们通过大量的蒙特卡罗模拟来评估CCCD分类器的分类性能,并将其与文献中常用的其他分类器进行比较。特别是,当一个类在两类设置中比另一个类更频繁时,CCCD分类器的性能相对较好,这是类不平衡问题的一个例子。我们还指出了类不平衡和类重叠问题之间的关系,以及它们对CCCD分类器和其他分类方法的性能的影响,以及一些通过构造对类不平衡具有鲁棒性的最新算法。在模拟数据集和实际数据集上的实验表明,CCCD分类器对类不平衡问题具有鲁棒性。CCCD在欠采样过程中保留了丢弃点的信息,但却大大低于大多数类的采样。然而,许多最先进的方法通过集成分类器来保存这些信息,但CCCD只产生一个具有相同属性的分类器,这使得它既吸引人又快速。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
05C20号 有向图(有向图),比赛
05C90年 图论的应用
65二氧化碳 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接