×

缺少针对不平衡类大小的数据生成分类器。 (英语) Zbl 1351.68227号

摘要:针对训练数据不平衡时的两类分类问题,提出了一种算法。这意味着其中一个类中的训练实例数量太少,以至于传统的分类算法在检测少数类时变得无效。我们对核Fisher判别分析进行了修改,以便在新的算法公式中明确解决问题的不平衡性。新算法利用现有少数数据点的特性来学习其他少数数据点(如果它们确实存在的话)的影响。该算法通过采用学习的属性和条件采样进行迭代,从而为少数集生成足够的人工数据点,从而提高少数类的检测概率。在大量模拟和实际数据集上实施该方法,我们表明,与一组替代的最新非平衡分类算法相比,该方法的性能具有竞争力。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 链接