阿拉什·波哈比;巴尼·马利克。;丁、余 缺少针对不平衡类大小的数据生成分类器。 (英语) Zbl 1351.68227号 J.马赫。学习。物件。 16, 2695-2724 (2015). 摘要:针对训练数据不平衡时的两类分类问题,提出了一种算法。这意味着其中一个类中的训练实例数量太少,以至于传统的分类算法在检测少数类时变得无效。我们对核Fisher判别分析进行了修改,以便在新的算法公式中明确解决问题的不平衡性。新算法利用现有少数数据点的特性来学习其他少数数据点(如果它们确实存在的话)的影响。该算法通过采用学习的属性和条件采样进行迭代,从而为少数集生成足够的人工数据点,从而提高少数类的检测概率。在大量模拟和实际数据集上实施该方法,我们表明,与一组替代的最新非平衡分类算法相比,该方法的性能具有竞争力。 MSC公司: 68T05型 人工智能中的学习和自适应系统 62H30型 分类和区分;聚类分析(统计方面) 关键词:核Fisher判别分析;不平衡数据;二级分类 软件:ElemStatLearn(电子状态学习);STPR工具 PDF格式BibTeX公司 XML格式引用 \textit{A.Pourhabib}等人,J.Mach。学习。第16号决议,2695--2724(2015年;Zbl 1351.68227) 全文: 链接