烟熏

此代码实现SMOTEBoost。SMOTEBoost是一种处理离散类标签数据中类不平衡问题的算法。它使用SMOTE和标准boosting过程AdaBoost的组合,通过向学习者提供在先前boosting迭代中错误分类的少数民族类示例,以及这些实例的更广泛表示(由SMOTE实现),从而更好地建模少数民族类。由于boosting算法对所有错误分类的示例和主要由多数类组成的数据池中的样本赋予相同的权重,因此训练集的后续采样仍然偏向于多数类。因此,为了减少由于班级不平衡而导致的学习过程中固有的偏差,增加少数民族班级的抽样权重,在每一轮的提升中都引入了SMOTE。SMOTE的引入增加了学习者的少数民族班样本数量,并在每轮提升轮的分布中关注这些案例。除了最大化倾斜类数据集的裕度外,该过程还增加了集成中分类器之间的多样性,因为每次迭代都会产生不同的合成样本集。有关该算法的更多理论描述,请参阅以下论文:N.V.Chawla,A.Lazarevic,L.O.Hall,K.Bowyer,“SMOTEBoost:在Boosting中改进少数民族阶级的预测”,数据库知识发现杂志:PKDD,2003。目前SMOTEBoost的实现是作者为了研究的目的而独立完成的。为了使用户能够使用多种不同的弱学习者进行提升,使用wekaapi创建了一个接口。目前,有四种Weka算法可以作为弱学习者使用:J48、SMO、IBk、Logistic


zbMATH参考文献(28篇文章引用)

显示第1到第20个结果,共28个。
按年份排序(引用)
  1. 朱冰冰;高子涵;赵俊凯;塞普K.L.M.范登布鲁克:用于二进制不平衡分类的R库(2019)不是zbMATH
  2. 谢文浩;梁功谦;董仲辉;谭宝玉;张宝生:基于样本选择策略的非均衡数据分类改进过采样算法(2019)
  3. 张学英;李瑞贤;张波;杨云翔;郭晶晶;季翔:基于实例的不平衡处理方法学习推荐算法(2019)
  4. Vanhoeyveld,Jellis;Martens,David:稀疏和大型行为数据集中的不平衡分类(2018)
  5. 龚俊浩;金贤雄:Rhsboost:改善不平衡数据中的分类性能(2017年)
  6. Koziarski,Michał;Wożniak,Michał:一种用于不平衡数据分类的联合清洗和重采样算法(2017)
  7. Li,Qian;Li,Gang;Niu,Wenjia;Cao,Yanan;Chang,Liang;Tan,Jianlong;Guo,Li:用Wiener过程过采样促进不平衡数据学习(2017)
  8. Do,Thanh Nghi;Poulet,François:用于分类大规模图像数据集的并行多类逻辑回归(2015)ioport公司
  9. 安东尼奥·费尔南德斯·巴尔德拉(Fernández Baldera),路易斯鲍梅拉(Baumela),路易斯:非对称二元弱势学习者的多班提升(2014)
  10. 李秋杰;毛耀斌:非平衡数据分类boosting方法述评(2014)
  11. 王强:基于混合样本支持向量机的不平衡数据分类方法(2014)
  12. Zięba,Maciej;Świątek,Jerzy;Lubicz,Marek:Cost-sensitive SVM with non-information examples elimination for incompational posteral risk management problem(2014年),Zięba,Maciej;Świ
  13. Di Martino,Matías;Hernández,Guzmán;Fiori,Marcelo;Fernández,Alicia:最优分类器设计的新框架(2013)ioport公司
  14. Mikel Galar;阿尔伯托省Fernández;Edurne Berneecha;Herrera,Francisco:EUSBoost:通过进化欠采样增强高度不平衡数据集的集合(2013)ioport公司
  15. 维多利亚州的洛佩斯;阿尔伯托的费尔南德斯;萨尔瓦多的加西亚;瓦西里的帕拉德;弗朗西斯科的赫雷拉:对不平衡数据分类的洞察:使用数据内在特征的实证结果和当前趋势(2013年)ioport公司
  16. Stefanowski,Jerzy:从不平衡数据中学习分类器的重叠、罕见示例和类分解(2013)ioport公司
  17. Yang,Xingwei;Bai,Xiang;Köknar Tezel,Suzan;Latecki,Longin Jan:用于形状和图像检索的加密距离空间(2013)
  18. 张勇;王大鹏:类不平衡数据集的成本敏感集成方法(2013)
  19. 何景瑞;汤航航;卡博奈尔,詹姆:一个描述稀有类别的有效框架(2012)
  20. Majeske,Karl D.;Lauer,Thomas W.:利用贝叶斯决策模型优化航空乘客预筛选系统(2012年)