×

处理不平衡数据集:一种基于改进SMOTE算法的重采样方法。 (英语) Zbl 1384.62206号

摘要:大多数分类模型在处理不平衡数据集时都呈现出不平衡的学习状态。本文提出了一种基于改进的SMOTE(合成少数过采样技术)算法的非平衡数据集学习新方法。该方法将过采样和欠采样方法有机地结合起来,目的是有针对性地选择邻域,合成不同策略的样本。实验表明,大多数分类器在用我们的算法处理不平衡数据集后,在正负类的分类问题上取得了理想的性能。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 内政部:10.1007/978-3642-01307-2_43·Zbl 05547058号 ·文件编号:10.1007/978-3-642-01307-2_43
[2] Chawla N.V.,《人工智能研究杂志》16(3),第321页–(2002)
[3] Estabrooks A.,从不平衡数据集归纳学习的组合方案(2000年)
[4] 内政部:10.1145/1007730.1007736·兹伯利05442742 ·doi:10.145/1007730.1007736
[5] 内政部:10.1007/11538059_91·doi:10.1007/11538059_91
[6] 内政部:10.1109/TIT.1968.1054155·doi:10.1109/TIT.1968.1054155
[7] 内政部:10.1198/016214500000098·Zbl 1089.62511号 ·doi:10.1198/016214500000098
[8] 内政部:10.1145/1007730.1007737·Zbl 05442773号 ·数字对象标识代码:10.1145/1007730.1007737
[9] Tomek I.,IEEE系统、人与控制论汇刊6(6)第769页–(1976)
[10] 内政部:10.1145/1007730.1007734·Zbl 05442966号 ·数字对象标识代码:10.1145/1007730.1007734
[11] Weiss G.M.,《人工智能研究杂志》,第19页,第315页–(2003)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。