薛伟;张静 处理不平衡数据集:一种基于改进SMOTE算法的重采样方法。 (英语) Zbl 1384.62206号 Commun公司。统计、仿真计算。 45,第4期,1160-1172(2016). 摘要:大多数分类模型在处理不平衡数据集时都呈现出不平衡的学习状态。本文提出了一种基于改进的SMOTE(合成少数过采样技术)算法的非平衡数据集学习新方法。该方法将过采样和欠采样方法有机地结合起来,目的是有针对性地选择邻域,合成不同策略的样本。实验表明,大多数分类器在用我们的算法处理不平衡数据集后,在正负类的分类问题上取得了理想的性能。 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 关键词:分类;不平衡数据集;重新取样;SMOTE算法 PDF格式BibTeX公司 XML格式引用 \textit{W.Xue}和\textit{J.Zhang},公社。统计、仿真计算。45,第4号,1160--1172(2016;Zbl 1384.62206) 全文: 内政部 参考文献: [1] 内政部:10.1007/978-3642-01307-2_43·Zbl 05547058号 ·文件编号:10.1007/978-3-642-01307-2_43 [2] Chawla N.V.,《人工智能研究杂志》16(3),第321页–(2002) [3] Estabrooks A.,从不平衡数据集归纳学习的组合方案(2000年) [4] 内政部:10.1145/1007730.1007736·兹伯利05442742 ·doi:10.145/1007730.1007736 [5] 内政部:10.1007/11538059_91·doi:10.1007/11538059_91 [6] 内政部:10.1109/TIT.1968.1054155·doi:10.1109/TIT.1968.1054155 [7] 内政部:10.1198/016214500000098·Zbl 1089.62511号 ·doi:10.1198/016214500000098 [8] 内政部:10.1145/1007730.1007737·Zbl 05442773号 ·数字对象标识代码:10.1145/1007730.1007737 [9] Tomek I.,IEEE系统、人与控制论汇刊6(6)第769页–(1976) [10] 内政部:10.1145/1007730.1007734·Zbl 05442966号 ·数字对象标识代码:10.1145/1007730.1007734 [11] Weiss G.M.,《人工智能研究杂志》,第19页,第315页–(2003) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。