基于SMOTE的加权深旋转森林用于非平衡高光谱数据分类
摘要
1.简介
(1) 提出的基于深度集成学习的SMOTE-WDRoF在内部结合了深度旋转森林和SMOTE。 对于不平衡的高光谱数据,它可以获得更高的精度和更快的训练速度。 (2) 此外,引入自适应权值函数可以缓解SMOTE的缺陷,即SMOTE在合成新样本时会产生额外的噪声。
2.相关工程
2.1. 合成少数派过采样技术(SMOTE)
(1) 计算 k个 少数类样本的最近邻在每个少数类样本中的欧氏距离 . (2) 一个邻居 从中随机选择 k个 的最近邻居 . (3) 创建新实例 之间 和 : 哪里 是介于0和1之间的随机数。
2.2. 随机森林(RF)
2.3. 旋转森林(RoF)
(1) 首先,特征空间 被拆分为 K(K) 不相交的特征集,并且每个子集包括 功能的数量。 (2) 其次,利用bootstrap算法随机选取75%的训练数据,得到一个新的训练集。 (3) 然后,系数 通过在每个子空间上使用主成分分析(PCA)获得 所有子空间的系数都组织在一个稀疏的“旋转”矩阵中 . (4) 的列 通过匹配原始特征的顺序重新排列 F类 建立旋转矩阵 然后,构建新的训练集 ,用于训练单个分类器。 (5) 对所有不同的训练集重复上述过程,并生成一系列单独的分类器。 最后,根据多数投票规则得出结果。
2.4. 基于轮作的深层森林(RBDF)
3.方法
3.1. 空间信息提取与平衡数据集生成
3.2. 加权深轮伐林(WDRoF)
(1) 数据集 SMOTE生成的数据被输入RoF模型,其中 . The可以写为 ,其中 K(K) 表示实例数。 在RoF中,我们将PCA应用于特征转换,这是一种将一组变量转换为一组无关变量的数学转换方法。 其目标是获得投影矩阵 : 首先,自相关矩阵 计算结果为: 哪里 是预期的数量 和 表示换位。 其次,特征分解应用于 计算其特征值: 和相应的特征向量: 最后,主成分系数可以通过以下公式计算: 用方程构造旋转矩阵( 2 )然后生成旋转特征向量 由RoF提供。 (2) 旋转特征向量 被送入随机森林的第一级和样本的重量 设置为1。 在级别1中,每个RF将为数据集生成每个实例的分类概率和分类错误信息。 所有分类概率向量 对水平1的平均值进行计算,以获得稳健估计 : 哪里 代表 我 决策树输出和 表示RF中决策树的数量。 此外,根据分类误差,样本的权重 可以计算 哪里 是任何其他类别的票数 w个 第个RF模型。 如果样本被上一级错误分类,则样本的权重会增加,这使得样本在下一级中发挥更重要的作用,并迫使分类器将注意力集中在错误分类的样本上。 (3) 在最后一级,计算平均概率向量后,通过求最大概率获得预测标签。
4.实验结果
4.1. 数据集集合
印度松AVRIS 使用美国国家航空航天局的机载可见/红外成像光谱仪(AVIRIS)传感器获得,并于1992年6月在印第安纳州西北部的印第安松树试验场采集。 作为高不平衡数据集, 印度松AVRIS 包括 像素和220个波段,覆盖范围从0.4到2.5 m,空间分辨率为20m。原始地面实况中有16个不同的土地覆盖类别和10249个样本。 随机选取30%的原始参考数据构成训练数据集,其余部分构成测试数据集。 对于 印度松AVRIS ,如果样本数小于100,例如Oats,则随机选择一半的样本来构建训练集。 训练集上的IR为73.6。 KSC公司 于1996年3月23日被佛罗里达州肯尼迪航天中心(KSC)上空的机载可见/红外成像光谱仪所获取。 图像包括 空间分辨率为18米的像素。去除噪声带后,使用176个光谱带进行分析。 根据地面实况图,大约有5208个实例和13个类。 与中的设置类似 印度松AVRIS 图像,每个类30%的像素被随机选择来构成训练集,其他像素被用来构建测试集。 训练集上的IR为8.71。 萨利纳斯 由AVIRIS传感器在加利福尼亚州萨利纳斯山谷采集,具有224个光谱带。 此图像包括 像素,空间分辨率为20米。原始地面实景也有16类,主要包括蔬菜、葡萄园和裸地。 训练集由从原始参考数据中随机选择的8%样本构成。 培训集的IR为12.51。 帕维亚大学场景 覆盖意大利帕维亚市的反射光学系统成像光谱仪传感器采集到的数据。 数据集包括 像素覆盖范围为0.43至0.86 m,空间分辨率为1.3 m。原始地面实况中有16类42776个实例。 训练数据集由8%的样本组成,这些样本是从原始数据中随机选择的,没有进行替换。 训练集上的IR为19.83。
4.2. 实验设置
4.3. 评估指标
精度: 精度是用来衡量不平衡数据中每个类别的分类精度。 这个 仅测试类样本时测量预测率 我 哪里 和 代表对 我 th类与错误预测 我 第个类进入 我 分别是第个类。 平均准确度(AA): 作为性能指标,AA为数据中的每个类提供相同的权重,而与它拥有的实例数无关。 它可以定义为 卡帕: 评估预测结果一致性的指标是Kappa,它检查一致性是否是偶然造成的。 Kappa越高,分类器的性能越好,可以定义为 哪里 和 代表班级的实际样本量 我 和类的预测样本量 我 分别是。
4.4. 性能比较分析
4.4.1. 上的实验结果 印度松AVRIS
4.4.2. 上的实验结果 KSC公司
4.4.3. 上的实验结果 萨利纳斯
4.4.4. 上的实验结果 帕维亚大学场景
4.4.5. 不同深度学习方法的培训时间
4.5. 模型参数对分类性能的影响
4.5.1. 水平的影响
4.5.2. 窗口大小的影响
5.结论
作者贡献
基金
机构审查委员会声明
知情同意书
数据可用性声明
致谢
利益冲突
工具书类
张,M。; 李伟(Li,W.)。; Du,Q.基于不同区域的CNN用于高光谱图像分类。 IEEE传输。 图像处理。 2018 , 27 , 2623–2634. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] Landgrebe,D.高光谱图像数据分析。 IEEE信号处理。 美格。 2002 , 19 , 17–28. [ 谷歌学者 ] [ 交叉参考 ] 李,H。; Song,Y。; Chen,C.P.基于多尺度空间信息融合的高光谱图像分类。 IEEE传输。 地质科学。 远程传感器。 2017 , 55 , 5302–5312. [ 谷歌学者 ] [ 交叉参考 ] 郑,X。; 袁,Y。; Lu,X.通过选定波段的空间光谱保持降低维数。 IEEE传输。 地质科学。 远程传感器。 2017 , 55 , 5185–5197. [ 谷歌学者 ] [ 交叉参考 ] 林,L。; Song,X.使用CNN根据空间光谱信息对高光谱数据进行分类。 高级智能。 信息隐藏多媒体。 信号处理。 2017 , 64 , 61–68. [ 谷歌学者 ] 袁,Y。; Feng,Y。; Lu,X.基于投影的NMF用于高光谱分解。 IEEE J.选择。 顶部。 申请。 地球目标遥感。 2015 , 8 , 2632–2643. [ 谷歌学者 ] [ 交叉参考 ] 冯·W。; 黄,W。; Bao,W.采用基于SMOTE和带微分采样率的旋转森林的自适应集成方法进行非平衡高光谱图像分类。 IEEE地质科学。 遥感快报。 2019 , 16 , 1879–1883. [ 谷歌学者 ] [ 交叉参考 ] Quan,Y。; 钟,X。; 冯·W。; 多芬·G。; Xing,M.利用多光谱数据进行森林灾害监测的一种新的特征扩展方法。 远程传感器。 2020 , 12 , 2261. [ 谷歌学者 ] [ 交叉参考 ] 江,M。; 方,Y。; 苏,Y。; 蔡,G。; Han,G.用于高光谱图像分类的具有增强特征的随机子空间集成。 IEEE地质科学。 遥感快报。 2019 , 17 , 1373–1377. [ 谷歌学者 ] [ 交叉参考 ] 赵(Q.Zhao)。; 贾,S。; Li,Y.基于更紧密随机投影和最小类内方差算法的高光谱遥感图像分类。 模式识别。 2020 , 111 , 107635. [ 谷歌学者 ] [ 交叉参考 ] Shi,T。; 刘,H。; 陈,Y。; Wang,J。; Wu,G.利用水稻高光谱植被指数估算农业土壤中的砷。 J.危险。 马特。 2016 , 308 , 243–252. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] Obermeier,W.A。; Lehnert,L.W。; M.J.波尔。; 吉亚诺尼,S.M。; 席尔瓦,B。; 塞伯特,R。; 激光,H。; 莫瑟,G。; 米勒,C。; Luterbacher,J。; 等人,《变化环境中的草地生态系统服务:高光谱监测的潜力》。 遥感环境。 2019 , 232 , 111273. [ 谷歌学者 ] [ 交叉参考 ] 张,M。; 英语,D。; 胡,C。; 卡尔森,P。; F.E.穆勒·卡格尔(Muller-Karger)。; Toro-Farmer,G。; Herwitz,S.R.《浅水环境中遥感反射率的短期变化:重复航空高光谱测量的观测结果》。 《国际遥感杂志》。 2016 , 37 , 1620–1638. [ 谷歌学者 ] [ 交叉参考 ] 李强。; 冯·W。; Quan,Y.H.中国新冠肺炎疫情的趋势和预测。 J.感染。 2020 , 80 , 469–496. [ 谷歌学者 ] 庞蒂乌斯,J。; 哈纳文,R.P。; 哈利特,R.A。; 库克,B.D。; Corp,L.A.高空间分辨率光谱分解,用于绘制复杂城市环境中的火山灰物种。 遥感环境。 2017 , 199 , 360–369. [ 谷歌学者 ] [ 交叉参考 ] 理查兹,J.A。; Jia,X.使用合适的邻域增强高光谱最大似然分类中的训练集。 IEEE地质科学。 遥感快报。 2008 , 5 , 774–777. [ 谷歌学者 ] [ 交叉参考 ] 郭,X。; 黄,X。; 张,L。; 张,L。; A广场。; Benediktsson,J.A.高光谱遥感图像分类的支持张量机。 IEEE传输。 地质科学。 远程传感器。 2016 , 54 , 3248–3264. [ 谷歌学者 ] [ 交叉参考 ] Meher,S.K.高光谱遥感图像分类的知识编码颗粒神经网络。 IEEE J.选择。 顶部。 申请。 地球目标遥感。 2015 , 8 , 2439–2446. [ 谷歌学者 ] [ 交叉参考 ] 李,J。; 杜琪。; 李毅。; Li,W.基于正交补码子空间投影的不平衡数据高光谱图像分类。 IEEE传输。 地质科学。 远程传感器。 2018 , 56 , 3838–3851. [ 谷歌学者 ] [ 交叉参考 ] Mi,Y.基于主动学习SMOTE的不平衡分类。 Res.J.应用。 工程技术。 2013 , 5 , 944–949. [ 谷歌学者 ] [ 交叉参考 ] Taherkhani,A。; 科斯马,G。; McGinnity,T.M.AdaBoost-CNN:卷积神经网络的自适应Boosting算法,用于使用传递学习对多类非平衡数据集进行分类。 神经计算 2020 , 404 , 351–366. [ 谷歌学者 ] [ 交叉参考 ] 张,X。; 庄,Y。; Wang,W。; Pedrycz,W.使用合成实例进行类不平衡对象识别的传输增强。 IEEE传输。 赛博。 2016 , 48 , 357–370. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] 阿南德,A。; Pugalenthi,G。; 福格尔,G.B。; Suganthan,P.N.使用加权和欠采样对高度不平衡数据进行分类的方法。 氨基酸 2010 , 39 , 1385–1391. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] 林,M。; Tang,K。; Yao,X.训练神经网络进行多类不平衡分类的动态抽样方法。 IEEE传输。 神经网络。 学习。 系统。 2013 , 24 , 647–660. [ 谷歌学者 ] 冯·W。; 黄,W。; 基于边缘理论的班级不平衡合奏学习。 申请。 科学。 2018 , 8 , 815. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 冯·W。; 多芬·G。; 黄,W。; Quan,Y。; Liao,W.改良随机森林中基于Margin的新子抽样迭代分类技术。 知识。 基于系统。 2019 , 182 , 104845. [ 谷歌学者 ] [ 交叉参考 ] 冯·W。; Bao,W.用于高光谱图像分类的基于加权的旋转森林。 IEEE地质科学。 遥感快报。 2017 , 14 , 2167–2171. [ 谷歌学者 ] [ 交叉参考 ] F.J.卡斯特拉诺斯。; 瓦莱罗·马斯,J.J。; Calvo-Zaragoza,J。; Rico-Juan,J.R.对字符串空间中的不平衡数据进行过采样。 模式识别。 莱特。 2018 , 103 , 32–38. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Chawla,N.V.公司。; K.W.鲍耶。; 洛杉矶霍尔。; Kegelmeyer,W.P.SMOTE:合成少数过采样技术。 J.阿蒂夫。 智力。 物件。 2002 , 16 , 321–357. [ 谷歌学者 ] [ 交叉参考 ] Blaszczynski,J。; Stefanowski,J.袋装中不平衡数据的邻里抽样。 神经计算 2015 , 150 , 529–542. [ 谷歌学者 ] [ 交叉参考 ] 齐克。; Yang,H。; 胡,Q。; Yang,D.一种新的基于改进支持向量机的高维自适应加权非平衡数据分类器。 知识。 基于系统。 2019 , 185 , 104933. [ 谷歌学者 ] [ 交叉参考 ] Zhou,Z.H。; Liu,X.Y.用解决班级不平衡问题的方法训练成本敏感型神经网络。 IEEE传输。 知识。 数据工程。 2006 , 18 , 63–77. [ 谷歌学者 ] [ 交叉参考 ] Datta,A。; Ghosh,S。; Ghosh,A.高光谱图像无监督波段选择的聚类和排序技术组合。 IEEE J.选择。 顶部。 申请。 地球目标遥感。 2015 , 8 , 2814–2823. [ 谷歌学者 ] [ 交叉参考 ] Galar,M.《班级失衡问题的合奏综述:打包、助推和混合方法》(the Ensembles for the Class Imbalance Problem:Bagging,Boosting,and Hybrid Based Approachs)。 IEEE传输。 系统。 人类网络。 C部分申请。 版次。 2012 , 42 , 463–484. [ 谷歌学者 ] [ 交叉参考 ] Ng、W.W.Y。; 胡,J。; 杨,D.S。; 尹,S。; Roli,F.《不平衡分类问题的基于灵敏度的多样化欠采样》。 IEEE传输。 赛博。 2017 , 45 , 2402–2412. [ 谷歌学者 ] [ 交叉参考 ] Ming,G。; 夏,H。; 盛,C。; Harris,C.J.A将基于SMOTE和PSO的RBF分类器相结合,用于两类不平衡问题。 神经计算 2011 , 74 , 3456–3466. [ 谷歌学者 ] 刘X.Y。; 吴杰。; Zhou,Z.H.班级平衡学习探索性抽样不足。 IEEE传输。 系统。 人类网络。 B部分Cybern。 2008 , 39 , 539–550. [ 谷歌学者 ] Barandela,R。; 瓦尔多维诺斯,R.M。; 桑切斯·加雷塔,J.S。; Ferri,F.J.不平衡训练样本问题:采样不足或过度。 在 IAPR模式识别(SPR)和结构与句法模式识别(SSPR)统计技术联合国际研讨会 ; 施普林格:柏林/海德堡,德国,2004年; 第3138卷,第806-814页。 [ 谷歌学者 ] 刘,B。; Tsoumakas,G.通过随机欠采样处理分类器链中的类不平衡。 知识。 基于系统。 2020 , 192 , 105292.1–105292.13. [ 谷歌学者 ] [ 交叉参考 ] Akkasi,A。; 瓦罗卢,E。; Dimiller,N.平衡欠采样:一种新的基于句子的欠采样方法,用于改进化学和生物医学文本中命名实体的识别。 申请。 智力。 2017 , 48 , 1–14. [ 谷歌学者 ] [ 交叉参考 ] 康(Kang,Q.)。; 陈,X.S。; Li,S.S。; Zhou,M.C.不平衡分类的采样方案下的噪声滤波。 IEEE传输。 赛博。 2017 , 47 , 4263–4274. [ 谷歌学者 ] [ 交叉参考 ] Ng、W.W.Y。; 徐,S。; 张杰。; 田,X。; Rong,T。; Kwong,S.Hashing基于欠采样集成的非平衡模式分类问题。 IEEE传输。 赛博。 2020 , 1–11. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] De Morais,R.F.A.B。; Vasconcelos,G.C.通过对少数类进行欠采样来提高过采样算法的性能。 神经计算 2019 , 343 , 3–18. [ 谷歌学者 ] [ 交叉参考 ] 巴蒂斯塔,G.E.A.P.A。; R.C.普拉蒂。; Monard,M.C.关于平衡机器学习训练数据的几种方法行为的研究。 ACM SIGKDD探索。 新闻。 2004 , 6 , 20–29. [ 谷歌学者 ] [ 交叉参考 ] 普鲁斯蒂,M.R。; Jayanthi,T。; Velusamy,K.Weighted-SMOTE:钠冷快堆事件分类SMOTE的修改。 掠夺。 编号。 能源 2017 , 100 , 355–364. [ 谷歌学者 ] [ 交叉参考 ] 杜扎斯,G。; 巴考,F。; 丰塞卡,J。; Khudinyan,M.《土地覆盖分类中的非平衡学习:使用几何SMOTE算法提高少数民族类的预测精度》。 远程传感器。 2019 , 11 , 3040. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Sun,J。; 朗·J。; 藤田,H。; Li,H.使用DTE-SBD进行不平衡企业信用评估:基于SMOTE和差异化采样率的装袋的决策树集成。 信息科学。 2018 , 425 , 76–91. [ 谷歌学者 ] [ 交叉参考 ] 埃尔特金,S。; 黄,J。; 博图,L。; Giles,C.L.《边界学习:不平衡数据分类中的主动学习》。 2007年11月6日至10日在葡萄牙里斯本举行的第十六届ACM信息与知识管理会议记录; 计算机协会:美国纽约州纽约市,2007年; 第127–136页。 [ 谷歌学者 ] 孙,Y。; 卡梅尔,M.S。; Wong,A.K.C。; Wang,Y.非平衡数据分类的成本敏感增强。 模式识别。 2007 , 40 , 3358–3378. [ 谷歌学者 ] [ 交叉参考 ] 他,H。; Garcia,E.A.从不平衡数据中学习。 IEEE传输。 知识。 数据工程。 2009 , 21 , 1263–1284. [ 谷歌学者 ] 丁·S。; 米尔扎,B。; 林,Z。; 曹,J。; Sepulveda,J.Kernel基于在线学习的不平衡多类分类。 神经计算 2017 , 277 , 139–148. [ 谷歌学者 ] [ 交叉参考 ] Yu,H。; 杨,X。; 郑S。; Sun,C.从不平衡数据中主动学习:在线加权极端学习机的解决方案。 IEEE传输。 神经网络。 学习。 系统。 2019 , 30 , 1088–1103. [ 谷歌学者 ] [ 交叉参考 ] 张,H。; 刘伟。; Shan,J。; Liu,Q.概念漂移和课堂失衡的在线主动学习配对合奏。 IEEE接入 2018 , 6 , 73815–73828. [ 谷歌学者 ] [ 交叉参考 ] Sun,T。; Jiao,L。; 冯,J。; 刘,F。; 张欣。基于最大边缘的非平衡高光谱图像分类。 IEEE地质科学。 遥感快报。 2015 , 12 , 522–526. [ 谷歌学者 ] [ 交叉参考 ] 冯·W。; 多芬·G。; 黄,W。; Quan,Y。; Bao,W。; 吴,M。; Li,Q.非平衡高光谱数据分类的基于动态合成少数民族过采样技术的旋转森林。 IEEE J.选择。 顶部。 申请。 地球目标遥感。 2019 , 12 , 2159–2169. [ 谷歌学者 ] [ 交叉参考 ] 瓦普尼克,V.N。 统计学习理论的本质 ; 施普林格:德国柏林/海德堡,2013年。 [ 谷歌学者 ] 贾普科维奇,N。; Stephen,S。阶级失衡问题:一项系统研究。 智力。 数据分析。 2002 , 6 , 429–449. [ 谷歌学者 ] [ 交叉参考 ] 阿卡巴尼(Akbani,R.)。; Kwek,S.S.公司。; 杰普科维奇,N。 支持向量机在非平衡数据集中的应用 ; 施普林格:柏林/海德堡,德国,2004年; 第39-50页。 [ 谷歌学者 ] Kang,P。; Cho,S.EUS SVM:用于数据不平衡问题的欠采样SVM的集合。 在 神经信息处理国际会议记录 ; 施普林格:德国柏林/海德堡,2006年; 第837-846页。 [ 谷歌学者 ] 齐,W。; 罗,Z.H。; 黄J.C。; Feng,Y.H。; Zhong,L.一种新的非平衡数据学习集成方法:外推打包-SMOTE SVM。 计算。 智力。 神经科学。 2017 , 2017 , 1827016. [ 谷歌学者 ] Ying,L。; Haokui,Z。; Qiang,S.Spectral–使用3D卷积神经网络对高光谱图像进行空间分类。 远程传感器。 2017 , 9 , 67. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 塞拉米,A。; 阿贝斯,A.B。; 巴拉,V。; Farah,I.R.融合了三维光谱空间深度神经网络和光谱聚类用于高光谱图像分类。 模式识别。 莱特。 2020 , 138 , 594–600. [ 谷歌学者 ] [ 交叉参考 ] 李,S。; Song,W。; 方,L。; 陈,Y。; 加米西,P。; Benediktsson,J.A.高光谱图像分类的深度学习:概述。 IEEE传输。 地质科学。 远程传感器。 2019 , 57 , 6690–6709. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 陈,Y。; Wang,Y。; 顾,Y。; 何,X。; 加米西,P。; Jia,X.高光谱图像分类深度学习集成。 IEEE J.选择。 顶部。 申请。 地球目标遥感。 2019 , 12 , 1882–1897. [ 谷歌学者 ] [ 交叉参考 ] 李,S。; Song,W。; 秦,H。; Hao,A.深度方差网络:针对不平衡训练数据集的迭代改进CNN框架。 模式识别。 J.模式识别。 Soc公司。 2018 , 81 , 294–308. [ 谷歌学者 ] [ 交叉参考 ] 布达,M。; Maki,A。; Mazurowski,M.A.卷积神经网络中类不平衡问题的系统研究。 神经网络。 Off.J.国际神经网络。 Soc公司。 2018 , 106 , 249–259. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] [ 绿色版本 ] 曹,X。; Wen,L。; Ge,Y。; 赵,J。; Jiao,L.基于旋转的深层森林高光谱图像分类。 IEEE地质科学。 遥感快报。 2019 , 16 , 1105–1109. [ 谷歌学者 ] [ 交叉参考 ] Breiman,L.Bagging预测。 机器。 学习。 1996 , 24 , 123–140. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Breiman,L.随机森林。 机器。 学习。 2001 , 45 , 5–32. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 罗德里格斯,J.J。; L.I.Kuncheva。; Alonso,C.J.旋转森林:一种新的分类器集合方法。 IEEE传输。 模式分析。 机器。 智力。 2006 , 28 , 1619–1630. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] 胡,W。; 黄,Y。; 李伟(Li,W.)。; 张,F。; Li,H.深卷积神经网络用于高光谱图像分类。 J.传感器。 2015 , 2015 , 1–12. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 费尔南德斯,A。; 洛佩兹,V。; 加拉尔,M。; 德尔·耶稣,M.J。; Herrera,F.用多类分析不平衡数据集的分类:二值化技术和特殊方法。 知识。 基于系统。 2013 , 42 , 97–110. [ 谷歌学者 ] [ 交叉参考 ] Sáez,J.A。; Krawczyk,B。; Woźniak,M.分析多类不平衡数据集中不同类别和类型示例的过采样。 模式识别。 2016 , 57 , 164–178. [ 谷歌学者 ] [ 交叉参考 ] Xu,X。; Chen,W。; Sun,Y.非平衡数据分类的过采样算法。 J.系统。 电子工程。 2019 , 30 , 1182–1191. [ 谷歌学者 ] [ 交叉参考 ] Yan,Y。; 刘,R。; 丁,Z。; 杜,X。; 陈,J。; Zhang,Y.非平衡分类中SMOTE的无参数清洗方法。 IEEE接入 2019 , 7 , 23537–23548. [ 谷歌学者 ] [ 交叉参考 ]