重击

SMOTE:合成少数过采样技术。描述了一种从不平衡数据集构造分类器的方法。如果分类类别没有大致相等地表示,则数据集是不平衡的。通常,真实世界的数据集主要由“正常”示例组成,只有一小部分“异常”或“有趣”示例。同样的情况是,将异常(有趣的)示例错误分类为正常示例的成本通常远高于反向错误的成本。多数(正态)类的欠采样被认为是提高分类器对少数类敏感度的一种好方法。本文证明了我们对少数(异常)类进行过采样和对大多数(正常)类进行欠采样的方法相结合可以获得更好的分类器性能(在ROC空间)。本文还表明,在ROC空间中,对少数类进行过采样和对多数类进行欠采样的方法相结合,可以获得更好的分类器性能(在ROC空间中),而不是在naivebayes中改变Ripper或类优先级的损失率。我们过度抽样少数类的方法包括创建合成的少数类示例。实验使用C4.5、Ripper和naivebayes分类器进行。利用接收机工作特性曲线(AUC)下面积和ROC凸包策略对该方法进行了评估。


zbMATH中的参考文献(引用于 128篇文章,1标准件)

显示128个结果中的1到20个。
按年份排序(引用)

1 2 ... 5 6 7 下一个

  1. Abdallah,Zahraa S.;Gaber,Mohamed Medhat:Co-eye:符号近似时间序列的多分辨率集成分类器(2020)
  2. Chaabane,Ikram;Guermazi,Radhouane;Hammami,Mohamed:从不平衡数据学习决策树的增强技术(2020)
  3. Gubela,Robin M.;Lessmann,Stefan;Jaroszewicz,Szymon:收入提升模型的响应转换和利润分解(2020)
  4. Halbersberg,Dan;Wienreb,Maydan;Lerner,Boaz:用于学习贝叶斯网络分类器结构的准确性和信息的联合最大化(2020)
  5. Mahajan,Pravar Dilip;Maurya,Abhinav;Megahed,Aly;Elwany,Alaa;Strong,Ray;Blomberg,Jeanette:用于可操作收入变化预测的不平衡数据集的预测精度优化(2020年)
  6. Ruehle,Fabian:数据科学在弦理论中的应用(2020)
  7. 孙红伟;崔月华;高,倩;王,童:二元响应数据的修正套索回归估计(2020)
  8. 吴迪;张江江;耿绍金;蔡兴娟;张国友:软件缺陷预测的多目标bat算法(2020)
  9. 谢金汉;郝美玲;刘文新;林媛媛:海量不平衡数据的融合变量筛选(2020)
  10. Ahmad,Jamal;Hayat,Maqsood:MFSC:采用Chou's PseAAC成分的一般形式对高尔基蛋白进行分类的基于多投票的特征选择(2019年)
  11. 贾建华;李晓燕;邱,王仁;肖,宣;周,郭晨:iPPI PseAAC(CGR):通过将混沌博弈表示纳入PseAAC(2019年),识别蛋白质相互作用
  12. Kocheturov,Anton;Pardalos,Panos M.;Karakitsiou,Athanasia:计算生物医学的海量数据集和机器学习:趋势和挑战(2019)
  13. Lai,Chun Sing;Tao,Yingshan;Xu,Fangyuan;Ng,Wing W.Y.;Jia,Youwei;Yuan,Haoliang;Huang,Chao;Lai,Loi Lei;Xu,Zhao;Locatelli,Giorgio:具有不确定性的非平衡和二分法数据的稳健相关分析框架(2019年)
  14. Mouratidis,Despoina;Kermanidis,Katia Lida:语言无关的并行数据自动选择的集成和深度学习(2019)
  15. Park,Soyoung;Carriquiry,Alicia:评估法医玻璃证据的学习算法(2019年)
  16. Poterie,A.;Dupuy,J.-F.;Monbet,V.;Rouvière,L.:分组变量的分类树算法(2019年)
  17. Razzaghi,Talayeh;Safro,Ilya;Ewing,Joseph;Sadrfaridpour,Ehsan;Scott,John D.:具有不平衡医疗数据集的减肥手术风险预测模型(2019年)
  18. 谢文浩;梁功谦;董仲辉;谭宝玉;张宝生:基于样本选择策略的非均衡数据分类改进过采样算法(2019)
  19. 阎元廷;吴曾宝;杜秀全;陈杰;赵,舒;张燕萍:非平衡数据过采样的三向决策集成方法(2019)
  20. Zarei,Shaho;Mohammadpour,Adel:通过逻辑回归在高维分类中使用合成数据和降维(2019年)

1 2 ... 5 6 7 下一个