重击

SMOTE:合成少数过采样技术。描述了一种构造不平衡数据集的方法。如果分类近似不平衡,则分类不相等。通常,真实世界的数据集主要由“正常”示例组成,只有一小部分“异常”或“有趣”示例。同样的情况是,将异常(有趣的)示例错误分类为正常示例的成本通常远高于反向错误的成本。多数(正态)类的欠采样被认为是提高分类器对少数类敏感度的一种好方法。本文证明了我们对少数(异常)类进行过采样和对大多数(正常)类进行欠采样的方法相结合可以获得更好的分类器性能(在ROC空间)。文中所提出的基于bayper或loss比的bayper类抽样方法,也能在类中取得比多数抽样率更好的性能。我们过度抽样少数类的方法包括创建合成的少数类示例。实验使用C4.5、Ripper和naivebayes分类器进行。利用接收机工作特性曲线(AUC)下面积和ROC凸包策略对该方法进行了评估。


zbMATH中的参考文献(参考 123篇文章 123篇,1标准件)

显示123个结果中的1到20个。
按年份排序(引用)

1 2 ... 5 6 7 下一个

  1. Gubela,Robin M.;Lessmann,Stefan;Jaroszewicz,Szymon:收入提升模型的响应转换和利润分解(2020)
  2. Halbersberg,Dan;Wienreb,Maydan;Lerner,Boaz:用于学习贝叶斯网络分类器结构的准确性和信息的联合最大化(2020)
  3. Mahajan,Pravar Dilip;Maurya,Abhinav;Megahed,Aly;Elwany,Alaa;Strong,Ray;Blomberg,Jeanette:用于可操作收入变化预测的不平衡数据集的预测精度优化(2020年)
  4. Ruehle,Fabian:数据科学在弦理论中的应用(2020)
  5. 孙红伟;崔月华;高,倩;王,童:二元响应数据的修正套索回归估计(2020)
  6. 吴迪;张江江;耿绍金;蔡兴娟;张国友:软件缺陷预测的多目标bat算法(2020)
  7. 谢金汉;郝美玲;刘文新;林媛媛:海量不平衡数据的融合变量筛选(2020)
  8. Ahmad,Jamal;Hayat,Maqsood:MFSC:采用Chou's PseAAC成分的一般形式对高尔基蛋白进行分类的基于多投票的特征选择(2019年)
  9. 贾建华;李晓燕;邱,王仁;肖,宣;周,郭晨:iPPI PseAAC(CGR):通过将混沌博弈表示纳入PseAAC(2019年),识别蛋白质相互作用
  10. Kocheturov,Anton;Pardalos,Panos M.;Karakitsiou,Athanasia:计算生物医学的海量数据集和机器学习:趋势和挑战(2019)
  11. Lai,Chun Sing;Tao,Yingshan;Xu,Fangyuan;Ng,Wing W.Y.;Jia,Youwei;Yuan,Haoliang;Huang,Chao;Lai,Loi Lei;Xu,Zhao;Locatelli,Giorgio:具有不确定性的非平衡和二分法数据的稳健相关分析框架(2019年)
  12. Mouratidis,Despoina;Kermanidis,Katia Lida:语言无关的并行数据自动选择的集成和深度学习(2019)
  13. Park,Soyoung;Carriquiry,Alicia:评估法医玻璃证据的学习算法(2019年)
  14. Poterie,A.;Dupuy,J.-F.;Monbet,V.;Rouvière,L.:分组变量的分类树算法(2019年)
  15. Joseph Sabileya,San-Barialya,2019年《外科学预测》;Joseph Sabileya,2019;医学预测模型
  16. 谢文浩;梁功谦;董仲辉;谭宝玉;张宝生:基于样本选择策略的非均衡数据分类改进过采样算法(2019)
  17. 阎元廷;吴曾宝;杜秀全;陈杰;赵,舒;张燕萍:非平衡数据过采样的三向决策集成方法(2019)
  18. Zarei,Shaho;Mohammadpour,Adel:通过逻辑回归在高维分类中使用合成数据和降维(2019年)
  19. 张学英;李瑞贤;张波;杨云翔;郭晶晶;季翔:基于实例的不平衡处理方法学习推荐算法(2019)
  20. Bellinger,Colin;Drummond,Christopher;Japkowicz,Nathalie:基于流形的合成过采样与流形一致性估计(2018)

1 2 ... 5 6 7 下一个