SMOTE公司 swMATH ID: 34239 软件作者: N.V.Chawla、K.W.Bowyer、L.O.Hall、W.P.Kegelmeyer 描述: SMOTE:合成少数过采样技术。描述了一种从不平衡数据集构造分类器的方法。如果分类类别没有大致相等地表示,则数据集是不平衡的。通常,现实世界的数据集主要由“正常”示例组成,只有很小比例的“异常”或“有趣”示例。同样,将异常(有趣的)示例误分类为正常示例的成本通常远高于反向错误的成本。多数(正常)类的欠采样被认为是提高分类器对少数类敏感性的一种好方法。本文表明,与只对多数类进行欠采样相比,我们对少数(异常)类进行过采样和对多数(正常)类进行欠抽样的方法可以获得更好的分类器性能(在ROC空间中)。本文还表明,与在Ripper或Naive Bayes的类先验中改变损失率相比,我们对少数类进行过采样和对多数类进行欠采样的组合方法可以获得更好的分类器性能(在ROC空间)。我们对少数群体进行过抽样的方法包括创建合成的少数群体示例。使用C4.5、Ripper和Naive Bayes分类器进行了实验。该方法使用接收机工作特性曲线(AUC)下的面积和ROC凸包策略进行评估。 主页: https://arxiv.org/abs/1106.1813 相关软件: UCI-毫升;第4.5条;SMOTEBoost公司;阿达欣;JStatCom公司;伦敦银行支持向量机;MWMOTE公司;KEEL公司;XGBoost公司;Scikit公司;阿达·布斯特。MH公司;阿达成本;对;不平衡学习;ElemStatLearn(电子状态学习);LIBLINEAR银行;威卡;亚当;随机森林;开放多媒体程序库 引用于: 150文件 标准条款 1出版物描述软件,包括1出版物以zbMATH为单位 年份 SMOTE:合成少数过采样技术。 Zbl 0994.68128号新泽西州查拉。;鲍耶,K.W。;洛杉矶霍尔。;Kegelmeyer,W.P。 2002 全部的 前5名468位作者引用 三 科林·贝林格 三 弗朗西斯科·埃雷拉 三 W.Philip Kegelmeyer 2 罗德·亚当斯 2 凯文·鲍耶(Kevin W.Bowyer)。 2 尼提什·查拉。 2 周国成 2 尼尔·戴维 2 Jochen De Weerdt 2 朱利安·多拉多 2 Zied Elouedi 2 卡洛斯·费尔南德斯·洛萨诺 2 阿尔贝托·费尔南德斯 2 克里斯蒂娜·冈萨雷斯·卡斯特拉诺 2 Grina,Fares公司 2 劳伦斯·O·霍尔。 2 Micha Koziarski 2 埃里克·列夫雷 2 斯特凡·莱斯曼 2 穆萨·马马多夫(Musa A.Mammadov)。 2 克里斯蒂安·罗伯特·蒙泰努 2 雅赞·F·鲁马尼。 2 孙毅 2 Tilakaratne,C.D.公司。 2 德克·范登·波尔 2 米查尔·沃兹尼亚克 2 肖轩 2 马西耶·齐巴 1 扎哈拉·阿卜杜拉。 1 哈马德·阿夫扎尔 1 贾马尔·艾哈迈德 1 梅伦·艾哈迈德 1 阿卡林,阿尔图纳 1 阿卜杜拉·阿尔比兹里 1 埃桑阿米尼亚语 1 阿南塔库马尔,乌沙 1 劳拉·安德鲁奇 1 塞西利奥·安古洛 1 菲利波·安东纳佐 1 阿什坎,艾什盖尔 1 Astudillo Estévez,巴勃罗 1 瓦西里欧斯·阿萨纳西奥 1 白、香 1 米歇尔·鲍林斯 1 潘涛 1 罗伯特·E·班菲尔德。 1 维克多·巴雷拉。 1 克莉丝汀·巴内特。 1 伊恩·巴内特。 1 萨普塔什·贝吉 1 亚尼夫·本·伊扎克 1 阿莱西奥·贝尔纳多 1 巴塔查里亚,Sourangshu 1 克里斯托夫·比尔纳基 1 洛克·布拉格斯 1 珍妮特·布隆伯格 1 约瑟夫·博多夫斯基 1 马提亚斯·博加特 1 菲利普·博尔切特 1 保拉·布兰科 1 克里斯蒂安·布拉沃 1 亚历山大·布林特鲁普 1 约翰·布朗斯坦(John S.Brownstein)。 1 沃特·巴金克斯 1 维多拉斯·布拉瓦斯 1 曹晶晶 1 曹亚南 1 曹毅 1 杰米·卡博内尔(Jaime G.Carbonell)。 1 Alicia L.Carriquiry。 1 卡瓦略,马特乌斯·阿劳霍 1 克里斯蒂亚诺·莱特·德·卡斯特罗 1 维托·塞奎拉 1 伊克拉姆·恰巴内 1 北卡罗来纳州Chandrasekara。 1 Chang、Liang 1 拉马切拉普帕 1 陈白云 1 陈德刚 1 陈刚 1 陈嘉秀 1 陈杰 1 陈彦成 1 陈志 1 陈子忠 1 程,范 1 程翔 1 池光清 1 Wiesław Chmielnicki 1 Chong,Wing Fung(永丰) 1 Sy-Minin周 1 福莱钟 1 David A.Cieslak。 1 艾米丽·科恩。 1 托马斯·科尔曼。 1 Yandre M.G.科斯塔。 1 克里斯托夫·库塞门特 1 斯文·克罗恩(Sven F.Crone)。 1 马克·库克莱利 1 崔、温泉 …还有368位作者 全部的 前5名59篇连载文章中引用 13 数据挖掘与知识发现 12 信息科学 12 机器学习 10 运筹学年鉴 9 欧洲运筹学杂志 7 模式识别 6 国际近似推理杂志 6 理论生物学杂志 4 神经网络 4 计算统计与数据分析 4 应用统计学年鉴 三 计算机与运筹学 三 工程中的数学问题 2 应用数学与计算 2 应用统计学杂志 2 国际应用数学与计算机科学杂志 2 数据分析和分类进展。ADAC公司 2 算法 1 物理报告 1 心理测量学 1 美国统计协会杂志 1 运筹学 1 保险数学与经济学 1 统计学和概率论字母 1 分类杂志 1 经济动力学与控制杂志 1 数学和计算机建模 1 科学计算杂志 1 计算统计学 1 统计传播。模拟和计算 1 统计计算与模拟杂志 1 计算与决策科学基础 1 数学成像与视觉杂志 1 国际计算机视觉杂志 1 人工智能研究杂志 1 复杂性 1 摘要与应用分析 1 应用数学与决策科学杂志 1 苯乙酸。模式分析与应用 1 Informatica(维尔纽斯) 1 斯堪的纳维亚精算杂志 1 非线性分析。真实世界应用程序 1 统计学的进展与应用 1 系统科学与复杂性杂志 1 遗传学和分子生物学中的统计应用 1 工业与管理优化杂志 1 医学中的计算和数学方法 1 统计分析与数据挖掘 1 电子统计杂志 1 数学物理进展 1 农业、生物和环境统计杂志 1 国际工程科学与应用数学进展杂志 1 统计与计算 1 计算机科学前沿 1 数学与统计传播 1 微分方程的计算方法 1 数据科学与自适应分析进展 1 SN运营研究论坛 1 查普曼和霍尔/CRC计算生物学系列 全部的 前5名11个领域引用 91 计算机科学(68至XX) 87 统计学(62-XX) 18 运筹学、数学规划(90-XX) 16 生物学和其他自然科学(92-XX) 14 博弈论、经济学、金融和其他社会和行为科学(91-XX) 2 数值分析(65-XX) 1 数学逻辑和基础(03-XX) 1 代数拓扑(55-XX) 1 粒子和系统力学(70-XX) 1 量子理论(81-XX) 1 系统论;控制(93至XX) 按年份列出的引文