SMOTEBoost公司 swMATH ID: 12571 软件作者: 巴尔南·达斯;Nitesh V.Chawla、Aleksandar Lazarevic、Lawrence O.Hall、Kevin W.Bowyer 描述: 此代码实现SMOTEBoost。SMOTEBoost是一种处理具有离散类标签的数据中的类不平衡问题的算法。它结合了SMOTE和标准助推程序AdaBoost,不仅为学习者提供了在前一次助推迭代中被错误分类的少数类示例,而且还提供了这些实例的更广泛表示(由SMOTE实现),从而更好地为少数类建模。由于boosting算法对所有错误分类的示例和主要由多数类组成的数据池中的样本赋予同等的权重,因此训练集的后续采样仍偏向于多数类。因此,为了减少由于阶级不平衡导致的学习过程中固有的偏见,并增加少数阶级的抽样权重,在每一轮助推中都引入了SMOTE。SMOTE的引入增加了学习者的少数民族班样本数量,并在每个助学轮的分布中关注这些案例。除了最大化倾斜类数据集的边距外,此过程还增加了集成中分类器之间的多样性,因为在每次迭代时都会生成不同的合成样本集。有关算法理论描述的更多详细信息,请参阅以下论文:N.V.Chawla,A.Lazarevic,L.O.Hall,K.Bowyer,“SMOTEBoost:Improving Prediction of Minority Class in Boosting,Journal of Knowledge Discovery in Databases:PKDD,2003。出于研究目的,作者独立完成了SMOTEBoost的当前实现。为了使用户能够使用大量不同的弱学习者进行助推,使用Weka API创建了一个接口。目前,四种Weka算法可以用作弱学习者:J48、SMO、IBk、Logistic 主页: http://www.mathworks.com/matlabcentral/fileexchange/37311-smoteboost 依赖项: Matlab公司 相关软件: SMOTE公司;UCI-毫升;阿达成本;JStatCom公司;MWMOTE公司;阿达欣;KEEL公司;阿达·布斯特。MH公司;Scikit公司;不平衡学习;4.5条;R(右);RUSBoost公司;威卡;玫瑰色;XGBoost公司;LIBLINEAR银行;伦敦银行支持向量机;ebmc公司;令人窒息地 引用于: 34文件 全部的 前5名107位作者引用 2 科林·贝林格 2 卡博尼尔,詹姆·G。 2 何景瑞 2 Micha Koziarski 2 米查尔·沃兹尼亚克 1 白、香 1 路易斯·鲍梅拉 1 萨普塔什·贝吉 1 保拉·布兰科 1 安德烈亚斯·布亚 1 曹晨杰 1 曹亚南 1 维托·塞尔奎拉 1 伊克拉姆·恰巴内 1 Chang、Liang 1 陈志 1 纳雷克·达夫蒂安 1 董中辉 1 杜文丽 1 段,江 1 Zied Elouedi 1 范、朱 1 安东尼奥·费尔南德斯·巴尔德拉 1 傅燕 1 龚俊浩 1 Grina,票价 1 拉德胡安·盖尔马齐 1 郭宏宇 1 郭靖 1 郭、李 1 郭文杰 1 穆罕默德·哈马米 1 何青 1 徐国伟 1 季、香 1 季、宣 1 穆罕默德·卡梅尔。 1 李康 1 Kim、Hyunjoong 1 苏珊·科克纳·特泽尔 1 Latecki,Longin Jan公司 1 托马斯·劳尔。 1 亚历山大·拉扎雷维奇 1 Lee,Yue-Shi先生 1 埃里克·列夫雷 1 李东东 1 李刚 1 李俊楠 1 李、钱 1 李清 1 李秋杰 1 李瑞贤 1 梁公谦 1 刘、苗 1 刘锐 1 陆晓玲 1 马雷克·卢比茨 1 卡尔·D·马杰斯(Karl D.Majeske)。 1 毛耀斌 1 大卫·马滕斯 1 大卫·米斯 1 玛丽亚姆·纳赛尔 1 牛文佳 1 彭世革 1 乔治·彼得里德斯 1 邱国平 1 任,赵 1 宋杰 1 贾迪埃普·斯利瓦斯塔瓦 1 孙东楚 1 孙燕民 1 杰西·斯威特克 1 谭宝玉 1 谭建龙 1 陶新民 1 杰贝德·托马尔。 1 桐、杭杭 1 路易斯·托戈 1 杰利斯·范霍伊维尔德 1 韦贝克,沃特 1 海娜·L·维克托。 1 王大鹏 1 王文阳 1 王,杨 1 威廉·J·韦尔奇。 1 马库斯·沃尔菲恩 1 奥拉夫·沃尔肯豪尔 1 黄国强。 1 吴全旺 1 吴锡之 1 吴越 1 亚伯拉罕·怀纳。 1 谢文浩 1 杨树珍 1 杨兴伟 1 杨云翔 1 甄子丹,秀-简 1 鲁本·扎马(Ruben H.Zamar)。 1 张宝胜 1 张波 …还有7位作者 全部的 前5名21篇连载文章中引用 6 信息科学 三 机器学习 2 模式识别 2 数据挖掘与知识发现 2 计算机科学前沿 1 应用数学与计算 1 计算机与运筹学 1 国际近似推理杂志 1 神经网络 1 统计传播。模拟和计算 1 统计计算与模拟杂志 1 计算统计与数据分析 1 数学成像与视觉杂志 1 工程中的数学问题 1 摘要与应用分析 1 苯乙酸。模式分析与应用 1 国际应用数学与计算机科学杂志 1 机器学习研究杂志(JMLR) 1 数据分析和分类进展。ADAC公司 1 统计分析与数据挖掘 1 国际信息技术与决策杂志 全部的 前5名在7个字段中引用 29 计算机科学(68-XX) 18 统计学(62-XX) 三 运筹学、数学规划(90-XX) 1 数值分析(65-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 生物学和其他自然科学(92-XX) 1 系统理论;控制(93至XX) 按年份列出的引文