GOSDT公司 swMATH ID: 44146 软件作者: Jimmy Lin、Chudi Zhong、Diane Hu、Cynthia Rudin、Margo Seltzer 描述: 广义和可伸缩的最优稀疏决策树。从计算的角度来看,决策树优化是众所周知的困难,但对于可解释机器学习领域来说却是至关重要的。尽管在过去40年中做出了努力,但直到最近才取得了优化突破,使得实用算法能够找到最优决策树。这些新技术有可能引发范式转换,在这种转换中,可以构建稀疏决策树来有效优化各种目标函数,而不需要依赖贪婪的分裂和修剪启发式,而这些启发式往往会导致次优解决方案。这项工作的贡献是为决策树优化提供了一个通用框架,该框架解决了该领域的两个重要开放问题:不平衡数据的处理和连续变量的完全优化。我们提出了在各种目标上生成最优决策树的技术,包括F-score、AUC和ROC凸包下的部分区域。我们还引入了一种可扩展的算法,该算法在存在连续变量的情况下产生可证明的最佳结果,并将决策树的构建速度提高了几个数量级(相对于现有技术)。 主页: https://arxiv.org/abs/2006.08690 源代码: https://github.com/Jimmy-Lin/GeneralizedOptimalSparseDecisionTrees网站 依赖项: C类++ 关键词: 机器学习;arXiv_cs.LG公司;arXiv_状态ML;决策树 相关软件: MurTree公司;UCI-毫升;r零件;PyDL8.5型;火焰;CMAR公司;ORL公司;AlexNet公司;ImageNet公司;4.5条;AdaBoost.MH公司;R(右);C50元;OSDT公司;bsnsing公司;聚会;古罗比;随机森林;匹配;FP-增长 引用于: 6出版物 全部的 前5名15位作者引用 2 辛西娅·鲁丁 1 贾斯汀·J·布蒂利尔(Justin J.Boutiler)。 1 埃米利奥·卡里佐萨 1 陈超凡 1 陈志 1 黄海阳 1 刘燕超 1 卡拉·米奇尼 1 克里斯蒂娜·莫勒罗·里奥 1 琳达·奈斯 1 多洛雷斯罗梅罗·莫拉莱斯 1 莱西亚·塞梅诺娃 1 王彤 1 钟楚迪 1 Zhou,Zachary(扎卡里·周) 3篇连载文章中引用 2 信息计算杂志 1 顶部 1 统计调查 在4个字段中引用 4 运筹学、数学规划(90-XX) 三 计算机科学(68至XX) 2 统计学(62-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文