×

GOSDT公司

swMATH ID: 44146
软件作者: Jimmy Lin、Chudi Zhong、Diane Hu、Cynthia Rudin、Margo Seltzer
描述: 广义和可伸缩的最优稀疏决策树。从计算的角度来看,决策树优化是众所周知的困难,但对于可解释机器学习领域来说却是至关重要的。尽管在过去40年中做出了努力,但直到最近才取得了优化突破,使得实用算法能够找到最优决策树。这些新技术有可能引发范式转换,在这种转换中,可以构建稀疏决策树来有效优化各种目标函数,而不需要依赖贪婪的分裂和修剪启发式,而这些启发式往往会导致次优解决方案。这项工作的贡献是为决策树优化提供了一个通用框架,该框架解决了该领域的两个重要开放问题:不平衡数据的处理和连续变量的完全优化。我们提出了在各种目标上生成最优决策树的技术,包括F-score、AUC和ROC凸包下的部分区域。我们还引入了一种可扩展的算法,该算法在存在连续变量的情况下产生可证明的最佳结果,并将决策树的构建速度提高了几个数量级(相对于现有技术)。
主页: https://arxiv.org/abs/2006.08690
源代码:  https://github.com/Jimmy-Lin/GeneralizedOptimalSparseDecisionTrees网站
依赖项: C类++
关键词: 机器学习;arXiv_cs.LG公司;arXiv_状态ML;决策树
相关软件: MurTree公司;UCI-毫升;r零件;PyDL8.5型;火焰;CMAR公司;ORL公司;AlexNet公司;ImageNet公司;4.5条;AdaBoost.MH公司;R(右);C50元;OSDT公司;bsnsing公司;聚会;古罗比;随机森林;匹配;FP-增长
引用于: 6出版物

3篇连载文章中引用

2 信息计算杂志
1 顶部
1 统计调查

按年份列出的引文