×

GOSDT公司

swMATH ID: 44146
软件作者: Jimmy Lin、Chudi Zhong、Diane Hu、Cynthia Rudin、Margo Seltzer
描述: 广义和可伸缩的最优稀疏决策树。从计算的角度来看,决策树优化是众所周知的困难,但对于可解释机器学习领域来说却是至关重要的。尽管在过去40年中做出了努力,但直到最近才取得了优化突破,使得实用算法能够找到最优决策树。这些新技术有可能引发范式转换,在这种转换中,可以构建稀疏决策树来有效优化各种目标函数,而不需要依赖贪婪的分裂和修剪启发式,而这些启发式往往会导致次优解决方案。这项工作的贡献是为决策树优化提供了一个通用框架,该框架解决了该领域的两个重要开放问题:不平衡数据的处理和连续变量的完全优化。我们提出了在各种目标上生成最优决策树的技术,包括F-score、AUC和ROC凸包下的部分区域。我们还引入了一种可扩展的算法,该算法在存在连续变量的情况下产生可证明的最佳结果,并将决策树的构建速度提高了几个数量级(相对于现有技术)。
主页: https://arxiv.org/abs/2006.08690
源代码:  https://github.com/Jimmy-Lin/GeneralizedOptimalSparseDecisionTrees网站
依赖项: C类++
关键词: 机器学习;arXiv_cs。LG公司;arXiv_状态ML;决策树
相关软件: UCI-毫升;第4.5条;MurTree公司;PyDL8.5型;Scikit公司;形状;HHCART公司;XGBoost公司;空间ML;随机森林;克里奥;r零件;火焰;CMAR公司;ORL公司;AlexNet公司;ImageNet公司;阿达·布斯特。MH公司;HgMUS公司;勒图尔
引用于: 11文件

按年份列出的引文