GOSDT公司 swMATH ID: 44146 软件作者: Jimmy Lin、Chudi Zhong、Diane Hu、Cynthia Rudin、Margo Seltzer 描述: 广义和可伸缩的最优稀疏决策树。从计算的角度来看,决策树优化是众所周知的困难,但对于可解释机器学习领域来说却是至关重要的。尽管在过去40年中做出了努力,但直到最近才取得了优化突破,使得实用算法能够找到最优决策树。这些新技术有可能引发范式转换,在这种转换中,可以构建稀疏决策树来有效优化各种目标函数,而不需要依赖贪婪的分裂和修剪启发式,而这些启发式往往会导致次优解决方案。这项工作的贡献是为决策树优化提供了一个通用框架,该框架解决了该领域的两个重要开放问题:不平衡数据的处理和连续变量的完全优化。我们提出了在各种目标上生成最优决策树的技术,包括F-score、AUC和ROC凸包下的部分区域。我们还引入了一种可扩展的算法,该算法在存在连续变量的情况下产生可证明的最佳结果,并将决策树的构建速度提高了几个数量级(相对于现有技术)。 主页: https://arxiv.org/abs/2006.08690 源代码: https://github.com/Jimmy-Lin/GeneralizedOptimalSparseDecisionTrees网站 依赖项: C类++ 关键词: 机器学习;arXiv_cs。LG公司;arXiv_状态ML;决策树 相关软件: UCI-毫升;4.5条;MurTree公司;PyDL8.5型;Scikit公司;形状;HHCART公司;XGBoost公司;空间ML;随机森林;中央情报局;r零件;火焰;CMAR公司;ORL公司;AlexNet公司;ImageNet公司;阿达·布斯特。MH公司;HgMUS公司;勒图尔 引用于: 11文件 全部的 前5名33位作者引用 2 埃米利奥·卡里佐萨 2 克里斯蒂娜·莫勒罗·里奥 2 多洛雷斯罗梅罗·莫拉莱斯 2 辛西娅·鲁丁 1 拉斐尔·布兰科罗 1 贾斯汀·J·布蒂利尔(Justin J.Boutiler)。 1 杰弗里·陈 1 陈超凡 1 陈志 1 埃米尔·德米罗维奇 1 费德里科·多诺弗里奥 1 大卫·布莱恩·邓森 1 乔治·格拉尼 1 埃曼纽尔·希伯拉德 1 黄,哈扬 1 阿列克谢·伊格纳提耶夫(Alexey A.Ignatyev)。 1 亚辛·伊扎 1 克里斯托弗·莱基 1 李,程 1 刘燕超 1 安娜·卢基纳 1 Joáo P.塞尔瓦侯爵。 1 卡拉·米奇尼 1 玛尔塔·莫纳奇 1 琳达·奈斯 1 劳拉·帕拉吉 1 Kotagiri拉马莫哈纳劳 1 莱西亚·塞梅诺娃 1 彼得·詹姆斯·斯塔基 1 王彤 1 钟楚迪 1 Zhou,Zachary(扎卡里·周) 1 朱一成 全部的 前5名7篇连载文章中引用 2 计算机与运筹学 2 INFORMS计算机杂志 1 美国统计协会杂志 1 顶部 1 人工智能研究杂志 1 机器学习研究杂志(JMLR) 1 统计调查 在4个字段中引用 6 运筹学、数学规划(90-XX) 5 计算机科学(68-XX) 三 统计学(62-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文