用SAT学习最优决策集和列表

主要文章内容

余金强
阿列克谢·伊格纳提耶夫
彼得·J·斯塔基
皮埃尔·勒·博迪奇

摘要

决策集和决策表是两种最容易解释的机器学习模型。鉴于对可解释机器学习决策的重新重视,这两种机器学习模型都变得越来越有吸引力,因为它们结合了小规模和清晰的可解释性。在本文中,我们将大小定义为这些基于规则的模型的SAT编码中的文字总数,而不是早期专注于规则数量的工作。在本文中,我们开发了一些方法来计算最小大小的“完美”决策集和决策列表,这些决策集和列表在训练数据上完全准确,并且利用现代SAT求解技术实现了最小大小。我们还提供了一种确定最优稀疏备选方案的新方法,该方法在大小和准确性之间进行了权衡。本文的实验表明,基于SAT的方法计算出的最优决策集与最佳启发式方法相当,但更简洁,因此更易于解释。我们对比了最优决策列表与最优决策集的大小和测试准确性,以及用于确定最优决策列表的其他最先进方法。最后,我们检查了由决策集和决策列表生成的平均解释的大小。

文章详细信息

章节
文章