箔-D

FOIL-D:用于大型数据集的多关系数据挖掘的有效缩放FOIL。多关系规则挖掘对于关系数据库中的知识发现非常重要,因为它允许发现涉及多个关系表的模式。归纳逻辑程序设计(ILP)技术已经在多种多关系规则挖掘任务中取得了相当大的成功,但是大多数ILP系统并不能扩展到非常大的数据集。在本文中,我们提出了两个对流行的ILP系统FOIL的扩展,以提高其可伸缩性。(i) 我们展示了如何将FOIL直接连接到关系数据库管理系统。这使得FOIL能够在先前超出其范围的数据集上运行。(ii)我们描述了基于直方图的估计方法,这些方法显著降低了学习一组规则的计算成本。我们给出的实验结果表明,在一组标准ILP数据集上,使用我们的扩展学习的规则集与使用标准箔学习的规则集是等价的,但是成本要低得多。