×

在归纳逻辑编程中提取上下文敏感模型。 (英语) Zbl 0986.68011号

摘要:给定特定领域的背景知识和示例形式的数据,归纳逻辑编程(ILP)系统从数据分析的意义上提取模型。我们将ILP系统面临的模型选择步骤视为一个决策问题,其解决方案需要了解模型部署的上下文。在本文中,“上下文”将由先前类分布的当前规范和客户对分类错误的偏好来定义。在这种受限的环境中,我们考虑在以下情况下使用ILP系统:(a)上下文可以定期更改。例如,这可能是由于类别分布或错误分类成本的变化引起的;(b)数据来自观察性研究。也就是说,他们可能没有考虑到任何特定的背景。这些影响包括:(a)任何一种模式都可能不是所有环境的最佳选择;和(b)并非所有提供的背景信息都与所有上下文相关。利用接收机工作特性曲线分析的结果,我们研究了一种技术,该技术可以装备ILP系统来拒绝在任何情况下都不可能最优的模型。我们提供了使用该技术分析两个与化学品毒性(尤其是其诱变和致癌特性)有关的数据集的经验结果。客户可以而且通常会以完全不同的要求处理此类数据集。例如,合成化学家需要具有低佣金错误率的模型,该模型可用于有效指导新化合物的合成。另一方面,毒理学家更喜欢遗漏错误率低的模型。这将能够以误认为无毒案例为有毒的计算成本,更全面地识别有毒化学品。这里采用的方法试图获得一个解决方案,该解决方案包含根据每个用户希望应用的成本函数对其进行优化的模型。在这样做的同时,它还为如何在ILP中评估背景谓词的相关性问题提供了一个解决方案。

MSC公司:

68N17号 逻辑编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部