×

从二进制数据中查找基本属性。 (英语) Zbl 1038.68092号

摘要:我们考虑由\(n \)维二元向量组成的数据集,这些向量表示某些(可能未知)现象的正负示例。如果只使用\(S\)中的属性就可以区分正示例和负示例,则此类数据集的属性(或变量)的子集\(S\)称为支持集。本文研究了在知识发现、数据挖掘、学习理论、数据逻辑分析等各个领域中经常出现的小支持集的发现问题。我们研究了随机生成数据中支持集的分布,并讨论了为什么寻找小支持集很重要。我们提出了几种分离度量(属性子集上的实值集函数),建立了优化模型以找到最大化这些度量的最小子集,并设计了有效的启发式算法来解决这些(通常是NP-hard)优化问题。我们证明了所提出的几种启发式算法具有保证恒定的近似比,并且我们报告了将这些启发式算法与随机生成的和真实世界数据集上的一些文献中的其他启发式算法进行比较的计算经验。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68T99型 人工智能

软件:

AMPL公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部