×

ROC“n”规则学习–更好地理解覆盖算法。 (英语) Zbl 1075.68071号

摘要:本文通过在覆盖空间(ROC空间的一种变体)中可视化其评估指标及其动态,分析了分离与查询或覆盖规则学习算法的行为。我们的结果表明,最常用的指标,包括准确度、加权相对准确度、熵和基尼指数,等同于两个基本原型中的一个:准确度,它试图优化ROC曲线下未知成本的面积,以及覆盖的正反例之间的成本加权差异,它试图在已知或假设成本下找到最优点。我们还表明,(m)-估计的简单推广权衡了这两个原型。此外,我们的结果表明,像CN2的显著性检验这样的停止和过滤标准侧重于识别随机分类的显著偏差,这不一定能避免过拟合。我们还发现了Foil的基于MDL的编码长度限制的问题,该限制在很大程度上等同于规则调用的可变阈值。一般来说,我们将这些结果解释为证据,表明与一般概念相反,预修剪启发式并没有得到很好的理解,值得进一步研究。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68周05 非数值算法

关键词:

学习算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部