×

比较了33种新旧分类算法的预测精度、复杂度和训练时间。 (英语) Zbl 0969.68669号

摘要:在32个数据集上比较了22个决策树、9个统计算法和2个神经网络算法的分类精度、训练时间和(在树的情况下)叶子数。分类精度由平均错误率和错误率的平均秩来衡量。这两个标准都将一个基于样条线的统计算法POLYCLASS放在首位,尽管它与其他二十个算法在统计上没有显著差异。另一种统计算法,逻辑回归,在这两个精度标准方面排名第二。最准确的决策树算法是带线性分割的QUEST算法,分别排名第四和第五。虽然基于脾的统计算法往往具有良好的准确性,但它们也需要相对较长的训练时间。例如,POLYCLASS在训练时间中位数方面排名倒数第三。与其他算法的秒数相比,它通常需要数小时的训练。QUEST和logistic回归算法的速度要快得多。在具有单变量分裂的决策树算法中,C4.5、IND-CART和QU-FST具有最佳的错误率和速度组合。但是C4.5生产的树的叶子数量往往是IND-CART和QUEST的两倍。

MSC公司:

68单位99 计算方法和应用
68T05型 人工智能中的学习和自适应系统

软件:

4.5条;R(右)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序