×

用于\(\mathrm{A}^*\)在概率分类器链中进行推理的一组可容许启发式算法。 (英语) Zbl 1412.68189号

摘要:概率分类器链最近对多标签分类产生了兴趣,因为它们能够优化估计一组标签的联合概率。主要障碍是在预测阶段执行推理的计算成本过高。这个陷阱为提出有效的推理替代方案打开了大门,避免探索所有可能的解决方案。近似算法、波束搜索和蒙特卡罗采样都是合适的技术,但理论上只有(ε=0)近似算法才能保证在子集0/1损失方面达到最优解。本文提供了另一种基于启发式搜索的替代方案,以保持这种最优性。它包括应用(mathrm{A}^*)算法,该算法提供了一种可接受的启发式,能够探索比(epsilon=0)近似算法更少的节点。一项初步研究已经达到了这一目标,但代价是高昂的评估启发式的计算时间,仅适用于线性模型。在本文中,我们提出了一系列由一个参数定义的启发式算法,该参数控制探索的节点数和计算启发式算法的成本之间的权衡。此外,一定的参数值提供了一种也适用于非线性情况的方法。在几个基准数据集上报告的实验表明,对于不同的参数值,探索的节点数保持相当稳定,尽管对于高值,时间会显著增加。因此,该参数的低值给出了启发式算法,理论上保证探索的节点数少于(epsilon=0)近似算法的节点数,并显示出竞争性的计算时间。最后,结果表明,在复杂情况下,如存在噪声时,使用这些启发式的(mathrm{A}^*)算法表现出良好的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)

软件:

ML-KNN公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Brier,G.W.(1950)。验证以概率表示的预测。《月度天气回顾》,78(1),1-3·doi:10.1175/1520-0493(1950)078<0001:VOFEIT>2.0.CO;2
[2] Cheng,W.和Hüllermier,E.(2009)。结合基于实例的学习和逻辑回归进行多标签分类。机器学习,76(2-3),211-225·Zbl 1470.68091号 ·doi:10.1007/s10994-009-5127-5
[3] Dembczyñski,K.、Cheng,W.和Hüllermier,E.(2010年)。基于概率分类器链的贝叶斯最优多标签分类。ICML,2010年,279-286。
[4] Dembczyñski,K.、Waegeman,W.、Cheng,W.和Hüllermier,E.(2012年)。多标签分类中的标签依赖和损失最小化。机器学习,88(1-2),5-45·Zbl 1243.68237号 ·doi:10.1007/s10994-012-5285-8
[5] Dembczynski,K。;Waegeman,W。;赫勒迈耶,E。;Raedt,LD(编辑);Bessire,C.(编辑);Dubois,D.(编辑);Doherty,P.(编辑);Frasconi,P.(编辑);Heintz,F.(编辑);Lucas,PJF(编辑),多标签分类中的连锁分析,编号242294-299(2012),阿姆斯特丹·Zbl 1327.68189号
[6] Elisseeff,A.和Weston,J.(2005)。一种多标记分类的核方法。摘自:ACM信息检索研究与开发会议(第274-281页)。
[7] Hart,P.E.、Nilsson,N.J.和Raphael,B.(1968年)。启发式确定最小成本路径的形式基础。IEEE系统科学与控制论汇刊,4(2),100-107·doi:10.1109/TSSC.1968.300136
[8] Kumar,A.、Vembu,S.、Menon,A.K.和Elkan,C.(2012年)。基于波束搜索的概率分类器链学习和推理。ECML/PKDD,2012年,665-680。
[9] Kumar,A.、Vembu,S.、Menon,A.K.和Elkan,C.(2013)。多标签学习的波束搜索算法。机器学习,92(1),65-89·Zbl 1273.68301号 ·doi:10.1007/s10994-013-5371-6
[10] Lin,C.J.、Weng,R.C.和Keerthi,S.S.(2008)。逻辑回归的信赖域牛顿法。机器学习研究杂志,9(4月),627-650·Zbl 1225.68195号
[11] McCallum,A.K.(1999)。使用EM训练的混合模型进行多标签文本分类。In:AAAI 99文本学习研讨会。
[12] Mena,D.、Montañés,E.、Quevedo,J.R.和del Coz,J.J.(2015)。概率分类器链中用于多标签分类的推理方法概述。技术报告:西班牙奥维耶多大学Gijón Viesques校区人工智能中心。
[13] Mena,D.、Montañés,E.、Quevedo,J.R.和del Coz,J.J.(2015)。在概率分类器链中使用*进行推理。在:IJCAI 2015,第20届人工智能国际联合会议记录(第3707-3713页),阿根廷布宜诺斯艾利斯,7月25日至31日。
[14] Montañes,E.、Quevedo,J.R.和del Coz,J.J.(2011)。聚合独立和依赖模型以学习多标签分类器。摘自:ECML/PKDD’11卷第二部分(第484-500页)。斯普林格·弗拉格·Zbl 1326.68251号
[15] Montañes,E.、Senge,R.、Barranquero,J.、Quevedo,J.R.、del Coz,J.J.和Hüllermier,E.(2014)。多标签分类的相关二进制相关模型。模式识别,47(3),1494-1508。手写识别和其他公关应用
[16] Pearl,J.(1984)。启发式:用于解决计算机问题的智能搜索策略。马萨诸塞州波士顿:Addison-Wesley Longman Publishing Co.Inc。
[17] Read,J.、Martino,L.和Luengo,D.(2014)。使用分类器链进行多维学习的高效蒙特卡罗方法。模式识别,47(3),1535-1546·Zbl 1326.68251号 ·doi:10.1016/j.patcog.2013.10.006
[18] Read,J.、Pfahringer,B.、Holmes,G.和Frank,E.(2009年)。多标签分类的分类器链。收录于:ECML/PKDD’09,LNCS(第254-269页)。施普林格
[19] Read,J.、Pfahringer,B.、Holmes,G.和Frank,E.(2011年)。多标签分类的分类器链。机器学习,85(3),333-359·doi:10.1007/s10994-011-5256-5
[20] Russell,S.J.和Norvig,P.(2003)。《人工智能:现代方法》(第二版)。纽约:培生教育·Zbl 0835.68093号
[21] Senge,R.、Barranquero,J.、del Coz,J.J.和Hüllermier,E.(2012a)。纠正多标签分类的分类器链。技术报告。
[22] Senge,R.、del Coz,J.J.和Hüllermier,E.(2012b)。关于多标签分类中分类器链中的错误传播问题。参加:德国分类协会关于数据分析、机器学习和知识发现的会议。
[23] Tsoumakas,G.和Vlahavas,I.(2007年)。随机k标签集:多标签分类的集成方法。收录于:ECML/PKDD’07,LNCS(第406-417页)。斯普林格。
[24] Zhang,M.L.和Zhou,Z.H.(2007)。Ml-knn:多标签学习的懒惰学习方法。模式识别,40(7),2038-2048·Zbl 1111.68629号 ·doi:10.1016/j.patcog.2006.12.019
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。