×

通过引入运行时,使用平均排名和主动测试加速算法选择。 (英语) Zbl 1462.62138号

总结:通过结合多目标度量,优先考虑有希望且快速评估的算法,可以大大加快算法选择方法的速度。在本文中,我们引入了这样一种度量,即A3R,并将其纳入两种算法选择技术中:平均排名主动测试平均排名结合了在先前数据集上观察到的算法排名,以确定新数据集的最佳算法。第二种方法的目的是迭代选择要在新数据集上测试的算法,从每个新评估中学习,智能地选择下一个最佳候选。我们展示了如何升级这两种方法,以结合精度和运行时间的多目标测量A3R。有必要在准确度和运行时间之间建立正确的平衡,否则进行信息量较小的测试会浪费时间。正确的平衡可以通过在功能A3R中进行适当的参数设置来设置,以权衡精度和运行时间。我们的结果表明,平均排名和主动测试的升级版本比基于精确度的版本的平均间隔损失值要好得多。

MSC公司:

62F07型 统计排名和选择程序
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿卜杜拉赫曼,SM;Braddil,P,ECAI元学习、元学习和算法选择研讨会的精度和时间相结合的措施,2014,49-50,(2014)
[2] Braddil,P.&Soares,C.(2000)。分类算法选择排序方法的比较。机器学习:ECML 2000第63-75页。斯普林格。
[3] 布拉迪尔,P;苏亚雷斯,C;Costa,JP,排名学习算法:在准确性和时间结果上使用IBL和元学习,机器学习,50251-277,(2003)·Zbl 1033.68082号 ·doi:10.1023/A:1021713901879
[4] Braddil,P.,Carrier,C。G.、Soares,C.和Villata,R.(2008)。元学习:在数据挖掘中的应用柏林:施普林格·Zbl 1173.68625号
[5] Demšar,J,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30,(2006)·Zbl 1222.68184号
[6] 弗吉尼亚州费多罗夫。V.(1972)。最佳实验理论剑桥:学术出版社。
[7] Feurer,M.,Springenberg,T.&Hutter,F.(2015)。通过元学习初始化贝叶斯超参数优化。第二十届AAAI人工智能会议记录2015年1月。
[8] Fürnkranz,J.和Petrak,J.(2001)。对地标变体的评估。ECML/PKDD 2000数据挖掘、决策支持和元学习集成研讨会工作说明第57-68页。
[9] 霍尔,M;E·弗兰克;霍姆斯,G;普法林格,B;鲁特曼,P;Witten,IH,WEKA数据挖掘软件:更新,ACM SIGKDD Explorations Newsletter,11,10-18,(2009)·数字对象标识代码:10.1145/1656274.1656278
[10] Jankowski,N.(2013)。元学习的复杂性度量及其最优性。算法概率和朋友。贝叶斯预测和人工智能。第198-210页·Zbl 1403.68192号
[11] Leite,R.和Braddil,P.(2008)。使用带有采样地标和数据特征的元学习选择分类器。2008年ICML/COLT/UAI第二届计划学习研讨会(PlanLearn)会议记录第35-41页。
[12] Leite,R.和Braddil,P.(2010年)。通过抽样和元学习预测最佳分类算法的主动测试策略。ECAI公司第309-314页。
[13] Leite,R.、Braddil,P.和Vanschoren,J.(2012)。选择具有主动测试的分类算法。模式识别中的机器学习和数据挖掘第117-131页。斯普林格。
[14] Li,L.,Chu,W.,Langford,J.&Schapire,R.E.(2010)。个性化新闻文章推荐的上下文强盗方法。第19届WWW会议记录第661-670页。ACM公司。
[15] Lin,S,秩加总方法,WIRE计算统计,2555-570,(2010)·doi:10.1002/wics.111
[16] Long,B.、Chapelle,O.、Zhang,Y.、Chang,Y..、Zheng,Z.和Tseng,B.(2010年)。通过预期损失优化主动学习排名。第33届国际ACM SIGIR信息检索研究与开发会议记录第267-274页。ACM公司。
[17] Neave,H.R.和Worthington,P.L.(1988)。无分布测试伦敦:Unwin Hyman。
[18] Pfahringer,B.、Bensusan,H.和Giraud-Carrier,C.(2000)。告诉我谁可以学习你,我可以告诉你是谁:标记各种学习算法。第17届机器学习国际会议论文集第743-750页。
[19] 皮赫尔,V;达塔,S;Datta,S,Rankaggreg,加权秩加总的R包,BMC生物信息学,10,62,(2009)·doi:10.1186/1471-2105-10-62
[20] Prudíncio,R.B.和Ludermir,T.B.(2007)。积极选择元学习的培训示例。第七届混合智能系统国际会议,2007年。HIS 2007。第126-131页。电气与电子工程师协会。
[21] 赖斯,JR,算法选择问题,计算机进展,15,65-118,(1976)·doi:10.1016/S0065-2458(08)60520-3
[22] Smith-Miles,K A,《用于算法选择的元学习的跨学科观点》,ACM计算调查(CSUR),41,6:1-6:25,(2008)·数字对象标识代码:10.1145/1456650.1456656
[23] 孙权;Pfahringer,B,《基于元学习的算法排名的成对元规则》,机器学习,93,141-161,(2013)·Zbl 1293.68241号 ·doi:10.1007/s10994-013-5387-y
[24] van Rijn,J.N.、Abdulrahman,S.M.、Braddil,P.和Vanschoren,J.(2015)。使用学习曲线快速选择算法。智能数据分析的进展XIV第298-309页。斯普林格。
[25] Vanschoren,J;JN,Rijn;Bischl,B;Torgo,L,Openml:机器学习中的网络科学,ACM SIGKDD Explorations Newsletter,15,49-60,(2014)·数字对象标识代码:10.1145/2641190.2641198
[26] 维滕,我。H.和Frank,E.(2005年)。数据挖掘:实用机器学习工具和技术伯灵顿:摩根·考夫曼·Zbl 1076.68555号
[27] Xu,L.、Hutter,F.、Hoos,H.和Leyton-Brown,K.(2011年)。Hydra-MIP:混合整数编程的自动算法配置和选择在国际人工智能联合会议(IJCAI)上,在RCRA关于用组合爆炸解决问题的算法的实验评估研讨会上
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。