×

学习我们不关心的:具有牺牲功能的防盗训练。 (英文) Zbl 1451.68222号

总结:传统的机器学习范式侧重于优化目标。这项优化任务是通过调整模型的自由参数来完成的;然而,在分类中,我们很多时候都没有使用优化目标来评估模型的性能。此外,为目标函数选择一组糟糕的自由参数可能会导致数据的意外过度拟合。在这项工作中,我们提出了一种基于反训练理论的新方法,用于生成转换数据的牺牲函数。这些牺牲函数将新的与分类器无关的目标纳入到选择模型自由参数的任务中。我们的方法基于最近在反训练方面的工作,开发了一类分类器不应该在其上表现良好的新函数。我们使用多目标进化算法通过最小化牺牲函数来解决模型选择任务以及模型应始终表现良好的功能(即,误差、敏感性、特异性等)。我们的实验发现,与最先进的优化器相比,所提出的方法在泛化误差方面提供了统计上显著的改进。

MSC公司:

68T05型 人工智能中的学习和自适应系统
90C29型 多目标规划

软件:

第4.5条
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abbas,H.A.,乳腺癌诊断的进化人工神经网络方法,Artif。智力。医学,25,3,265-281(2002)
[2] 阿巴斯,H.A.,使用多目标进化算法加速反向传播,神经计算。,15, 11, 2705-2726 (2003) ·Zbl 1085.68608号
[3] Bifet,A。;Frank,E.,《推特流数据中的情感知识发现》,发现科学国际会议(2010年)
[4] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社·Zbl 1058.90049号
[5] 布雷曼,L。;J;弗里德曼;Olshen,R。;Stone,C.,《分类和回归树》(1984),CRC出版社·Zbl 0541.62042号
[6] 卡鲁阿纳,R。;尼古列斯库·马齐尔(Niculescu-Mizil),A。;船员,G。;Ksikes,A.,从模型库中选择集成,机器学习国际会议(2004)
[7] 沙佩尔,O。;Vapnik,V.,支持向量机的模型选择,神经信息处理系统的进展(1999)
[8] 查拉,N.V。;贾普科维奇,N。;Kolcz,A.,社论:关于从不平衡数据集学习的特刊,Sigkdd Explor。,6, 1, 1-6 (2004)
[9] 科尔,J.R。;王,Q。;Cardenas,E。;费什,J。;Chai,B。;Farris,R.J。;Kulam-Syed-Mohideen,A.S。;McGarrell,D.M。;马什,T。;Garrity,G.M。;Tiedje,J.M.,核糖体数据库项目:rRNA分析的改进比对和新工具,核酸研究,37,141-145(2009)
[10] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
[11] Ditzler,G。;Polikar,R.,流不平衡数据概念漂移的增量学习,IEEE Trans。知识。数据工程,25,10,2283-2301(2013)
[12] 杜达,R.O。;哈特,体育。;Stork,D.G.,《模式分类》(2001),John Wiley&Sons,Inc·兹伯利0968.68140
[13] 埃思里奇·J。;Ditzler,G。;Polikar,R.,使用多目标进化算法的最优ν-svm参数估计,IEEE进化计算大会,3570-3577(2010)
[14] 费尔南德斯·德尔加多,M。;Cernadas,E。;巴罗,S。;Amorim,D.,我们需要数百个分类器来解决现实世界的分类问题吗?,J.马赫。学习。研究,第15号,3133-3181(2014年)·兹比尔1319.62005
[15] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,Mach。学习。,46, 389-422 (2002) ·Zbl 0998.68111号
[16] Haykin,S.,《神经网络和学习机器》(2009),皮尔逊出版社
[17] He,H。;Chen,S.,IMORL:增量多对象识别和定位,IEEE Trans。神经网络。,19, 10, 1727-1738 (2008)
[18] He,H。;Garcia,E.,《从不平衡数据中学习》,IEEE Trans。数据知识。迪斯科。,12, 9, 1263-1284 (2009)
[19] 黄,B。;Boutros,P.,《随机森林的参数敏感性》,BMC Bioninform。,17, 331 (2016)
[20] Igel,C.,支持向量机的多目标模型选择,进化多准则优化国际会议,534-546(2005)·Zbl 1109.68605号
[21] Jin,Y。;Okabe,T。;Sendhof,B.,使用多目标进化算法的神经网络正则化和集成,IEEE进化计算大会,1-8(2004)
[22] 柯克帕特里克,S。;盖拉特,C.D。;Vecchi,M.,《模拟退火优化》,《科学》,第220、4598、671-680页(1983年)·Zbl 1225.90162号
[23] Kren,T。;Pilat,M。;Neruda,R.,机器学习工作流的多目标进化,IEEE计算智能和数据挖掘研讨会(2017)
[24] 拉瓦利,S。;Branicky,M.,《论经典网格搜索与概率路线图之间的关系》,(23,《国际机器人研究杂志》(2002),673-692
[25] Lemke,C。;Budka,M。;Gabris,B.,元学习-趋势和技术调查,Artif。智力。版本:44、1、117-130(2013)
[26] 奥尔森·R。;Bartley,N。;Urbanowicz,R。;Moore,J.,用于自动化数据科学的基于树的管道优化工具评估,《遗传和进化计算会议论文集》,485-492(2016)
[27] 奥尔森·R。;Urbanowicz,R。;安德鲁斯,P。;薰衣草,N。;Creis Kidd,L。;Moore,J.,通过基于树的管道优化实现生物医学数据科学自动化,进化计算的应用,123-137(2016)
[28] Pasolli,大肠杆菌。;Truong,D.T。;马利克,F。;Waldron,L。;Segata,N.,《大型宏基因组数据集的机器学习元分析:工具和生物学见解》,《公共科学图书馆·计算》。生物学,12,7,e1004977(2016)
[29] Patil,K.R。;鲁恩,L。;McHardy,A.C.,《用于元基因组序列分类分配的PhyloPythiaS网络服务器》,《公共科学图书馆·综合》,第7期,第6期(2012年)
[30] 佩雷拉,C。;Stern,J.,《模型选择:完全贝叶斯方法》,环境计量学,12559-568(2001)
[31] 昆兰,J.R.,C4.5:机器学习程序(1993),摩根考夫曼出版社
[32] 罗莎莱斯·佩雷斯,A。;Escalante,H.J。;Gonzalez,J.A。;Reyes-Garcia,C.,SVM模型选择的偏差和方差优化,第26届国际佛罗里达人工智能研究会会议论文集,136-141(2013)
[33] Rosen,G.L。;Reichenberger,E.R。;Rosenfeld,A.M.,NBC:用于元基因组阅读分类分类的朴素贝叶斯分类工具网络服务器,生物信息学,27,1,127-129(2011)
[34] Savic,D.,综合决策支持的单目标与多目标优化,集成。评估。Decis公司。支持,20(2002)
[35] Schlköpf,B。;Smola,A.J.,《使用内核学习:支持向量机、正则化、优化和超越》(2001),麻省理工学院出版社
[36] 杉山,M。;Rubens,N.,带模型选择的主动学习的批集成方法,神经网络。,21, 9, 1278-1286 (2008) ·Zbl 1254.68226号
[37] 萨托普,T。;Igel,C.,支持向量机的多目标优化,Stud.Comput。智力。,199-220 (2006)
[38] 瓦伦苏埃拉,M。;Rozenblit,J.,《利用牺牲数据学习反训练》,J.Mach。学习。第17、24、1-42号决议(2016年)·Zbl 1360.68715号
[39] Vapnik,V.,《统计学习理论的本质》(1999),斯普林格·维里拉出版社·Zbl 0928.68093号
[40] Wolpert,D.H。;Macready,W.G.,《优化无免费午餐定理》,IEEE Trans。进化。计算。,1, 1, 67-82 (1997)
[41] Zhao,H.,帕累托最优决策树的多目标遗传规划方法,Decis。支持系统。,43, 3, 809-826 (2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。