×

使用贝叶斯方法实现最优概率主动学习。 (英语) 兹比尔1491.68161

主动学习方法选择下一个要学习的输入,以便在监督学习下使学习更有效,即输入-输出关系的学习。本文考虑了分类环境中的主动学习框架。利用分类模型的Dirichlet共轭先验,定义了估计的风险差异,并提出了一种新的主动学习策略,即主动学习的期望概率增益(xPAL)。通过一些修改,xPAL简化为现有的主动学习方法、预期误差减少(EER)、概率主动学习(PAL)和不确定性采样(US)。作者从理论上证明了这些关系,并将xPAL的性能与现有方法进行了数值比较。虽然很少讨论基于统计实验设计的主动学习框架的联系,但xPAL为最近的主动学习方法提供了一个统一的框架。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴拉姆,Y。;亚尼夫,RE;Luz,K.,《主动学习算法的在线选择》,《机器学习研究杂志》,5,255-291(2004)
[2] Beyer,C.、Krempl,G.和Lemaire,V.(2015)。如何选择重要信息:关于分类的主动学习策略的比较研究。《第15届国际知识技术和数据驱动商业会议论文集》,计算机械协会,i-KNOW’15,美国纽约州纽约市。
[3] Bishop,CM,模式识别和机器学习(2006),Springer·Zbl 1107.68072号
[4] Bondu,A.、Lemaire,V.和Boullé,M.(2010年)。主动学习中的探索与开发:贝叶斯方法。在国际神经网络联合会议(IJCNN)上(第1-7页)。电气与电子工程师协会。
[5] Brinker,K.(2003年)。在主动学习中结合多样性和支持向量机。第20届国际机器学习会议(ICML)论文集(第59-66页)。
[6] Calma,A。;雷特迈尔,T。;Sick,B.,《支持向量机的半监督主动学习:利用数据结构信息的新方法》,《信息科学》,456,13-33(2018)·Zbl 1440.68202号 ·doi:10.1016/j.ins.2018.04.063
[7] Chapelle,O.(2005)。parzen窗口分类器的主动学习。第10届人工智能与统计国际研讨会论文集(AISTATS)(第5卷,第49-56页)。
[8] Chaudhuri,A.、Kakde,D.、Sadek,C.、Gonzalez,L.和Kong,S.(2017年)。支持向量数据描述的核带宽选择的平均值和中值标准。数据挖掘研讨会国际会议(ICDMW)(第842-849页)。电气与电子工程师协会。
[9] Cuong,N.V.、Lee,W.S.和Ye,N.(2014)。具有一般损失的近最优自适应池式主动学习。《第30届人工智能不确定性会议论文集》(第122-131页)。
[10] Dasgupta,S.(2009年)。积极学习的两个方面。在发现科学国际会议上(第35-35页)。斯普林格。
[11] Donmez,P.、Carbonell,J.G.和Bennett,P.N.(2007年)。双策略主动学习。《欧洲机器学习会议论文集》(ECML)(第116-127页)。斯普林格。
[12] Golovin,D.和Krause,A.(2010年)。自适应子模块:一种新的主动学习和随机优化方法。算法学习理论(ALT)第23届会议论文集(第333-345页)。
[13] Guillory,A.和Bilmes,J.(2010年)。交互式子模块集合封面。第27届国际机器学习会议(ICML)论文集。
[14] Hernández-González,J。;罗德里格斯,D。;Inza,I。;哈里森·R。;Lozano,JA,由一群可靠性未知的注释者标记的缺陷报告的两个数据集,《简要数据》,18,840-845(2018)·doi:10.1016/j.dib.2018.03.109
[15] Houlsby,N.、Huszár,F.、Ghahramani,Z.和Lengyel,M.(2011)。贝叶斯主动学习用于分类和偏好学习。arXiv:1112.5745[stat.ML]。
[16] Huang,K.和Lin,H.(2016)。一种用于成本敏感多类主动学习的新的不确定性采样算法。第16届国际数据挖掘会议(ICDM)论文集(第925-930页)。电气与电子工程师协会。
[17] Hutter,F。;徐,L。;呼,HH;Leyton Brown,K.,算法运行时预测:方法与评估,人工智能,206,79-111(2014)·Zbl 1334.68185号 ·doi:10.1016/j.artint.2013.10.003
[18] 贾普科维奇,N。;Shah,M.,《评估学习算法:分类视角》(2011),剑桥大学出版社·Zbl 1230.68020号 ·doi:10.1017/CBO9780511921803
[19] Konyushkova,K.、Sznitman,R.和Fua,P.(2018年)。发现通用主动学习策略。arXiv:1810.04114v2[cs.LG]。
[20] Kottke,D.、Krempl,G.、Lang,D.、Teschner,J.和Spiliopoulou,M.(2016)。多类概率主动学习。《欧洲人工智能会议论文集》(第586-594页)。IOS出版社。
[21] Kottke,D.、Herde,M.、Minh,T.P.、Benz,A.、Mergard,P.、Roghman,A.、Sandrock,C.和Sick,B.(2021年)。scikit-activeml:一个用于主动学习算法的库和工具箱。预印本,2021030194。
[22] Krempl,G。;科特克,D。;Lemaire,V.,优化概率主动学习(OPAL),机器学习,100,2-3,449-476(2015)·Zbl 1341.68160号 ·doi:10.1007/s10994-015-5504-1
[23] Lewis,D.D.和Gale,W.A.(1994年)。用于训练文本分类器的序列算法。第17届信息检索研究与开发国际年会(SIGIR)会议记录(第3-12页)。斯普林格。
[24] Murphy,K.P.(2006)。二项式和多项式分布。技术报告,不列颠哥伦比亚大学。
[25] Nguyen,H.T.和Smeulders,A.(2004)。使用预聚类进行主动学习。第21届机器学习国际会议(ICML)论文集(第79-86页)。ACM出版社。
[26] Osugi,T.、Kim,D.和Scott,S.(2005)。平衡探索和开发:一种新的主动机器学习算法。第五届国际数据挖掘会议(ICDM)论文集(第330-337页)。电气与电子工程师协会。
[27] Roy,N.和McCallum,A.(2001年)。通过蒙特卡罗误差减少估计实现最优主动学习。第18届国际机器学习会议(ICML)论文集(第441-448页)。
[28] 定居,B.(2009年)。主动学习文献调查。技术报告,威斯康星大学麦迪逊分校计算机科学系。
[29] 安定下来,B,积极学习。摩根和克莱普尔出版社(Morgan and Claypool Publishers)关于人工智能和机器学习的综合讲座(2012)排名第18·Zbl 1270.68006号
[30] Seung,H.S.、Opper,M.和Sompolinsky,H.(1992年)。委员会质询。第五届计算学习理论年度研讨会论文集(COLT)(第287-294页)。ACM公司。
[31] Shi,S.,Liu,Y.,Huang,Y.、Zhu,S..和Liu,Y.(2008)。基于打包特征的kNN主动学习。第四届自然计算国际会议论文集(第61-64页),中国济南。
[32] Thrun,S.B.和Möller,K.(1992年)。在动态环境中积极探索。《神经信息处理系统进展》(第531-538页)。
[33] Vanschoren,J。;van Rijn,JN;Bischl,B。;Torgo,L.,Openml:机器学习中的网络科学,SIGKDD Explorations,15,2,49-60(2013)·doi:10.145/2641190.2641198
[34] Vapnik,VN,统计学习理论的本质(1995),Springer·Zbl 0833.62008号 ·数字对象标识代码:10.1007/978-1-4757-2440-0
[35] Wei,K.、Iyer,R.和Bilmes,J.(2015)。数据子集选择和主动学习中的子模块。第32届机器学习国际会议(ICML)论文集(1954-1963页)。
[36] Weigl,E。;Heidl,W。;Lughofer,E。;Radauer,T。;Eitzinger,C.,《通过在线主动学习和灵活分类器更新提高表面检测系统性能》,《机器视觉与应用》,27,1,103-127(2015)·doi:10.1007/s00138-015-0731-9
[37] Xu,Z.、Akella,R.和Zhang,Y.(2007)。在主动学习中融入多样性和密度,以获得相关反馈。《欧洲信息检索会议论文集》(ECIR)(第246-257页)。斯普林格。
[38] Zoller,T.和Buhmann,J.M.(2000年)。分层成对数据聚类的主动学习。第15届模式识别国际会议论文集(ICPR)(第186-189页)。电气与电子工程师协会。
[39] 《狮子座》,I。;Bifet,A。;普法林格,B。;Holmes,G.,《使用漂移流数据进行主动学习》,《神经网络和学习系统学报》,25,1,27-39(2014)·doi:10.1109/TNNLS.2012.2236570
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。