×

分层多标签分类的主动学习。 (英文) Zbl 1455.68177号

摘要:由于技术进步,每天都会产生大量数据,这给需要由领域专家或昂贵的程序标记数据以用于监督机器学习的应用领域带来了挑战。为了选择哪些数据点在标记时将提供更多信息,可以使用主动学习方法。主动学习(AL)是机器学习的一个子领域,它解决了用较少但更具代表性的实例构建模型的方法。尽管已经对AL进行了大量研究,但在分层多标签分类中还没有进行彻底的研究,分层多标签是一种学习任务,可以将多个类标签分配给一个实例,并且这些标签是分层结构的。在这项工作中,我们提供了一个公共框架,其中包含适用于此任务的基准和最新算法。此外,我们还提出了一种新的算法,即分层查询-基于委员会(H-QBC),并在不同域的数据集上进行了验证。我们的结果表明,与竞争对手相比,H-QBC能够提供更好的预测性能结果,同时具有计算效率和无参数。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)

软件:

新GOA;RCV1型
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Athanasopoulos,G。;Gamakumara,P。;Panagiotelis,A。;RJ Hyndman;Afan,M.,《层次预测》,689-719(2020),查姆:斯普林格,查姆
[2] Bekker J,Davis J(2018)从积极和未标记的数据中学习:一项调查。加拿大安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省安大略省·Zbl 1496.68270号
[3] Borchani,H。;瓦兰多,G。;比尔扎,C。;Larrañaga,P.,《关于多产出回归的调查》,Wiley Int Rev Data Min Knowl Discov,5,5,216-233(2015)·doi:10.1002/widm.1157
[4] Brinker K(2006)《关于多标签分类中的主动学习》。摘自:《从数据和信息分析到知识工程》,柏林施普林格出版社,第206-213页
[5] Cerri R、Barros RC、de Carvalho ACPLF(2012)分层多标签分类的遗传算法。摘自:2012年SAC第27届ACM应用计算研讨会论文集。ACM,纽约,第250-255页
[6] Cerri R、Barros R、de Carvalho A(2015)《基于神经网络的基因本体论蛋白质功能的层次分类》。In:神经网络(IJCNN),2015年国际联合会议,第1-8页
[7] 塞里·R。;巴罗斯,RC;de Carvalho,AC;Jin,Y.,蛋白质功能预测中分层多标签分类的简化策略,BMC Bioinf,17,1,373(2016)·doi:10.1186/s12859-016-1232-1
[8] 塞里·R。;议员巴斯加洛普;巴罗斯,RC;de Carvalho,AC,用遗传算法诱导分层多标签分类规则,应用软件计算,77,584-604(2019)·doi:10.1016/j.asoc.2019.01.017
[9] Chakraborty S,Balasubramanian V,Panchanathan S(2011)多标签分类中主动学习的最佳批次选择。摘自:2011年MM第19届ACM多媒体国际会议记录。ACM,纽约,第1413-1416页
[10] Chakraborty S、Balasubramanian V、Sankar AR、Panchanathan S、Ye J(2015)Batchrank:一种新的用于分层分类的批处理模式主动学习框架。摘自:第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM,第99-108页
[11] Cheng Y,Zhang K,Xie Y,Agrawal A,Choudhary A(2012)《关于分层分类中的主动学习》。摘自:第21届ACM信息和知识管理国际会议记录。ACM,第2467-2470页
[12] Cheng Y,Chen Z,Fei H,Wang F,Choudhary A(2014)具有层次结构嵌入方差的批量模式主动学习。摘自:2014年SIAM数据挖掘国际会议记录。SIAM,第10-18页
[13] EA Cherman;帕帕尼科劳,Y。;Tsoumakas,G。;Monard,MC,多标签主动学习:关键问题和一种新的查询策略,Evol Syst,10,63-78(2019)·doi:10.1007/s12530-017-9202-z
[14] Demsar,J.,多数据集上分类器的统计比较,J Mach Learn Res,7,1-30(2006)·Zbl 1222.68184号
[15] Duin,JD,线粒体疾病的分层主动学习应用(2017),Tese de Doutorado:内布拉斯加州大学
[16] Gargiulo,F。;Silvestri,S。;Ciampi,M。;Pietro,GD,用于分层极端多标签文本分类的深度神经网络,应用软件计算,79,125-138(2019)·doi:10.1016/j.asoc.2019.03.041
[17] 郭A,Wu J,Sheng VS,Zhao P,崔Z(2017)多标签主动学习与低秩映射用于图像分类。2017年IEEE多媒体与博览会国际会议(ICME),第259-264页
[18] Hoi SCH,Jin R,Zhu J,Lyu MR(2006)批量模式主动学习及其在医学图像分类中的应用。摘自:2006年ICML第23届机器学习国际会议记录。纽约计算机械协会,第417-424页
[19] Hung C-W,Lin H-T(2011)带辅助学习器的多语言主动学习。收录:Hsu C-N,Lee WS(编辑)《亚洲机器学习会议论文集》,《机器学习研究论文集》第20卷,PMLR。桃园南园酒店及度假村,第315-332页
[20] Huang S,Zhou Z(2013)基于不确定性和多样性的主动查询,用于增量多标签学习。2013年IEEE第13届数据挖掘国际会议,第1079-1084页
[21] 黄,S。;金·R。;周,Z.,通过查询信息性和代表性示例进行主动学习,IEEE Trans-Pattern Ana Mach Intell,36,10,1936-1949(2014)·doi:10.1109/TPAMI.2014.2307881
[22] 焦,Y。;赵,P。;吴杰。;西安,X。;Xu,H。;崔,Z。;罗,X。;于,JX;Li,Z.,带最优标签子集选择的主动多标签学习,高级数据挖掘和应用,523-534(2014),Cham:Springer,Cham
[23] Klimt B,Yang Y(2004)《安然语料库:电子邮件分类研究的新数据集》。摘自:ECML'04:第18届欧洲机器学习会议记录-LNCS 3201。柏林施普林格,第217-226页·Zbl 1132.68562号
[24] 科切夫,D。;文斯,C。;斯特鲁伊夫,J。;Díeroski,S.,《预测结构化输出的树集合》,《模式识别》,46,3,817-833(2013)·doi:10.1016/j.patcog.2012.09.023
[25] Krawczyk,B。;Minku,法学博士;贾马,J。;Stefanowski,J。;Woźniak,M.,《数据流分析的集成学习:调查》,Inf Fusion,37,132-156(2017)·doi:10.1016/j.inffus.2017.02.004
[26] 莱瓦蒂奇,J。;塞西,M。;科切夫,D。;Díeroski,S.,《利用树集合进行多目标回归的自我训练》,基于知识的系统,123,41-60(2017)·doi:10.1016/j.knosys.2017.02.014
[27] Levatić,J。;科切夫,D。;塞西,M。;Džeroski,S.,多目标回归的半监督树,Inf Sci,450109-127(2018)·doi:10.1016/j.ins.2018.03.033
[28] Lewis DD,Catlett J(1994),监督学习的异质不确定性抽样。摘自:第十一届机器学习国际会议记录,第148-156页
[29] 刘易斯,DD;Yang,Y。;罗斯,TG;Li,F.,Rcv1:文本分类研究的新基准集合,J Mach Learn Res,5361-397(2004)
[30] Li X,Guo Y(2013)利用多标签SVM分类进行主动学习。In:IJCAI国际人工智能联合会议,第1479-1485页
[31] Li X,Wang L,Sung E(2004)多标签SVM主动学习用于图像分类。2004年图像处理国际会议,2004年。ICIP’04,第4卷,第2207-2210页
[32] Li X,Kuang D,Ling CX(2012)分层文本分类的主动学习。参加:亚太知识发现和数据挖掘会议。柏林施普林格,第14-25页
[33] Li X,Ling CX,Wang H(2013)《有效的自上而下的分层文本分类主动学习》。在:太平洋-亚洲知识发现和数据挖掘会议。柏林施普林格,第233-244页
[34] Mileski V,Díeroski S,Kocev D(2017)层次多目标回归的预测聚类树。摘自:Adams N、Tucker A、Weston D(编辑)《智能数据分析进展》,第十六卷。查姆施普林格,第223-234页
[35] Mo Y,Scott SD,Downey D(2016)学习具有主动过度标记的层次分解概念。2016年IEEE第16届数据挖掘国际会议(ICDM),第340-349页
[36] Nakano FK、Pinto WJ、Pappa GL、Cerri R(2017)《利用神经网络对转座元件进行分级分类的自上而下策略》。In:国际神经网络联合会议(IJCNN),第2539-2546页
[37] 中野,FK;Lietaert,M。;Vens,C.,《发现缺失或错误蛋白质功能注释的机器学习》,BMC Bioinf,20,1,485(2019)·doi:10.1186/s12859-019-3060-6
[38] Pliakos,K。;Vens,C.,《使用聚类树集成挖掘生物医学数据特征》,《生物识别信息》,85,40-48(2018)·doi:10.1016/j.jbi.2018.07.012
[39] 齐G-J,华X-S,芮Y,唐J,张H-J(2008)图像分类的二维主动学习。2008年IEEE计算机视觉和模式识别会议,第1-8页
[40] 钱C,于毅,周Z-H(2015)基于帕累托优化的子集选择。摘自:第28届神经信息处理系统国际会议论文集——第1卷,NIPS’15。麻省理工学院出版社,剑桥,第1774-1782页
[41] Reyes,O。;莫雷尔,C。;Ventura,S.,多标签学习的有效主动学习策略,神经计算,273494-508(2018)·doi:10.1016/j.neucom.2017.08.001
[42] Ribeiro MT、Singh S、Guestrin C(2016)“我为什么要相信你?”解释了任何分类器的预测。摘自:第22届ACM SIGKDD知识发现和数据挖掘国际会议记录,第1135-1144页
[43] 鲁本斯,N。;卡普兰,D。;杉山,M。;坎特,P。;里奇,F。;罗卡奇,L。;Shapira,B.,《推荐系统中的主动学习》,推荐系统手册,735-767(2011),柏林:施普林格出版社,柏林
[44] Schietgat,L。;文斯,C。;斯特鲁伊夫,J。;Blockeel,H。;科切夫,D。;Díeroski,S.,使用分层多标签决策树集成预测基因功能,BMC Bioinf,11,1,2(2010)·数字对象标识代码:10.1186/1471-2105-11-2
[45] 解决B(2010)主动学习文献调查。威斯康星大学麦迪逊分校52(55-66):11
[46] Seung HS、Opper M、Sompolinsky H(1992),委员会质询。摘自:第五届计算学习理论年度研讨会论文集。ACM,第287-294页
[47] Štrumbelj,E。;Kononenko,I.,《用特征贡献解释预测模型和个人预测》,《知识信息系统》,41,3,647-665(2014)·数字对象标识代码:10.1007/s10115-013-0679-x
[48] Valentini,G.,用于全基因组基因功能预测的真路径规则层次集成,IEEE/ACM Trans-Comput Biol Bioinf,8,3,832-847(2010)·doi:10.1109/TCBB.2010.38
[49] van Engelen,JE;Hoos,HH,《半监督学习调查》,《马赫学习》,109373-440(2020)·Zbl 1441.68215号 ·doi:10.1007/s10994-019-05855-6
[50] Vasisht D,Damianou A,Varma M,Kapoor A(2014)稀疏贝叶斯多标签分类的主动学习。摘自:第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’14。ACM,纽约,第472-481页
[51] 文斯,C。;斯特鲁伊夫,J。;Schietgat,L。;季洛斯基,S。;Blockeel,H.,分层多标签分类的决策树,Mach Learn,73,185-214(2008)·Zbl 1470.62098号 ·doi:10.1007/s10994-008-5077-3
[52] Wang X,Zhao H,Lu B-L(2011)用于大规模分层多标签分类的增强k近邻算法。附:ECML/PKDD PASCAL大规模等级分类联合研讨会会议记录
[53] Wehrmann J,Cerri R,Barros R(2018)分层多标签分类网络。在:Dy J,Krause A(编辑)第35届机器学习国际会议论文集,机器学习研究论文集(PMLR)第80卷,斯德哥尔摩Stockholmsmässan,第5075-5084页
[54] Wu J,Sheng VS,Zhang J,Zhao P,Cui Z(2014)图像分类的多标签主动学习。2014年IEEE图像处理国际会议(ICIP),第5227-5231页
[55] 吴杰。;Ye,C。;胜,VS;张杰。;赵,P。;Cui,Z.,针对多标签图像分类的带标签相关性探索的主动学习,IET Comput Vis,11,7,577-584(2017)·doi:10.1049/iet-cvi.2016.0243
[56] 吴杰。;郭,A。;胜,VS;赵,P。;Cui,Z.,《带样本噪声的多标签图像分类的主动学习方法》,《国际J模式识别Artif Intell》,32,3,1850005(2018)·doi:10.1142/S021801418500052
[57] Yan Y,Huang S-J(2018)分层多标签分类的成本效益主动学习。IJCAI,第2962-2968页
[58] Yan Y、Rosales R、Fung G、Dy JG(2011)《积极向人群学习》。摘自:第28届机器学习国际会议论文集,ICML'11。麦迪逊Omnipress,第1161-1168页
[59] Yang B,Sun J-T,Wang T,Chen Z(2009)文本分类的有效多标签主动学习。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’09。ACM,纽约,第917-926页
[60] Yang,K。;Ren,J。;Zhu,Y。;Zhang,W.,无线物联网入侵检测的主动学习,IEEE Wirel Commun,25,6,19-25(2018)·doi:10.1109/MWC.2017.1800079
[61] Ye C,Wu J,Sheng V,Zhao P,Cui Z(2015a)图像分类的标签相关多标签主动学习,第3437-3441页
[62] Ye C,Wu J,Sheng VS,Zhao S,Zhao-P,Cui Z(2015b)《图像分类中的多标签主动学习与chi-square统计》(Multi-label active learning with chi-square statistics for image classification)。摘自:第五届ACM多媒体检索国际会议论文集,ICMR’15。纽约计算机械协会,第583-586页
[63] Yu,G。;Fu,G。;Wang,J。;Zhao,Y.,Newgoa:通过混合图上的双随机行走预测蛋白质的新go注释,IEEE/ACM Trans-Comput Biol Bioinf,15,4,1390-1402(2017)·doi:10.1109/TCBB.2017.2715842
[64] 曾,C。;周,W。;李·T。;Shwartz,L。;Grabarnik,GY,基于票证数据的知识引导分层多标签分类,IEEE Trans Netw Serv Manag,14,2,246-260(2017)·doi:10.1109/TNSM.2017.2668363
[65] Zhang,M-L,ML-RBF:用于多标签学习的RBF神经网络,神经过程快报,29,61-74(2009)·doi:10.1007/s11063-009-9095-3
[66] Zhang B,Wang Y,Wang W(2012)基于信息标签相关性挖掘的多标签图像分类批量模式主动学习。2012年IEEE计算机视觉应用研讨会,第401-407页
[67] 张,B。;Wang,Y。;Chen,F.,通过高阶标签相关驱动的主动学习进行多标签图像分类,IEEE Trans-image Process,23,3,1430-1441(2014)·Zbl 1374.94442号 ·doi:10.1109/TIP.2014.2302675
[68] 张,Z。;张杰。;刘,Y。;王,Z。;邓,L.,通过层次多标签分类对长非编码RNA进行本体功能注释,生物信息学,34,10,1750-1757(2017)·doi:10.1093/bioinformatics/btx833
[69] Zhao,Y。;Wang,J。;陈,J。;张,X。;Guo先生。;Yu,G.,通过基因本体建模进行基因功能预测的文献综述,Front Genet,11400(2020)·doi:10.3389/fgene.2020.00400
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。