×

图上的注意多标签学习:一种消息传递方法。 (英语) Zbl 1493.68297号

摘要:我们解决了图上多标签分类的一个很大程度上公开的问题。与传统的向量输入不同,图具有丰富的可变尺寸子结构,这些子结构在某些方面与标签相关。我们认为,揭示这些关系可能是分类性能和可解释性的关键。我们引入了用于多标签学习的图形注意模型(GAML),这是一种能够有效处理此问题的新型图形神经网络。GAML将标签视为辅助节点,并将其与输入图形一起建模。通过将神经消息传递算法和注意机制迭代地应用于标签节点和输入节点,GAML可以捕获不同分辨率下标签和输入子图之间的关系。此外,我们的模型可以利用显式标签依赖。由于我们的建议,它还可以随着标签数量和图形大小线性缩放分级注意我们使用图形结构输入和经典的非结构化输入对GAML进行了广泛的实验评估。结果表明,GAML显著优于其他竞争方法。重要的是,GAML支持直观的可视化,以便更好地理解标签-子结构关系和模型行为的解释。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alanis-Lobato,G.、Andrade-Navarro,M.A.和Schaefer,M.H.(2016)。HIPPIE v2。0:增强蛋白质-蛋白质相互作用网络的意义和可靠性。核酸研究,gkw985。
[2] Bahdanau,D.、Cho,K.和Bengio,Y.(2014年)。神经机器翻译通过联合学习对齐和翻译。ArXiv预打印ArXiv:1409.0473。
[3] Bi,W.,&Kwok,J.T.(2011)。树和dAG结构层次上的多标签分类。《机器学习国际会议论文集》,第17-24页。
[4] Bruna,J.、Zaremba,W.、Szlam,A.和LeCun,Y.(2013年)。图上的谱网络和局部连通网络。ArXiv预打印ArXiv:1312.6203。
[5] Chen,M.、Lin,Z.和Cho,K.(2018年)。图卷积网络用于带结构标记空间的分类。ArXiv预打印ArXiv:1710.04908。
[6] Chen,S.-F、Chen,Y.-C.、Yeh,C.-K和Wang,Y.-C.F.(2017)。无序RNN,具有多标签分类的视觉关注。ArXiv预打印ArXiv:1707.05495。
[7] Cho,K.,Van Merriönboer,B.,Gulcehre,C.,Bahdanau,D.,Bougares,F.,Schwenk,H.等人(2014)。使用RNN编码器-解码器学习短语表示以进行统计机器翻译。arXiv预打印arXiv:1406.1078。
[8] Defferrard,M.l.、Bresson,X.和Vandergheynst,P.(2016)。图上的卷积神经网络与快速局域谱滤波。《神经信息处理系统进展学报》,第3844-3852页。
[9] Dembczynski,K.、Cheng,W.和Hüllermier,E.(2010年)。基于概率分类器链的贝叶斯最优多标签分类。《机器学习国际会议论文集》,第10卷,第279-286页。
[10] Deng,J.、Ding,N.、Jia,Y.、Frome,A.、Murphy,K.、Bengio,S.等(2014)。使用标签关系图的大规模对象分类。《欧洲计算机视觉会议记录》(第48-64页)。斯普林格。
[11] Fout,A.、Byrd,J.、Shariat,B.和Ben-Hur,A.(2017)。利用图卷积网络预测蛋白质界面。《神经信息处理系统进展学报》,第6533-6542页。
[12] Fürnkranz,J.、Hüllermeier,E.、Mencía,E.L.和Brinker,K.(2008)。通过校准标签排名进行多标签分类。机器学习,73(2),133-153·Zbl 1470.68108号
[13] Ghamrawi,N.和McCallum,A.(2005年)。集体多标签分类。《信息和知识管理国际会议记录》(第195-200页)。ACM。
[14] Gilmer,J.、Schoenholz,S.S.、Riley,P.F.、Vinyals,O.和Dahl,G.E.(2017)。量子化学的神经信息传递。机器学习国际会议论文集。
[15] Gong,Y.、Jia,Y.,Leung,T.、Toshev,A.和Ioffe,S.(2013)。多标签图像注释的深度卷积排序。ArXiv预打印ArXiv:1312.4894。
[16] Grover,A.和Leskovec,J.(2016)。node2vec:网络的可扩展特性学习。《知识发现和数据挖掘国际会议论文集》(第855-864页)。ACM。
[17] Guo,Y.,&Gu,S.(2011)。使用条件依赖网络的多标签分类。《国际人工智能联合会议论文集》,第22卷,第1300页。
[18] Hamilton,W.、Ying,Z.和Leskovec,J.(2017a)。大型图的归纳表示学习。《神经信息处理系统进展学报》,第1025-1035页。
[19] Hamilton,W.L.、Ying,R.和Leskovec,J.(2017b)。图的表示学习:方法和应用。ArXiv预打印ArXiv:1709.05584。
[20] Jin,W.、Barzilay,R.和Jaakkola,T.(2018年)。用于分子图生成的连接树变分自动编码器。ArXiv预打印ArXiv:1802.04364。
[21] Kingma,D.和Ba,J.(2014)。亚当:一种随机优化方法。ArXiv预打印ArXiv:1412.6980。
[22] Kipf,T.N.和Welling,M.(2016a)。图卷积网络半监督分类。ArXiv预印本ArXiv:1609.02907。
[23] Kipf,T.N.和Welling,M.(2016年b)。变分图自动编码器。ArXiv预打印ArXiv:1611.07308。
[24] Kong,X.和Philip,S.Y.(2012年)。gMLC:一个用于图分类的多标签特征选择框架。知识与信息系统,31(2),281-305。
[25] Lafferty,J.、McCallum,A.和Pereira,F.(2001年)。条件随机场:用于分割和标记序列数据的概率模型。《机器学习国际会议论文集》,第282-289页。
[26] Li,X.,&Guo,Y.(2015)。基于特征软件非线性标签空间变换的多标签分类。《国际人工智能联合会议论文集》,第2015卷,第3635-3642页。
[27] Li,Y.、Tarlow,D.、Brockschmidt,M.和Zemel,R.(2016)。门控图序列神经网络。在学习表征国际会议的会议记录中。
[28] Li,Y.、Vinyals,O.、Dyer,C.、Pascanu,R.和Battaglia,P.(2018年)。学习图形的深层生成模型。ArXiv预打印ArXiv:1803.03324。
[29] Madjarov,G.、Kocev,D.、Gjorgjevikj,D.和Díeroski,S.(2012)。多标签学习方法的广泛实验比较。模式识别,45(9),3084-3104。
[30] Mullard,A.(2014)。开发新药耗资26亿美元。《自然评论:药物发现》,13(12),877-877。
[31] Narayanan,A.、Chandramohan,M.、Venkatesan,R.、Chen,L.、Liu,Y.和Jaiswal,S.(2016)。graph2vec:学习图形的分布式表示。ArXiv预打印ArXiv:1707.05005。
[32] Niepert,M.、Ahmed,M.和Kutzkov,K.(2016年)。学习图的卷积神经网络。机器学习国际会议论文集。
[33] Perozzi,B.、Al-Rfou,R.和Skiena,S.(2014)。Deepwalk:社交表征的在线学习。《知识发现和数据挖掘国际会议论文集》(第701-710页)。ACM。
[34] Pham,T.、Tran,T.和Venkatesh,S.(2017年)。一刀切:用于多个学习的列束。ArXiv预印本ArXiv:17022.01。
[35] Pham,T.、Tran,T.和Venkatesh,S.(2018年)。用于分子活性预测的图形记忆网络。ArXiv预印ArXiv:1801.02622。
[36] Pham,T.、Tran,T.,Phung,D.和Venkatesh,S.(2017年)。用于集体分类的柱状网络。在人工智能AAAI会议记录中。
[37] Read,J.、Reutemann,P.、Pfahringer,B.和Holmes,G.(2016)。Meka:对Weka的多标签/多目标扩展。机器学习研究杂志,17(1),667-671·Zbl 1360.68708号
[38] Scarselli,F.、Gori,M.、Tsoi,A.C.、Hagenbuchner,M.和Monfardini,G.(2009年)。图形神经网络模型。IEEE神经网络汇刊,20(1),61-80。
[39] Schaefer,M.H.、Fontaine,J.-F.、Vinayagam,A.、Porras,P.、Wanker,E.E.和Andrade-Navarro,M.A.(2012年)。HIPPIE:将蛋白质相互作用网络与基于实验的质量分数相结合。公共科学图书馆综合版,7(2),e31826。
[40] Schlichtkrull,M.、Kipf,T.N.、Bloem,P.、van den Berg,R.、Titov,I.和Welling,M.(2017年)。用图卷积网络建模关系数据。ArXiv预打印ArXiv:1703.06103。
[41] Segler,M.H.S.、Kogej,T.、Tyrchan,C.和Waller,M.P.(2017年)。利用递归神经网络生成用于药物发现的聚焦分子库。ACS中央科学,4120-131。
[42] Shervashidze,N.、Schweitzer,P.、van Leeuwen,E.J.、Mehlhorn,K.和Borgwardt,K.M.(2011)。魏斯费勒-勒曼图核。机器学习研究杂志,12(9月),2539-2561·Zbl 1280.68194号
[43] Simonovsky,M.和Komodakis,N.(2018年)。图形:使用变分自动编码器生成小图形。ArXiv预打印ArXiv:1802.03480。
[44] Srivastava,R.K.、Greff,K.和Schmidhuber,J.(2015)。训练深度网络。《神经信息处理系统进展学报》,第2377-2385页。
[45] Sun,L.,Ji,S.,&Ye,J.(2011)。多标签分类的典型相关分析:最小二乘公式、扩展和分析。IEEE模式分析和机器智能汇刊,33(1),194-200。
[46] Takigawa,I.和Mamitsuka,H.(2017)。完整子图特征集上线性模型的广义稀疏学习。IEEE模式分析和机器智能汇刊,39(3),617-624。
[47] Teney,D.、Liu,L.和van den Hengel,A.(2017)。可视化问答的图形结构表示法。IEEE计算机视觉和模式识别会议论文集。
[48] Tsochantaridis,I.、Hofmann,T.、Joachims,T.和Altun,Y.(2004年)。支持相互依赖和结构化输出空间的向量机学习。《机器学习国际会议论文集》,第823-830页。
[49] Tsoumakas,G.和Vlahavas,I.(2007年)。随机k标签集:多标签分类的集成方法。《欧洲机器学习会议记录》,第406-417页。斯普林格。
[50] Tsoumakas,G.、Katakis,I.和Vlahavas,I..(2008年)。在具有大量标签的域中进行高效的多标签分类。《ECML/PKDD多维数据挖掘研讨会论文集》(第21卷,第53-59页)。锡。
[51] Tsoumakas,G.和Katakis,I.(2007年)。多标签分类:概述。国际数据仓库与挖掘杂志,3(3),1-13。
[52] Tsoumakas,G.、Spyromitros-Xioufis,E.、Vilcek,J.和Vlahavas,I.(2011年)。Mulan:一个用于多标签学习的java库。机器学习研究杂志,12(7月),2411-2414·Zbl 1280.68207号
[53] Wang,H.,Wang,J.,WangJ.,Zhao,M.,Zhang,W.,ZhangF.等人(2017年)。图形:利用生成性对抗网络进行图形表示学习。ArXiv预打印ArXiv:1711.08267。
[54] Wang,J.、Yang,Y.、Mao,J.,Huang,Z.、Huang、C.和Xu,W.(2016)。CNN-RNN:多标签图像分类的统一框架。《IEEE计算机视觉和模式识别会议论文集》,第2285-2294页。电气与电子工程师协会。
[55] Wei,Y.、Xia,W.、Lin,M.、Huang,J.、Ni,B.、Dong,J.等(2016)。HCP:用于多标签图像分类的灵活CNN框架。IEEE模式分析和机器智能汇刊,38(9),1901-1907。
[56] Xu,K.,Ba,J.、Kiros,R.、Cho,K.、Courville,A.、Salakhudinov,R.等人(2015)。展示、出席和讲述:用视觉注意力生成神经图像字幕。《机器学习国际会议论文集》,第2048-2057页。
[57] Yanardag,P.和Vishwanathan,S.V.N.(2015)。深度图形内核。第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集(第1365-1374页)。ACM。
[58] Yeh,C.-K.,Wu,W.-C.,Ko,W.-J.,&Wang,Y.-C.F.(2017)。学习多标签分类的深层潜在空间。《AAAI人工智能会议记录》,第2838-2844页。
[59] You,J.、Ying,R.、Ren,X.、Hamilton,W.L.和Leskovec,J.(2018)。Graphrnn:图形的深层生成模型。ArXiv预打印ArXiv:1802.08773。
[60] Zhang,D.,Yin,J.,Zhu,X.,&Zhang(2017)。网络表征学习:一项调查。ArXiv预印ArXiv:1801.05852。
[61] Zhang,M.-L.和Zhou,Z.-H.(2007)。ML-KNN:一种多标签学习的懒惰学习方法。模式识别,40(7),2038-2048·Zbl 1111.68629号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。