×

基于拓扑和标签属性的有效图分类。 (英语) Zbl 07260330号

摘要:图分类是一项重要的数据挖掘任务,最近针对这项任务提出了各种图核方法。这些方法已被证明是有效的,但它们往往具有较高的计算开销。本文提出了一种基于不同全局拓扑属性构造的特征向量和全局标签特征的图分类方法。主要思想是来自同一类的图应该具有相似的拓扑和标签属性。我们的方法简单且易于实现,通过对实际基准数据集的详细比较,我们表明,我们的基于拓扑和标记特征的方法提供了具有竞争力的分类精度,在那些具有大量未标记图形实例的数据集上的结果明显更好。我们的方法也比大多数其他图内核快得多。

MSC公司:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] T.Joachims、T.Hofmann、Y.Yue和C.-N.Yu,用支持向量机预测结构化对象,Commun ACM 52(11)(2009),97-104。
[2] L.Ralaivola、S.J.Swamidass、H.Saigo和P.Baldi,《化学信息学的图形内核》,神经网络18(2005),1093-1110。
[3] P.Mah’e和J.-P.Vert,《基于分子树模式的图形核》,《马赫学习》第75卷第1期(2009年),第3-35页·Zbl 1473.68154号
[4] K.M.Borgwardt、C.S.Ong、S.Sch¨onauer、S.V.N.Vishwanathan、A.J.Smola和H.P.Kriegel,通过图核预测蛋白质功能,In ISMB(生物信息学补充),2005年,47-56。
[5] C.Bilgin、C.Demir、C.Nagi和B.Yener,乳腺组织建模和分类的细胞纹理挖掘,第29届IEEE医学和生物学会工程国际年会,2007年,5311-5314。
[6] B.Scholkopf和A.J.Smola,《使用内核学习:支持向量机、正则化、优化和超越》,马萨诸塞州剑桥,麻省理工学院出版社,2001年。
[7] V.N.Vapnik,《统计学习理论的本质》,纽约,斯普林格·弗拉格出版社,1995年·Zbl 0833.62008号
[8] T.G¨artner、P.Flach和S.Wrobel,《图形核:硬结果和有效替代方案》,第16届计算学习理论年会,2003年,129-143·Zbl 1274.68312号
[9] H.Kashima、K.Tsuda和A.Inokuchi,标记图之间的边缘化核,机器学习国际会议,2003年,321-328。
[10] K.M.Borgwardt和H.-P.Kriegel,图上最短路径核,第五届IEEE数据挖掘国际会议,华盛顿特区,2005年,74-81。
[11] T.Horv’ath、T.G¨artner和S.Wrobel,预测图挖掘的循环模式核,第十届ACM SIGKDD知识发现和数据挖掘国际会议,2004,158-167。
[12] J.Ramon和T.G¨artner,图核的表达性与效率,第1届挖掘图、树和序列国际研讨会,2003年。
[13] N.Shervashidze和K.M.Borgwardt,图上的快速子树核,神经信息处理系统进展,2009年,1660-1668。
[14] N.Shervashidze、S.V.Vishwanathan、T.H.Petri、K.Mehlhorn和K.M.Borgwardt,《用于大型图形比较的高效graphlet内核》,第12届国际
[15] I.R.Kondor、N.Shervashidze和K.M.Borgwardt,《石墨波频谱》,机器学习国际会议,第382卷,A.P.Danyluk、L.Bottou和M.L.Littman编辑,2009年,第67页。
[16] M.Thoma、H.Cheng、A.Gretton、J.Han、H.-P.Kriegel、A.Smola、L.Song、P.S.Yu、X.Yan和K.M.Borgwardt,《具有最优保证的判别频繁子图挖掘》,《统计分析数据挖掘》3(5)(2010),302-318·兹比尔07260252
[17] S.V.N.Vishwanathan、K.M.Borgwardt和N.N.Schraudolph,图核的快速计算,神经信息处理系统,B.Sch¨olkopf、J.Platt和T.Hoffman编辑,马萨诸塞州剑桥,麻省理工学院出版社,2006年,1449-1456。
[18] I.R.Kondor和J.Lafferty,图和其他离散结构上的扩散核,机器学习国际会议,2002年,315-322。
[19] G.Li、M.Semerci、B.Yener和M.J.Zaki,通过拓扑和标签属性进行图形分类,第九届图形挖掘和学习研讨会(含SIGKDD),2011年。
[20] P.Mahé,N.Ueda,T.Akutsu,J.-L.Perret,和J.-P.Vert,边缘化图核的扩展,在机器学习国际会议上,2004年。
[21] S.V.N.Vishwanathan、N.N.Schraudolph、I.R.Kondor和K.M.Borgwardt,《图形内核》,J Mach Learn Res 11(2010),1201-1242·Zbl 1242.05112号
[22] X.Yan和J.Han,gspan:基于图的子结构模式挖掘,IEEE数据挖掘国际会议,2002年。
[23] C.Meyer,《矩阵分析与应用线性代数》,宾夕法尼亚州费城,SIAM,2000年·Zbl 0962.15001号
[24] Z.Bai、J.Demmel、J.Dongarra、A.Ruhe和H.Vorst,《代数特征值问题求解模板:实用指南》,费城,SIAM,2000年·Zbl 0965.65058号
[25] S.Nijssen和J.Kok,《频繁结构挖掘的快速入门可以带来变化》,《2004年ACM SIGKDD知识发现和数据挖掘国际会议论文集》,2004年,647-652。
[26] E.Jones,T.Oliphant,P.Peterson等人。SciPy:Python的开源科学工具,2001年。可在网址://www。scipy.org。
[27] A.A.Hagberg、D.A.Schult和P.J.Swart,《使用NetworkX探索网络结构、动力学和功能》,《第七届科学会议Python会议论文集》(SciPy2008),加利福尼亚州帕萨迪纳,2008年,11-15。
[28] C.-C.Chang和C.-J.Lin,LIBSVM:支持向量机库,ACM Trans Intell Syst Technol 2(2011),27:1-27:27。软件可在http://www.csie.ntu.edu。tw/~cjlin/libsvm。
[29] A.Debnath、R.L.de Compadre、G.Debnath、A.Shusterman和C.Hansch,致突变芳香硝基化合物的构效关系。与分子轨道能量和疏水性的相关性,《医学化学杂志》34(1991),786-797。
[30] N.Wale和G.Karypis,《化合物检索和分类描述符空间的比较》,IEEE数据挖掘国际会议,2006年。
[31] P.Dobson和A.J.Doig,区分酶结构和非酶结构,《分子生物学杂志》330(4)(2003),771-783。
[32] C.C.Bilgin、P.Bullough、G.E.Plopper和B.Yener,用于骨组织建模和分类的Ecm-aware细胞颗粒挖掘,《数据挖掘知识发现》20(2010),416-438。
[33] C.Demir、S.H.Gultekin和B.Yener,《学习脑肿瘤的拓扑特性》,IEEE/ACM Trans-Comput Biol Bioinform 2(3)(2005),262-270。
[34] I.Guyon、J.Weston、S.Barnhill和V.Vapnik,使用支持向量机进行癌症分类的基因选择,《马赫学习》46(1)(2002),389-422·Zbl 0998.68111号
[35] L.Lov´asz和K.Vesztergombi,图的几何表示,Paul Erdos和他的数学,1999年。
[36] U.Brandes和D.Fleischer,基于当前流量的中央计量,STACS 2005,2005,533-544·Zbl 1118.90302号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。