×

一种大型公共连通诱导子图的快速发现算法。 (英语) Zbl 1419.05140号

摘要:我们提出了一种快速算法来解决寻找公共子图这一经典问题,该算法有助于检测生物大分子之间的结构关系。虽然这个难题的成本可能很高,但与已知算法相比,我们的性能提高了几个数量级。我们通过对含有数千个原子的蛋白质的实验来验证我们的发现。

MSC公司:

05C60型 图论中的同构问题(重构猜想等)和同态问题(子图嵌入等)
05C35号 图论中的极值问题
05C90年 图论的应用
92比99 一般数学生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] Abu-Khzam,F.N.,顶点覆盖参数化的最大公共诱导子图,Inf.Process Lett。,114, 3, 99-103 (2014) ·Zbl 1284.68274号
[2] Akutsu,T。;Tamura,T.,计算有界度外平面图最大公共连通边子图的多项式时间算法,算法,6,1,119(2013)·Zbl 1461.68140号
[3] Artymiuk,P.J。;波雷特,A.R。;Grindley,H.M。;赖斯,D.W。;Willett,P.,《识别蛋白质结构中氨基酸侧链三维模式的图表理论方法》,《分子生物学杂志》。,243, 2, 327-344 (1994)
[4] Artymiuk,P.J。;斯普里格斯,R.V。;Willett,P.,《生物大分子结构关系分析的图论方法》,J.AM.Soc.Inf.Sci。技术。,56, 5, 518-528 (2005)
[5] 阿维斯,D。;Fukuda,K.,枚举反向搜索,离散应用。数学。,65, 1, 21-46 (1996) ·Zbl 0854.68070号
[6] 巴罗·H·G。;Burstall,R.M.,子图同构,匹配关系结构和最大团,Inf.过程。莱特。,4, 83-84 (1976) ·Zbl 0374.05043号
[7] Bonchev,D.,《化学图论:导论和基础》(1991),CRC·兹比尔074605063
[8] Breuker,D。;德尔夫曼,P。;迪特里希,H.-A。;Steinhorst,M.,《图论和模型集合管理:选定图形算法的概念框架和运行时分析》,Inf.Syst。电子商务管理。,13, 1, 69-106 (2015)
[9] 布林特,A.T。;Willett,P.,识别三维最大公共子结构的算法,J.Chem。Inf.计算。科学。,27, 4, 152-158 (1987)
[10] Bron,C。;Kerbosch,J.,《寻找无向图的所有团》(算法457),Commun。ACM,16575-576(1973年)·Zbl 0261.68018号
[11] Brun,L。;盖泽尔,B。;Fourey,S.,图编辑距离与最大公共未标记子图之间的关系(2012)
[12] 曹毅。;Charisi,A。;Cheng,L.C。;姜涛(Jiang,T.)。;Girke,T.,Chemminer:R的复合挖掘框架,生物信息学,24,15,1733-1734(2008)
[13] 曹毅。;姜涛(Jiang,T.)。;Girke,T.,搜索和预测类药物化合物的最大通用子结构算法,生物信息学,24,13,i366-i374(2008)
[14] 卡拉汉,R。;Pardalos,P.M.,最大团问题的精确算法,Oper。Res.Lett.公司。,9, 6, 375-382 (1990) ·Zbl 0711.90080号
[15] Cone,M.M。;Venkataraghavan,R。;McLafferty,F.W.,《识别最大共同亚结构的分子结构比较程序》,《美国化学杂志》。Soc.,99,23,7668-7671(1977年)
[16] Conte博士。;Foggia,P。;Vento,M.,《挑战最大公共子图检测算法的复杂性:三种算法在广泛图形数据库上的性能分析》,J.Graph algorithms Appl。,2007年11月1日,99-143·Zbl 1161.68846号
[17] A.Conte、R.Grossi、A.Marino、L.Tattini和L.Versari,大型公共连通诱导子图的快速算法,收录于:WEPA 2016:2016年11月21日至22日关于枚举问题和应用的第一次研讨会Aubiére(法国),2016。;A.Conte、R.Grossi、A.Marino、L.Tattini和L.Versari,大型公共连通诱导子图的快速算法,收录于:WEPA 2016:2016年11月21日至22日关于枚举问题和应用的第一次研讨会Aubiére(法国),2016。
[18] A.Conte、R.Grossi、A.Marino、L.Tattini和L.Versari,大型公共连通诱导子图的快速算法,in:计算生物学算法-第四届国际会议,2017年6月5日至6日,葡萄牙阿韦罗,《论文集》,第62-74页。;A.Conte、R.Grossi、A.Marino、L.Tattini和L.Versari,大型公共连通诱导子图的快速算法,收录于:计算生物学算法-第四届国际会议,2017年AlCoB,葡萄牙阿韦罗,2017年6月5日至6日,论文集,第62-74页。
[19] A.Conte,R.Grossi,A.Marino,L.Versari,《大规模网络分析的Sublinear空间有界延迟枚举:最大集团》,摘自:第43届自动化、语言和编程国际学术讨论会,2016年7月11日至15日,意大利罗马,2016年,第48:1-148:15页。;A.Conte,R.Grossi,A.Marino,L.Versari,《大规模网络分析的Sublinear空间有界延迟枚举:最大集团》,摘自:第43届自动化、语言和编程国际学术讨论会,2016年7月11日至15日,意大利罗马,2016年,第48:1-148:15页·Zbl 1388.68218号
[20] A.Conte,R.Grossi,A.Marino,L.Versari,通过时空高效反向搜索寻找最大公共子图,载于:第24届国际计算与组合数学会议,COCOON 2018,2018年7月2-4日,中国青岛,2018(正在出版)。;A.Conte,R.Grossi,A.Marino,L.Versari,通过时空高效反向搜索寻找最大公共子图,收录于:第24届国际计算与组合数学会议,COCOON 2018,2018年7月2-4日,中国青岛,2018(正在出版)·兹比尔1512.05299
[21] Cuissart,B。;Hébrard,J.-J.,找到两个图的最大公共连通诱导子图的直接算法,(模式识别中基于图的表示的国际研讨会(2005),Springer),162-171·Zbl 1119.68372号
[22] Droschinsky,A。;海涅曼,B。;Kriege,N。;Mutzel,P.,带多项式延迟的最大公共子树同构的枚举,算法与计算国际研讨会,81-93(2014),Springer·Zbl 1435.05105号
[23] 埃利希,H.C。;Rarey,M.,《最大公共子图同构算法及其在分子科学中的应用:综述》,Wiley Interdiscip。版次计算。分子科学。,1,1,68-79(2011年)
[24] Fober,T。;Mernberger,M。;Klebe,G。;Hllermier,E.,蛋白质结构比较的基于图形的方法,Wiley Interdiscip。版本数据最小知识。发现。,3, 5, 307-320 (2013)
[25] Gardiner,E.J。;Artymiuk,P。;Willett,P.,用于匹配三维分子结构的Clique-detection算法,J.摩尔图模型。,15, 245-253 (1997)
[26] 古普塔,A。;Nishimura,N.,《寻找最大子树和最小超树》,《算法》,21,2,183-210(1998)·Zbl 0896.68103号
[27] Holder,L.,《PDB-To-graph计划》(2015年)。(2016年5月4日访问)
[28] 黄,J。;Wang,W。;普林斯,J。;Yang,J.,Spin:从图数据库中挖掘最大频繁子图,Proc。第十届美国计算机学会SIGKDD,581-586(2004),美国计算机学会
[29] 黄,X。;赖,J。;Jennings,S.,最大公共子图:一些上限和下限结果,BMC生物信息学,7,Suppl 4,S6(2006)
[30] Kann,V.,关于最大公共子图问题的逼近性,(STACS’92的Proc.)。程序。STACS’92,Lect Notes Compute Sci(1992)),377-388·Zbl 1494.68196号
[31] Koch,I.,枚举两个图中的所有连通最大公共子图,Theoret。计算。科学。,250, 1, 1-30 (2001) ·Zbl 0952.68105号
[32] 科赫,I。;Lengauer,T。;Wanke,E.,《在一组蛋白质结构中寻找最大共同亚拓扑的算法》,J.Compute。《生物学》,3,2,289-306(1996)
[33] 克里西尼尔,E.B。;Henrick,K.,通过回溯搜索检测公共子图同构,Softw.-实际。实验,34,6,591-607(2004)
[34] 劳勒,E.L。;Lenstra,J.K。;Rinnooy Kan,A.H.G.,《生成所有最大独立集:np-hardeness和多项式时间算法》,SIAM J.Compute。,9, 3, 558-565 (1980) ·Zbl 0445.68054号
[35] 李维,G.,关于两个有向或无向图的最大公共子图的推导的注记,CALCOLO,9,4,341-352(1973)·Zbl 0261.05132号
[36] Mcgregor,J.J.,回溯搜索算法与最大公共子图问题,软件实践与经验12,23-34(1982)·Zbl 0466.68053号
[37] 哦,M。;山田,T。;服务端,M。;Goto,S。;Kanehisa,M.,酶催化反应模式的系统分析和微生物生物降解途径的预测,化学杂志。信息模型。,47, 4, 1702-1712 (2007)
[38] Raymond,J.W。;Gardiner,E.J。;Willett,P.,Rascal:使用最大公共边子图计算图形相似性,计算。J.,452002(2002)·Zbl 1037.68101号
[39] Sheridan,R.P。;Kearsley,S.K.,为什么我们需要这么多化学相似性搜索方法?,药物研发。今天,7,17,903-911(2002)
[40] Suters,W.H。;Abu-Khzam,F.N。;Zhang,Y。;Symons,C.T。;萨马托娃,N.F。;Langston,M.A.,最大公共子图问题的一种新方法和更快的精确方法,(计算组合(2005)),717-727·Zbl 1128.05308号
[41] Ullmann,J.R.,子图同构的算法,J.ACM,23,1,31-42(1976)·Zbl 0323.05138号
[42] 范伯洛,R.J.P。;温特巴赫,W。;De Groot,M.J.L。;Bender,A。;Verheijen,P.J.T。;Reinders,M.J.T。;de Ridder,D.,基于最大公共子图的化合物相似性的有效计算及其在基因转录水平预测中的应用,国际生物信息学研究应用杂志。,9, 4, 407-432 (2013)
[43] Versari,L.,Ricerca veloce di pattern comuni a due grafi(2015),比萨大学:比萨大学,(意大利语)
[44] 维斯马拉,P。;Valery,B.,使用团检测或约束满足算法寻找最大公共连通子图,(信息系统和管理科学中的建模、计算和优化(2008)),358-368·兹比尔1160.90681
[45] Wang,T。;周,J.,Emcss:最大公共子结构搜索的新方法,J.Chem。Inf.计算。科学。,37, 5, 828-834 (1997)
[46] R.Welling,《最大公共子图算法的性能分析》,载于:第15届第二十届IT学生会议,荷兰,联合国。特温特出版社,2011年。;R.Welling,《最大公共子图算法的性能分析》,载于:第15届第二十届IT学生会议,荷兰,联合国。特温特出版社,2011年。
[47] 袁,Y。;王,G。;Chen,L。;Wang,H.,大型不确定图形数据库的图形相似性搜索,VLDB J.,24,2,271-296(2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。