×

PPI网络中基于多重拓扑特征的蛋白质复合物检测算法。 (英语) Zbl 1453.92110号

摘要:从现有的蛋白质相互作用(PPI)网络中检测蛋白质复合体是一项重要任务,并且已经提出了一些相关算法。这些算法通常只考虑单个拓扑度量,而忽略了蛋白质复合体丰富的拓扑特征和固有的组织信息。然而,有效利用这些信息对蛋白质复合物检测至关重要。为了克服这一不足,本研究提出了一种启发式聚类算法,通过充分利用PPI网络的拓扑信息来识别蛋白质复合物。通过考虑聚类系数和节点度,提出了一种新的节点度量来量化局部子图中每个节点的重要性。迭代范式用于增量识别种子蛋白质并将每个种子扩展到一个簇。首先,在未聚类的节点中,选择节点度量最高的节点作为新种子。然后,根据簇的密度和候选节点与簇之间的连接,通过从相邻节点递归添加候选节点,将种子扩展为簇。实验结果表明,该算法在F测度和精度方面优于其他同类算法。

MSC公司:

92C40型 生物化学、分子生物学
92立方厘米 系统生物学、网络
54小时99 一般拓扑与其他结构、应用程序的连接
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿达姆塞克,B。;帕拉,G。;I.J.Farkas。;德雷尼,I。;Vicsek,T.,Cfinder:在生物网络中定位集团和重叠模块,生物信息学,22,8,1021-1023(2006)
[2] 阿加瓦尔,C.C。;Reddy,C.K.,《数据聚类:算法和应用》(2013),CRC出版社
[3] Altaf-Ul-Amin,M。;Y.Shinbo。;Mihara,K。;Kurokawa,K。;Kanaya,S.,大型相互作用网络中蛋白质复合物检测算法的开发与实现,BMC生物信息。,7, 1, 207 (2006)
[4] 巴德,G.D。;Hogue,C.W.,《在大型蛋白质相互作用网络中发现分子复合物的自动化方法》,BMC Bioninform。,4, 1, 1 (2003)
[5] Bai,L。;Cheng,X。;梁,J。;Guo,Y.,基于新描述模型的快速图聚类社区检测,Inf.Sci。,388, 37-47 (2017)
[6] Barabási,A.-L。;Albert,R.,《随机网络中尺度的出现》,《科学》,286,5439,509-512(1999)·Zbl 1226.05223号
[7] 博米克,S。;Seah,B.S.,蛋白质-蛋白质相互作用网络的聚类和总结:一项调查,IEEE Trans。知识。数据工程,28,3,638-658(2016)
[8] Brohee,S。;Van Helden,J.,蛋白质相互作用网络的聚类算法评估,BMC生物信息。,7, 1, 1 (2006)
[9] 曹,B。;罗,J。;Liang,C。;王,S。;Song,D.,Moepga:一种基于多目标进化规划遗传算法的检测酵母蛋白质相互作用网络中蛋白质复合体的新方法,计算。生物化学。,58, 173-181 (2015)
[10] 迪米特拉科普洛斯,C。;Theofilatos,K。;Pegkas,A。;Likothanasis,S。;Mavroudi,S.,通过逐渐扩展密集邻域从加权蛋白质相互作用图预测重叠蛋白质复合体,Artif。智力。医学,71,62-69(2016)
[11] 加文,A.-C。;阿洛伊,P。;格兰迪,P。;克劳斯,R。;Boesche,M。;Marzioch,M。;劳,C。;Jensen,L.J。;南卡罗来纳州巴斯塔克。;Dümpelfeld,B.,《蛋白质组调查揭示酵母细胞机械的模块性》,《自然》,4407084631-636(2006)
[12] 加文,A.-C。;伯舍,M。;克劳斯,R。;格兰迪,P。;Marzioch,M。;Bauer,A。;舒尔茨,J。;瑞克·J·M。;A.-M.Michon。;Cruciat,C.-M.,《通过蛋白质复合物的系统分析实现酵母蛋白质组的功能组织》,《自然》,4156868141-147(2002)
[13] Girvan,M。;Newman,M.E.J.,《社会和生物网络中的社区结构》,Proc。国家。阿卡德。科学。美国,99,12,7821-7826(2002)·Zbl 1032.91716号
[14] Huttlin,E.L。;R.J.布鲁克纳。;Paulo,J.A。;坎农,J.R。;Ting,L。;Baltier,K。;科尔比,G。;Gebreab,F。;吉吉,M.P。;Parzen,H.,《人类相互作用组的结构定义了蛋白质群落和疾病网络》,《自然》,545,7655,505-509(2017)
[15] 伊藤,T。;千叶,T。;小泽一郎。;吉田,M。;服务端,M。;Sakaki,Y.,探索酵母蛋白相互作用组的综合双杂交分析,Proc。国家。阿卡德。科学。,98, 8, 4569-4574 (2001)
[16] 江,P。;Singh,M.,Spici:大型生物网络的快速聚类算法,生物信息学,26,8,1105-1111(2010)
[17] Keretsu,S。;Sarmah,R.,加权边缘聚类法,用于识别蛋白质相互作用网络中结合基因表达谱的蛋白质复合物,计算。生物化学。,65, 69-79 (2016)
[18] Keskin,O。;Tuncbag,N。;Gursoy,A.,从分子到蛋白质组水平预测蛋白质-蛋白质相互作用,化学。版本:116、8、4884(2016)
[19] 库萨尔,M。;Zare-Mirakabad,F。;Jamali,Y.,Wcoach:加权PPI网络中的蛋白质复合物预测,基因遗传学。系统。,90, 5, 317-324 (2015)
[20] 新泽西州克罗根。;卡格尼,G。;Yu,H。;钟,G。;郭,X。;Ignatchenko,A。;李,J。;Pu,S。;北达特塔。;Tikuisis,A.P.,《酿酒酵母中蛋白质复合物的全球景观》,《自然》,440,7084,637-643(2006)
[21] 雷,X。;Liang,J.,检测动态PPI网络中蛋白质复合物的基于邻域亲和力的核心连接方法,分子,22,7,1223(2017)
[22] Leung,H.C。;向,Q。;Yiu,S.-M。;Chin,F.Y.,《从PPI数据预测蛋白质复合物:核心连接方法》,J.Compute。生物学,16,2,133-144(2009)
[23] 李,M。;Chen,J.-e。;王,J.-x。;胡,B。;Chen,G.,基于新拓扑结构改进DPClus算法识别蛋白质复合物,BMC生物信息。,9, 1, 1 (2008)
[24] 李,X。;吴,M。;Kwoh,C.-K。;Ng,S.-K.,《从蛋白质相互作用网络检测蛋白质复合物的计算方法:调查》,BMC基因组学,11,1,1(2010)
[25] Liu,G.,加权PPI网络的复杂发现,生物信息学,25,15,1891(2009)
[26] 刘,X。;杨,Z。;Zhou,Z。;孙,Y。;Lin,H。;Wang,J。;Xu,B.,蛋白质相互作用网络特征对计算复杂检测方法的影响,J.Theor。生物学,439,141-151(2018)
[27] 马,X。;Gao,L.,使用基于图连通性的核心连接算法预测蛋白质相互作用网络中的蛋白质复合物,信息科学。,189233-254(2012年)
[28] 马什,J.A。;Hernndez,H。;霍尔,Z。;阿赫内特,S.E。;佩里卡,T。;罗宾逊,C.V。;Teichmann,S.A.,蛋白质复合物正在进化选择中,通过有序路径组装,《细胞》,153,2,461-470(2013)
[29] Nepusz,T。;Yu,H。;Paccanaro,A.,《检测蛋白质相互作用网络中重叠的蛋白质复合物》,《自然方法》,9,5,471-472(2012)
[30] Orchard,S。;Kerrien,S。;阿巴尼,S。;阿兰达,B。;Bhate,J。;Bidwell,S。;桥梁,A。;布里甘蒂,L。;Brinkman,F.S。;Cesareni,G.,《蛋白质相互作用数据管理:国际分子交换(imex)联盟》,《自然方法》,9,4,345(2012)
[31] 彭,W。;Wang,J。;赵,B。;Wang,L.,使用加权pagerank-nibble算法和核心连接结构识别蛋白质复合物,IEEE/ACM Trans。计算。生物信息学。,179-192年12月1日(2015年)
[32] Pereira-Leal,J.B。;恩赖特,A.J。;Ouzounis,C.A.,从蛋白质相互作用网络中检测功能模块,蛋白质结构。功能。生物信息。,54, 1, 49-57 (2004)
[33] Pu,S。;Wong,J。;特纳,B。;Cho,E。;Wodak,S.J.,酵母蛋白复合物的最新目录,核酸研究,37,3,825(2009)
[34] 斋月,E。;Naef,A。;Ahmed,M.,使用遗传算法预测蛋白质相互作用网络中的蛋白质复合体,BMC Bioninform。,17, 7, 269 (2016)
[35] Saxena,A。;Prasad,M。;古普塔,A。;巴里尔,N。;帕特尔,O.P。;Tiwari,A。;Er,M.J。;丁·W。;Lin,C.-T.,聚类技术与发展综述,神经计算,267664-681(2017)
[36] Shih,Y.-K。;Parthasarathy,S.,通过重叠马尔可夫聚类识别交互网络中的功能模块,生物信息学,28,18,473-479(2012)
[37] 斯普林,V。;Mirny,L.A.,《分子网络中的蛋白质复合物和功能模块》,Proc。国家。阿卡德。科学。,100, 21, 12123-12128 (2003)
[38] 斯塔克,C。;Breitkreutz,B.-J。;Reguly,T。;Boucher,L。;Breitkreutz,A。;Tyers,M.,《生物网格:交互数据集的通用存储库》,《核酸研究》,第34期,第1535-539页(2006年)
[39] Tong,A.H.Y。;德雷斯,B。;Nardelli,G。;巴德,G.D。;Brannetti,B。;卡斯塔尼奥利。;Evangelista,M。;Ferracuti,S。;B.纳尔逊。;Paoluzi,S.,为肽识别模块定义蛋白质相互作用网络的综合实验和计算策略,《科学》,295553321-324(2002)
[40] Wang,J。;郑伟。;钱,Y。;Liang,J.,蛋白质相互作用网络中蛋白质复合物检测的种子展开图聚类方法,Molecules,22,121179(2017)
[41] Watts,D.J。;Strogatz,S.H.,《小世界网络的集体动力学》,《自然》,393,6684,440-442(1998)·Zbl 1368.05139号
[42] 黄,J.J。;Gleich,D.F。;Dhillon,I.S.,使用邻居膨胀种子扩展的重叠社区检测,IEEE Trans。知识。数据工程,28,5,1272-1284(2016)
[43] 吴昌杰。;Hamada,M.S.,《实验:规划、分析和优化》,第552卷(2011年),John Wiley&Sons
[44] 吴,M。;李,X。;Kwoh,C.-K。;Ng,S.-K.,一种基于核连接的检测PPI网络中蛋白质复合物的方法,BMC生物信息学,10,1,1(2009)
[45] 塞纳里奥斯,I。;Salwinski,L。;段晓杰。;Higney,P。;Kim,S.-M。;Eisenberg,D.,Dip,《相互作用蛋白质数据库:研究蛋白质相互作用细胞网络的研究工具》,《核酸研究》,30,1,303-305(2002)
[46] Zaki,N。;埃菲莫夫·D。;Berengueres,J.,使用相互作用可靠性评估和加权聚类系数的蛋白质复合物检测,BMC Bioinform。,14, 1, 163 (2013)
[47] 扎宁,M。;Papo,D。;Sousa,P.A。;Menasalvas,E。;Nicchi,A。;库比克,E。;Boccaletti,S.,《将复杂网络与数据挖掘相结合:原因与方法》,Phys。代表,635,1-44(2016)
[48] 赵,B。;Wang,J。;李,M。;Wu,F.-X。;Pan,Y.,基于不确定图模型的蛋白质复合物检测,IEEE/ACM Trans。计算。生物信息学。,11, 3, 486-497 (2014)
[49] 赵,J。;雷,X。;Wu,F.X.,基于ICSC预测加权动态PPI网络中的蛋白质复合物,复杂性,2017,2017,4120506(2017)·Zbl 1373.92054号
[50] X.赵。;曹,F。;Liang,J.,混合数据的序列集成聚类生成算法,应用。数学。计算。,335, 264-277 (2018) ·Zbl 1427.68280号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。