×

利用多层信息迭代预测蛋白质功能。 (英语) Zbl 1244.92025号

摘要:基于相似性的计算方法是从蛋白质相互作用(PPI)数据集预测蛋白质功能的有用工具。虽然提出了各种基于相似性的预测算法,但在许多情况下,预测结果并不令人满意。这种算法的目的是根据与未标记蛋白质相似的蛋白质的功能来预测未标记蛋白质的功能。因此,预测质量在很大程度上取决于如何选择一组合适的蛋白质(即预测域),从中预测未标记蛋白质的功能,以及如何测量蛋白质之间的相似性。现有算法的另一个问题是,他们只认为函数预测是一个一次性的过程,忽略了蛋白质之间的相互作用在预测函数时是相互的和动态的。如何解决这些主要问题以提高预测质量仍然是计算生物学中的一个挑战。
我们提出了一种创新的方法,从PPI数据集迭代预测未标记蛋白质的蛋白质功能。迭代法在预测功能时考虑了蛋白质相互作用的相互和动态特征,通过在预测算法中引入一种新的语义蛋白质相似度和一种选择多层预测域的方法,解决了蛋白质相似性度量和预测域选择问题。新的蛋白质相似性是基于蛋白质功能所携带的多层信息。对真实蛋白质相互作用数据集进行的评估表明,所提出的迭代函数预测方法优于其他类似或非迭代方法,并提供了更好的预测结果。
由蛋白质功能的多层信息衍生出的新的蛋白质相似性更合理地反映了蛋白质之间的内在关系,通过将蛋白质相互作用的相互和动态特征纳入预测算法,可以显著提高预测质量。

MSC公司:

92C40型 生物化学、分子生物学
92-08 生物学问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul,S.F。;Gish,W。;Miller,W。;Myers,W。;Lipman,D.J.,基本局部对齐搜索工具,J.Mol.Biol。,215, 403 (1990)
[2] Pearson,W.R.,与FASTP和FASTA的快速和敏感序列比较,酶学方法。,183, 63 (1990)
[3] 佩纳-卡斯蒂略,L。;塔桑,M。;Myers,C.L.,《利用综合基因组证据对小家鼠基因功能预测的关键评估》,《基因组生物学》,9,Suppl 1,S2(2008)
[4] Wachi,S。;Yoneda,K.公司。;Wu,R.,相互作用转录组分析揭示了肺癌组织差异表达基因的高度集中性,生物信息学。,21, 4205 (2005)
[5] 北卡罗来纳州西蒙尼斯。;van Helden,J。;科恩,G.N。;Wodak,S.J.,酵母中蛋白质复合物的转录调控,基因组生物学。,5,R33(2004)
[6] 凯利,R。;Ideker,T.,《利用蛋白质网络系统解释遗传相互作用》,《自然生物技术》。,23, 561 (2005)
[7] 卢·L·J。;夏,Y。;A.帕卡纳。;Yu,H。;Gerstein,M.,《评估基因组数据集成预测蛋白质网络的极限》,《基因组研究》,第15期,第945页(2005年)
[8] 邓,M。;张凯。;梅塔,S。;Chen,T。;Sun,F.,利用蛋白质相互作用数据预测蛋白质功能,J.Comp。《生物学》,10947(2003)
[9] Schwikowski,B。;Uetz,P。;Fields,S.,《酵母相互作用蛋白质网络》,《自然生物技术》。,18, 1257 (2000)
[10] 莱托夫斯基,S。;Kasif,S.,《从蛋白质/蛋白质相互作用数据预测蛋白质功能:一种概率方法》,生物信息学,19,补充1,i197(2003)
[11] A.巴斯克斯。;弗拉米尼,A。;Maritan,A。;Vespignani,A.,《从蛋白质相互作用网络预测全球蛋白质功能》,《自然生物技术》。,21 (2003), 697-670
[12] Hishigaki,H。;Nakai,K。;小野,T。;Tanigami,A。;Takagi,T.,《从蛋白质相互作用数据评估蛋白质功能的预测准确性》,《酵母》,18523(2001)
[13] Chua,H.N。;Sung,W.K。;Wong,L.,利用间接邻域和拓扑权重从蛋白质-蛋白质相互作用预测蛋白质功能,生物信息学。,22, 1623 (2006)
[14] Bader,G。;Hogue,C.,《在大型蛋白质相互作用网络中发现分子复合物的自动化方法》,BMC生物信息学。,4, 2 (2003)
[15] 斯普林,V。;Mirny,L.A.,分子网络中的蛋白质复合物和功能模块,美国国家科学院院刊。,100, 12123 (2003)
[16] Pereira-Leal,J.B。;恩赖特,A.J。;Ouzounis,C.A.,从蛋白质相互作用网络检测功能模块,蛋白质。,54, 49 (2004)
[17] 邓恩(Dunn,R.)。;Dudbridge,F。;Sanderson,C.,《利用边-间聚类研究蛋白质相互作用网络中的生物功能》,BMC生物信息学。,6, 39 (2005)
[18] Samanta,M.P。;Liang,S.,从大规模蛋白质相互作用网络中的冗余预测蛋白质功能,国家科学院院刊。,100, 12579 (2003)
[19] 阿尔诺,V。;马尔斯,S。;Marn,I.,蛋白质相互作用数据的迭代聚类分析,生物信息学。,21, 364 (2005)
[20] Rives,A.W。;Galitski,T。;网络,蜂窝的模块化组织,国家科学院院刊,1001128(2003)
[21] Ruepp,A。;Zollner,A。;Maier,D.,全基因组蛋白质系统分类的功能注释方案,核酸研究,32,5539(2004)
[22] 朱伟。;Hou,J。;Chen,Y-P.P.,PPI网络的语义和分层蛋白质功能预测,理论生物学杂志,267129(2010)·Zbl 1410.92041号
[23] Kiritchenko,S。;马特温,S。;Famili,F.,《使用层次文本分类的基因功能注释》,Proc。BioLINK SIG:链接生物学文献、信息和知识。(2005)
[24] Misteli,T.,蛋白质动力学对核结构和基因表达的影响,《科学》,291843(2001)
[25] Lin,D.,相似性的信息理论定义,第十五届机器学习国际会议论文集,296(1998)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。