×

蛋白质空间:一种实现蛋白质宇宙本质的自然方法。 (英文) Zbl 1406.92224号

总结:目前的方法无法告诉我们蛋白质宇宙的具体性质。它们基于氨基酸替代和多序列比对的不同模型,这是一个NP-hard问题,需要人工干预。蛋白质结构分析也为绘制蛋白质世界提供了方向。不幸的是,现在只知道蛋白质三维结构的一小部分。此外,系统发育树表示对于任何现有的树构建方法来说都不是唯一的。在这里,我们开发了一种新的方法来认识蛋白质宇宙的本质。我们表明,利用基于氨基酸归一化分布的距离,可以将蛋白质宇宙实现为60维欧氏空间中的蛋白质空间。每个蛋白质都与蛋白质空间中的一个点一一对应,在这个点上,具有相似性质的蛋白质保持在一起。因此,蛋白质空间中两点之间的距离表示相应两个蛋白质的生物距离。我们还提出了一种用于推断系统发育的自然图形表示。基于蛋白质在蛋白质空间中的生物距离,这种表示是自然和独特的。这将解决蛋白质如何在蛋白质宇宙中分布的基本问题。

MSC公司:

92C40型 生物化学、分子生物学
92D20型 蛋白质序列,DNA序列
92D15型 与进化有关的问题
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul,S.F。;卡罗尔·R·J。;Lipman,D.J.,基本局部对齐搜索工具,J.Mol.Biol。,215, 403-410 (1990)
[2] Backeljau,T.等人。;De Bruyn,L。;De Wolf,H。;Jordaens,K。;Van Dongen,S.,《Multiple UPGMA and neighbor-joining trees and the performance of some computer packages》,分子生物学。演变。,13, 2, 309-313 (1996)
[3] 贝特曼,A。;硬币,L。;杜宾,R。;R·D·芬恩。;Hollich,V.,《Pfam蛋白质家族数据库》,《核酸研究》,32,第1版,D138-D141(2004)
[4] 伯曼,H.M。;韦斯特布鲁克,J。;Z.Feng。;Gilliland,G。;Bhat,T.N.,蛋白质数据库,核酸研究,28,1,235-242(2000)
[5] Buneman,P.,《关于树的度量属性的注记》,J.Combin,Theory Ser。B、 17、48-50(1974)·兹标0286.05102
[6] Chen,C.,用伪氨基酸组成和支持向量机融合网络预测蛋白质结构类,Ana。生物化学。,357, 116-121 (2006)
[7] Chen,C.,利用Chou的伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein Pept。莱特。,16, 27-31 (2009)
[8] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性。,蛋白质:结构。功能。遗传学。(勘误表:同上,第44、60卷),第43、246-255页(2001年)
[9] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[10] Chou,K.C。;Shen,H.B.,《评论:开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,2, 63-92 (2009)
[11] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[12] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[13] Corpet,F。;仆人,F。;Gouzy,J。;Kahn,D.,ProDom和ProDom-CG:蛋白质域分析和全基因组比较工具,核酸研究,28,267-269(2000)
[14] 邓,M。;Yu,C。;梁,Q。;He,R.L。;Yau,S.S.-T.,表征基因序列的新方法:具有生物距离的基因组空间和应用,《公共科学图书馆·综合》,6,3,e17293(2011)
[15] 丁,H.,利用周氏两亲性伪氨基酸组成预测细胞壁裂解酶,蛋白质Pept。莱特。,16, 351-355 (2009)
[16] Ding,H.,用改进的马氏判别算法和伪氨基酸组成识别高尔基体蛋白类型,protein Pept。莱特。,18, 58-63 (2011)
[17] 丁Y.S。;Zhang,T.L.,使用周的伪氨基酸组成预测凋亡蛋白的亚细胞定位:基于免疫遗传算法的集成分类器的方法,模式识别。莱特。,29, 1887-1892 (2008)
[18] 北卡罗来纳州多科利安。;Shakhnovich,B。;Shakhnovich,E.I.,《从生物大爆炸中扩展蛋白质宇宙及其起源》,Proc。国家。阿卡德。科学。美国,99,14132-14136(2002)
[19] 杜,P。;曹,S。;Li,Y.,SubChlo:利用伪氨基酸成分和循证K-最近邻(ET-KNN)算法预测蛋白质亚叶绿体位置,J.Theor。生物学,261330-335(2009)·Zbl 1403.92063号
[20] Esmaeili,M.,使用周的伪氨基酸组成概念预测人类乳头瘤病毒的风险类型,J.Theor。生物学,263203-209(2010)·Zbl 1406.92455号
[21] Fan,G.L。;Li,Q.Z.,通过将伪平均化学位移纳入周氏伪氨基酸组成的一般形式,预测分枝杆菌蛋白质的亚细胞位置,J.Theor。生物,304,88-95(2012)·Zbl 1397.92186号
[22] Fang,Y.,《预测DNA结合蛋白:从周的伪氨基酸组成和其他特定序列特征探讨》,《氨基酸》,34,103-109(2008)
[23] 惠誉,W.M。;Margoliash,E.,《系统发育树的构建》,《科学》,155279-284(1967)
[24] Gao,Q.B.,通过融合不同形式的伪氨基酸成分提高外膜蛋白的识别能力,Ana。生物化学。,398, 52-59 (2010)
[25] Georgiou,D.N.,《使用模糊聚类技术和矩阵对氨基酸进行分类及其对周氏伪氨基酸组成的影响》,J.Theor。生物学,257,17-26(2009)·Zbl 1400.92393号
[26] Gu,Q.,使用具有近似熵和疏水性模式的Chou伪氨基酸组成预测低同源性的G-蛋白质偶联受体类别,Protein Pept。莱特。,17, 559-567 (2010)
[27] 郭,J.,使用周的伪氨基酸组成概念预测蛋白质折叠速率,J.Comp。化学。,32, 1612-1617 (2011)
[28] 海亚特,M。;Khan,A.,基于Chou的PseAAC,Protein Pept的一般形式,使用模糊K-最近邻算法识别外膜蛋白。莱特。,19, 411-421 (2012)
[29] 霍尔姆,L。;Sander,C.,绘制蛋白质宇宙,科学,273595-602(1996)
[30] Hu,L.,通过结合一系列蛋白质生物学特性,使用伪氨基酸组成预测蛋白酶家族,protein Pept。莱特。,18, 552-558 (2011)
[31] J.H.Hurley。;A.C.牛顿。;帕克·P·J。;Blumberg,P.M。;Nishizuka,Y.,C1蛋白激酶C同源结构域的分类和功能,蛋白质科学。,6, 477-480 (1997)
[32] 雅罗斯基,L。;Li,Z。;Krishna,S.S。;巴科利察,C。;Wooley,J.,《蛋白质宇宙未知区域的探索》,《公共科学图书馆·生物学》。,7、9、e1000205(2009)
[33] Jiang,X.,利用Chou伪氨基酸组成的概念预测凋亡蛋白的亚细胞位置:一种近似熵的方法,蛋白质肽。莱特。,15, 392-396 (2008)
[34] Jiang,X.,使用基于近似熵的Chou伪氨基酸组成和AdaBoost分类器集合预测蛋白质亚核位置,《氨基酸》,34,669-675(2008)
[35] Kandaswamy,K.K.,通过一种新的伪氨基酸组成模式protein Pept,用遗传算法和支持向量机预测凋亡蛋白位置。莱特。,17, 1473-1479 (2010)
[36] Koonin,E.V.,《元基因组魔法与不断膨胀的蛋白质世界》,《自然生物技术》。,25, 540-542 (2007)
[37] 库宁,E.V。;Wolf,Y.I。;Karev,G.P.,《蛋白质宇宙的结构和基因组进化》,《自然》,420,218-223(2002)
[38] Ladunga,I.,《系统发生连续体指示蛋白质宇宙中的星系:蛋白质自然群结构的初步结果》,J.Mol.Evol。,4, 358-375 (1992)
[39] Levitt,M.,《蛋白质宇宙的性质》,Proc。国家。阿卡德。科学。美国,10611079-11084(2009)
[40] 李,F.M。;Li,Q.Z.,使用Chou的伪氨基酸组成和改进的杂交方法预测蛋白质亚细胞位置,蛋白质肽。莱特。,15, 612-616 (2008)
[41] Li,Z.C.,《利用Chou的伪氨基酸组成预测蛋白质结构类别:使用连续小波变换和主成分分析的方法》,《氨基酸》,37,415-425(2009)
[42] Lin,H。;Li,Q.Z.,《使用伪氨基酸组成预测蛋白质结构类别:通过合并400个二肽组分的方法》,J.Comp。化学。,28, 1463-1466 (2007)
[43] Lin,H.,利用Chou的伪氨基酸组成预测外膜蛋白的改良Mahalanobis判别式,J.Theor。《生物学》,252350-356(2008)·Zbl 1398.92076号
[44] Lin,H.,利用周氏伪氨基酸成分预测分枝杆菌蛋白质的亚细胞定位,蛋白质Pept。莱特。,15, 739-744 (2008)
[45] Lin,W.Z.,iDNA-Prot:使用灰色模型随机森林识别DNA结合蛋白,PLos One,6,9,e24756(2011)
[46] 利普曼。,D.J。;Pearson,W.R.,《快速和敏感蛋白质相似性》,《科学》,2271435-1441(1985)
[47] Mahdavi,A。;Jahandideh,S.,基于伪氨基酸组成的密度相似性预测膜蛋白类型的应用,J.Theor。生物学,276132-137(2011)·Zbl 1405.92218号
[48] Mohabatkar,H.,利用周氏伪氨基酸组成预测细胞周期蛋白,蛋白质Pept。莱特。,17, 1207-1214 (2010)
[49] Mohabatkar,H.,使用Chou的伪氨基酸组成和支持向量机概念预测GABA(A)受体蛋白,J.Theor。生物学,281,18-23(2011)·兹比尔1397.92215
[50] 梅勒,H。;Parker,P.J.,延伸蛋白激酶C超家族,生物化学。J.,332,281-292(1998)
[51] Nanni,L。;Lumini,A.,《为亚线粒体定位创建周氏伪氨基酸特征的遗传编程》,《氨基酸》,34653-660(2008)
[52] Nanni,L.,通过融合一组基于周氏伪氨基酸组成变体和进化信息的分类器来识别细菌毒性蛋白,IEEE/ACM Trans。计算。生物信息。(2011)
[53] Povolotskaya,I.S。;Kondrashov,F.A.,序列空间和蛋白质宇宙的持续扩张,《自然》,465922-926(2010)
[54] 邱,J.D.,基于周伪氨基酸组成概念的G蛋白偶联受体类别预测:基于离散小波变换的方法,Ana。生物化学。,390, 68-73 (2009)
[55] 邱,J.D.,使用周的伪氨基酸组成概念预测酶家族类别:基于离散小波变换的支持向量机方法,Protein Pept。莱特。,17, 715-722 (2010)
[56] 邱,J.D.,OligoPred:一个通过将离散小波变换合并到周的伪氨基酸组成中来预测同源寡聚体蛋白质的网络服务器,J.Mol.Graph。模型,30,129-134(2011)
[57] Sahu,S.S。;Panda,G.,一种基于周氏伪氨基酸组成的新特征表示方法,用于蛋白质结构类预测,Compute。生物化学。,34, 320-327 (2010) ·Zbl 1403.92221号
[58] 塞图,N。;Nei,M.,邻接法:重建系统发育树的新方法,分子生物学。演变。,4, 4, 406-425 (1987)
[59] 史密斯,T.F。;Waterman,M.S.,生物序列比较,高级应用。数学。,2, 482-489 (1981) ·Zbl 0489.92004号
[60] 索卡尔·R。;Michener,C.,《评估系统关系的统计方法》,堪萨斯大学科学院。牛。,38, 1409-1438 (1958)
[61] Wang,Y.C.,通过结合结合三联体特征的伪氨基酸组成预测酶亚科类别,Protein Pept。莱特。,17, 1441-1449 (2010)
[62] 韦伯,B.L.J。;Hirst,S.J。;Giembycz,M.A.,《蛋白激酶C同工酶:结构、调节及其在调节气道平滑肌张力和有丝分裂中的作用》,英国药理学杂志。,130, 1433-1452 (2000)
[63] 吴振聪。;Xiao,X。;Chou,K.C.,2D-MH:一个基于蛋白质序列组成氨基酸的物理化学性质生成蛋白质序列图形表示的网络服务器,J.Theor。生物学,267,29-34(2010)·Zbl 1410.92089号
[64] Xiao,X。;Chou,K.C.,使用伪氨基酸组成通过细胞自动机和其他方法预测蛋白质属性,Curr。生物信息。,6, 251-260 (2011)
[65] Xiao,X。;王,P。;Chou,K.C.,GPCR-2L:通过杂交两种不同模式的伪氨基酸组成预测G蛋白偶联受体及其类型,分子生物学系统。,7, 911-919 (2011)
[66] Xiao,X。;王,P。;Chou,K.C.,细胞自动机及其在蛋白质生物信息学中的应用,Curr。蛋白质肽。科学。,12, 508-519 (2011)
[67] Xiao,X。;王,P。;Chou,K.C.,iNR-PhysChem:一种基于序列的预测因子,用于通过物理化学属性矩阵识别核受体及其亚家族,PLoS One,7,2,e30869(2012)
[68] Yang,Z.,《计算分子进化》(2006),牛津大学出版社:牛津大学出版社,纽约
[69] 游,S.S.-T。;Yu,C。;He,R.,蛋白质图谱及其应用,DNA细胞。生物学,27,241-250(2008)
[70] Yu,C.,蛋白质图:一种基于氨基酸各种特性的无比对序列比较方法,Gene,486110-118(2011)
[71] Yu,C。;梁,Q。;尹,C。;He,R.L。;Yau,S.S.-T.,《利用生物几何学构建基因组空间的新方法》,《DNA研究》,第17期,第155-168页(2010年)
[72] Yu,L.,SecretP:通过将新特征融合到Chou的伪氨基酸组成中来识别细菌分泌的蛋白质,J.Theor。生物学,267,1-6(2010)·Zbl 1410.92040号
[73] Zeng,Y.H.,基于自协方差方法,使用增广的周氏伪氨基酸组成预测蛋白质亚线粒体位置,J.Theor。生物学,259366-372(2009)·Zbl 1402.92193号
[74] 张国勇。;Fang,B.S.,基于氨基酸组成分布和Chou的两亲性伪氨基酸组成预测氧化还原酶的辅因子,J.Theor。《生物学》,253,310-315(2008)
[75] Zhang,G.Y.,通过改进的Chou伪氨基酸组成预测脂肪酶类型,Protein Pept。莱特。,151132-1137(2008年)
[76] Zhang,S.W.,使用周的伪氨基酸组成预测蛋白质四级结构:序列分段的PseAAC方法,氨基酸,35,591-598(2008)
[77] Zhang,S.W.,使用周的伪氨基酸组成概念预测蛋白质亚细胞定位:结合进化信息和冯·诺依曼熵的方法,氨基酸,34565-572(2008)
[78] 周晓波,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.Theor。《生物学》,248546-551(2007)·兹比尔1451.92245
[79] 邹,D.,使用周的伪氨基酸成分预测超二级结构,J.Compute。化学。,32, 271-278 (2011)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。