×

探索扩大弱同源折叠检测的蛋白质空间。 (英文) Zbl 1406.92456号

摘要:冗余预测方法已被用于探索弱同源蛋白基序的发生。实现了一种基于模板的混合算法,通过检测具有低序列身份的结构域构建子结构来预测蛋白质结构的不同层。对物理化学决定因素、二级结构轮廓和多重排列进行了分析,以生成一系列广泛的结构亚域。然后,密集的计算程序在二级结构预测、碎片组装和结构同源物检测的基础上生成了所有各种三维褶皱。该算法不仅可以识别常见的蛋白质亚结构,还可以通过链接超二级结构的主干轨迹来检测高阶结构,如域超家族/超家族。应用刚性转换协议,获得了与本地结构的平均均方根偏差为2.3º且本地结构的模板建模平均得分为0.43的检测域构建模型的总体。这里提出的折叠检测算法比以前提出的方法产生更准确的结果,对于序列一致性小于20%的蛋白质,也可以预测结构同源性。我们的工具可在http://www.acbrc.org/tools.html.

MSC公司:

92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Altschul,S.F。;Gish,W。;米勒,W。;Myers,E.W。;Lipman,D.J.,基本局部对齐搜索工具,J.Mol.Biol。,215, 403-410 (1990)
[2] Altschul,S.F。;Madden,T.L。;Schaffer,A.A。;张杰。;张,Z。;米勒,W。;O.J.利普曼。;BLAST、Gapped和PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,25,3389-3402(1997)
[3] Ben Naim,A.,Levinthal的问题再次提出,并回答了J.Biomol。结构。动态。,30, 113-124 (2012)
[4] Bernardes,J.S。;Carbone,A。;Zaverucha,G.,结合归纳逻辑编程和命题模型的基于家族的蛋白质远程同源性检测的判别方法,BMC生物信息学,12,83-95(2011)
[5] Bujnicki,J.M.,通过片段重组预测蛋白质结构,化学生物化学,7,19-27(2006)
[6] 别列佐夫斯基,I.N。;Trifonov,E.N.,《蛋白质结构和折叠:一个新的开始》,J.Biomol。结构。动态。,19, 397-403 (2001)
[7] C.莱文塔尔,《如何优雅地折叠》。In:《生物系统穆斯堡尔谱学》论文集;第67卷,1969年。第22-24页。;C.莱文塔尔,《如何优雅地折叠》。In:《生物系统穆斯堡尔谱学》论文集;1969年第67卷。第22-24页。
[8] 乔提亚,C。;Lesk,A.M.,《蛋白质序列和结构差异之间的关系》,EMBO J.,5823-826(1986)
[9] Chothia,C.,《蛋白质》。分子生物学家的一千个家庭,《自然》,357543-544(1992)
[10] 达加,P.R。;Patel,R.Y。;Doerksen,R.J.,《基于模板的蛋白质建模:最新方法学进展》,Curr。顶部。医药化学。,84-94年10月(2010年)
[11] 杜,P。;安德烈,M。;Levy,R.M.,我们在蛋白质数据库中看到了与短蛋白质片段相对应的所有结构吗?更新,蛋白质工程,16,407-414(2003)
[12] 丁克尔,H。;迈克尔·S。;Weatheritt,R.J。;戴维,N.E。;Van Roey,K。;Altenberg,B。;脚趾,G。;乌亚尔,B。;塞勒,M。;巴德,A。;Jodicke,L。;Dammert,医学硕士。;施罗德,C。;锤子,M。;施密特,T。;Jehl,P。;McGuigan,C。;Dymecka,M。;Chica,C。;幸运,K。;Via,A。;Chatr-ariamontri,A。;哈斯拉姆,N。;格雷布涅夫,G。;爱德华,R.J。;M.O.斯坦梅茨。;Meiselbach,H。;Diella,F。;Gibson,T.J.,ELM-真核生物线性基序数据库,核酸研究,40,242-251(2011)
[13] Ginalski,K。;帕斯·J。;Wyrwicz,L.S。;von Grotthuss,M。;Bujnicki,J.M。;Rychlewski,L.,ORFeus:使用序列图谱和预测的二级结构检测远距离同源性,核酸研究,31,3804-3807(2003)
[14] 郭建堂。;Ellrott,J.T.K。;Xu,Y.,基于模板的蛋白质结构预测的历史观点,方法分子生物学。,413, 3-42 (2008)
[15] 哈里森,A。;珀尔,F。;莫特·R。;桑顿,J。;Orengo,C.A.,量化褶皱空间内的相似性,J.Mol.Biol。,323, 909-926 (2002)
[16] Hughey,R。;Krogh,A.,《序列分析的隐马尔可夫模型:基本方法的扩展和分析》,计算。申请。生物科学。,1995年10月12日(1996年)
[17] Hamming,R.W.,错误检测和纠错代码,贝尔系统。《技术期刊》,26,147-160(1950)·Zbl 1402.94084号
[18] 琼斯,A.T。;Thirup,S.,《在蛋白质模型构建和晶体学中使用已知子结构》,EMBO J.,5819-822(1986)
[19] 雅罗斯基,L。;Rychlewski,L。;李,Z。;李伟(Li,W.)。;Godzik,A.,FFAS03:一个用于profile序列比对的服务器,《核酸研究》,第33期,第284-288页(2005年)
[20] Karplus,K。;巴雷特,C。;Hughey,R.,检测远程蛋白质同源性的隐马尔可夫模型,生物信息学,14846-856(1998)
[21] 科洛德尼,R。;Koehl,P。;吉巴斯。;Levit,M.,《蛋白质片段的小库精确模拟天然蛋白质结构》,《分子生物学杂志》。,323, 297-307 (2002)
[22] 科奇克,G。;Berezovsky,I.N.,《域层次结构和闭环(DHcL):探索蛋白质域结构层次结构的服务器》,《核酸研究》,36,239-245(2008)
[23] Kyte,J。;Doolittle,R.,《一种显示蛋白质亲水特性的简单方法》,J.Mol.Biol。,157, 105-132 (1982)
[24] 凯利,洛杉矶。;Sternberg,M.J.,《网络上的蛋白质结构预测:使用Phyre服务器的案例研究》,Nat.Protoc。,4363-371(2009年)
[25] 刘,T。;Tang,G.W。;Capriotti,E.,《比较建模:最新技术和蛋白质药物靶点结构预测》,Comb。化学。高通量屏幕。,14, 532-547 (2011)
[26] 卢帕斯,A.N。;Ponting,C.P。;Russell,R.B.,《蛋白质折叠的进化:不同蛋白质折叠中的相似模体是会聚、插入或古代肽世界遗迹的结果吗?》?,J.结构。生物学,134191-203(2001)
[27] Lolkema,J.S。;Slotboom,D.,《水病剖面比对:寻找膜蛋白结构同源物的工具》,FEMS Microb。第22版,305-322(1998)
[28] 穆尔津,A.G。;Brenner,S.E。;哈伯德,T。;Chothia,C.,SCOP:用于序列和结构研究的蛋白质结构分类数据库,《分子生物学杂志》。,247, 536-540 (1995)
[29] Madera,M.,Profile comparer:一个用于评分和校准轮廓隐藏马尔可夫模型的程序,生物信息学,242630-2631(2008)
[30] Moult,J。;Fidelis,K。;Kryshtafovych,A。;Tramontano,A.,蛋白质结构预测(CASP)方法的关键评估-第九轮,蛋白质,79,1-5(2011)
[31] Marchler-Bauer,A。;卢,S。;安德森,J.B。;Chitsaz,F。;德比郡,M.K。;德维斯·斯科特,C。;Fong,J.H。;Geer,L.Y。;吉尔·R.C。;新泽西州冈萨雷斯。;瓜兹,M。;D.I.Hurwitz。;J.D.杰克逊。;Ke,Z。;Lanczycki,C.J。;Lu,F。;Marchler,G.H。;Mullokandov,M。;Omelchenko,M.V。;Robertson,C.L。;Song,J.S。;Thanki,N。;Yamashita,R.A。;张,D。;张,N。;郑,C。;Bryant,S.H.,CDD:蛋白质功能注释的保守域数据库,《核酸研究》,39,225-229(2011)
[32] Needleman,S.B。;Wunsch,C.D.,《适用于搜索两种蛋白质氨基酸序列相似性的通用方法》,《分子生物学杂志》。,第48页,443-453页(1970年)
[33] 奥伦戈,C.A。;Michie,A.D。;琼斯,S。;琼斯·D·T。;Swindells,M.B。;Thornton,J.M.,CATH-蛋白质结构域的层次分类,结构,51093-1108(1997)
[34] 奥伦戈,C.A。;琼斯·D·T。;桑顿,J.M.,《蛋白质超家族和结构域超家族》,《自然》,372631-634(1994)
[35] Pearson,W.R.,与FASTP和FASTA快速、敏感的序列比较,酶学方法。,183, 63-98 (1990)
[36] Poupon,A。;Mornon,J.P.,从序列预测蛋白质折叠核,FEBS Lett。,452, 283-289 (1999)
[37] Reid,A.J。;叶芝,C。;Orengo,C.A.,可结合远程同源性检测方法,将覆盖范围增加10
[38] 罗伊,S。;Ratnaswamy,G。;Boice,J.A。;费尔曼,R。;麦克伦登,G。;Hecht,M.H.,通过极性和非极性氨基酸的二元模式设计的蛋白质显示出天然的类似性质,J.Am.Chem。《社会学杂志》,1195302-5306(1997)
[39] 史密斯,T.F。;Waterman,M.S.,《常见分子子序列的识别》,《分子生物学杂志》。,147, 195-197 (1981)
[40] 斯科尔尼克,J。;Kihara,D。;Zhang,Y.,PROSPECTOR 3.0线程算法的开发和大规模基准测试,Protein,56,502-518(2004)
[41] Soding,J.,通过HMM-HMM比较进行蛋白质同源性检测,生物信息学,21951-960(2005)
[42] Selvaraj,S。;Gromiha,M.M.,疏水簇和长程接触网络在(α/β)\(_8\)桶蛋白折叠中的作用,生物物理学。J.,84,1919-1925(2003)
[43] 施瓦茨,R。;Istrail,S。;King,J.,球形蛋白质序列中氨基酸串的频率表明连续疏水残基的区块受到抑制,《蛋白质科学》。,10, 1023-1031 (2001)
[44] 萨德雷耶夫,R.I。;唐,M。;Kim,B。;Grishin,N.V.,《同源性检测的COMPASS服务器:改进的统计准确性、速度和功能》,《核酸研究》,第37期,第90-94页(2009年)
[45] 托德,A.E。;奥伦戈,C.A。;桑顿,J.M.,《从结构角度看蛋白质超家族功能的进化》,《分子生物学杂志》。,307, 1113-1143 (2001)
[46] Traut,T.W.,外显子编码蛋白质的结构或功能单位吗?,程序。国家。阿卡德。科学。美国,852944-2948(1988)
[47] 汤普森,J.D。;希金斯,D.G。;Gibson,T.J.,CLUSTAL W:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性,《核酸研究》,22,4673-4680(1994)
[48] Vapnik,V.N.,《统计学习理论概述》,IEEE Trans。神经网络,1988-999(1999)
[49] Wiltgen,M.,《结构生物信息学:从序列到结构和功能》,Curr。生物信息学,454-87(2009)
[50] Zhang,Y.,蛋白质结构预测:什么时候有用?,货币。操作。结构。《生物学》,第19期,第145-155页(2009年)
[51] Zhang,Y.,蛋白质结构预测的进展和挑战,Curr。操作。结构。《生物学》,18,342-348(2008)
[52] Zhang,Y。;Skolnick,J.,《TM-align:基于TM-score的蛋白质结构对齐算法》,《核酸研究》,33,2302-2309(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。