×

基于二级蛋白质结构疏水性指数的新尺度。 (英语) Zbl 1451.92239号

综述:本文涉及计算生物学中与蛋白质预测和蛋白质二级结构分析有关的一个分支。虽然传统方法使用简单的氨基酸组成来预测二级结构含量,但最近发现疏水性可以改进此预测任务和几个相关预测任务的结果。为此,我们提出并分析了两种新的基于疏水性指数的标尺的优点,这两种标尺包含了关于蛋白质序列长程相互作用的信息,并将其与当前使用的原始疏水性指数值进行了对比。我们还使用所提出的量表比较了三个主要的疏水性指数,即艾森伯格指数、福切雷·普利斯卡指数和西德指数。使用模糊认知图进行分析,该图量化了疏水性尺度/指数与蛋白质含量值之间的关系强度。已经进行了一组经验测试,包括为一组200个低同源性蛋白质生成模糊认知图模型。结果表明,与当前使用的原始指数值相比,沿着蛋白质序列的二级结构含量与两个建议的疏水性尺度的相关性约为2.5倍。无论应用的水生生物指数如何,新尺度都表现出更强的相关性。不同标尺的分析表明,当与新标尺一起使用时,艾森伯格憎水指数具有优越性。相反,当使用忽略长程相互作用的原始疏水指数值时,发现Fauchere-Pliska指数与其他两个指数相比表现更好。

MSC公司:

92D20型 蛋白质序列,DNA序列
92-08 生物问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Aguilar,J.,《关于模糊认知地图论文的调查》,国际计算机杂志。认知。,3, 2, 27-33 (2005)
[2] Axelrod,R.,《决策结构:政治精英的认知地图》(1976),普林斯顿大学出版社
[3] 伯曼,H.M。;韦斯特布鲁克,J。;Z.Feng。;Gilliland,G。;巴特,T·N。;韦西格,H。;Shindyalov,I.N。;Bourne,P.E.,蛋白质数据库,核酸研究,28,235-242(2000)
[4] 比奥,V。;Gibrat,J.F。;莱文,J.M。;罗布森,B。;Garnier,J.,二级结构预测:三种不同方法的组合,蛋白质工程,2185-191(1988)
[5] 伯泽尔,F。;Kramer,S.,基于频繁模式的蛋白质二级结构预测的新表示,生物信息学,22,21,2628-2634(2006)
[6] 公牛,B.M。;Breese,K.,氨基酸溶液的表面张力:氨基酸残基的疏水性标度,Arch。生物化学。生物物理学。,161, 665-670 (1974)
[7] Cai,Y.D。;Chou,K.C.,通过功能域组成和伪氨基酸组成预测酶亚类,《蛋白质组研究杂志》,4,967-971(2005)
[8] 蔡,Y。;刘,X-J。;Xu,X。;Chou,K-C.,预测蛋白质二级结构含量的人工神经网络方法,计算。化学。,26, 347-350 (2002)
[9] 蔡,Y。;刘晓杰。;Chou,K-C.,用人工神经网络预测蛋白质二级结构含量,J.Compute。化学。,242727-731(2002年)
[10] Cai,Y.D。;周国平。;Chou,K.C.,通过杂交基因产物组成和伪氨基酸组成预测酶家族类别,J.Theor。《生物学》,234145-149(2005)·Zbl 1445.92221号
[11] 陈,C。;周,X。;田,Y。;邹,X。;Cai,P.,用伪氨基酸组成和支持向量机融合网络预测蛋白质结构类,Ana Biochem,357116-121(2006)
[12] 陈,C。;田玉霞。;邹晓勇。;蔡,P.X。;Mo,J.Y.,使用伪氨基酸组成和支持向量机预测蛋白质结构类别,J.Theor。《生物学》,243444-448(2006)·Zbl 1447.92300号
[13] Chou,K.C.,使用成对偶联的氨基酸组成来预测蛋白质二级结构含量,J.protein Chem。,18, 4, 473-480 (1999)
[14] Chou,K.C.,《综述:预测蛋白质中的急转弯及其类型》,《分析》。生物化学。,286, 1-16 (2000)
[15] Chou,K.C.,《综述:蛋白质结构类和亚细胞位置的预测》,Curr。蛋白质肽科学。,1, 171-208 (2000)
[16] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,蛋白质,43,3,246-255(2001),[勘误表:蛋白质,2001,44,60]
[17] Chou,K.C.,《综述:蛋白质结构类预测的进展及其对生物信息学和蛋白质组学的影响》,Curr。蛋白质肽科学。,6, 423-436 (2005)
[18] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[19] Chou,K.C.,G蛋白偶联受体类别的预测,《蛋白质组研究》,第4期,1413-1418页(2005年)
[20] Chou,K.C。;Elrod,D.W.,G蛋白偶联受体的生物信息学分析,《蛋白质组研究杂志》,1429-433(2002)
[21] Chou,K.C。;蔡永德,用伪氨基酸组成预测蛋白质四级结构,蛋白质,53282-289(2003)
[22] Chou,K.C。;蔡永德,蛋白质亚细胞定位的预测和分类:序列序效应和伪氨基酸组成,细胞生物化学杂志。,90,1250-1260(2003),[补遗,细胞生物化学杂志,2004,91,1085]
[23] Chou,K.C。;Cai,Y.D.,通过功能域组成预测蛋白质结构类别,生物化学。生物物理学。Res.Commun.公司。,3211007-1009(2004),[勘误:生物化学-生物物理研究委员会,2005,329,1362]
[24] Chou,K.C。;蔡永德,通过杂交功能域组成和伪氨基酸组成预测蛋白质的亚细胞定位,细胞生物化学杂志。,91, 1197-1203 (2004)
[25] Chou,K.C。;Cai,Y.D.,通过结合两性效应预测膜蛋白类型,《化学杂志》。通知。型号。,45, 407-413 (2005)
[26] Chou,K.C。;Cai,Y.D.,杂交空间中蛋白酶类型的预测,生物化学。生物物理学。Res.Comm.,339,1015-1020(2006)
[27] Chou,K.C。;沈海斌,融合多分类器预测蛋白质亚细胞定位,细胞生物化学杂志。,99, 517-527 (2006)
[28] Chou,K.C。;Shen,H.B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,《生物化学》。生物物理学。Res.Commun.公司。,347, 150-157 (2006)
[29] Chou,K.C。;Shen,H.B.,通过融合优化的证据理论K最近邻分类器预测真核蛋白亚细胞位置,《蛋白质组研究杂志》,51888-1897(2006)
[30] Chou,K.C。;Shen,H.B.,《革兰氏阴性细菌蛋白质亚细胞位置的大规模预测》,《蛋白质组研究杂志》,53420-3428(2006)
[31] Chou,K.C。;沈海斌,大尺度植物蛋白质亚细胞定位预测,细胞生物化学杂志。,100665-678(2007年)
[32] 希德·H。;Bunster,M。;卡纳莱斯,M。;Gazitua,F.,蛋白质的疏水性和结构类别,《蛋白质工程杂志》,5,373-375(1992)
[33] 科内特,J.L。;Cease,K.B。;Margalit,H。;斯普格,J.L。;Berzofsky,J.A.(Berzofsky,J.A.)。;DeLisi,C.,检测蛋白质中两亲性结构的疏水性尺度和计算技术,J.Molec。生物学,195,659-685(1987)
[34] 丁·C·H。;Dubchak,I.,使用支持向量机和神经网络的多类蛋白质折叠识别,生物信息学,17,349-358(2001)
[35] 杜,P。;Li,Y.,通过将假氨基酸组成与分段序列的各种物理化学特征杂交预测蛋白质亚线粒体位置,BMC Bioninform。,7, 518 (2006)
[36] Du,Q.-S。;刘,P.-J。;Mezey,P.G.,《启发式分子亲脂性势的理论推导:分子溶剂化的量子化学描述》,J.Chem。通知。模型,45,2,347-353(2005)
[37] 杜青山。;王世清。;Chou,K.C.,启发式分子亲脂性势(HMLP):氨基酸侧链的亲脂性和亲水性,J.Compute。化学。,27, 685-692 (2006)
[38] 艾森哈贝尔,F。;帝国,F。;阿戈斯,P。;Frommel,C.,仅从氨基酸组成预测蛋白质的二级结构含量。I.新的分析向量分解方法,《蛋白质》,25,2,157-168(1996)
[39] Fauchere,J.L。;Pliska,V.,N-乙酰-氨基酸酰胺分配产生的氨基酸侧链的疏水参数-Pi,《欧洲医学化学杂志》。,18, 369-375 (1983)
[40] Feng,K.Y。;Cai,Y.D。;Chou,K.C.,用于预测蛋白质结构域结构类别的Boosting分类器,生物化学。生物物理学。Res.Commun.公司。,334213-217(2005年)
[41] 高,Y。;Shao,S.H。;Xiao,X。;丁Y.S。;Huang,Y.S。;黄,Z.D。;Chou,K.C.,使用伪氨基酸组成预测蛋白质亚细胞位置:用Lyapunov指数、贝塞尔函数和切比雪夫滤波器进行探讨,《氨基酸》,28,373-376(2005)
[42] 郭振民,2002。基于伪氨基酸组成的模式识别方法预测膜蛋白类型。上海交通大学生物-X生命科学研究中心硕士论文。
[43] 郭义忠。;李,M。;卢,M。;温,Z。;王凯。;李·G。;Wu,J.,基于快速傅里叶变换的蛋白质功率谱分类G蛋白偶联受体和核受体,氨基酸,30397-402(2006)
[44] Herrera,F。;Lozano,M。;Verdegay,J.L.,《处理实数编码的遗传算法:行为分析的操作符和工具》,人工英特尔。修订版,第12、4、265-319页(1998年)·Zbl 0905.68116号
[45] Homaeian,L.,Kurgan,L.A.,Cios,K.J.,Ruan,J.,Chen,K.,2007年。黄昏带序列蛋白质二级结构含量的预测。蛋白质,印刷品。
[46] Jones,D.,后基因组时代的蛋白质结构预测,Curr。操作。结构。《生物学》,10,3,371-379(2000)
[47] Juretic,D。;Lucin,A.,《预测蛋白质螺旋旋转与膜倾向的偏好函数法》,J.Chem。通知。计算。科学。,38, 4, 575-585 (1998)
[48] Kabsch,W。;Sander,C.,蛋白质二级结构词典:氢键和几何特征的模式识别,生物聚合物,22,1222577-2637(1983)
[49] 川岛,S。;Ogata,H。;Kanehisa,M.,AA指数:氨基酸指数数据库,《核酸研究》,27,368-369(1999)
[50] Kedarisetti,K。;洛杉矶库根。;Dick,S.,用于不同同源性的蛋白质结构类预测的分类器集合,Biochem。生物物理学。Res.Commun.公司。,348, 3, 981-988 (2006)
[51] Kosko,B.,《模糊认知地图》,《国际机器研究杂志》,第24期,第65-75页(1986年)·Zbl 0593.68073号
[52] Koulouriotis,D.E。;迪亚库拉基斯,I.E。;Emiris,D.M。;安东尼达基斯,E.N。;Kaliakatsos,I.A.,《使用进化模糊认知图高效建模和控制复杂动态系统》,国际计算机杂志。认知。,1, 2, 41-65 (2003)
[53] Kurgan,L.A.,Homaeian,L.,2005年。仅从一级序列预测二级蛋白质结构含量——基于特征选择的方法。机器学习和数据挖掘国际会议,德国莱比锡,LNAI 4587,第334-345页。
[54] 洛杉矶库根。;Homaeian,L.,蛋白质序列和结构域结构类的预测——预测算法、序列表示和同源性的影响,以及测试程序对准确性的影响,模式识别,39,12,2323-2343(2006)·Zbl 1103.68767号
[55] Kurgan,L.A.,Rahbari,M.,Homaeian,L.,2006年。预测的蛋白质结构含量对预测暮光带蛋白质结构类别的影响。摘自:第五届机器学习和应用国际会议,佛罗里达州奥兰多,第180-186页。
[56] Lee,S。;Lee,B.C。;Kim,D.,利用氨基酸组成和进化信息预测蛋白质二级结构含量,《蛋白质》,62,4,1107-1114(2006)
[57] 刘伟。;Chou,K.C.,蛋白质二级结构含量预测,蛋白质工程,12,1041-1050(1999)
[58] Lin,Z。;Pan,X.,蛋白质二级结构含量的精确预测,蛋白质化学杂志。,20, 3, 217-220 (2001)
[59] Lin,H.,Li,Q.Z.,2007a。使用伪氨基酸组成预测蛋白质结构类别:通过合并400个二肽组分来实现。J.计算。化学。doi:10.1002/jcc.20554。
[60] 林,H。;Li,Q.Z.,利用伪氨基酸组成和改良马氏判别法预测芋螺毒素超家族和家族,生物化学。生物物理学。Res.Commun.公司。,354548-551(2007年)
[61] Lin,K。;西莫西斯,V.A。;泰勒,W.R。;Heringa,J.,使用隐藏神经网络的简单快速二级结构预测方法,生物信息学,21,2,152-159(2005)
[62] 刘,H。;杨,J。;王,M。;薛,L。;Chou,K.C.,使用傅立叶光谱分析和伪氨基酸组成预测膜蛋白类型,蛋白质杂志,24385-389(2005)
[63] 刘,H。;王,M。;Chou,K.C.,预测膜蛋白类型的低频傅里叶光谱,生物化学。生物物理学。Res.Commun.公司。,336, 737-739 (2005)
[64] 罗瑞英。;冯,Z.P。;刘建康,用氨基酸和多肽组成预测蛋白质结构类别,《欧洲生物化学杂志》。,269, 4219-4225 (2002)
[65] 宫泽,S。;Jernigan,R.L.,《从蛋白质晶体结构估算选择性相互间接触能:准化学近似》,大分子,18534-552(1985)
[66] 蒙达尔,S。;巴夫纳,R。;莫汉·巴布,R。;Ramakumar,S.,用于芋螺毒素超家族分类的伪氨基酸组成和多类支持向量机方法,J.Theor。生物学,243,252-260(2006)·Zbl 1447.92309号
[67] Moult,J。;哈伯德,T。;Bryant,S.H。;Fidelis,K。;Pedersen,J.T.,蛋白质结构预测方法的关键评估:第二轮,蛋白质,29,2-6(1997)
[68] 牛,B。;Cai,Y.D。;卢,W.C。;郑国勇。;Chou,K.C.,用AdaBoost学习者预测蛋白质结构类,蛋白质肽Lett。,13, 489-492 (2006)
[69] 西川,K。;Ooi,T.,用经验方法预测球形蛋白质的表面蛋白质内部图,《国际肽蛋白质研究杂志》,16,19-32(1980)
[70] 潘,Y.X。;张,Z.Z。;郭振明。;Feng,G.Y。;黄,Z.D。;何,L.,伪氨基酸组成在预测蛋白质亚细胞位置中的应用:随机信号处理方法,蛋白质化学杂志。,22, 395-402 (2003)
[71] J.M.R.帕克。;Guo博士。;Hodges,R.S.,从高效液相色谱肽保留数据中得出的新亲水性标度:预测的表面残基与抗原和X射线衍生可及位点的相关性,生物化学,275425-5432(1986)
[72] Pilizota,T。;Lucic,B。;Trinajsic,N.,《利用变量选择从氨基酸残基组成模拟蛋白质的二级结构含量》,J.Chem。Inf.计算。科学。,44, 1, 113-121 (2004)
[73] Ponnuswamy,P.K。;Prabhakaran,M。;Manavalan,P.,球形蛋白质中氨基酸残基的疏水堆积和空间排列,生物化学。生物物理学。《学报》,623301-316(1980)
[74] Rost,B.,综述:蛋白质二级结构预测持续上升,J.Struct。生物学,134,2-3,204-218(2001)
[75] 阮,J。;王凯。;杨,J。;库根,L。;Cios,K.,《从初级蛋白质序列预测螺旋和链含量的高度准确和一致的方法》,Artif。智力。医学,35,1-2,19-35(2005)
[76] Shen,H.B。;Chou,K.C.,使用优化的证据理论K近邻分类器和伪氨基酸组成来预测膜蛋白类型,Biochem。生物物理学。Res.Commun.公司。,334, 288-292 (2005)
[77] Shen,H.B。;Chou,K.C.,用优化的证据理论K最近分类器和伪氨基酸组成预测蛋白质亚核位置,生物化学。生物物理学。Res.Comm.,337,752-756(2005)
[78] Shen,H.B。;Chou,K.C.,蛋白质折叠模式识别的集成分类器,生物信息学,221717-1722(2006)
[79] Shen,H.B.,Chou,K.C.,2006年B。使用集成分类器识别膜蛋白类型。氨基酸,doi:10.1007/s00726-00006-00439-00722。
[80] Shen,H.B。;Chou,K.C.,Gpos-PLoc:预测革兰氏阳性细菌蛋白质亚细胞定位的集成分类器,蛋白质工程设计选择。,20, 39-46 (2007)
[81] Shen,H.B。;Chou,K.C.,《病毒-PLoc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器》,《生物聚合物》,85,233-240(2007)
[82] Shen,H.B。;Chou,K.C.,Hum-mPLoc:一种集成分类器,用于通过合并多个位点的样本进行大规模人类蛋白质亚细胞位置预测,Biochem。生物物理学。Res.Commun.公司。,355, 1006-1011 (2007)
[83] Shen,H.B。;杨,J。;刘晓杰。;Chou,K.C.,《使用监督模糊聚类预测蛋白质结构类别》,《生物化学》。生物物理学。Res.Commun.公司。,334, 577-581 (2005)
[84] Shen,H.B。;杨,J。;Chou,K.C.,Fuzzy KNN用于从伪氨基酸组成预测膜蛋白类型,J.Theor。生物学,240,9-13(2006)·Zbl 1447.92312号
[85] Shen,H.B.、Yang,J.、Chou,K.C.,2007年。Euk-PLoc:用于大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,doi:10.1007/s00726-00006-00478-00728。
[86] Shi,J.Y.,Zhang,S.W.,Pan,Q.,Cheng,Y.-M.,Xie,J.,2007年。利用多尺度能量和伪氨基酸组成的支持向量机预测蛋白质亚细胞定位。氨基酸,doi:10.1007/s00726-00006-00475-y。
[87] 斯塔克·W。;库根,L。;佩德里茨,W。;Reformat,M.,使用遗传算法方法以所需精度学习模糊认知地图,Electron。莱特。,40, 24, 1519-1520 (2004)
[88] 斯塔克·W。;库根,L。;佩德里茨,W。;Reformat,M.,模糊认知图的遗传学习,模糊集和系统,153,3,371-401(2005)·Zbl 1074.68592号
[89] Sweet,R.M。;艾森伯格,D.,《序列疏水性相关性测量三维蛋白质结构的相似性》,J.Mol.Biol。,171, 479-488 (1983)
[90] 王,M。;杨,J。;刘国平。;徐志杰。;Chou,K.C.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计选择。,17, 509-516 (2004)
[91] 王,M。;杨,J。;徐志杰。;Chou,K.C.,预测膜蛋白类型的SLLE,J.Theor。生物学,232,7-15(2005)·Zbl 1442.92118号
[92] 王世清。;杨,J。;Chou,K.C.,《基于伪氨基酸组成的叠加泛化预测膜蛋白类型》,《理论生物学杂志》,242941-946(2006)·Zbl 1447.92315号
[93] 温,Z。;李,M。;李毅。;郭毅。;Wang,K.,Delaunay三角剖分与潜在结构的偏最小二乘投影:G蛋白偶联受体分类和快速结构识别模型,氨基酸,32,277-283(2006)
[94] 韦茨,D.H。;Scheraga,H.,水对蛋白质结构的影响。氨基酸残基对蛋白质分子内外和特定构象的偏好分析,大分子,11,9-15(1978)
[95] 沃尔德,S。;埃里克森,L。;Hellberg,S。;琼森,J。;Sjöström,m。;Skagerberg,B。;Wikström,C.,《六种非天然氨基酸及其在催产素肽类似物构效关系中的应用》,Can。化学杂志。,65, 1814-1820 (1987)
[96] Xiao,X。;邵,S。;丁,Y。;黄,Z。;黄,Y。;Chou,K.C.,使用复杂性度量因子预测蛋白质亚细胞位置,《氨基酸》,28,57-61(2005)
[97] Xiao,X。;邵,S。;丁,Y。;黄,Z。;陈,X。;Chou,K.C.,使用细胞自动机生成生物序列的图像表示,《氨基酸》,28,29-35(2005)
[98] Xiao,X。;Shao,S.H。;黄,Z.D。;Chou,K.C.,使用伪氨基酸组成预测蛋白质结构类别:用复杂性度量因子进行探讨,计算机杂志。《化学》,27,478-482(2006)
[99] Xiao,X。;Shao,S.H。;丁Y.S。;黄,Z.D。;Chou,K.C.,使用细胞自动机图像和伪氨基酸组成预测蛋白质亚细胞位置,《氨基酸》,30,49-54(2006)
[100] 张,C。;林,Z-S。;张,Z。;Yan,M.,基于一级序列预测球形蛋白质的螺旋/链含量,蛋白质工程,11,11,971-979(1998)
[101] 张,Z。;孙,Z。;Zhang,C.,《预测球形蛋白质螺旋/链含量的新方法》,J.Theor。生物学,208,65-78(2001)
[102] 张世伟。;潘,Q。;张海川。;邵,Z.C。;Shi,J.Y.,《通过伪氨基酸组成预测蛋白质同源异构体类型:改进特征提取和朴素贝叶斯特征融合的方法》,《氨基酸》,30,461-468(2006)
[103] 周国平。;蔡永德,通过杂交基因本体和伪氨基酸组成预测蛋白酶类型,蛋白质,63,681-684(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。