×

用伪氨基酸组成预测蛋白质结构类别:近似熵和疏水性模式。 (英语) Zbl 1397.92551号

摘要:与传统氨基酸(AA)成分相比,最初用于蛋白质亚细胞定位预测的伪氨基酸(PseAA)成分可以包含更多蛋白质序列信息,从而显著增强了使用离散模型预测蛋白质各种属性的能力。在本研究中,基于PseAA组成的概念,利用蛋白质序列的近似熵和疏水性模式来表征PseAA组分。同时,应用免疫遗传算法(IGA)搜索生成PseAA组合物的最佳权重因子。因此,对于给定的蛋白质序列样本,生成27-D(维)PseAA组成作为其描述符。预测引擎采用模糊K近邻分类器。由此在蛋白质结构分类预测中获得的结果非常令人鼓舞,表明当前的方法也可以用于提高其他蛋白质属性的预测质量,或者至少可以在相关领域对现有方法起到补充作用。我们的算法是用Matlab编写的,可以通过联系通讯作者获得。

MSC公司:

92D20型 蛋白质序列,DNA序列
68吨10 模式识别、语音识别
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿戈斯,P。;Rao,J.K。;Hargrave,P.A.,膜结合蛋白的结构预测,《欧洲生物化学杂志》。,128565-575,(1982年)
[2] 曹毅。;刘,S。;张,L。;秦,J。;Wang,J。;唐凯,用粗糙集预测蛋白质结构类,BMC生物信息学。,7, 20-25, (2006)
[3] 卡拉奇,L。;周,K.C。;Maggiora,G.M.,预测牛生长激素三级结构的启发式方法,生物化学,304389-4398,(1991)
[4] 钱多尼亚,J.M。;Karplus,M.,二级结构和结构类别预测的神经网络,蛋白质科学。,4, 275-285, (1995)
[5] Chen,Y.L。;Li,Q.Z.,利用改进的杂交方法和伪氨基酸组成预测凋亡蛋白的亚细胞位置,J.theor。生物学,248377-381,(2007)·兹比尔1451.92113
[6] Chen,Y.L。;Li,Q.Z.,凋亡蛋白亚细胞定位的预测,理论杂志。生物学,245775-783,(2007)·Zbl 1451.92112号
[7] 陈,C。;周,X。;田,Y。;邹,X。;Cai,P.,用伪氨基酸组成和支持向量机融合网络预测蛋白质结构类,Ana。生物化学。,357, 116-121, (2006)
[8] 陈,C。;田玉霞。;邹晓勇。;蔡,P.X。;Mo,J.Y.,使用伪氨基酸组成和支持向量机预测蛋白质结构类别,J.theor。生物学,243444-448,(2006)·Zbl 1447.92300号
[9] Chou,K.C.,抗冻蛋白的能量优化结构及其结合机制,J.mol.biol。,223, 509-517, (1992)
[10] Chou,K.C.,预测(20-1)-D氨基酸组成空间中蛋白质结构类别的新方法,蛋白质:结构、功能和遗传学,21319-344,(1995)
[11] Chou,K.C.,蛋白质结构类测定的关键驱动力,《生物化学》。生物物理学。公共资源。,264, 216-224, (1999)
[12] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构、功能和遗传学,43,246-255,(2001),(勘误表:Chou、K.C.(2001)。使用伪氨基酸成分预测蛋白质细胞属性。蛋白质:结构、功能和遗传学44、60)
[13] Chou,K.C.,蛋白质组学的一个新分支:蛋白质细胞属性的预测,(),57-70,(第4章)
[14] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19,(2005)
[15] Chou,K.C.,《综述:蛋白质结构类预测的进展及其对生物信息学和蛋白质组学的影响》,Curr。蛋白肽。科学。,6, 423-436, (2005)
[16] Chou,P.Y.,从氨基酸组成预测蛋白质结构类别,(),549-586
[17] 周,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.biol。化学。,277, 45765-45769, (2002)
[18] 周,K.C。;Cai,Y.D.,通过功能域组成预测蛋白质结构类别,生物化学。生物物理。公共资源。,3211007-1009,(2004),(勘误:Chou,K.C.,Cai,Y.D.,2005)。生物化学。生物物理学。Res.Commun公司。329, 1362)
[19] 周,K.C。;Elrod,D.W.,蛋白质亚细胞位置预测,蛋白质工程,12,107-118,(1999)
[20] 周,K.C。;Shen,H.B.,《大规模植物蛋白质亚细胞定位预测》,J.cell。生物化学。,100, 665-678, (2007)
[21] 周,K.C。;Shen,H.B.,Euk-mploc:通过合并多个位点进行大规模真核蛋白质亚细胞定位预测的融合分类器,J.蛋白质组研究,61728-1734,(2007)
[22] 周,K.C。;Shen,H.B.,《Signal-CF:预测信号肽的亚组偶联和窗口融合方法》,《生物化学》。生物物理。公共资源。,357, 633-640, (2007)
[23] 周,K.C。;Shen,H.B.,Memtype-2L:通过pse-PSSM和Biochem结合进化信息预测膜蛋白及其类型的网络服务器。生物物理。社区资源。,360, 339-345, (2007)
[24] 周,K.C。;Zhang,C.T.,通过考虑氨基酸相互作用的距离函数预测蛋白质折叠类型,J.biol。化学。,269, 22014-22020, (1994)
[25] 周,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。微生物。,30, 275-349, (1995)
[26] Cosic,I.,《大分子生物活性:它是大分子之间的共振相互作用吗-理论与应用,IEEE传输。生物群落。工程,41,1101-1114,(1994)
[27] Deleage,G.公司。;Roux,B.,基于类预测的蛋白质二级结构预测算法,蛋白质工程,1289-294,(1987)
[28] 杜,P。;Li,Y.,通过将假氨基酸组成与分段序列的各种物理化学特征杂交预测蛋白质亚线粒体位置,BMC bioninform。,7, 518-525, (2006)
[29] 杜,Q.S。;魏德清。;Chou,K.C.,蛋白质中氨基酸的相关性,肽,241863-1869,(2003)
[30] 杜,Q.S。;姜振强。;何文忠。;李,D.P。;Chou,K.C.,氨基酸主成分分析(AAPCA)及其在蛋白质结构类别预测中的应用,生物化学杂志。结构。动态。,23, 635-640, (2006)
[31] Fasman,G.D.,《蛋白质》,第1卷,(1976年),克利夫兰CRC出版社
[32] Fauchere,J.L。;查顿,M。;基尔,L.B。;Verloop,A。;Pliska,V.,《生物学和药理学相关研究的氨基酸侧链参数》,国际药理学杂志。蛋白质研究,32,269-278,(1988)
[33] 芬克尔斯坦(Finkelstein,A.V.)。;Ptitsyn,O.B.,为什么球形蛋白质适合有限的折叠模式?,掠夺。生物物理。摩尔生物。,50, 171-190, (1987)
[34] Hong,B。;唐,Q.Y。;Yang,F.S.,Apen和crossapen:特性、快速算法及其在脑电和认知、信号处理研究中的初步应用。,15, 100-108, (1999)
[35] 霍普,T.P。;Woods,K.R.,从氨基酸序列预测蛋白质抗原决定簇,Proc。美国国家科学院。科学。美国,78,3824-3828,(1981)
[36] 黄,Y。;Li,Y.,使用模糊预测蛋白质亚细胞位置k个-NN方法,生物信息学,20,21-28,(2004)
[37] 黄,W.L。;陈,H.M。;黄光裕,S.F。;Ho,S.Y.,使用自适应模糊k-最近邻法准确预测酶亚家族类别,生物系统,90,405-413,(2006)
[38] Janin,J.,球形蛋白质的表面和内部体积,《自然》,277491-492,(1979)
[39] Janin,J。;Wodak,S.,蛋白质中氨基酸侧链的构象,J.mol.biol。,125, 357-386, (1978)
[40] 川岛,S。;Ogata,H。;Kanehisa,M.,Aaindex:氨基酸指数数据库,核酸研究,27368-369,(1999)
[41] Kedarisetti,K.D。;洛杉矶库尔干。;Dick,S.,《不同同源性蛋白质结构类预测的分类器集成》,《生物化学》。生物物理。公共资源。,348981-988,(2006年)
[42] Keller,J.M。;格雷,M.R。;Givens,J.A.,模糊k个-最近邻算法,IEEE转换。系统。人类赛伯恩。,15, 580-585, (1985)
[43] Klein,P.,用判别分析预测蛋白质结构类别,生物化学。生物物理。《学报》,874205-215,(1986)
[44] 克莱因,P。;Delisi,C.,从氨基酸序列预测蛋白质结构类别,生物聚合物,251659-1672,(1986)
[45] Kneller,D.G。;科恩,F.E。;Langridge,R.,通过增强神经网络预测蛋白质二级结构的改进,J.mol.biol。,214, 171-182, (1990)
[46] 库根,L。;Homaeian,L.,蛋白质序列和结构域结构类的预测——预测算法、序列表示和同源性以及测试程序对准确性的影响,模式识别等。,39, 2323-2343, (2006) ·Zbl 1103.68767号
[47] 洛杉矶库尔干。;斯塔克·W。;阮,J.,基于二级蛋白质结构疏水性指数的新型量表,J.theor。生物学,248354-366,(2007)·Zbl 1451.92239号
[48] 莱维特,M。;Chothia,C.,球状蛋白质的结构模式,《自然》,261552-557,(1976)
[49] Lim,V.I.,预测球状蛋白质中α-螺旋和β-结构区域的算法,J.mol.biol。,88, 873-894, (1974)
[50] Lin,H。;Li,Q.Z.,利用伪氨基酸组成和改良马氏判别法预测芋螺毒素超家族和家族,生物化学。生物物理学。公共资源。,354, 548-551, (2007)
[51] Lin,H。;Li,Q.Z.,使用伪氨基酸组成预测蛋白质结构类别:通过合并400个二肽组分进行处理,J.comput。化学。,28, 1463-1466, (2007)
[52] 刘,H。;王,M。;Chou,K.C.,预测膜蛋白类型的低频傅里叶光谱,生物化学。生物物理。公共资源。,336, 737-739, (2005)
[53] 刘,H。;杨,J。;王,M。;薛,L。;Chou,K.C.,《利用傅里叶光谱分析和伪氨基酸组成预测膜蛋白类型》,《蛋白质杂志》,24,385-389,(2005)
[54] 罗,R.Y。;Feng,Z.P。;Liu,J.K.,通过氨基酸和多肽组成预测蛋白质结构类别,欧洲生物化学杂志。,269, 4219-4225, (2002)
[55] Metfessel,文学学士。;索鲁格,P.N。;康奈利,D.P。;Rich,S.T.,使用统计聚类和神经网络预测蛋白质结构类别的交叉验证,蛋白质科学。,2, 1171-1182, (1993)
[56] 蒙达尔,S。;巴夫纳,R。;Mohan Babu,R。;Ramakumar,S.,用于芋螺毒素超家族分类的伪氨基酸组成和多类支持向量机方法,J.theor。生物学,243,252-260,(2006)·Zbl 1447.92309号
[57] Nakashima,H。;西川,K。;Ooi,T.,蛋白质的折叠类型与氨基酸组成有关,J.biochem。,99, 152-162, (1986)
[58] Pincus,S.M.,作为系统复杂性度量的近似熵,Proc。美国国家科学院。科学。美国,882297-2301,(1991年)·Zbl 0756.60103号
[59] Pu,X。;郭杰。;Leung,H。;Lin,Y.,根据序列和位置特异性评分矩阵预测膜蛋白类型,J.theor。生物学,247,259-265,(2007)·Zbl 1455.92115号
[60] Richman,J.S。;Moorman,J.R.,《使用近似熵和样本熵进行生理时间序列分析》,美国生理学杂志。心脏循环。生理学。,278,H2039-H2049,(2000)
[61] 罗斯,G.D。;阿联酋盖塞洛维茨。;Lesser,G.J。;Lee,R.H.公司。;Zehfus,M.H.,球形蛋白质中氨基酸残基的疏水性,科学,229834-838,(1985)
[62] Sadovsky,M.G.,《基于最小熵原理比较核苷酸序列的方法》,Bull。数学。生物学,65,309-322,(2003)·兹比尔1334.92149
[63] Shen,H.B。;Chou,K.C.,使用优化的证据理论K最近邻分类器和伪氨基酸组成预测膜蛋白类型,Biochem。生物物理。公共资源。,334, 288-292, (2005)
[64] Shen,H.B。;Chou,K.C.,用优化的证据理论K最近分类器和伪氨基酸组成预测蛋白质亚核位置,生物化学。生物物理。公共资源。,337752-756(2005年)
[65] Shen,H.B。;Chou,K.C.,蛋白质折叠模式识别的集成分类器,生物信息学,221717-1722,(2006)
[66] Shen,H.B。;Chou,K.C.,Gpos-ploc:预测革兰氏阳性细菌蛋白质亚细胞定位的集成分类器,蛋白质工程。选择。,20, 39-46, (2007)
[67] Shen,H.B。;Chou,K.C.,Virus-ploc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器,生物聚合物,85,233-240,(2007)
[68] Shen,H.B。;Chou,K.C.,Hum-mploc:一种集成分类器,用于通过合并多个位点的样本进行大规模人类蛋白质亚细胞位置预测,Biochem。生物物理。公共资源。,355, 1006-1011, (2007)
[69] Shen,H.B。;杨,J。;刘晓杰。;Chou,K.C.,《使用监督模糊聚类预测蛋白质结构类别》,《生物化学》。生物物理。社区资源。,334, 577-581, (2005)
[70] Shen,H.B。;杨,J。;Chou,K.C.,Fuzzy KNN,用于从伪氨基酸组成预测膜蛋白类型,J.theor。生物学,240,9-13,(2006)·Zbl 1447.92312号
[71] Shen,H.B。;杨,J。;Chou,K.C.,Euk-ploc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67,(2007)
[72] 史J.Y。;张,S.W。;潘,Q。;Cheng,Y.-M。;Xie,J.,使用多尺度能量和伪氨基酸组成的支持向量机预测蛋白质亚细胞定位,氨基酸,33,69-74,(2007)
[73] Tanford,C.,疏水相互作用对蛋白质球状构象稳定性的贡献,化学杂志。社会,84,4240-4274,(1962)
[74] 王Z.X。;Yuan,Z.,用组分耦合方法预测蛋白质结构类的效果如何?,蛋白质,38,165-175,(2000)
[75] 王,M。;杨,J。;刘,G.P。;徐志杰。;Chou,K.C.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计。选择。,17, 509-516, (2004)
[76] 王胜强。;杨,J。;Chou,K.C.,利用叠加泛化法预测基于伪氨基酸组成的膜蛋白类型,J.theor。生物学,242941-946,(2006)·Zbl 1447.92315号
[77] Xiao,X。;邵,S.H。;黄,Z.D。;Chou,K.C.,使用伪氨基酸组成预测蛋白质结构类别:用复杂性测量因子进行研究,J.comput。化学。,27, 478-482, (2006)
[78] Xiao,X。;邵,S.H。;丁,Y.S。;黄,Z.D。;Chou,K.C.,使用细胞自动机图像和伪氨基酸组成预测蛋白质亚细胞位置,氨基酸,30,49-54,(2006)
[79] 张天乐、丁玉莎,2007。使用伪氨基酸组成和二元树支持向量机预测蛋白质结构类。氨基酸,doi:10.1007/s00726-007-0496-1;张天乐、丁玉莎,2007。使用伪氨基酸组成和二元树支持向量机预测蛋白质结构类。氨基酸,doi:10.1007/s00726-007-0496-1
[80] 张,C.T。;周,K.C。;Maggiora,G.M.,从氨基酸组成预测蛋白质结构类别:模糊聚类的应用,蛋白质工程,8,425-435,(1995)
[81] 张,S.W。;潘,Q。;张,H.C。;邵,Z.C。;Shi,J.Y.,通过伪氨基酸组成预测蛋白质同源异构体类型:通过改进的特征提取和朴素贝叶斯特征融合进行探讨,氨基酸,30461-468,(2006)
[82] 张,T.L。;丁,Y.S。;Chou,K.C.,利用氨基酸序列的疏水模式预测蛋白质亚细胞位置,计算。生物化学。,30, 367-371, (2006) ·Zbl 1119.92033号
[83] 周国平,《关于蛋白质结构类预测的有趣争议》,《蛋白质化学杂志》。,17229-738,(1998年)
[84] 周,G.P。;Assa-Mount,N.,《蛋白质结构类预测的一些见解》,《蛋白质:结构、功能和遗传学》,44,57-59,(2001)
[85] 周,G.P。;K.博士,凋亡蛋白的亚细胞定位预测,蛋白质:结构、功能和遗传学,50,44-48,(2003)
[86] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.theor。生物学,248546-551,(2007)·Zbl 1451.92245号
[87] 齐默尔曼,J.M。;Eliezer,N。;Simha,R.,《用统计方法表征蛋白质中的氨基酸序列》,J.theor。生物,2170-2011,(1968)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。