×

分泌物P:通过将新特征融合到Chou的伪氨基酸成分中来识别细菌分泌的蛋白质。 (英语) Zbl 1410.92040号

摘要:蛋白质分泌在细菌的生活方式中起着重要作用。分泌蛋白通过使细菌与环境相互作用,特别是将致病菌和共生菌传递到真核宿主中,对细菌致病至关重要。因此,细菌分泌蛋白的鉴定成为研究各种疾病和相应药物的重要过程。本文将几个新特征融合到Chou的伪氨基酸组成(PseAAC)中,开发了两个基于支持向量机(SVM)的三元分类器来预测革兰氏阴性菌和革兰氏阳性菌的分泌蛋白,该方法对经典分泌型、非经典分泌型和非分泌型蛋白质的识别准确率分别为94.03%和94.36%。为了比较我们的方法与六种已发表的方法在鉴定细菌分泌蛋白方面的实用能力大肠杆菌枯草芽孢杆菌收集样本构建革兰氏阴性菌和革兰氏阳性菌的测试集,我们的方法的预测结果与现有方法的预测效果相当。当对两个公共独立数据集进行预测NCSP时,它也对革兰氏阴性细菌蛋白质产生了令人满意的结果。可以访问预测服务器SecretPhttp://cic.scu.edu.cn/bioinformatics/secretPV2/index.htm.

MSC公司:

92C40型 生物化学、分子生物学
62页第10页 统计学在生物学和医学中的应用;元分析
92立方37 细胞生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔特舒尔,S.F。;Madden,T.L。;Schaffer,A.A。;Zhang,J.H。;张,Z。;Miller,W。;Lipman,D.J。;BLAST,Gapped,PSI-BLAST:新一代蛋白质数据库搜索程序,核酸研究,253389-3402(1997)
[2] Bendtsen,J.D。;Jensen,L.J。;布洛姆,N。;冯·海涅,G。;Brunak,S.,非经典和无领导蛋白质分泌的基于特征的预测,蛋白质工程设计。选择。,17, 349-356 (2004)
[3] Bendtsen,J.D。;基默,L。;Fausboll,A。;Brunak,S.,细菌中的非经典蛋白质分泌,BMC微生物。,5, 58-70 (2005)
[4] Bendtsen,J.D。;尼尔森,H。;冯·海因,G。;Brunak,S.,《信号肽预测的改进:信号肽3.0》,《分子生物学杂志》。,340, 783-795 (2004)
[5] 布洛克迈尔,美国。;Caspers,M。;弗洛伊德,R。;Jockwer,A。;诺尔·T。;Eggert,T.,《枯草芽孢杆菌所有信号肽的系统筛选:优化革兰氏阳性细菌异源蛋白分泌的有效策略》,J.Mol.Biol。,362, 393-402 (2006)
[6] 公牛,H.B。;Breese,K.,氨基酸溶液的表面张力:氨基酸残基的疏水性标度,Arch。生物化学。生物物理学。,161, 665-670 (1974)
[7] 巴特纳,D。;Bonas,U.,《动植物病原菌的常见感染策略》,Curr。意见植物生物学。,6, 312-319 (2003)
[8] Cai,Y.D。;Feng,K.Y。;李玉霞。;Chou,K.C.,预测α-转角类型的支持向量机,肽,24629-630(2003)
[9] Cai,Y.D。;Lin,S.L。;Chou,K.C.,预测蛋白质信号序列及其裂解位点的支持向量机,肽,24159-161(2003)
[10] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,预测蛋白质中HIV蛋白酶裂解位点的支持向量机,J.Compute。化学。,23, 267-274 (2002)
[11] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,用于β-回转类型分类和预测的支持向量机,J.Pept。科学。,8, 297-301 (2002)
[12] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,通过支持向量机预测蛋白质结构类别,计算机。化学。,26, 293-296 (2002)
[13] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,预测GalNAc-转移酶特异性的支持向量机,肽,23205-208(2002)
[14] Cai,Y.D。;李嘉图,P.W。;Jen,C.H。;Chou,K.C.,SVM在预测膜蛋白类型中的应用,J.Theor。生物学,226373-776(2004)
[15] Cai,Y.D。;周国平。;Chou,K.C.,通过使用功能域组成预测膜蛋白类型的支持向量机,Biophys。J.,84,3257-3263(2003)
[16] Cai,Y.D。;周国平。;Jen,C.H。;林,S.L。;Chou,K.C.,《利用支持向量机识别丝氨酸水解酶的催化三联体》,J.Theor。生物学,228551-557(2004)·Zbl 1439.92141号
[17] 坎布隆,E.D。;Roy,C.R.,通过细菌分泌系统识别效应蛋白并将其传递到真核细胞,Traffic,7929-939(2006)
[18] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[19] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[20] Chou,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.Biol。化学。,277, 45765-45769 (2002)
[21] Chou,K.C。;Shen,H.B.,Signal-CF:预测信号肽的亚组偶联和窗口融合方法,《生物化学》。生物物理学。Res.Commun.公司。,357, 633-640 (2007)
[22] Chou,K.C。;Shen,H.B.,蛋白质亚细胞定位预测的最新进展,分析。生物化学。,370, 1-16 (2007)
[23] Chou,K.C。;Shen,H.B.,预测单位点和多位点真核蛋白亚细胞定位的新方法:Euk-mPLoc 2.0,PLoS One,5,e9931(2010)
[24] Chou,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。分子生物学。,30, 275-349 (1995)
[25] Desvaux,M。;Hebraud,M.,《李斯特菌的蛋白质分泌系统:由内而外的细菌毒力》,FEMS Microbiol。修订版,30774-805(2006)
[26] Desvaux,M。;Hebraud,M。;Talon,R。;Henderson,I.R.,《细菌蛋白质的分泌和亚细胞定位:语义意识问题》,《微生物趋势》。,17, 139-145 (2009)
[27] Desvaux,M。;A.Khan。;Beatson,S.A。;斯科特·塔克,A。;Henderson,I.R.,核梭杆菌的蛋白质分泌系统:4型分泌物和完整V型通路的基因组鉴定为发病机制带来了新的见解,Biochim。生物物理学。法案,1713,92-112(2005)
[28] 丁Y.S。;Zhang,T.L。;Chou,K.C.,用伪氨基酸组成和模糊支持向量机网络预测蛋白质结构类,protein Pept。莱特。,14, 811-815 (2007)
[29] Economou,A。;克里斯蒂·P·J。;费尔南德斯,R.C。;Palmer,T。;普莱诺,G.V。;Pugsley,A.P.,《数字分泌:原核生物中的蛋白质运输》,《微生物分子》。,62, 308-319 (2006)
[30] 艾森哈贝尔,F。;帝国,F。;阿戈斯,P。;Frommel,C.,仅从氨基酸组成预测蛋白质的二级结构含量。1.新的分析向量分解方法,《蛋白质》,25,157-168(1996)
[31] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,利用Chou伪氨基酸组成的概念预测人乳头瘤病毒的风险类型,J.Theor。生物学,263203-209(2010)·Zbl 1406.92455号
[32] Gardy,J.L。;Brinkman,F.S.L.,《预测细菌蛋白质亚细胞定位的方法》,《微生物自然评论》。,4, 741-751 (2006)
[33] Gardy,J.L。;Laird,M.R。;陈,F。;Rey,S。;沃尔什·C·J。;埃斯特,M。;Brinkman,F.S.L.,PSORTb v.2.0:细菌蛋白质亚细胞定位的扩展预测和从比较蛋白质组分析中获得的见解,生物信息学,21,617-623(2005)
[34] Gardy,J.L。;斯宾塞,C。;王凯。;埃斯特,M。;Tusnady,G.E。;西蒙,I。;华,S。;德费斯,K。;兰伯特,C。;Nakai,K。;Brinkman,F.S.L.,PSORT-B:改进革兰氏阴性菌的蛋白质亚细胞定位预测,核酸研究,31,3613-3617(2003)
[35] Gasteiger,E。;Gattiker,A。;胡格兰,C。;伊万尼,I。;阿佩尔·R·D。;Bairoch,A.,ExPASy:用于深入蛋白质知识和分析的蛋白质组学服务器,核酸研究,313784-3788(2003)
[36] Gerlach,R.G。;Hensel,M.,《蛋白质分泌系统和粘附素:革兰氏阴性病原体的分子库》,《国际医学微生物学杂志》。,297401-415(2007年)
[37] Gerlach,R.G。;Hensel,M.,《蛋白质分泌系统和粘附素:革兰氏阴性病原体的分子库》,《国际医学微生物学杂志》。,297, 401-415 (2007)
[38] Grantham,R.,《帮助解释蛋白质进化的氨基酸差异公式》,《科学》,185862-864(1974)
[39] 吉拉尔,S。;米切尔·T·J。;B.马丁。;Claverys,J.P.,《人类病原体肺炎链球菌非补体细胞的能力编程捕食:遗传要求》,Proc。国家。阿卡德。科学。美国,1028710-8715(2005)
[40] 郭义忠。;Yu,L.Z。;温,Z.N。;Li,M.L.,使用支持向量机结合自协方差预测蛋白质序列中的蛋白质相互作用,《核酸研究》,36,3025-3030(2008)
[41] 何振生。;张杰。;史晓华(Shi,X.H.)。;胡,L.L。;Kong,X.G。;Cai,Y.D。;Chou,K.C.,《基于功能群和生物特征预测药物靶点相互作用网络》,《公共科学图书馆·综合》,5,e9603(2010)
[42] 广濑,I。;萨诺,K。;Shioda,I。;Kumano,M。;Nakamura,K。;Yamane,K.,枯草芽孢杆菌胞外蛋白的蛋白质组分析:二维蛋白质电泳研究,微生物学,146,65-75(2000)
[43] Holland,I.B.,《细菌蛋白质的转移——概述》,《生物化学》。生物物理学。《学报》,1694年,第5-16页(2004年)
[44] 霍普,T.P。;Woods,K.R.,从氨基酸序列预测蛋白质抗原决定簇,Proc。国家。阿卡德。科学。美国,78,3824-3828(1981)
[45] 华,S。;Sun,Z.,蛋白质亚细胞定位预测的支持向量机方法,生物信息学,17,721-728(2001)
[46] 黄立杰。;Chen,S.X。;黄,Y。;罗伟杰。;蒋海华。;胡庆华。;张,P.F。;Yi,H.,分泌蛋白二氢二醇脱氢酶作为非小细胞肺癌新血清标记物的蛋白质组学鉴定,肺癌,54,87-94(2006)
[47] 黄,T。;史晓华(Shi,X.H.)。;王,P。;何振生。;Feng,K.Y。;胡,L.L。;Kong,X.G。;李玉霞。;Cai,Y.D。;Chou,K.C.,《基于序列特征、亚细胞位置和相互作用网络的蛋白质代谢稳定性分析和预测》,《公共科学图书馆·综合》,5,e10972(2010)
[48] Journet,L。;休斯,K.T。;Cornelis,G.R.,《III型分泌:一种同时具有运动性和毒性的分泌途径》(综述),分子生物学。《生物学》,22,41-50(2005)
[49] 卡尔·L。;Krogh,A。;Sonnhammer,E.L.L.,一种结合跨膜拓扑结构和信号肽预测方法,J.Mol.Biol。,338, 1027-1036 (2004)
[50] 卡尔·L。;Krogh,A。;Sonnhammer,E.L.L.,用于序列特征预测的HMM后验解码器,包括同源信息,生物信息学,21,251-257(2005)
[51] 卡尔·L。;Krogh,A。;Sonnhammer,E.L.L.,《跨膜拓扑结构和信号肽预测相结合的优势——Phobius网络服务器》,核酸研究,35,429-432(2007)
[52] 坎佩努萨,I。;Zikmanis,P.,来自蛋白菌的非经典分泌蛋白质末端序列预测二级结构的独特属性,Cent。《欧洲生物学杂志》。,3, 320-326 (2008)
[53] 康克尔,M.E。;Kim,B.J。;Rivera Amill,V。;Garvis,S.G.,细菌分泌蛋白是空肠弯曲菌内化为培养哺乳动物细胞所必需的,Mol.Microbiol。,32, 691-701 (1999)
[54] 科斯塔基奥蒂,M。;纽曼,C.L。;塔纳西,D.G。;Stathopoulos,C.,穿过细菌外膜的蛋白质输出机制,《细菌学杂志》。,187, 4306-4314 (2005)
[55] Krogh,A。;Larsson,B。;冯·海因,G。;Sonnhammer,E.L.L.,用隐马尔可夫模型预测跨膜蛋白拓扑结构:应用于完整基因组,《分子生物学杂志》。,305, 567-580 (2001)
[56] Lin,H.,利用Chou的伪氨基酸组成预测外膜蛋白的改良Mahalanobis判别式,J.Theor。《生物学》,252350-356(2008)·Zbl 1398.92076号
[57] Lin,W.Z。;Xiao,X。;Chou,K.C.,GPCR-GIA:通过灰色关联分析识别G蛋白偶联受体及其家族的网络服务器,protein Eng.Des。选择。,22, 699-705 (2009)
[58] Lory,S.,《蛋白质的分泌和细菌表面细胞器的组装:细胞外蛋白靶向的共享途径》,Curr。意见微生物。,1, 27-35 (1998)
[59] 卢,Z。;Szafron,D。;格雷纳,R。;卢,P。;Wishart,D.S。;Poulin,B。;Anvik,J。;麦克唐奈尔,C。;Eisner,R.,使用机器学习分类器预测蛋白质的亚细胞定位,生物信息学,20547-556(2004)
[60] 马什本·沃伦,L.M。;Whiteley,M.,《特殊交付:原核生物中的囊泡贩运》,《微生物分子》。,61, 839-846 (2006)
[61] Matthews,B.W.,T4噬菌体溶菌酶预测和观察二级结构的比较,Biochim。生物物理学。《学报》,405,442-451(1975)
[62] 奈尔(Nair,R.)。;Rost,B.,《模拟细胞分选提高亚细胞定位预测》,J.Mol.Biol。,348, 85-100 (2005)
[63] Nakai,K。;Horton,P.,PSORT:检测蛋白质中的分类信号并预测其亚细胞定位的程序,《趋势生物化学》。科学。,24, 34-36 (1999)
[64] Nakai,K。;Kanehisa,M.,预测革兰氏阴性菌蛋白质定位位点的专家系统,蛋白质,1195-110(1991)
[65] 尼尔森,H。;布鲁纳克,S。;von Heijne,G.,《预测信号肽和其他蛋白质分类信号的机器学习方法》,《蛋白质工程》,12,3-9(1999)
[66] 尼尔森,H。;Engelbrecht,J。;布鲁纳克,S。;von Heijne,G.,用于鉴定原核和真核信号肽并预测其切割位点的神经网络方法,Int.J.neural Syst。,8, 581-599 (1997)
[67] 皮博迪,C.R。;Chung,Y.J。;Yen,M.R。;维达尔·英格利亚迪,D。;帕格斯利,A.P。;Saier,M.H.,II型蛋白分泌及其与细菌IV型菌毛和古鞭毛的关系,微生物学,1493051-3072(2003)
[68] Prilusky,J。;费尔德,C.E。;Zeev-Ben-Mordehai,T。;里德伯格,E.H。;曼,O。;贝克曼,J.S。;西尔曼,I。;Sussman,J.L.,FoldIndex:预测给定蛋白质序列是否内在展开的简单工具,生物信息学,213435-3438(2005)
[69] Rakonjac,J。;Russel,M.,《蛋白质和蛋白质/DNA复合物的组装、分泌和靶向移位的细菌系统》,澳大利亚ASBMB。生物化学。,34, 7-10 (2003)
[70] Shen,H.B。;Chou,K.C.,《信号-3L:预测信号肽的三层方法》,《生物化学》。生物物理学。Res.Commun.公司。,363, 297-303 (2007)
[71] Smialowski,P。;Martin-Galiano,A.J。;Mikolajka,A。;Girschick,T。;荷拉克,T.A。;Frishman,D.,《蛋白质溶解度:基于序列的预测和实验验证》,生物信息学,232536-2542(2007)
[72] 斯蒂芬斯,C。;Shapiro,L.,细菌蛋白分泌物——新抗生素的靶点?,化学。《生物学》,4637-641(1997)
[73] Tanford,C.,疏水相互作用对蛋白质球状构象稳定性的贡献,《美国化学杂志》。Soc.,84,4240-4247(1962年)
[74] Tjalsma,H。;Bolhuis,A。;Jongbloed,J.D.H。;Bron,S。;van Dijl,J.M.,《枯草芽孢杆菌信号肽依赖性蛋白质转运:分泌体微生物的基因组调查》。分子生物学。修订版,64,515-547(2000)
[75] 曾,T.T。;泰勒,B.M。;Setubal,J.C.,《细菌-宿主关联中的蛋白质分泌系统及其在基因本体中的描述》,BMC微生物。,9,补遗1,S2(2009)
[76] Vapnik,V.,《统计学习理论》(1998),威利出版社:威利纽约·Zbl 0935.62007号
[77] 沃尔德,S。;Jonsson,J。;Sjostrom,M。;桑德伯格,M。;S.Rannar,DNA、肽序列和化学过程通过主成分分析和对潜在结构的偏最小二乘投影进行相互建模,Ana。蜂鸣器。《学报》,277239-253(1993)
[78] Xiao,X。;Lin,W.Z.,蛋白质灰色关联度测度在预测蛋白质四级结构类型中的应用,氨基酸,37741-749(2009)
[79] Xiao,X。;Lin,W.Z。;Chou,K.C.,《使用灰色动态模型和伪氨基酸组成预测蛋白质结构类别》,J.Compute。化学。,2018年至2024年(2008年)
[80] Xiao,X。;Shao,S.H。;丁Y.S。;黄,Z.D。;Chou,K.C.,使用细胞自动机图像和伪氨基酸组成预测蛋白质亚细胞位置,《氨基酸》,30,49-54(2006)
[81] Xiao,X。;Shao,S.H。;丁Y.S。;黄,Z.D。;Huang,Y.S。;Chou,K.C.,使用复杂性度量因子预测蛋白质亚细胞位置,《氨基酸》,28,57-61(2005)
[82] Xiao,X。;Shao,S.H。;黄,Z.D。;Chou,K.C.,《使用伪氨基酸组成预测蛋白质结构类别:用复杂性度量因子进行探讨》,J.Compute。化学。,27, 478-482 (2006)
[83] Xiao,X。;王,P。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:一种使用细胞自动机图像几何矩的方法,J.Theor。生物学,254691-696(2008)·Zbl 1400.92416号
[84] Xiao,X。;王,P。;Chou,K.C.,通过杂交功能域组成和伪氨基酸组成预测蛋白质四元结构属性,J.Appl。结晶器。,42, 169-173 (2009)
[85] Xiao,X。;王,P。;Chou,K.C.,GPCR-CA:预测G蛋白偶联受体功能类的细胞自动机图像方法,J.Compute。化学。,30, 1414-1423 (2009)
[86] 余春生(Yu,C.S.)。;Chen,Y.C。;卢,C.H。;Hwang,J.K.,蛋白质亚细胞定位预测,蛋白质,64,643-651(2006)
[87] 余春生(Yu,C.S.)。;Lin,C.J。;Hwang,J.K.,基于n肽成分的支持向量机预测革兰氏阴性菌蛋白质的亚细胞定位,蛋白质科学。,1402-1406年(2004年)
[88] Yu,L.Z。;郭义忠。;张,Z。;李义忠。;李,M.L。;李,G.B。;熊维杰。;Zeng,Y.H.,SecretP:预测哺乳动物分泌蛋白质的新方法,肽,31574-578(2010)
[89] 曾Y.H。;郭义忠。;肖瑞秋。;Yang,L。;Yu,L.Z。;Li,M.L.,基于自协方差方法,使用增广的周伪氨基酸组成预测蛋白质亚线粒体位置,J.Theor。生物学,259366-372(2009)·Zbl 1402.92193号
[90] 周国平。;K.博士,凋亡蛋白的亚细胞定位预测,蛋白质,50,44-48(2003)
[91] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.Theor。《生物学》,248546-551(2007)·兹比尔1451.92245
[92] 齐默尔曼,J.M。;Eliezer,N。;Simha,R.,《用统计方法表征蛋白质中的氨基酸序列》,J.Theor。生物学,21170-201(1968)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。