×

BlaPred:通过Chou的通用PseAAC使用三级预测系统预测和分类β-内酰胺酶。 (英语) Zbl 1406.92215号

摘要:\(\β\)-内酰胺类抗生素占全球抗生素使用量的近一半。β-内酰胺酶是细菌武库中的一个主要成分,可逃避β-内肽抗生素的致命作用。不同的β-内酰胺酶变体已经进化为对抗不同类型的β-内酰胺抗生素。已经进行了广泛的研究来分离和鉴定β-内酰胺酶的不同变体。不幸的是,β-内酰胺酶的鉴定和分类完全基于实验,这既耗费时间又耗费资源。因此,需要快速准确的计算方法,从后基因组时代产生的大量序列数据中识别和分类新的(β)-内酰胺酶。基于这些考虑,我们开发了一个基于支持向量机的三层预测系统BlaPred,以仅根据其蛋白质序列预测和分类(按照Ambler分类)β-内酰胺酶。使用的输入特征是氨基酸组成、经典和两亲性伪氨基酸组成。结果表明,基于伪氨基酸组成的经典模型的性能优于其他模型。遵循差一法交叉验证程序,区分\(\β\)-内酰胺酶和非\(\β\)-内酰胺酶的准确率为93.57%(一级);A类(β)-内酰胺酶的预测准确率为93.27%,B类为95.52%,C类为96.86%,D类(II级)为97.31%;在第三级,B1、B2和B3亚类的预测准确率分别为84.78%、95.65%和89.13%。在独立数据集上的比较结果表明,我们的方法能够有效区分(β)-内酰胺酶和非(β)内酰胺酶,总准确率为93.09%,并且能够进一步将(β)内酰胺酶序列划分为各自的Ambler类和亚类,准确率分别高于92%和87%,分别是。BlaPred在独立基准数据集上的比较性能也显示出与其他现有方法相比的显著改进。最后,BlaPred可以作为Web服务器和独立软件使用,可以通过以下网址访问http://proteininformatics.org/mkumar/blapred.

MSC公司:

92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚伯拉罕·E·P。;链状,E.,一种细菌产生的酶,能够破坏青霉素,Rev.Infect。数字化信息系统。,10, 677-678 (1988), 1940
[2] Ambler,R.P.,《β-内酰胺酶的结构》,Philos。事务处理。R.Soc.伦敦。生物科学B。,289, 321-331 (1980)
[3] Arif,M。;海亚特,M。;Jan,Z.,iMem-2LSAAC:通过将SAAC的概念扩展到chou的伪氨基酸组成中来区分膜蛋白及其类型的两级模型,J.Theor。生物学,442,11-21(2018)·Zbl 1397.92180号
[4] Bush,K。;雅各比,G.A。;Medeiros,A.A.,β-内酰胺酶的功能分类方案及其与分子结构的相关性,抗微生物。Agents Chemother公司。,39, 1211-1233 (1995)
[5] Cai,Y.D。;刘晓杰。;Xu,X.B。;Chou,K.C.,通过结合准序列顺序效应预测蛋白质亚细胞位置的支持向量机,J.Cell Biochem。,84, 343-348 (2002)
[6] Cai,Y.D。;Feng,K.Y。;卢,W.C。;Chou,K.C.,使用LogitBoost分类器预测蛋白质结构类别,J.Theor。《生物学》,238172-176(2006)·Zbl 1445.92220号
[7] Chen,W。;Lin,H。;Chou,K.C.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[8] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[9] Chen,W。;Lei,T.Y。;Jin,D.C。;Lin,H。;Chou,K.C.,PseKNC:生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60 (2014)
[10] Chen,W。;冯,P.M。;邓,E.Z。;Lin,H。;Chou,K.C.,iTIS-PseTNC:一种基于序列的预测因子,用于使用伪三核苷酸组成识别人类基因中的翻译起始位点,Ana。生物化学。,462, 76-83 (2014)
[11] Chen,W。;Tang,H。;Ye,J。;Lin,H。;Chou,K.C.,iRNA-PseU:鉴定RNA假尿苷位点,分子生物学。核酸,5,e332(2016)
[12] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.C.,iRNA-3型A:识别RNA腺苷位点的三种修饰,分子疗法。核酸,11468-474(2018)
[13] Cheng,X。;萧,X。;Chou,K.C.,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.Biosyst.,预测多位置植物蛋白的亚细胞定位。,13, 1722-1727 (2017)
[14] Cheng,X。;萧,X。;Chou,K.C.,pLoc-mVirus:通过将最佳GO信息纳入一般PseAAC,Gene,628,315-321预测多位置病毒蛋白的亚细胞定位(2017)
[15] Cheng,X。;萧,X。;Chou,K.C.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学(2017)
[16] Cheng,X。;萧,X。;Chou,K.C.,pLoc-mEuk:通过将关键GO信息提取到一般PseAAC中来预测多标记真核蛋白的亚细胞定位,基因组学,110,50-58(2018)
[17] Cheng,X。;萧,X。;Chou,K.C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,341448-1456(2018)
[18] Cheng,X。;Zhao,S.G。;萧,X。;Chou,K.C.,iATC-mHyb:一种用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget,8,58494-58503(2017)
[19] Cheng,X。;赵,S.G。;萧,X。;Chou,K.C.,iATC-mISF:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346(2017)
[20] Cheng,X。;Zhao,S.G。;Lin,W.Z。;萧,X。;Chou,K.C.,pLoc-mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,33,3524-3531(2017)
[21] Chou,K.-C.,《利用亚基偶联预测信号肽》,《蛋白质工程》,第14期,第75-79页(2001年)
[22] Chou,K.-C.,使用缩放窗口预测信号肽,肽,221973-1979(2001)
[23] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[24] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[25] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6262-274(2009)
[26] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[27] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,9, 1092-1100 (2013)
[28] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[29] 周,K.C.,《生物科学进步推动的药物化学空前革命》,当前。顶级药物化学。,17, 2337-2358 (2017)
[30] Chou,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。分子生物学。,30275-349(1995年)
[31] Chou,K.C。;Shen,H.B.,开发用于预测蛋白质属性的网络服务器的最新进展,《自然科学》。,1, 63-92 (2009)
[32] Dehzangi,A。;Heffernan,R。;Sharma,A。;Lyons,J。;Paliwal,K。;Sattar,A.,通过将基于进化的描述符合并到Chous general PseAAC,J.Theor中,对革兰氏阳性和革兰氏阴性蛋白进行亚细胞定位。《生物学》,364,284-294(2015)·兹比尔1405.92092
[33] 杜,P。;Li,Y.,通过将假氨基酸组成与分段序列的各种物理化学特征杂交预测蛋白质亚线粒体位置,BMC Bioinf。,7, 518 (2006)
[34] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC-Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[35] 杜青山。;王世清。;谢新政。;王庆云。;黄R.B。;Chou,K.C.,2L-PCA:用于定量药物设计及其应用的两级主成分分析仪,Oncotarget,870564-70578(2017)
[36] Ehsan,A。;Mahmood,K。;Y.D.Khan。;汗,S.A。;Chou,K.C.,《信号肽分类的数学生物学新模型》,《科学》。代表,81039(2018)
[37] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.C.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,确定不同rna修饰的发生位置。核酸,7155-163(2017)
[38] 冯·P。;Yang,H。;丁·H。;Lin,H。;Chen,W。;Chou,K.C.,iDNA6mA-PseKNC:通过将核苷酸物理化学性质结合到PseKNC中来鉴定DNA N(6)-甲基腺苷位点,基因组学(2018)
[39] 加利尼,M。;Lamotte-Brasseur,J。;罗索里尼,G.M。;斯宾塞,J。;迪德伯格,O。;弗雷尔,J.M。;金属β-内酰胺酶工作,G.,B类β-内内酰胺酶的标准编号方案,抗菌。Agents Chemother,45,660-663(2001)
[40] 贾,J。;刘,Z。;萧,X。;刘,B。;Chou,K.C.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物学》,377,47-56(2015)
[41] 贾,J。;刘,Z。;萧,X。;刘,B。;Chou,K.C.,pSuc-Lys:用PseAAC和整体随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[42] Y.D.Khan。;北拉苏尔。;侯赛因,W。;汗,S.A。;Chou,K.C.,iPhosT-PseAAC:通过将序列统计矩合并到PseAAA中来识别磷酸苏氨酸位点,Anal。生物化学。,550, 109-116 (2018)
[43] Z.U.Khan。;海亚特,M。;Khan,M.A.,利用Chou的伪氨基酸组成结合概率神经网络模型识别酸性和碱性酶,J.Theor。生物学,365197-203(2015)·Zbl 1314.92069号
[44] 克纳普,C.W。;Dolfing,J。;埃勒特,P.A。;Graham,D.W.,《1940年以来存档土壤中抗生素抗性基因丰度增加的证据》,《环境》。科学。技术。,44, 580-587 (2010)
[45] 诺克斯,J.R。;莫斯,P.C。;Frere,J.M.,细菌β-内酰胺抗性的分子进化,《化学》。生物,1937-947(1996)
[46] 库马尔,M。;维玛,R。;Raghava,G.P.,使用支持向量机和隐马尔可夫模型预测线粒体蛋白质,J.Biol。化学。,281, 5357-5363 (2006)
[47] 库马尔,R。;库马里,B。;Kumar,M.,通过结合结构域信息对线粒体和亚线粒体蛋白进行全蛋白质组预测和注释,线粒体(2017)
[48] 库马尔,R。;库马里,B。;Srivastava,A。;Kumar,M.,NRfamPred:预测核受体蛋白及其亚家族的蛋白质组尺度两级方法,Sci。代表,46810(2014)
[49] 库马尔,R。;Srivastava,A。;库马里,B。;Kumar,M.,通过周氏伪氨基酸组成和支持向量机预测β-内酰胺酶及其类别,J.Theor。生物,365,96-103(2015)·Zbl 1314.92055号
[50] 李伟(Li,W.)。;Godzik,A.,《Cd-hit:聚类和比较大组蛋白质或核苷酸序列的快速程序》,生物信息学,221658-1659(2006)
[51] 林,H。;邓,E.Z。;丁·H。;Chen,W。;Chou,K.C.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪K元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[52] 刘,B。;Yang,F。;Chou,K.C.,2L-piRNA:用于识别Piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,267-277(2017)
[53] 刘,B。;Wu,H。;Chou,K.C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,9, 67-91 (2017)
[54] 刘,B。;王,S。;朗·R。;Chou,K.C.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2017)
[55] 刘,B。;杨,F。;黄,D.S。;Chou,K.C.,iPromoter-2L:通过基于多窗口的PseKNC识别启动子及其类型的双层预测因子,生物信息学,34,33-40(2018)
[56] 刘,B。;方,L。;朗·R。;兰,X。;Chou,K.C.,iEnhancer-2L:通过伪K元组核苷酸组成识别增强子及其强度的双层预测因子,生物信息学,32,362-369(2016)
[57] 刘,B。;方,L。;刘,F。;王,X。;陈,J。;Chou,K.C.,用伪结构状态组成方法识别真实的microRNA前体,《公共科学图书馆·综合》,第10期,文章e0121501页,(2015)
[58] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[59] Liu,L.M。;徐,Y。;Chou,K.C.,iPGK PseAAC:通过将四层不同的氨基酸成对偶联信息结合到一般的PseAAC中来鉴定蛋白质中的赖氨酸磷酸甘油化位点,Med.Chem。,13, 552-559 (2017)
[60] Meher,P.K。;Sahu,T.K。;塞尼,V。;Rao,A.R.,通过将成分、物理化学和结构特征纳入Chou的一般PseAAC,Sci,预测抗菌肽,提高准确性。代表742362(2017)
[61] 梅,J。;赵,J.,通过周氏一般伪氨基酸组成和基序特征分析和预测突触前和突触后神经毒素,J.Theor。生物学,447147-153(2018)
[62] 梅,J。;赵,J.,利用周氏伪氨基酸组成和不同分类器预测HIV-1和HIV-2蛋白,科学。众议员,82359(2018)
[63] S.O.Meroueh。;米纳索夫,G。;Lee,W。;Shoichet,B.K。;Mobashery,S.,《青霉素结合蛋白β-内酰胺酶进化的结构方面》,《美国化学杂志》。Soc.,125,9612-9618(2003)
[64] Muthu Krishnan,S.,使用Chou的通用PseAAC分析受体相关蛋白(RAP)与蛋白质结构域的各种折叠模式的进化关系,J.Theor。生物学,44562-74(2018)
[65] 邱伟荣。;孙碧琴。;萧,X。;徐,Z.C。;Chou,K.C.,iPTM-mLys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123(2016)
[66] 邱伟荣。;姜世勇(Jiang,S.Y.)。;徐,Z.C。;萧,X。;Chou,K.C.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178-41188(2017)
[67] Shen,H.B。;Chou,K.C.,蛋白质折叠模式识别的集合分类器,生物信息学,2211717-1722(2006)
[68] Shen,H.B。;Chou,K.C.,PseAAC:用于生成各种蛋白质伪氨基酸组成的灵活web服务器,Ana。生物化学。,373, 386-388 (2008)
[69] 宋,J。;Wang,Y。;李,F。;Akutsu,T。;罗林斯,N.D。;韦伯,G.I。;Chou,K.C.,iProt-Sub:准确绘制和预测蛋白酶特异性底物和切割位点的综合软件包,Brief Bioinf(2018)
[70] 宋,J。;李,F。;莱尔,A。;Marquez-Lago,T.T。;Akutsu,T。;哈法里,G。;周,K.C。;韦伯,G.I。;派克,R.N。;Hancock,J.,PROSPERous:90种蛋白酶底物裂解位点的高通量预测,精确度提高,生物信息学,34,684-687(2018)
[71] Srivastava,A。;Singhal,N。;Goel,M。;Virdi,J.S。;Kumar,M.,《CBMAR:一个全面的β-内酰胺酶分子注释资源》,数据库(牛津)(2014),2014,bau111
[72] Srivastava,A。;Singhal,N。;Goel,M。;Virdi,J.S。;Kumar,M.,《β-内酰胺酶家族中家族特异性指纹的鉴定》,科学杂志。《世界期刊》,2014年,第980572条,pp.(2014)
[73] UniProt,C.,UniProt:蛋白质信息中心,《核酸研究》,43,D204-D212(2015)
[74] 沃尔什·T·R。;托勒曼,医学硕士。;Poirel,L。;Nordmann,P.,《金属-β-内酰胺酶:风暴前的宁静?》?,临床。微生物。第18版,306-325(2005)
[75] Wang,J。;杨,B。;Revote,J。;Leier,A。;马尔克斯·拉戈,T.T。;韦伯,G。;宋,J。;Chou,K.C。;Lithgow,T.,POSSUM:基于PSSM轮廓生成数字序列特征描述符的生物信息学工具包,生物信息学,33,2756-2758(2017)
[76] 王,P。;萧,X。;Chou,K.C.,NR-2L:基于序列衍生特征识别核受体亚家族的两级预测因子,《公共科学图书馆·综合》,6,e23505(2011)
[77] 萧,X。;王,P。;Chou,K.C.,Quat-2L:预测蛋白质四元结构属性的网络服务器,Mol.Divers,15149-155(2011)
[78] 萧,X。;王,P。;Chou,K.C.,GPCR-2L:通过杂交两种不同模式的伪氨基酸组分预测G蛋白偶联受体及其类型,分子生物学。,7, 911-919 (2011)
[79] 萧,X。;王,P。;Lin,W.Z。;贾建华。;Chou,K.C.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436168-177(2013年)
[80] 萧,X。;程翔;苏盛超;毛,齐;Chou,Kuo-Chen,pLoc-mGpos:将关键基因本体信息合并到通用PseAAC中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。,9, 330-349 (2017)
[81] 徐,Y。;王,Z。;李,C。;Chou,K.C.,iPreny-PseAAC:通过将两层序列偶联纳入PseAAC,Med.Chem。,13, 544-551 (2017)
[82] 徐,Y。;邵晓杰。;Wu,L.Y。;邓,纽约。;Chou,K.C.,iSNO-AAPair:将氨基酸成对偶联到PseAAC中以预测蛋白质中半胱氨酸S-亚硝基化位点,Peer J.,1,e171(2013)
[83] 徐,Y。;文,X。;Wen,L.S。;Wu,L.Y。;邓,纽约。;Chou,K.C.,iNitro-Tyr:具有一般伪氨基酸组成的蛋白质中硝基酪氨酸位点的预测,《公共科学图书馆·综合》,9,文章e105018 pp.(2014)
[84] Zavaljevski,N。;史蒂文斯,F.J。;Reifman,J.,《蛋白质分类和关键氨基酸位置识别的选择性核标度支持向量机》,生物信息学,18,689-696(2002)
[85] 张,S。;Duan,X.,用过采样方法预测蛋白质亚细胞定位和Chou的通用PseAAC,J.Theor。生物学,437,239-250(2018)·Zbl 1394.92047号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。