×

利用周氏伪氨基酸组成和支持向量机预测β-内酰胺酶及其类别。 (英语) Zbl 1314.92055号

摘要:β-内酰胺类抗生素被用作对抗许多致病微生物的主要治疗剂。抗生素在治疗细菌感染中的广泛和不加区分的使用,促使了几种逃避抗生素致命作用的机制的演变\(\β\)-内酰胺酶是一种内源性酶,通过裂解\(\β\)-内酰胺环使细菌对\(\β\)-内酰胺类抗生素产生耐药性。根据一级结构,\(\β\)-内酰胺酶家族分为四类,即A、B、C和D。B类为金属酶,C和D在酶催化中不需要任何金属。在本研究中,我们开发了一种基于支持向量机的两级(β)-内酰胺酶蛋白质预测方法,该方法在第一级区分(β)内酰胺酶和非(β)内酰胺酶,然后在第二级将预测的β-内酰胺酶分为不同类别。我们评估了不同输入载体的性能,即简单氨基酸组成、1型和2型Chou的伪氨基酸组成。性能比较表明,基于1型伪氨基酸组成训练的SVM模型具有最佳性能。在第一级,我们能够将β-内酰胺酶与非β-内内酰胺酶进行分类,准确率为90.63%。在第二级,我们发现A级、B级、C级和D级的最大准确率分别为61.82%、89.09%、70.91%和70.91%。此外,还开发了一个网络服务器和独立的PredLactamase,以使科学界可以使用该方法,您可以访问http://14.139.227.92/mkumar/前内酰胺酶.

MSC公司:

92C40型 生物化学、分子生物学
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ambler,R.P.,《β-内酰胺酶的结构》,Philos。事务处理。R.Soc.伦敦,Ser。B、 289、321-331(1980)
[2] Bailey,T.L.,MEME SUITE:模体发现和搜索工具,《核酸研究》,37,W202-W208(2009)
[3] Bock,J.R。;Gough,D.A.,从一级结构预测蛋白质相互作用,生物信息学,17455-460(2001)
[4] Bonomo,J。;Gill,R.T.,作为应变工程模型的抗生素耐药性,计算机。化学。工程,29509-517(2005)
[5] Bradley,A.E.,机器学习算法评估中ROC曲线下面积的使用,模式识别。,301145-1159(1997年)
[6] Brown,M.P.,使用支持向量机对微阵列基因表达数据进行基于知识的分析,Proc。国家。阿卡德。科学。美国,97,262-267(2000)
[7] Cao,D.S.,《Propy:生成周氏PseAAC各种模式的工具》,生物信息学,29960-962(2013)
[8] Chen,L.,通过整合化学-化学相互作用和相似性预测药物的解剖治疗化学(ATC)分类,PLoS One,7,e35254(2012)
[9] Chen,W.,iTIS-PseTNC:一种基于序列的预测因子,用于使用伪三核苷酸组成识别人类基因中的翻译起始位点,Ana。生物化学。,462, 76-83 (2014)
[10] Chen,Y.K。;Li,K.B.,通过将蛋白质拓扑结构、结构域、信号肽和物理化学性质纳入周氏伪氨基酸组成的一般形式来预测膜蛋白类型,J.Theor。生物学,3181-12(2013)·Zbl 1406.92450号
[11] Chou,K.C.,Psedo氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用,Curr。蛋白质组学,6262-274(2009)
[12] Chou,K.C.,通过结合准序列效应预测蛋白质亚细胞位置,生物化学。生物物理学。Res.Commun.公司。,278, 477-483 (2000)
[13] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[14] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[15] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[16] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,1092-1100(2013年)
[17] Chou,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。分子生物学。,30, 275-349 (1995)
[18] Chou,K.C。;Cai,Y.D.,《使用功能域组成和支持向量机预测蛋白质亚细胞位置》,J.Biol。化学。,27745765-45769(2002年)
[19] Chou,K.C.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,《公共科学图书馆·综合》,6,e18258(2011)
[20] Chou,K.C.,iLoc-Hum:使用累积-标签尺度预测人类蛋白质的亚细胞位置,单位点和多位点,分子生物学。,8, 629-641 (2012)
[21] 科尔特斯,C。;Vapnik,V.,支持向量网络,马赫。学习。,20, 273-297 (1995) ·Zbl 0831.68098号
[22] 戴维斯,J。;Davies,D.,抗生素耐药性的起源和进化,微生物学。分子生物学。修订版,74417-433(2010)
[23] Demain,A.L。;Sanchez,S.,《微生物药物发现:80年的进展》,《抗生素杂志》。(东京),62,5-16(2009)
[24] Ding,H.,iCTX-type:一种基于序列的预测因子,用于识别靶向离子通道中芋螺毒素的类型,生物医药研究国际,2014,286419(2014)
[25] Du,P.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014)
[26] Du,P.,PseAAC-Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分Ana。生物化学。,425, 117-119 (2012)
[27] Fawcett,T.,ROC分析导论,模式识别。莱特。,27, 861-874 (2006)
[28] Feng,P.M.,具有特征选择的朴素贝叶斯分类器,用于识别噬菌体病毒蛋白,计算机。数学。方法医学,2013,530696(2013)·Zbl 1275.92017年
[29] Fisher,J.F.,《细菌对β-内酰胺抗生素的耐药性:引人注目的机会主义,引人注目的机会》,《化学》。修订版,105,395-424(2005)
[30] Franco,B.E.,抗生素耐药性过程的决定因素,感染。抗药性。,2, 1-11 (2009)
[31] Furey,T.S.,使用微阵列表达数据对癌症组织样本进行支持向量机分类和验证,生物信息学,16906-914(2000)
[32] Guo,S.H.,iNuc-PseKNC:利用伪k元组核苷酸组成预测基因组中核小体定位的基于序列的预测因子,生物信息学,301522-1529(2014)
[33] 霍尔,B.G。;Barlow,M.,《修订的β-内酰胺酶Ambler分类》,《抗菌杂志》。化学家。,55, 1050-1051 (2005)
[34] Han,G.S.,通过将氨基酸分类和物理化学性质纳入Chou的PseAAC的一般形式,J.Theor,一种预测膜蛋白类型的两阶段SVM方法。生物学,344,31-39(2014)·Zbl 1412.92242号
[35] Ho,I.I.Y.,氨基糖苷耐药性堪萨斯分枝杆菌,禽分枝杆菌-细胞内分枝杆菌、和偶发分枝杆菌氨基糖苷修饰酶负责吗?,抗微生物。Agents Chemother公司。,44, 39-42 (2000)
[36] 华,S。;Sun,Z.,用高片段重叠测度预测蛋白质二级结构的新方法:支持向量机方法,J.Mol.Biol。,308, 397-407 (2001)
[37] 雅各比,G.A。;Archer,G.L.,《细菌对抗菌剂耐药性的新机制》,N.Engl。《医学杂志》,324,601-612(1991)
[38] Jia,C.,基于自适应正态分布双profile Bayes和Chou的伪氨基酸组成预测蛋白质S-亚硝化位点,国际分子科学杂志。,15, 10410-10423 (2014)
[39] 卡特里恩,B。;Arthur,V.A.,《细菌的抗菌性》,Cent。《欧洲医学杂志》,141-155(2009)
[40] Kong,K.F.,《β-内酰胺抗生素:从抗菌到耐药性和细菌学》,APMIS,118,1-36(2010)
[41] 库马尔,M。;Raghava,G.P.,使用SVM和HMM模型预测核蛋白,BMC Bioinf。,10, 22 (2009)
[42] Kumar,M.,使用支持向量机和隐马尔可夫模型预测线粒体蛋白质,J.Biol。化学。,281, 5357-5363 (2006)
[43] Kumar,M.,使用支持向量机和进化图谱鉴定DNA结合蛋白,BMC生物信息学。,8, 463 (2007)
[44] Kumar,M.,使用SVM和PSSM图谱预测蛋白质中的RNA结合位点,蛋白质,71,189-194(2008)
[45] Kumar,M.,《利用结合残基和进化信息基于SVM预测RNA结合蛋白》,《分子识别杂志》。,24, 303-313 (2010)
[46] Kumar,R.,使用SVM和Pfam域信息进行蛋白质亚核定位预测,PLoS One,9,e98345(2014)
[47] Kumari,B.,PalmPred:一种基于SVM的使用序列剖面信息的棕榈酰化预测方法,《公共科学图书馆·综合》,9,e89246(2014)
[48] Li,B.Q.,用mRMR和IFS方法预测和分析S-亚硝化修饰位点,《蛋白质组学杂志》,75,1654-1665(2012)
[49] Li,L.,通过将各种特征纳入Chou’s PseAAC和向后特征选择方法来预测细菌蛋白质亚细胞定位,Biochimie,104100-107(2014)
[50] 李伟(Li,W.)。;Godzik,A.,《Cd-hit:聚类和比较大组蛋白质或核苷酸序列的快速程序》,生物信息学,221658-1659(2006)
[51] Liu,B.,iDNA-Prot | dis:通过将氨基酸距离和简化的字母组合纳入一般伪氨基酸组成来识别DNA结合蛋白,PLoS One,9,e106691(2014)
[52] Liu,B.,将从频率剖面提取的进化信息与基于序列的内核相结合,用于蛋白质远程同源性检测,生物信息学,30472-479(2014)
[53] 利弗莫尔,D.M.,所有β-内酰胺的生成是否相等?,扫描。J.感染。数字化信息系统。补遗,101,33-43(1996)
[55] McKeegan,K.S.,《微生物和病毒耐药性机制》,《微生物趋势》。,10,S8-14(2002)
[56] McManus,M.C.,《细菌对抗菌剂的耐药性机制》,美国卫生系统杂志。药剂学,54,1420-1433(1997),(测验1444-6)
[57] Mei,S.,基于Chou的PseAAC公式的蛋白质亚线粒体定位多核转移学习,J.Theor。生物学,293121-130(2012)·Zbl 1307.92085号
[58] Mishra,N.K.,基于支持向量机的谷胱甘肽S-转移酶蛋白质预测,蛋白质Pept。莱特。,14575-580(2007年)
[59] Nanninga,N.,形态发生大肠杆菌,微生物。分子生物学。修订版,62110-129(1998年)
[60] Nikaido,H.,《细菌的多药耐药性》,年。生物化学评论。,78, 119-146 (2009)
[61] Petrosino,J.,《β-内酰胺酶:实时蛋白质进化》,《微生物趋势》。,6, 323-327 (1998)
[62] Poirel,L.,第1类整合子的特征铜绿假单胞菌包含bla(VIM-2)碳青霉烯水解β-内酰胺酶基因和两个新的氨基糖苷类耐药基因盒Antimobic。Agents Chemother公司。,45546-552(2001年)
[63] 邱,W.R.,iRSpot-TNCPseAAC:用三核苷酸组成和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 1746-1766 (2014)
[64] 罗伯特·H。;Andreas,C.,《关于支持向量机的定性稳健性》,J.Multivariate Anal。,102, 993-1007 (2011) ·Zbl 1274.62285号
[65] Shen,H.B。;Chou,K.C.,Nuc-PLoc:通过融合PseAA成分和PsePSSM预测蛋白质亚核定位的新网络服务器,protein Eng.Des。选择。,20, 561-567 (2007)
[66] Shen,H.B。;Chou,K.C.,PseAAC:用于生成各种蛋白质伪氨基酸组成的灵活web服务器,Ana。生物化学。,373, 386-388 (2008)
[67] Shi,S.P.,PLMLA:通过结合多种特征预测赖氨酸甲基化和赖氨酸乙酰化,分子生物学。,8, 1520-1527 (2012)
[68] Shien,D.M.,《用于鉴定蛋白质甲基化位点的结构特征》,J.Compute。化学。,30, 1532-1543 (2009)
[69] Sing,T.,ROCR:R中分类器性能的可视化,生物信息学,213940-3941(2005)
[70] Srivastava,A.,β-内酰胺酶家族中家族特异性指纹的鉴定,科学。《世界杂志》,2014,2014,7(2014)
[71] Vacic,V.,Composition profiler:氨基酸组成差异的发现和可视化工具,BMC Bioinf。,8, 211 (2007)
[72] Vapnik,V.,《统计学习理论的本质》(1995),施普林格出版社:纽约州施普林格·Zbl 0833.62008号
[73] Wang,L.,人类5-HT1A配体功能分类的线性和非线性支持向量机,Mol.Inf.,31,85-95(2012)
[74] Wang,M.,基于伪氨基酸组成预测膜蛋白类型的加权支持向量机,蛋白质工程设计。选择。,17, 509-516 (2004)
[75] Wang,P.,NR-2L:基于序列衍生特征识别核受体亚家族的两级预测因子,PLoS One,6,e23505(2011)
[76] Xiao,X.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177 (2013)
[77] Xie,H.L.,基于Chou’s PseAAC的一般形式,使用集成SVM识别人类GPCR的N-连接糖基化位点,Protein Eng.Des。选择。,26, 735-742 (2013)
[78] Xu,Y.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,e55844(2013)
[79] Xu,Y.,iHyd-PseAAC:通过将二肽位置特异性倾向纳入伪氨基酸组成来预测蛋白质中的羟脯氨酸和羟赖氨酸,国际分子科学杂志。,15, 7594-7610 (2014)
[80] Xu,Y.,iNitro-Tyr:具有一般伪氨基酸组成的蛋白质中硝基酪氨酸位点的预测,PLoS One,9,e105018(2014)
[81] Zervosen,A.,《针对旧靶点的新药开发:青霉素结合蛋白》,《分子》,第17期,第12478-12505页(2012年)
[82] Zhang,J.,PSNO:通过将各种序列衍生的特征结合到Chou’S PseAAC的一般形式中来预测半胱氨酸S-亚硝基化位点,Int.J.Mol.Sci。,15, 11204-11219 (2014)
[83] Zhang,L.,通过进化差异信息预测低相似度序列的蛋白质结构类别,成为Chou伪氨基酸组成的一般形式,J.Theor。生物学,355,105-110(2014)
[84] 周国平。;Assa-Mount,N.,《蛋白质结构类预测的一些见解》,《蛋白质》,44,57-59(2001)
[85] Zien,A.,识别翻译起始位点的工程支持向量机内核,生物信息学,16799-807(2000)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。