×

pSuc-Lys:使用PseAAC和集成随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点。 (英语) Zbl 1343.92153号

摘要:作为一种翻译后修饰(PTM),蛋白赖氨酸琥珀酰化在调节各种生物过程中起着重要作用。然而,它也与一些疾病有关。因此,从基础研究和药物开发的角度来看,我们面临着一个具有挑战性的问题:对于一个含有许多Lys残基的非特征化蛋白质序列,哪些可以进行琥珀酰化,哪些不能?为了解决这个问题,我们开发了一个名为pSuc-Lys的预测器,方法是:(1)将序列耦合信息合并到一般的伪氨基酸组成中,(2)通过随机抽样平衡倾斜的训练数据集,以及(3)通过融合一系列单独的随机森林分类器构建集合预测器。严格的交叉验证表明,它显著优于现有方法。pSuc-Lys用户友好的web服务器已在http://www.jci-bioinfo.cn/pSuc-Lys用户无需通过复杂的数学方程即可轻松获得所需的结果。我们注意到,这里提出的公式和方法也可以用于分析计算蛋白质组学中的许多其他问题。

理学硕士:

92C40型 生物化学、分子生物学
92D20型 蛋白质序列,DNA序列
92-04 生物相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾哈迈德,S。;卡比尔,M。;Hayat,M.,《通过将二肽成分纳入Chou的一般PseAAC,Compute,鉴定热休克蛋白家族和J蛋白类型》。方法生物识别程序。,122, 165-174 (2015)
[2] 阿尔特豪斯,I.W。;冈萨雷斯,A.J。;周杰杰。;Diebel,M.R。;Romero,D.L。;亚里士多夫,P.A。;Tarpley,W.G。;Reusser,F.,喹啉U-78036是HIV-1逆转录酶的有效抑制剂,J.Biol。化学。,268, 14875-14880 (1993)
[3] 奥尔特豪斯,I.W。;周杰杰。;Gonzales,A.J。;Kezdy,F.J。;Romero,D.L。;亚里士多夫,P.A。;Tarpley,W.G。;Reusser,F.,非核苷HIV-1逆转录酶抑制剂U-88204E的动力学研究,生物化学,326548-6554(1993)
[4] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32 (2001) ·Zbl 1007.68152号
[5] Cai,Y.D.,通过结合两性效应预测膜蛋白类型,《化学杂志》。信息模型。,45, 407-413 (2005)
[6] 曹,D.S。;徐庆生。;Liang,Y.Z.,《propy:生成周氏PseAAC各种模式的工具》,生物信息学,29960-962(2013)
[7] 陈,J。;刘,H。;Yang,J.,使用氨基酸对抗原性量表预测线性B细胞表位,氨基酸,33423-428(2007)
[8] Chen,W。;Lin,H.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[9] Chen,W。;冯,P.M。;Lin,H.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[10] Chen,W。;冯,P.M。;Lin,H.,iSS-PseDNC:使用伪二核苷酸成分识别剪接位点,生物识别。Res.Int.,2014,623149(2014)
[11] Chen,W。;冯,P.M。;Deng,E.Z.,iTIS PseTNC:一种基于序列的预测因子,用于使用伪三核苷酸组成鉴定人类基因中的翻译起始位点,Anal。生物化学。,462, 76-83 (2014)
[12] Chen,W。;Lei,T.Y。;Jin,D.C.,PseKNC:用于生成伪K元组核苷酸组成的灵活网络服务器,Ana。生物化学。,456, 53-60 (2014)
[13] Chen,W。;张,X。;布鲁克,J。;Lin,H.,PseKNC-General:生成各种模式伪核苷酸组成的跨平台软件包,生物信息学,31,119-120(2015)
[14] Chen,W。;冯·P。;丁·H。;Lin,H.,iRNA-甲基:使用伪核苷酸组成识别N6-甲基腺苷位点,分析。生物化学。,490,26-33(2015),(另见《简要数据》,2015,5:376-378)
[15] Chou,K.C.,《稳态和非稳态酶动力学的图形规则》,《生物学报》。化学。,264, 12074-12079 (1989)
[16] Chou,K.C.,预测蛋白质中HIV蛋白酶裂解位点的矢量化序列耦合模型,J.Biol。化学。,268, 16938-16948 (1993)
[17] Chou,K.C.,用于预测GalNAc-转移酶特异性的序列耦合向量投影模型,蛋白质科学。,4, 1365-1383 (1995)
[18] Chou,K.C.,综述:人类免疫缺陷病毒蛋白酶在蛋白质中切割位点的预测,分析。生物化学。,233, 1-14 (1996)
[19] Chou,K.C.,利用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。遗传学。,43,246-255(2001),(勘误表:同上,2001年,第44卷,第60页)
[20] Chou,K.C.,蛋白质信号序列及其裂解位点的预测,蛋白质:结构。功能。遗传学。,42, 136-139 (2001)
[21] Chou,K.C.,使用亚基偶联预测信号肽,蛋白质工程,14,75-79(2001)
[22] Chou,K.C.,使用缩放窗口预测信号肽,肽,221973-1979(2001)
[23] Chou,K.C.,综述:蛋白质信号序列的预测,当前。蛋白质肽。科学。,3, 615-622 (2002)
[24] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[25] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组。,6, 262-274 (2009)
[26] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[27] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,9, 1092-1100 (2013)
[28] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[29] Chou,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。分子生物学。,30, 275-349 (1995)
[30] Chou,K.C。;蔡永德,《蛋白质亚细胞位置的预测和分类:序列序效应和伪氨基酸组成》,《细胞杂志》。生物化学。,90,1250-1260(2003),(增编,同上,2004,91,1085)
[31] Chou,K.C。;Shen,H.B.,通过融合多个分类器预测蛋白质亚细胞位置,J.Cell。生物化学。,99, 517-527 (2006)
[32] Chou,K.C。;沈海斌,《综述:蛋白质亚细胞定位预测的最新进展》,《分析》。生物化学。,370, 1-16 (2007)
[33] Chou,K.C。;Shen,H.B.,ProtIdent:通过融合功能域和序列进化信息来识别蛋白酶及其类型的web服务器,Biochem。生物物理学。Res.Commun.公司。,376, 321-325 (2008)
[34] Davis,J。;Goadrich,M.,《精确重算和ROC曲线之间的关系》,第23届机器学习国际会议论文集,233-240(2006),ACM
[35] Dehzangi,A。;Heffernan,R。;夏尔马,A。;Lyons,J。;Paliwal,K。;Sattar,A.,通过将基于进化的描述符纳入Chou的一般PseAAC,J.Theor,对革兰氏阳性和革兰氏阴性蛋白进行亚细胞定位。《生物学》,364,284-294(2015)·Zbl 1405.92092号
[36] 丁·H。;邓,E.Z。;袁,L.F。;刘,L。;Lin,H.,iCTX-Type:一种基于序列的预测因子,用于识别靶向离子通道中的芋螺毒素类型,Biomed。Res.Int.,2014,286419(2014)
[37] 杜,J。;周,Y。;苏,X。;于建杰。;Khan,S。;姜浩。;Kim,J。;吴,J。;Kim,J.H。;Choi,B.H.,Sirt5是一种NAD依赖性蛋白赖氨酸脱氨酸酶和脱琥珀酸酶,《科学》,334,806-809(2011)
[38] 杜,P。;顾S。;Jiao,Y.,PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式,国际分子科学杂志。,15, 3495-3506 (2014)
[39] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分,Anal。生物化学。,425, 117-119 (2012)
[40] Fan,G.L。;张晓云。;Liu,Y.L。;Nang,Y。;Wang,H.,DSPMP:通过杂交Chou伪氨基酸模式的不同描述符来区分疟疾寄生虫的分泌蛋白,J Compute。化学。,36, 2317-2327 (2015)
[41] Fawcett,J.A.,ROC分析简介,模式识别。莱特。,27, 861-874 (2005)
[42] Forsen,S.,《酶催化速率定律的图形规则》,《生物化学》。J.,187,829-835(1980)
[43] Fu,L。;牛,B。;朱,Z。;吴,S。;Li,W.,CD-HIT:加速聚类下一代测序数据,生物信息学,283150-3152(2012)
[44] 黄,C。;Yuan,J.Q.,通过融合蛋白质的三种不同的伪氨基酸组成模式,即蛋白质肽,同时鉴定蛋白质的三种不同属性。莱特。,22, 547-556 (2015)
[45] 贾,J。;刘,Z。;Xiao,X.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物学》,377,47-56(2015)
[46] 贾,J。;Xiao,X。;刘,B。;Jiao,L.,基于Bagging的光谱聚类集成选择,模式识别。莱特。,32, 1456-1467 (2011)
[47] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,通过将物理化学特性和平稳小波变换结合到伪氨基酸组成中来识别蛋白质结合位点(iPPBS-PseAAC),J.Biomol。结构。动态。(2015)
[48] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,iPPBS-Opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集识别蛋白质结合位点,《分子》,21,95(2016)
[49] Kandaswamy,K.K。;马丁内茨,T。;莫勒,S。;Suganthan,P.N。;Sridharan,S。;Pugalenthi,G.,AFP-Pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.Theor。生物学,27056-62(2011)
[50] Z.U.Khan。;海亚特,M。;Khan,M.A.,《利用Chou的伪氨基酸组成结合概率神经网络模型鉴别酸性和碱性酶》,J.Theor。生物学,365197-203(2015)·Zbl 1314.92069号
[51] 库马尔,R。;Srivastava,A。;库马里,B。;Kumar,M.,通过Chou的伪氨基酸组成和支持向量机预测β-内酰胺酶及其类别,J.Theor。生物,365,96-103(2015)·Zbl 1314.92055号
[52] Lin,H。;邓,E.Z。;丁·H。;Chen,W。;Chou,K.C.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪K元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[53] Lin,S.X。;Lapointe,J.,《理论和实验生物学》,为纪念郭振秋教授50周年和理查德·吉格教授40周年,J.Biomed举办了一场研讨会。科学。和工程师,6435-442(2013)
[54] Lin,W.Z。;Xiao,X.,Wenxiang:绘制文祥图的网络服务器,自然科学。,3, 862-865 (2011)
[55] Lin,W.Z。;Fang,J.A。;Xiao,X.,iDNA-Prot:使用灰色模型的随机森林识别DNA结合蛋白,PLoS ONE,6,e24756(2011)
[56] Lin,W.Z。;Fang,J.A。;Xiao,X.,iLoc-Animal:一种预测动物蛋白质亚细胞定位的多标记学习分类器,Mol.Biosyst。,9, 634-644 (2013)
[57] 刘,B。;方,L。;王,S。;Wang,X.,用简并K-tuple或Kmer策略鉴定microRNA前体,J.Theor。生物学,385153-159(2015)
[58] 刘,B。;方,L。;朗·R。;Lan,X.,iEnhancer-2L:通过伪k元组核苷酸组成识别增强子及其强度的双层预测因子,生物信息学(2015)
[59] 刘,B。;刘,F。;方,L。;Wang,X.,repDNA:一个Python软件包,通过结合用户定义的物理化学特性和序列顺序效应,为DNA序列生成各种模式的特征向量,生物信息学,311307-1309(2015)
[60] 刘,B。;方,L。;刘,F。;Wang,X.,iMiRNA-PseDPC:用伪距离-对合成方法鉴定microRNA前体,J.Biomol。结构。动态。(2015)
[61] 刘,B。;方,L。;刘,F。;王,X。;Chen,J.,用伪结构状态组成方法鉴定真的microRNA前体,PLoS ONE,10,e0121501(2015)
[62] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[63] 刘德清。;刘,H。;Shen,H.B。;Yang,J.,通过融合全球比对标记预测分泌蛋白信号序列裂解位点,氨基酸,32493-496(2007)
[64] 刘,Z。;Xiao,X。;邱,W.R.,iDNA-甲基:通过伪三核苷酸组成鉴定DNA甲基化位点,Ana。生物化学。,474,69-77(2015),(另见《简明数据》,2015,4:87-89)
[65] 刘,Z。;Wang,Y。;高,T。;潘,Z。;Cheng,H。;杨琼。;郑,Z。;Guo,A。;Ren,J。;Xue,Y.,CPLM:蛋白质赖氨酸修饰数据库,核酸研究,42,D531-D536(2014)
[66] 曼达尔,M。;Mukhopadhyay,A。;Maulik,U.,通过将基于多目标PSO的特征子集选择合并到Chou的PseAAC的一般形式中来预测蛋白质亚细胞定位,Med.Biol。工程计算。,53, 331-344 (2015)
[67] 蒙达尔,S。;Pai,P.P.,Chou的伪氨基酸组成改进了基于序列的抗冻蛋白预测,J.Theor。生物,356,30-35(2014)·Zbl 1412.92249号
[68] 帕克,J。;陈,Y。;蒂什科夫,D.X。;彭,C。;Tan,M。;戴,L。;谢,Z。;Zhang,Y。;Zwaans,B.M.M。;Skinner,M.E.,SIRT5-介导的赖氨酸脱琥珀酸化影响多种代谢途径,分子细胞,50,919-930(2013)
[69] Pugalenthi,G。;Kandaswamy,K.K。;Kolatkar,P.,RSARF:使用随机森林法从蛋白质序列预测残留溶剂可及性,蛋白质Pept。莱特。,19, 50-56 (2012)
[70] 邱伟荣。;Xiao,X.,iRSpot-TNCPseAAC:用三核苷酸组成和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 1746-1766 (2014)
[71] 邱伟荣。;Xiao,X。;Lin,W.Z.,iMethyl-PseAAC:通过伪氨基酸组成方法鉴定蛋白质甲基化位点,生物医学研究国际,2014,947416(2014)
[72] 桑切斯,V。;Peinado,A.M。;Perez-Cordoba,J.L。;Gomez,A.M.,《蛋白质序列的新信号特征和基于信号的Chou’s PseAAC表示法》,J.Bioninform。计算。生物学,1550024(2015)
[73] Shen,H.B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,《生物化学》。生物物理学。Res.Commun.公司。,347, 150-157 (2006)
[74] Shen,H.B.,通过融合优化的证据理论K-最近邻分类器预测真核蛋白亚细胞位置,J.Proteom。第5号决议,1888-1897(2006)
[75] Shen,H.B.,Nuc-PLoc:通过融合PseAA成分和PsePSSM预测蛋白质亚核定位的新网络服务器,protein Eng.Des。选择。,20, 561-567 (2007)
[76] Shen,H.B.,Signal-CF:预测信号肽的亚组偶联和窗口融合方法,《生物化学》。生物物理学。Res.Commun.公司。,357, 633-640 (2007)
[77] Shen,H.B.,Euk-mPLoc:通过合并多个位点进行大规模真核蛋白亚细胞定位预测的融合分类器,《蛋白质组研究》,第6期,1728-1734页(2007年)
[78] Shen,H.B.,《病毒-PLoc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器》,生物聚合物,85,233-240(2007)
[79] Shen,H.B.,QuatIdent:通过融合功能域和序列进化信息来识别蛋白质四元结构属性的web服务器,《蛋白质组研究》,第8期,第1577-1584页(2009年)
[80] Shen,H.B.,《Virus-mPLoc:通过合并多个位点预测病毒蛋白亚细胞位置的融合分类器》,J.Biomol。结构。动态。,28, 175-186 (2010)
[81] Shen,H.B。;Yang,J.,Euk-PLoc:大规模真核蛋白质亚细胞定位预测的集成分类器,《氨基酸》,33,57-67(2007)
[82] Shen,H.B。;Song,J.N.,通过融合多个序列特征从一级序列预测蛋白质折叠速率,J.Biomed。科学。工程,2136-143(2009)
[83] 孙,Y。;Wong,A.K。;Kamel,M.S.,《不平衡数据的分类:综述》,国际模式识别杂志。Artif公司。智力。,23, 687-719 (2009)
[84] 托马塞利,A.L。;里尔登,I.M。;Heinrikson,R.L.,用判别函数法预测蛋白质中的HIV蛋白酶裂解位点,蛋白质:结构。功能。遗传学。,24, 51-72 (1996)
[85] UniProt联盟,《2010年的通用蛋白质资源(UniProt)》,核酸研究,38,D142-D148(2010)
[86] 沃尔什,C.T。;Garneau-Tsodikova,S。;Gatto,G.J.,《蛋白质翻译后修饰:蛋白质组多样性的化学》,Angew。化学。国际编辑,44,7342-7372(2005)
[87] 王,X。;张伟。;张,Q。;Li,G.Z.,MultiP-SChlo:使用Chou的伪氨基酸成分和新的多标签分类器进行多标签蛋白质亚叶绿体定位预测,生物信息学,31,2639-2645(2015)
[88] Witze,E.S。;Old,W.M。;Resing,K.A。;Ahn,N.G.,用质谱法绘制蛋白质翻译后修饰,《自然方法》,4798-806(2007)
[89] Wu,Z.C。;Xiao,X.,2D MH:一个基于组成氨基酸的物理化学性质生成蛋白质序列图形表示的网络服务器,J.Theor。生物学,267,29-34(2010)·Zbl 1410.92089号
[90] Wu,Z.C。;Xiao,X.,iLoc-Hum:利用累积-标签尺度预测人类蛋白质在单位点和多位点的亚细胞位置,Mol.Biosyst。,8, 629-641 (2012)
[91] Xiao,X。;Wu,Z.C.,iLoc-Virus:一种多标记学习分类器,用于识别具有单个和多个位点的病毒蛋白的亚细胞定位,J.Theor。《生物学》,284,42-51(2011)·Zbl 1397.92238号
[92] Xiao,X。;王,P。;Lin,W.Z。;Jia,J.H.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177 (2013)
[93] Xiao,X。;Min,J.L。;Lin,W.Z。;Liu,Z.,iDrug-Target:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。动态。,33, 2221-2233 (2015)
[94] 谢,Z。;戴J。;戴,L。;Tan,M。;郑,Z。;Wu,Y。;博克,J.D。;Zhao,Y.,组蛋白中的赖氨酸琥珀酰化和赖氨酸丙二酰化,分子细胞。蛋白质组。,11, 100-107 (2012)
[95] Xu,H.D。;史,S.P。;温,P.P。;邱,J.D.,《SuccFind:一种通过增强特征策略的新型琥珀酰化位点在线预测工具》,生物信息学(2015)
[96] Xu,Y。;丁,J。;Wu,L.Y.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS ONE,8,e55844(2013)
[97] Xu,Y。;文,X。;邵晓杰。;Deng,N.Y.,iHyd-PseAAC:通过将二肽位置特异性倾向纳入伪氨基酸组成来预测蛋白质中的羟脯氨酸和羟赖氨酸,国际分子科学杂志。,15, 7594-7610 (2014)
[98] Xu,Y。;文,X。;温,L.S。;Wu,L.Y。;Deng,N.Y.,iNitro-Tyr:具有一般伪氨基酸组成的蛋白质中硝基酪氨酸位点的预测,PLoS ONE,9,e105018(2014)
[99] Xu,Y。;丁,Y.-X。;丁,J。;雷,Y.-H。;Wu,L.-Y。;Deng,N.-Y.,iSuc-PseAAC:通过结合肽位置特异性倾向预测蛋白质中的赖氨酸琥珀酰化,科学。代表5(2015)
[100] Zhang,C.T.,预测蛋白质中HIV蛋白酶裂解位点的替代-亚基耦合模型,蛋白质工程,765-73(1993)
[101] 张春涛,HIV蛋白酶特异性的研究:马尔可夫链理论的应用,蛋白质化学杂志。,12, 709-724 (1993)
[102] Zhang,C.T。;Kezdy,F.J.,《预测蛋白质中HIV蛋白酶裂解位点的载体方法》,《蛋白质:结构》。功能。遗传学。,16, 195-204 (1993)
[103] Zhang,C.T。;Kezdy,F.J。;Poorman,R.A.,预测GalNAc-转移酶特异性的向量投影方法,蛋白质:结构。功能。遗传学。,21, 118-126 (1995)
[104] 张,Z。;Tan,M。;谢,Z。;戴,L。;陈,Y。;赵毅,赖氨酸琥珀酰化作为一种新的翻译后修饰的鉴定,自然化学。生物学,758-63(2011)
[105] X.赵。;宁,Q。;Chai,H。;Ma,Z.,使用迭代半监督学习技术在电子计算机上准确识别蛋白质琥珀酰化位点,J.Theor。《生物学》,374,60-65(2015)·Zbl 1341.92023号
[106] 钟文忠。;周世芳,药物开发与生物医学分子科学,国际分子科学杂志。,15, 20072-20078 (2014)
[107] Zhou,G.P.,《文祥图中LZCC蛋白残基的分布为蛋白质相互作用机制提供了新的见解》,J.Theor。《生物学》,284142-148(2011)·Zbl 1397.92245号
[108] 周,G.P。;Deng,M.H.,将Chou导出酶动力学方程的图形规则扩展到涉及平行反应路径的系统,Biochem。J.,222169-176(1984)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。