×

兹马思-数学第一资源

pSuc-Lys:用PseAAC和集合随机森林法预测蛋白质中赖氨酸琥珀酰化位点。(英语) Zbl 1343.92153
摘要:赖氨酸琥珀酰化作为翻译后修饰的一种,在调节多种生物过程中起着重要作用。然而,它也与一些疾病有关。因此,无论是从基础研究还是药物开发的角度来看,我们都面临着一个具有挑战性的问题:对于一个含有许多Lys残基的非特异性蛋白质序列,哪些可以琥珀酰化,哪些不能?为了解决这个问题,我们开发了一个称为pSuc-Lys的预测因子,它通过(1)将序列耦合信息合并到一般的伪氨基酸组成中,(2)通过随机抽样来平衡倾斜的训练数据集,以及(3)通过融合一系列独立的随机森林分类器来构造一个集成预测器。严格的交叉验证表明,它的性能明显优于现有的方法。为pSuc Lys建立了一个用户友好的web服务器http://www.jci-bioinfo.cn/pSuc-Lys用户无需经过复杂的数学方程,就可以很容易地得到他们想要的结果。我们注意到,这里提出的公式和方法也可用于分析计算蛋白质组学中的许多其他问题。

理学硕士:
92C40型 生物化学、分子生物学
92D20 蛋白质序列,DNA序列
92-04年 有关生物学问题的软件、源代码等
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 艾哈迈德,S。;卡比尔,M。;Hayat,M.,热休克蛋白家族和J蛋白类型的鉴定,通过将二肽组分纳入chou׳的通用pseaac,Compute。方法项目生物医学,122165-174,(2015)
[2] 阿尔豪斯,I.W。;冈萨雷斯,A.J。;周杰杰。;迪贝尔,医学博士。;罗梅罗,D.L。;亚里士多德,P.A。;塔普利,W.G。;Reusser,F.,喹啉U-78036是一种有效的HIV-1逆转录酶抑制剂。《化学》,26814875-14880,(1993年)
[3] 阿尔豪斯,I.W。;周杰。;冈萨雷斯,A.J。;凯兹迪,F.J。;罗梅罗,D.L。;亚里士多德,P.A。;塔普利,W.G。;《非核苷HIV-1逆转录酶抑制剂U-88204E的动力学研究》,生物化学,326548-6554,(1993)
[4] 布雷曼,L.,随机森林,马赫。学习,45,5-32,(2001)·Zbl 1007.68152号
[5] 蔡,Y.D.,《结合两亲效应预测膜蛋白类型》,化学杂志。信息模型,45407-413,(2005年)
[6] 曹博士。;徐,Q.S。;Liang,Y.Z.,Propy:一种生成周氏pseaac各种模式的工具,生物信息学,29960-962,(2013)
[7] 陈杰。;刘,H。;Yang,J.,使用氨基酸对抗原性标度预测线性B细胞表位,氨基酸,33423-428,(2007)
[8] 陈,W。;Lin,H.,伪核苷酸组成或pseknc:分析基因组序列的有效配方,分子生物学系统,112620-2634,(2015)
[9] 陈,W。;冯,下午。;Lin,H.,Irspot psednc:用伪二核苷酸成分识别重组点,核酸研究,41,e68,(2013)
[10] 陈,W。;冯,下午。;Lin,H.,Iss-psednc:利用伪二核苷酸组成鉴定剪接位点,生物医学。Res.Int.,2014年,623149,(2014年)
[11] 陈,W。;冯,下午。;邓,E.Z.,Itis psetnc:一种基于序列的预测因子,用于使用伪三核苷酸成分识别人类基因中的翻译起始位点,Anal。生物化学,462,76-83,(2014年)
[12] 陈,W。;雷,T.Y。;Jin,D.C.,Pseknc:一个用于生成伪K-元组核苷酸组成的灵活的web服务器。生物化学,45653-60,(2014)
[13] 陈,W。;张,X。;布鲁克,J。;Lin,H.,Pseknc general:生成各种模式伪核苷酸组成的跨平台软件包,生物信息学,31119-120,(2015)
[14] 陈,W。;冯,P。;丁,H。;Lin,H.,Irna-甲基:用伪核苷酸组成鉴定N6-甲基腺苷位点。Biochem.,490,26-33,(2015年),(同时,简要数据,2015年,5:376-378)
[15] 周国庆,稳态和非稳态酶动力学的图形规则,生物学报。《化学》,2642074-12079,(1989年)
[16] 周国康,蛋白质中预测HIV蛋白酶裂解位点的向量化序列耦合模型,生物学报。《化学》,26816938-16948,(1993年)
[17] 周国庆,预测galnac转移酶特异性的序列耦合向量投影模型,蛋白质科学,41365-1383,(1995)
[18] 周国庆,综述:人类免疫缺陷病毒蛋白质蛋白酶裂解位点的预测。生物化学,233,1-14,(1996)
[19] 周国庆,用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。遗传学,43,246-255,(2001年),(勘误表:同上,2001年,第44卷,第60页)
[20] 周国庆,蛋白质信号序列及其裂解位点的预测,蛋白质:结构。功能。遗传学,42136-139,(2001)
[21] 周国庆,利用子网站耦合预测信号肽,蛋白质工程,14,75-79,(2001)
[22] 周国庆,利用标度窗预测信号肽,肽,22,1973-1979,(2001)
[23] 周国庆,综述:蛋白质信号序列的预测。蛋白质蛋白。科学,3615-622,(2002)
[24] 周国庆,用两亲性伪氨基酸组成预测酶亚家族类别,生物资讯学,21,10-19,(2005)
[25] 周国庆,伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用,当代。蛋白质组学,62262-274,(2009年)
[26] 周国庆,蛋白质属性预测与伪氨基酸组成之探讨(五十周年回顾),理论与实务。《生物学》,273236-247,(2011年)·Zbl 1405.92212
[27] 周国强,分子生物系统中多标记属性预测的一些注记,分子生物系统,91092-1100,(2013)
[28] 《生物信息学对药物化学的影响》,医学。《化学》,11218-234,(2015年)
[29] 周国庆。;张春涛,综述:蛋白质结构类的预测。版次。生物化学。《分子生物学》,30275-349,(1995年)
[30] 周国庆。;蔡英德,蛋白质亚细胞定位的预测与分类:序列顺序效应与伪氨基酸组成,J.细胞。生物化学,90,1250-1260,(2003年),(增编,同上,2004年,91,1085)
[31] 周国庆。;Shen,H.B.,通过融合多个分类器预测蛋白质亚细胞位置,J.Cell。生物化学,99517-527,(2006年)
[32] 周国庆。;沈海波,综述:蛋白质亚细胞定位预测的最新进展。生物化学,370,1-16,(2007年)
[33] 周国庆。;Shen,H.B.,Protident:一个通过融合功能域和序列进化信息来识别蛋白酶及其类型的网络服务器,生物化学。生物物理。社区居民,376,321-325,(2008年)
[34] 戴维斯,J。;《精确回忆与ROC曲线的关系》,第23届机器学习国际会议论文集,233-240,(2006),ACM
[35] 西藏,A。;赫弗南,R。;夏尔玛,A。;里昂,J。;帕里瓦尔,K。;Sattar,A.,革兰氏阳性和革兰氏阴性蛋白质亚细胞定位,通过将进化基描述符纳入周׳的通用pseaac,J.Theor。生物,364284-294,(2015年)·Zbl 1405.92092
[36] 丁,H。;邓恩智。;人民币,L.F。;刘,L。;Lin,H.,Ictx类型:一种基于序列的预测因子,用于识别靶向离子通道中的芋螺毒素类型,生物医学杂志。Res.Int.,2014年,286419,(2014年)
[37] 杜,J。;周,Y。;苏,X。;于建杰。;可汗,S。;江,H。;金,J。;吴,J。;金,J.H。;Choi,B.H.,Sirt5是一种依赖NAD的蛋白质赖氨酸去甲基化酶和去琥珀酸酶,科学,334806-809,(2011)
[38] 杜,P。;顾,S。;Jiao,Y.,Pseaac general:为大规模蛋白质数据集快速构建chou׳s伪氨基酸组成的各种通用形式模式,国际分子科学杂志,15,3495-3506,(2014)
[39] 杜,P。;王,X。;徐,C。;Gao,Y.,Pseaac builder:一个跨平台的独立程序,用于生成各种特殊的周氏伪氨基酸组成,Anal。生物化学,425117-119,(2012年)
[40] 风扇,G.L。;张晓阳。;Liu,Y.L。;保姆。;王浩,DSPMP:通过杂交周氏伪氨基酸模式的不同描述符来鉴别疟原虫的分泌蛋白,J Compute。《化学》,362317-2327,(2015年)
[41] 《ROC分析导论》,模式识别。Lett.,27861-874,(2005年)
[42] Forsen,S.,酶催化速率定律的图形规则,生物化学。J、 ,187829-835,(1980年)
[43] 傅,L。;牛,乙。;朱,Z。;吴,S。;Li,W.,CD-HIT:加速下一代测序数据聚类,生物信息学,283150-3152,(2012)
[44] 黄,C。;Yuan,J.Q.通过融合周氏伪氨基酸组成的三种不同模式,同时识别蛋白质的三种不同属性,即蛋白质Pept。利特,22547-556,(2015年)
[45] 贾杰。;刘,Z。;Xiao,X.,Ippi-esml:通过将蛋白质的物理化学性质和小波变换合并到pseaac中来识别蛋白质相互作用的集成分类器,J.Theor。生物,377,47-56,(2015年)
[46] 贾杰。;肖,X。;刘,B。;Jiao,L.,基于Bagging的光谱聚类集成选择,模式识别。利特,32,1456-1467,(2011年)
[47] 贾杰。;刘,Z。;肖,X。;Liu,B.,结合物理化学性质和平稳小波变换识别蛋白质结合位点(ippbs-pseaac),生物化学杂志。结构。戴恩(2015)
[48] 贾杰。;刘,Z。;肖,X。;Liu,B.,Ippbs opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集识别蛋白质-蛋白质结合位点,分子,21,95,(2016)
[49] 坎达斯瓦米,K.K。;马丁内茨。;莫勒S。;苏甘坦,P.N。;斯里德哈兰S。;Pugalenthi,G.,AFP-pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.Theor。生物学,27056-62,(2011年)
[50] 可汗,苏。;哈亚特,M。;韩,M.A.,《用周氏伪氨基酸组成结合概率神经网络模型识别酸性和碱性酶》,J.Theor。生物学,365,197-203,(2015年)·Zbl 1314.92069
[51] 库马尔,R。;斯利瓦斯塔瓦,A。;库马里,B。;Kumar,M.用周氏伪氨基酸组成和支持向量机预测β-内酰胺酶及其类别,理论与实践。生物学,365,96-103,(2015年)·Zbl 1314.92055
[52] 林,H。;邓恩智。;丁,H。;陈,W。;Chou,K.C.,Ipro54 pseknc:基于序列的预测因子,用于识别原核生物中具有伪K-元组核苷酸组成的sigma-54启动子,核酸研究,4212961-12972,(2014)
[53] 林,S.X。;Lapointe,J.,理论与实验生物学合二为一——纪念郭陈周教授50周年和richard Giege教授科学生涯40周年的研讨会,J.Biomed。科学。和Eng.,6435-442,(2013年)
[54] 林伟志。;Xiao,X.,Wenxiang:绘制文祥图的web服务器,Nat。科学,3862-865,(2011年)
[55] 林伟志。;方杰。;Xiao,X.,Idna-prot:用灰色模型随机森林识别DNA结合蛋白,PLoS ONE,6,e24756,(2011)
[56] 林伟志。;方杰。;Xiao,X.,Iloc动物:用于预测动物蛋白质亚细胞定位的多标记学习分类器,分子生物学系统,9634-644,(2013)
[57] 刘,B。;方,L。;王,S。;Wang,X.,用退化K-元组或kmer策略鉴定microrna前体,J.Theor。生物学,385153-159,(2015年)
[58] 刘,B。;方,L。;长,右。;Lan,X.,Ienhancer-2L:通过伪k-元组核苷酸组成识别增强子及其强度的两层预测因子,生物信息学,(2015)
[59] 刘,B。;刘,F。;方,L。;Wang,X.,Repdna:一个python软件包,通过结合用户定义的物理化学特性和序列顺序效应来生成DNA序列的各种模式的特征向量,生物信息学,311307-1309,(2015)
[60] 刘,B。;方,L。;刘,F。;Wang,X.,Imirna psedpc:用伪距离对组成法鉴定microrna前体,生物化学杂志。结构。戴恩(2015)
[61] 刘,B。;方,L。;刘,F。;王,X。;Chen,J.,《用伪结构状态组合方法识别真microrna前体》,PLoS ONE,10,e0121501,(2015)
[62] 刘,B。;刘,F。;王,X。;陈杰。;方,L。;周,K.C.,Pse-in-one:一个用于生成DNA、RNA和蛋白质序列的各种模式伪组件的web服务器,核酸研究,43,W65-W71,(2015)
[63] 刘博士。;刘,H。;沈海波。;Yang,J.,通过融合全球序列标记预测分泌蛋白信号序列裂解位点,氨基酸,32493-496,(2007)
[64] 刘,Z。;肖,X。;邱文荣,甲基吲哚乙酸:通过伪三核苷酸组成鉴定DNA甲基化位点。Biochem.,474,69-77,(2015年),(同时,简要数据,2015年,4:87-89)
〔65〕 刘,Z。;王,Y。;高,T。;平移,Z。;程,H。;杨,Q。;郑,Z。;郭,A。;任,J。;Xue,Y.,CPLM:蛋白质赖氨酸修饰数据库,核酸研究,42,D531-D536,(2014)
[66] 曼达尔,M。;穆霍帕德耶,A。;Maulik,U.,通过将基于多目标粒子群优化的特征子集选择纳入chou׳s pseaac,Med的一般形式来预测蛋白质亚细胞定位。生物。工程计算,53331-344,(2015)
[67] 蒙达尔,S。;Pai,P.P.,Chou׳的伪氨基酸组成改善了基于序列的抗冻蛋白预测,J.Theor。生物,356,30-35,(2014年)
[68] 帕克,J。;陈,Y。;蒂什科夫特区。;彭,C。;谭,M。;戴,L。;谢,Z。;张,Y。;茨瓦恩斯,B.M.M。;Skinner,M.E.,SIRT5介导的赖氨酸脱糖基化影响多种代谢途径,分子细胞,50919-930,(2013)
〔69〕 普加伦西,G。;坎达斯瓦米,K.K。;Kolatkar,P.,RSARF:使用随机森林法预测蛋白质序列的残留溶剂可及性,蛋白质Pept。Lett.,19,50-56,(2012年)
[70] 邱伟。;Xiao,X.,Irspot tncpseaac:识别含有三核苷酸成分和伪氨基酸成分的重组点,国际分子科学杂志,15,1746-1766,(2014)
[71] 邱伟。;肖,X。;《氨基酸模拟方法》,2014年,a.74A.氨基酸组分鉴定,PSHylin,2014年)
[72] 桑切斯,V。;佩纳多,上午。;佩雷斯科尔多瓦,J.L。;Gomez,A.M.,蛋白质序列的新信号特征和基于信号的chou׳s pseaac表示法,生物信息学杂志。计算机。生物,1550024,(2015年)
[73] 沈海波,《人类蛋白质亚细胞定位的新集成分类器》,生物化学。生物物理。公社,347150-157,(2006)
[74] 沈海波,通过融合优化的证据理论K近邻分类器预测真核蛋白质亚细胞位置,蛋白质组学杂志。第51888-1897号决议(2006年)
[75] 沈海波,Nuc-ploc:一个新的网络服务器,通过融合pseaa成分和psepssm预测蛋白质亚核定位。Sel.,20561-567,(2007年)
[76] 沈海波,信号CF:预测信号肽的子网站耦合和窗口融合方法,生物化学。生物物理。公社,357633-640,(2007年)
[77] 沈海波,Euk-mploc:一种融合多位点的大规模真核蛋白质亚细胞定位预测的融合分类器,蛋白质组学研究,61728-1734,(2007)
[78] 沈海波,病毒ploc:预测宿主和病毒感染细胞内病毒蛋白亚细胞定位的融合分类器,生物聚合物,85233-240,(2007)
[79] 沈海波,Quatident:一个融合功能域和序列进化信息识别蛋白质四级结构属性的网络服务器,蛋白质组研究杂志,81577-1584,(2009)
[80] 沈海波,病毒mploc:融合多个位点进行病毒蛋白亚细胞定位预测的融合分类器,生物医学杂志。结构。戴恩,28175-186,(2010年)
[81] 沈海波。;Yang,J.,Euk-ploc:大规模真核蛋白质亚细胞定位预测的集成分类器,氨基酸,33,57-67,(2007)
[82] 沈海波。;Song,J.N.,通过融合多个序列特征从一级序列预测蛋白质折叠率,生物医学杂志。科学。Eng.,2136-143,(2009年)
[83] 太阳,Y。;黄,A.K。;Kamel,M.S.,不平衡数据的分类:综述,国际J.模式识别。人工制品。国际期刊,23687-719,(2009年)
[84] 托马塞利,A.L。;里尔登,I.M。;Heinrikson,R.L.,用判别函数法预测蛋白质中HIV蛋白酶裂解位点,蛋白质:结构。功能。遗传学,24,51-72,(1996)
[85] UniProt财团,2010年通用蛋白质资源(UniProt),核酸研究,38,D142-D148,(2010)
[86] 沃尔什,C.T。;加内奥·佐迪科娃,S。;《蛋白质翻译后修饰:蛋白质组变异的化学》,Angew。化学。国际版,447342-7372,(2005年)
[87] 王,X。;张伟。;张Q。;Li,G.Z.,Multip schlo:用chou׳的伪氨基酸组成和新的多标记分类器预测蛋白质亚叶绿体定位,生物信息学,312639-2645,(2015)
[88] 维茨,E.S。;老,W.M。;辞职,K.A。;Ahn,N.G.,蛋白质翻译后修饰的质谱分析,自然科学院。方法,4798-806,(2007)
[89] 吴振华。;Xiao,X.,2D-MH:基于蛋白质组成氨基酸的物理化学性质生成蛋白质序列图形表示的网络服务器,J.Theor。生物学,267,29-34,(2010年)
[90] 吴振华。;Xiao,X.,Iloc hum:使用累积标记量表预测人类蛋白质的亚细胞位置,Mol.Biosyst.,8629-641,(2012)
[91] 肖,X。;吴志川,Iloc病毒:一种识别病毒蛋白亚细胞定位的多标记学习分类器,J.Theor。《生物学》,284,42-51,(2011年)·Zbl 1397.92238
[92] 肖,X。;王,P。;林伟志。;Jia,J.H.,Iamp-2L:一种用于识别抗菌肽及其功能类型的两级多标记分类器。生物化学,436168-177,(2013年)
[93] 肖,X。;Min,J.L。;林伟志。;Liu,Z.,Idrug target:通过基准数据集优化方法预测药物化合物和靶蛋白在细胞网络中的相互作用,J.Biomol。结构。戴恩,332221-2233,(2015年)
[94] 谢,Z。;戴,J。;戴,L。;谭,M。;郑,Z。;吴,Y。;博克,J.D。;Zhao,Y.,组蛋白中赖氨酸琥珀酰化和赖氨酸丙二酸化,分子细胞。蛋白质组学,11100-107,(2012)
[95] 徐博士。;石,S.P。;文,P.P。;邱建德,成功发现:通过增强特征策略的新型琥珀酰化位点在线预测工具,生物信息学,(2015)
[96] 徐,Y。;丁,J。;Wu,L.Y.,Isno pseaac:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝化位点,PLoS ONE,8,e55844,(2013)
[97] 徐,Y。;文,X。;邵小新。;邓,N.Y.,Ihyd pseaac:通过将二肽位置特异性纳入伪氨基酸组成来预测蛋白质中的羟脯氨酸和羟赖氨酸,国际分子科学杂志,157594-7610,(2014)
[98] 徐,Y。;文,X。;文,L.S。;吴,L.Y。;邓,N.Y.,Initro-tyr:蛋白质中具有一般伪氨基酸组成的硝基酪氨酸位点的预测,PLoS ONE,9,e105018,(2014)
[99] 徐,Y。;丁,Y.-X。;丁,J。;雷,Y.-H。;吴,L.-Y。;邓,N.-Y.,Isuc pseaac:通过结合肽位置特异性倾向预测蛋白质中赖氨酸琥珀酰化,Sci。报告5,(2015年)
[100] 1993年,第7期,蛋白质偶联位点预测
[101] 张春涛,HIV蛋白酶特异性的研究:马尔可夫链理论的应用,蛋白质化学杂志,12709-724,(1993)
[102] 张,C.T。;Kezdy,F.J.,预测蛋白质中HIV蛋白酶裂解位点的载体方法,蛋白质:结构。功能。遗传学,16195-204,(1993年)
[103] 张,C.T。;凯兹迪,F.J。;Poorman,R.A.,预测galnac转移酶特异性的向量投影法,蛋白质:结构。功能。遗传学,21118-126,(1995年)
[104] 张,Z。;谭,M。;谢,Z。;戴,L。;陈,Y。;赵,Y.赖氨酸琥珀酰化作为一种新的翻译后修饰的鉴定。化学。生物学,7,58-63,(2011年)
[105] 赵,X。;宁,Q。;柴,H。;Ma,Z.,使用迭代半监督学习技术精确识别蛋白质琥珀酸化位点,J.Theor。生物,374,60-65,(2015)·Zbl 1341.92023
[106] 钟文泽。;周世福,药物开发与生物医学分子科学,国际分子科学杂志,20072-20078,(2014)
[107号] 周国平,文祥图中LZCC蛋白残基的处理为蛋白质-蛋白质相互作用机制提供了新的见解。《生物学》,284142-148,(2011年)·Zbl 1397.92245
[108] 周国平。;邓,M.H.周氏推导酶动力学方程的图形规则扩展到涉及平行反应途径的系统,生物化学。J、 ,222169-176,(1984年)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。