×

通过各种周氏伪成分和还原氨基酸成分分析和预测动物毒素。 (英语) Zbl 1406.92205号

摘要:动物毒素蛋白是在有毒物种中检测到的富含二硫键的小肽之一。由于其靶点的高度特异性,它们被用作药物的药理工具和治疗剂。毒素蛋白的成功分析和预测对毒素的药理和治疗研究具有重要意义。在这项研究中,发现毒素和非毒素在氨基酸组成和几个重要生物学特性方面存在显著差异。首次提出用随机森林预测动物毒素蛋白,选择400个伪氨基酸组成和还原氨基酸字母表的二肽组成作为输入参数。基于13个还原氨基酸的还原氨基酸字母表的二肽组成,获得了85.71%的最佳总准确度。这些结果表明,我们的算法是一种有效的动物毒素预测工具。

MSC公司:

92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aboderin,A.A.,《α-氨基酸的经验疏水性量表及其应用》,国际生物化学杂志。,2, 537-544 (1971)
[2] Arif,M。;海亚特,M。;Jan,Z.,iMem-2LSAAC:通过将SAAC的概念扩展到Chou的伪氨基酸组成中来区分膜蛋白及其类型的两级模型,J.Theor。生物学,442,11-21(2018)·Zbl 1397.92180号
[3] Bischof,J.C。;He,X.M.,《蛋白质的热稳定性》,Ann.N Y Acad。科学。,1066, 12-33 (2006)
[4] Boeckmann,B。;Bairoch,A。;阿普韦勒,R。;布拉特,M.C。;Estreicher,A。;Gasteiger,E。;马丁·M·J。;Michoud,K。;奥多诺万,C。;Phan,I.,《2003年SWISS-PROT蛋白质知识库及其补充TrEMBL》,《核酸研究》,31,365-370(2003)
[5] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32 (2001) ·Zbl 1007.68152号
[6] Butt,A.H。;北卡罗来纳州拉苏尔。;Khan,Y.D.,通过将各种序列特征提取到Chou的通用PseAAC,Mol.Biol中来预测膜蛋白及其类型。众议员(2018),Epub提前印刷
[7] 蔡,L。;黄,T。;苏,J。;张,X。;Chen,W。;张,F。;He,L。;Chou,K.-C.,《精神分裂症患者新发现的大脑eQTL基因及其相互作用物的意义》,《分子疗法》。核酸,12433-442(2018)
[8] Cai,Y.D。;Chou,K.C.,通过结合功能域组成和伪氨基酸组成预测蛋白质亚细胞位置的最近邻算法,生物化学。生物物理学。Res.Commun.公司。,305407-411(2003年)
[9] 卡尔维特,J.J。;桑兹,L。;安古洛,Y。;罗蒙特,B。;Gutiérrez,J.M.,毒液、毒液、抗毒液,FEBS Lett。,583, 1736-1743 (2009)
[10] Chang,C.C。;Lin,C.J.,LIBSVM:支持向量机库,ACM Transact。智力。系统。技术。,2, 1-27 (2011)
[11] Chen,W。;冯·P。;Lin,H.,使用还原氨基酸字母预测酮酰基合酶家族,《微生物学报》。生物技术。,39, 579-584 (2012)
[12] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,第e68-e68条(2013)
[13] Chen,W。;Lei,T.Y。;Jin,D.C。;Lin,H。;Chou,K.C.,PseKNC:生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456,53-60(2014)
[14] Chen,W。;丁,H。;周,X。;Lin,H。;Chou,K.C.,iRNA(m6A)-PseDNC:使用伪二核苷酸成分识别N6-甲基腺苷位点,分析。生物化学。,561-562, 59-65 (2018)
[15] Chen,W。;冯,P.M。;Yang,H。;丁,H。;Lin,H。;Chou,K.C.,iRNA-AI:识别RNA序列中腺苷-肌苷编辑位点,Oncotarget,84208-4217(2017)
[16] Chen,W。;冯,P.M。;Yang,H。;丁,H。;Lin,H。;Chou,K.C.,iRNA-3型A:识别RNA腺苷位点的三种修饰,分子疗法。核酸,11468-474(2018)
[17] Chen,Y.L。;李启智。;张立清,利用多样性增量预测疟原虫线粒体蛋白质:结合伪氨基酸组成和结构字母,氨基酸,421309-1316(2012)
[18] 陈,Z。;赵,P。;李,F。;Leier,A。;Marquez-Lago,T.T。;王,Y。;韦伯,G.I。;史密斯,A.I。;戴利,R.J。;周,K.-C。;Song,J.,iFeature:Python软件包和网络服务器,用于从蛋白质和肽序列中提取和选择特征,生物信息学,342499-2502(2018)
[19] Cheng,X。;Xiao,X。;Chou,K.C.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学(2017)
[20] Cheng,X。;Xiao,X。;Chou,K.C.,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.Biosyst.,预测多位置植物蛋白的亚细胞定位。,13, 1722-1727 (2017)
[21] Cheng,X。;Xiao,X。;Chou,K.C.,pLoc-mVirus:通过将最佳GO信息合并到一般PseAAC中来预测多位置病毒蛋白的亚细胞定位,Gene,628,315-321(2017)
[22] Cheng,X。;Xiao,X。;Chou,K.C.,pLoc_bal-mGneg:通过准平衡训练数据集和通用PseAAC,J.Theor预测革兰氏阴性细菌蛋白质的亚细胞定位。生物学,45892-102(2018)·Zbl 1406.92173号
[23] Cheng,X。;Xiao,X。;Chou,K.C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,341448-1456(2018)
[24] Cheng,X。;Xiao,X。;Chou,K.C.,pLoc-mEuk:通过将关键GO信息提取到通用PseAAC中来预测多标签真核蛋白的亚细胞定位,基因组学,110,50-58(2018)
[25] Cheng,X。;Zhao,S.G。;Xiao,X。;Chou,K.C.,iATC-mHyb:一种用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget,8,58494-58503(2017)
[26] Cheng,X。;Zhao,S.G。;Xiao,X。;Chou,K.C.,iATC-mISF:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346(2017)
[27] Cheng,X。;林,W.-Z。;Xiao,X。;Chou,K.-C.,pLoc_bal-m动物:通过平衡训练数据集和PseAAC预测动物蛋白质的亚细胞定位,生物信息学(2018),bty628-bty628
[28] Cheng,X。;Zhao,S.G。;Lin,W.Z。;Xiao,X。;Chou,K.C.,pLoc-mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,33,3524-3531(2017)
[29] Chou,K.C.,使用缩放窗口预测信号肽,肽,21973-1979(2001)
[30] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[31] Chou,K.C.,使用亚基偶联预测信号肽,蛋白质工程,14,75-79(2001)
[32] Chou,K.C.,蛋白质信号序列的预测,Curr。蛋白质肽。科学。,3, 615-622 (2002)
[33] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19(2005)
[34] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,2626-274(2009)
[35] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[36] Chou,K.C.,《关于预测分子生物系统中多标签属性的一些评论》,Mol.Biosyst。,1092-1100(2013年)
[37] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[38] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 2337-2358 (2017)
[39] Chou,K.C。;Elrod,D.W.,G蛋白偶联受体的生物信息学分析,《蛋白质组研究杂志》,1429-433(2002)
[40] Chou,K.C。;蔡永德,蛋白质亚细胞位置序列效应和伪氨基酸组成的预测和分类,细胞杂志。生物化学。,90, 1250-1260 (2003)
[41] Chou,K.C。;Shen,H.B.,Reveiw:《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63-92 (2009)
[42] Chou,K.C。;Cheng,X。;Xiao,X.,pLoc_bal-mHum:利用PseAAC和准平衡训练数据集预测人类蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[43] Da Silva,S.L。;Rowan,E.G。;Albericio,F。;Stábeli,R.G。;洛杉矶卡尔德隆。;Soares,A.M.,《动物毒素及其在生物技术和药理学中的优势》,《生物医学研究国际》,2014年第2期(2014年)
[44] 丁,H。;邓,E.Z。;袁,L.F。;刘,L。;Lin,H。;Chen,W。;Chou,K.C.,iCTX-Type:一种基于序列的预测因子,用于识别靶向离子通道中芋螺毒素的类型,Biomed Res.Int.,2014,第286419页(2014)
[45] Ehsan,A。;Mahmood,K。;Y.D.Khan。;汗,S.A。;Chou,K.-C.,《信号肽分类的数学生物学新模型》,《科学》。代表,81039(2018)
[46] 范,Y.X。;宋,J。;Shen,H.B。;Kong,X.,PredCSF:预测芋螺毒素超家族的基于特征的综合方法,Protein Pept。莱特。,18, 261-267 (2011)
[47] 冯,P.M。;Chen,W。;Lin,H。;Chou,K.C.,iHSP-PseRAAAC:使用伪还原氨基酸字母组合识别热休克蛋白家族,Ana。生物化学。,442, 118-125 (2013)
[48] 冯,P.M。;丁,H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.C.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,确定不同RNA修饰的发生位置。核酸,7155-163(2017)
[49] 冯,P.M。;Yang,H。;丁,H。;Lin,H。;Chen,W。;Chou,K.C.,iDNA6mA-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC-,《基因组学》(2018)
[50] E.弗兰克。;霍尔,M。;Trigg,L。;霍姆斯,G。;Witten,I.H.,使用Weka的生物信息学数据挖掘,生物信息学,202479-2481(2004)
[51] Guruprasad,K。;B.V.B.Reddy。;Pandit,M.W.,《蛋白质稳定性与其二肽组成之间的相关性:从蛋白质一级序列预测蛋白质体内稳定性的新方法》,《蛋白质工程》,4,22-161(1990)
[52] 黄,Y。;牛,B。;高,Y。;Fu,L。;Li,W.,CD-HIT suite:一个用于聚类和比较生物序列的web服务器,生物信息学,26,680-682(2010)
[53] 霍,H。;李·T。;王,S。;Lv,Y。;Zuo,Y。;Yang,L.,通过结合各种Chou伪成分预测突触前和突触后神经毒素,Sci。众议员,7,5827(2017)
[54] Ikai,A.,球状蛋白的热稳定性和脂族指数,生物化学杂志。,88, 1895-1898 (1980)
[55] 贾维德,F。;Hayat,M.,通过将序列特征纳入Chou的PseAAC预测多标签蛋白质的亚细胞定位,基因组学(2018)
[56] 贾建华。;刘,Z。;Xiao,X。;刘,B.X。;Chou,K.C.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[57] 贾建华。;刘,Z。;Xiao,X。;刘,B.X。;Chou,K.C.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[58] 贾建华。;李晓云。;邱伟荣。;Xiao,X。;Chou,K.C.,iPPI-PseAAC(CGR):通过将混沌游戏表示纳入PseAAC,J.Theor中来识别蛋白质相互作用。生物学,460195-203(2019)·Zbl 1406.92189号
[59] Kohonen,J。;Talikota,S。;Corander,J。;奥维宁,P。;Arjas,E.,用于蛋白质功能预测的朴素贝叶斯分类器,《硅生物学》。,9, 23-34 (2009)
[60] Laxton,R.R.,《多样性的衡量》,J.Theor。生物学,70,51-67(1978)
[61] 李,F。;李,C。;Marquez-Lago,T.T。;Leier,A。;Akutsu,T。;Purcell,A.W。;Ian Smith,A。;Lithgow,T。;戴利,R.J。;宋,J。;Chou,K.-C.,Quokka:快速准确预测人类蛋白质组中激酶家族特异性磷酸化位点的综合工具,生物信息学(2018),bty522-bty522
[62] 李明,L。;严,X。;Kuo Chen,C.,iPGK-PseAAC:通过将四个不同层次的氨基酸成对偶联信息合并到一般PseAAC-医药化学,鉴定蛋白质中的赖氨酸磷酸甘油化位点。,13, 552-559 (2017)
[63] Lin,H。;Li,Q.Z.,利用伪氨基酸组成和改良马氏判别法预测芋螺毒素超家族和家族,生物化学。生物物理学。Res.Commun.公司。,354, 548-551 (2007)
[64] Lin,H。;邓,E.Z。;丁,H。;Chen,W。;Chou,K.C.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪K元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,12961-12972(2014)
[65] 刘,B。;朗·R。;Chou,K.C.,iDHS-EL:通过将三种不同模式的伪核苷酸组成融合到集成学习框架中来识别DNase I超敏位点,生物信息学,32,2411-2418(2016)
[66] 刘,B。;Wu,H。;Chou,K.C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,09, 67-91 (2017)
[67] 刘,B。;杨,F。;Chou,K.C.,2L-piRNA:用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,267-277(2017)
[68] 刘,B。;Wang,S.Y。;朗·R。;Chou,K.C.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2017)
[69] 刘,B。;翁,F。;黄,D.S。;Chou,K.C.,iRO-3wPseKNC:通过基于三个窗口的PseKNC识别DNA复制起源,生物信息学,bty312(2018)
[70] 刘,B。;杨,F。;黄,D.S。;Chou,K.C.,iPromoter-2L:通过基于多窗口的PseKNC鉴定启动子及其类型的两层预测因子,生物信息学,34,33-40(2018)
[71] 刘,B。;李凯。;黄,D.S。;Chou,K.C.,iEnhancer EL:用集成学习方法识别增强子及其强度,生物信息学,bty458(2018)
[72] 刘,B。;Fang,L.Y。;朗·R。;兰,X。;Chou,K.C.,iEnhancer-2L:通过伪K元组核苷酸组成识别增强子及其强度的双层预测因子,生物信息学,32,362-369(2016)
[73] 刘,B。;Liu,F.L。;Wang,X.L。;Chen,J.J。;Fang,L.Y。;Chou,K.C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[74] 刘,B。;Fang,L.Y。;刘,F。;Wang,X.L。;Chen,J.J。;Chou,K.C.,用伪结构状态合成方法识别真实的MicroRNA前体,PLoS One,10,文章e0121501 pp.(2015)
[75] Liu,D.Y。;李国平。;Zuo,Y.C.,TET蛋白的功能决定簇:序列基序与特定编码的排列,简介。生物信息。(2018),bby053-bby053
[76] 蒙达尔,S。;巴夫纳,R。;Mohan Babu,R。;Ramakumar,S.,用于芋螺毒素超家族分类的伪氨基酸组成和多类支持向量机方法,J.Theor。生物学,243,252-260(2006)·Zbl 1447.92309号
[77] Naamati,G。;Askenazi,M。;Linial,M.,《ClanTox:短动物毒素分类器》,《核酸研究》,37,W363-W368(2009)
[78] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Chou,K.C.,iPTM-mLys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123(2016)
[79] 邱伟荣。;姜世勇(Jiang,S.Y.)。;徐,Z.C。;Xiao,X。;Chou,K.C.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178-41188(2017)
[80] 邱伟荣。;孙碧琴。;Xiao,X。;徐,D。;Chou,K.C.,iPhos-PseEvo:通过灰色系统理论将进化信息整合到一般PseAAC中来识别人类磷酸化蛋白质,Mol.Inform。,36, 201600010 (2017)
[81] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;贾建华。;Chou,K.C.,iKcr-PseEns:利用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酰化位点,基因组学(2017)
[82] 萨哈,S。;Raghava,G.P.,BTXfred:细菌毒素预测,《硅生物》。,7, 405-412 (2007)
[83] 萨哈,S。;Raghava,G.P.,基于功能和来源的神经毒素预测,《硅生物》。,7, 369-387 (2007)
[84] Shanbhag,V.K.L.,蛇毒在癌症治疗中的应用,亚太地区。J.特罗普。生物识别。,5, 275-276 (2015)
[85] 宋,J。;李,F。;Leier,A。;Marquez-Lago,T.T。;Akutsu,T。;哈夫法里,G。;周,K.-C。;韦伯,G.I。;Pike,R.N.,Prosperous:提高准确性的90种蛋白酶底物裂解位点高通量预测,生物信息学,34,684-687(2018)
[86] Song,J.N。;李,F。;Takemoto,K。;哈夫法里,G。;Akutsu,T。;Chou,K.C。;Webb,G.I.,PREvaIL,一种在机器学习框架中使用序列、结构和网络特征推断催化残基的综合方法,J.Theor。生物学,443125-137(2018)
[87] 宋,J.N。;王永新。;Li,F.Y。;Akutsu,T。;罗林斯,N.D。;韦伯,G.I。;Chou,K.C.,iProt-Sub:一个用于准确绘制和预测蛋白酶特异性底物和裂解位点的综合软件包,简介。生物信息。,bby028(2018)
[88] 苏,Z.D。;黄,Y。;张志勇。;赵永伟。;王,D。;Chen,W。;Chou,K.C。;Lin,H.,iLoc-lncRNA:通过将八聚体成分纳入一般PseKNC预测lncRNA的亚细胞位置,生物信息学(2018),bty508-bty508
[89] 蒂洛什,Y。;Linial,I。;Askenazi,M。;Linial,M.,短毒素样蛋白在蛇床子基因组中大量存在,毒素,41367-1384(2012)
[90] Wang,J。;杨,B。;Revote,J。;Leier,A。;Marquez-Lago,T.T。;韦伯,G。;宋,J。;周,K.-C。;Lithgow,T.,POSSUM:基于PSSM轮廓生成数字序列特征描述符的生物信息学工具包,生物信息学,33,2756-2758(2017)
[91] Wang,J。;杨,B。;Leier,A。;Marquez-Lago,T.T。;Hayashida,M。;Rocker,A。;Zhang,Y。;Akutsu,T。;周,K.-C。;Strugnell,R.A。;宋,J。;Lithgow,T.,Bastion6:用于准确预测VI型分泌效应器的生物信息学方法,生物信息学,34,2546-2555(2018)
[92] Xiao,X。;Cheng,X。;苏,S.C。;毛,Q。;Chou,K.C.,pLoc-mGpos:将关键基因本体信息合并到通用PseAAC中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。,9, 330 (2017)
[93] Xiao,X。;Cheng,X。;陈,G。;毛,Q。;Chou,K.-C.,pLoc_bal-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[94] 严,X。;Zu,W。;春晖,L。;Kuo Chen,C.,iPreny-PseAAC:通过将两层序列偶联纳入PseAAC,Med.Chem。,13, 544-551 (2017)
[95] Yang,H。;邱伟荣。;刘国强。;郭富斌。;Chen,W。;Chou,K.C。;Lin,H.,iRSpot-Pse6NC:通过将六聚体成分纳入一般PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学。,14, 883-891 (2018)
[96] Yang,L。;Li,Q.,通过多样性增加预测突触前和突触后神经毒素,毒理学。《体外》,23346-348(2009)
[97] Yin,J.B。;范,Y.X。;Shen,H.B.,利用扩散图降维和子空间分类器预测芋螺毒素超家族,Curr。蛋白质肽。科学。,12, 580-588 (2011)
[98] 张长杰。;Tang,H。;Li,W.C。;Lin,H。;Chen,W。;Chou,K.C.,iOri人类:通过将二核苷酸的物理化学性质结合到伪核苷酸组成中来鉴定人类复制的起源,肿瘤靶点,736783-69793(2016)
[99] 张,L。;Luo,L.,利用多样性测度进行二次判别分析的剪接位点预测,核酸研究,316214-6220(2003)
[100] 左,Y.C。;Li,Q.Z.,使用减少的氨基酸组成来预测防御素家族和亚家族:整合相似性测量和结构字母表,肽,301788-1793(2009)
[101] 左,Y.C。;Li,Q.Z.,利用K最小多样性增量预测基于氨基酸分组的疟原虫分泌蛋白,氨基酸,38,859-867(2010)
[102] 左,Y.C。;Lv,Y。;魏振英。;Yang,L。;李国平。;Fan,G.L.,iDPF-PseRAAAC:使用伪还原氨基酸字母组成识别防御肽家族和亚家族的网络服务器,PLoS One,10,Article e0145541 pp.(2016)
[103] 左,Y.C。;李毅。;Chen,Y.L。;李国平。;严振华。;Yang,L.,PseKRAAC:生成伪K元组减少氨基酸组成的灵活web服务器,生物信息学,33,122-124(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。