×

使用粒子群优化算法优化的极值梯度增强系统识别N-甲基腺苷位点。 (英语) Zbl 1409.92184号

摘要:N-甲基腺苷(m^6A)是最重要的RNA修饰之一,对细胞分化起剪接事件、mRNA输出和稳定性的作用。由于m6A在基因中的广泛分布,RNA序列中m6A位点的鉴定对基础生物医学研究和药物开发具有重要意义。高通量实验室方法耗时且成本高昂。如今,有效的计算方法因其方便快捷而备受青睐。因此,在本文中,我们提出了一种新的方法,利用深度特征和原始特征的组合特征,通过粒子群优化(PXGB)优化的极值梯度提升来提高m^6A预测的性能。提出的PXGB算法使用三种特征,即位置特异性核苷酸倾向(PSNP)、位置特异性二核苷酸倾向(PSDP)和传统核苷酸组成(NC)。通过10倍交叉验证,测量了PXGB的性能,AUC为0.8390,MCC为0.5234。此外,将PXGB与现有方法进行了比较,PXGB较高的MCC和AUC表明PXGB可有效预测m6A位点。本研究中提出的预测因子可能有助于预测更多的m6A位点并指导相关实验验证。

MSC公司:

92D20型 蛋白质序列,DNA序列
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿克巴,S。;Hayat,M.,iMethyl-STTNC:通过将SAAC的理念扩展到Chou的PseAAC以形成RNA序列来识别N(6)-甲基腺苷位点,Theor Biol杂志,455205-211(2018)·Zbl 1406.92448号
[2] Alarcón,C.R.,N6-甲基腺苷标记用于加工的主要微RNA,《自然》,519,482-485(2015)
[3] Bengio,Y.,深度网络贪婪分层训练,高级神经信息处理。系统。,19, 153-160 (2007)
[4] 蔡,L。;黄,T。;苏,J。;张,X。;Chen,W。;张,F。;He,L.,新发现的脑eQTL基因及其相互作用物在精神分裂症中的意义,Mol.Ther。核酸,12433-442(2018)
[5] Chen T.、Tong H.、Benesty M.等,2016年。XGBoost:极限梯度增强。;Chen T.、Tong H.、Benesty M.等,2016年。XGBoost:极限坡度提升。
[6] 陈天琦,盖斯特林,C.,2016。“XGBoost:一个可扩展的树增强系统。”;Chen,Tianqi,Guestrin,C.,2016年。“XGBoost:一个可扩展的树增强系统。”
[7] Chen,W。;丁·H。;周,X。;Lin,H.,iRNA(m6A)-PseDNC:使用伪二核苷酸组成鉴定N6甲基腺苷位点,分析。生物化学。,561-562, 59-65 (2018)
[8] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H.,iRNA-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,84208-4217(2017)
[9] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H.,iRNA-3typeA:识别RNA腺苷位点的3种修饰,分子治疗学。核酸,11468-474(2018)
[10] Chen,W。;冯,P.M。;Lin,H.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[11] Chen,W。;Tang,H。;Ye,J。;Lin,H.,iRNA-PseU:识别RNA假尿苷位点,分子治疗学。核酸,5,e332(2016)
[12] Chen,W。;冯·P。;丁·H。;Lin,H。;Chou,K.C.,iRNA-甲基:使用伪核苷酸组成识别N6-甲基腺苷位点,Anal。生物化学。,490, 26-33 (2015)
[13] 陈伟,酿酒酵母转录组中N6-甲基腺苷的鉴定与分析,科学。代表,513859(2015)
[14] Cheng,X。;Xiao,X.,pLoc-mVirus:通过将最佳GO信息合并到通用PseAAC中来预测多位置病毒蛋白的亚细胞定位,Gene(勘误表:同上,2018年,第644卷,156-156),628,315-321(2017)
[15] Cheng,X。;Xiao,X.,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.Biosyst.,预测多位置植物蛋白的亚细胞定位。,13, 1722-1727 (2017)
[16] Cheng,X。;Xiao,X.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,341448-1456(2018)
[17] Cheng,X。;Xiao,X.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学,110,231-239(2018)
[18] Cheng,X。;Xiao,X.,pLoc-mEuk:通过将关键GO信息提取到通用PseAAC中来预测多标签真核蛋白的亚细胞定位,基因组学,110,50-58(2018)
[19] Cheng,X。;Zhao,S.G。;Lin,W.Z。;Xiao,X.,pLoc-mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,33,3524-3531(2017)
[20] Cheng,X。;Zhao,S.G。;Xiao,X.,iATC-mISF:用于预测解剖治疗化学物质类别的多标签分类器,生物信息学(勘误,同上,2017年,第33卷,2610),33,341-346(2017)
[21] Chou,K.C.,使用缩放窗口预测信号肽,肽,221973-1979(2001)
[22] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论(50周年回顾),J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[23] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[24] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 2337-2358 (2017)
[25] 周,K.C。;Shen,H.B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63-92 (2009)
[26] 周,K.C。;Shen,H.B.,Cell-PLoc:一个用于预测各种生物体中蛋白质亚细胞定位的Web服务器包,《国家协议》。,3, 2, 153-162 (2008)
[27] 周,K.C。;Zhang,C.T.,蛋白质结构类别的预测,生物化学评论。分子生物学。,30.4, 275-349 (1995)
[28] 科尔特斯,C。;迷幻药。,V.,支持向量网络,马赫。学习。,20.3, 273-297 (1995) ·Zbl 0831.68098号
[29] Cover,T.M.,最近邻模式分类,IEEE Trans。Inf.理论,13,21-27(1967)·Zbl 0154.44505号
[30] 卡特勒,Kt;Breiman,L.,《随机森林》,马赫。学习。,45.1, 157-176 (2004)
[31] Dunin-Horkawicz,S.,《Modomics:RNA修饰途径数据库》,《核酸研究》,34,90001,D145-D149(2006)
[32] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,确定不同RNA修饰的发生位置。核酸,7155-163(2017)
[33] 冯·P。;Yang,H。;丁·H。;Lin,H。;Chen,W.,iDNA6mA-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC:识别DNA N6-甲基腺苷位点,基因组学(2018)
[34] A.W.加乌里。;Y.D.Khan。;北卡罗来纳州拉苏尔。;Khan,S.A.,pNitro-Tyr-PseAAC:通过将五个特征合并到Chou的一般PseAAC-Curr中来预测蛋白质中的硝基酪氨酸位点。药物设计。(2018)
[35] 伊恩·古德费罗(Ian J.Goodfellow),《测量深度网络中的不变性》(Measuring不变性)(神经信息处理系统国际会议,柯兰联合公司(2009))
[36] Gumus,M。;Kiran,M.S.,使用XGBoost进行原油价格预测,(国际计算机科学与工程会议(2017)),1100-1103
[37] 哈希姆,M。;Kamil,E。;Abdullah,R.,《稀有k-mer DNA:序列基序的鉴定和CpG岛和启动子的预测》,J.Theor。生物学,38788-100(2015)
[38] 贾,C。;林,X。;Wang,Z.,基于自适应正态分布双profile bayes和Chou的伪氨基酸组成预测蛋白质S-亚硝化位点,国际分子科学杂志。,15, 10410-10423 (2014)
[39] 贾,J。;李,X。;邱伟。;Xiao,X.,iPPI-PseAAC(CGR):通过将混沌游戏表示纳入PseAAC,J.Theor中来识别蛋白质相互作用。生物学,460195-203(2019)·Zbl 1406.92189号
[40] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,iCar-PseCp:通过Monto Carlo取样确定蛋白质中的羰基化位点,并将序列耦合效应纳入一般PseAAC,Oncotarget,734558-34570(2016)
[41] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[42] 贾,J。;刘,Z。;Xiao,X。;Liu,B.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[43] 贾,J。;张,L。;刘,Z。;Xiao,X.,pSumo-CD:通过将序列耦合效应纳入一般PseAAC,使用协方差判别算法预测蛋白质中的sumoylation位点,生物信息学,32,3133-3141(2016)
[44] 朱,Z。;曹建忠。;Gu,H.,通过将k间隔氨基酸对合并到Chou的一般PseAAC中,用模糊SVM预测赖氨酸磷酸甘油酸化,J.Theor。生物学,397145-150(2016)
[45] 朱,Z。;He,J.J.,通过将k间隔氨基酸对的组成纳入Chou的一般PseAAC预测赖氨酸巴豆酰化位点,J.Mol.图模型,77,200-204(2017)
[46] 朱,Z。;Wang,S.Y.,通过将k间距氨基酸对纳入Chou的一般伪氨基酸组成预测瓜氨酸化位点,Gene,664,78-83(2018)
[47] Kennedy,J.,粒子群优化,(Icnn95国际神经网络会议(2002),IEEE)
[48] Khan,Y.D.博士。;北卡罗来纳州拉苏尔。;侯赛因,W。;Khan,S.A.,iPhosY-PseAAC:通过将序列统计矩合并到PseAAC,Mol.Biol中来识别磷酸化酪氨酸位点。代表(2018)
[49] Y.D.Khan。;北卡罗来纳州拉苏尔。;侯赛因,W。;Khan,S.A.,iPhosT-PseAAC:通过将序列统计矩纳入PseAAC,Ana,来识别磷酸苏氨酸位点。生物化学。,550, 109-116 (2018)
[50] Li,Guang Qing,TargetM6A:通过位置特异性核苷酸倾向和支持向量机从RNA序列中识别N6-甲基腺苷位点,IEEE Trans。纳米生物学。,1 (2016), -1
[51] 李祥涛;阴。,M.,粒子群启发的实参数优化布谷鸟搜索算法,软计算。,20.4, 1389-1413 (2016)
[52] 刘,B。;王,S。;Long,R.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2017)
[53] 刘,B。;翁,F。;Huang,D.S.,iRO-3wPseKNC:通过基于三个窗口的PseKNC识别DNA复制起源,生物信息学,34,3086-3093(2018)
[54] 刘,B。;Yang,F.,2L-piRNA:用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7267-277(2017)
[55] 刘,B。;杨,F。;Huang,D.S.,iPromoter-2L:通过基于多窗口的PseKNC识别启动子及其类型的双层预测因子,生物信息学,34,33-40(2018)
[56] Liu,Zi,pRNAm-PC:通过物理化学性质预测RNA序列中的N6-甲基腺苷位点,Ana。生物化学。,497, 60-67 (2016)
[57] Meyer,Kate D.,《mRNA甲基化综合分析显示3′UTR和近终止密码子富集》,《细胞》,149.7(2012)
[58] Meyer,K.D。;Jaffrey,S.R.,《动态上转录组:nN6-甲基腺苷和基因表达控制》,《分子细胞生物学》。,15, 313-326 (2014)
[59] Nilsen,T.W.,《内部mRNA甲基化最终发现功能》,《科学》,343.61761207-1208(2014)
[60] 邱伟荣。;姜世勇(Jiang,S.Y.)。;孙碧琴。;Xiao,X。;Cheng,X.,iRNA-2methyl:通过将序列偶联效应纳入一般PseKNC和集成分类器,医学化学,识别RNA 2′-O-甲基化位点。,13, 734-743 (2017)
[61] 邱,W.R。;姜世勇(Jiang,S.Y.)。;徐,Z.C。;Xiao,X.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178-41188(2017)
[62] 邱伟荣。;孙,B.Q。;Xiao,X。;Xu,D.,iPhos-PseEvo:通过灰色系统理论将进化信息纳入一般PseAAC,识别人类磷酸化蛋白质,Mol.Inf.,36(2017),UNSP 1600010
[63] 邱伟荣。;孙碧琴。;Xiao,X。;Xu,Z.C.,iPTM-mLys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123(2016)
[64] 邱伟荣。;孙碧琴。;Xiao,X。;Xu,Z.C.,iHyd-PseCp:通过将序列偶联效应纳入一般PseAAC来识别蛋白质中的羟脯氨酸和羟赖氨酸,Oncotarget,7,44310-44321(2016)
[65] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Jia,J.H.,iKcr-PseEns:使用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酰化位点,基因组学,110,239-246(2018)
[66] 邱伟荣。;Xiao,X。;Lin,W.Z.,iMethyl-PseAAC:通过伪氨基酸组成方法鉴定蛋白质甲基化位点,生物医学。Res.Int.(BMRI),2014年,第947416条,pp.(2014)
[67] 邱伟荣。;Xiao,X。;Xu,Z.C.,iPhos-PseEn:通过将不同的伪成分融合到集成分类器中来识别蛋白质中的磷酸化位点,Oncotarget,751270-51283(2016)
[68] Rozenski,J。;克莱恩,P.F。;Mccloskey,J.A.,RNA修饰数据库:1999年更新,核酸研究,27,1,196-197(1999)
[69] Rumelhart,David E.等人,1995年。“反向传播:基本理论。”反向传播L.Erlbaum Associates Inc。;Rumelhart,David E.等人,1995年。“反向传播:基本理论”,Backpropagation L.Erlbaum Associates Inc。
[70] 萨博,M.F。;伊克巴尔,N。;M.Khan。;M.Khan。;Maqbool,H.F.,使用Chou的PseKNC的复合编码特征识别RNA序列中的5-甲基胞嘧啶位点,J.Theor。生物学,452,1-9(2018)·Zbl 1397.92232号
[71] 施瓦茨,S。;阿加瓦拉,S.D。;Mumbach,M.R.,《高分辨率绘图揭示了酵母减数分裂中保守、广泛、动态的mRNA甲基化程序》,《细胞》,155.61409-1421(2013)
[72] 苏,Z.D。;黄,Y。;张志勇。;赵永伟。;王,D。;Chen,W。;Lin,H.,iLoc-lncRNA:通过将八聚体组成纳入通用PseKNC来预测lncRNA的亚细胞位置,生物信息学(2018)
[73] Vinje,Hilde,《比较基于K-mer的方法改进16S序列分类》,BMC Bioinf。,16.1, 205 (2015)
[74] Wang,L。;张,R。;Mu,Y.,Fu-SulfPred:通过Chou’S General PseAAC,J.Theor融合森林鉴定蛋白质S-磺基化位点。生物学,461,51-58(2019)·Zbl 1406.92221号
[75] 王,S。;Dong,P。;田毅,基于馈线集群和改进XGBoost的配电馈线统计线损估算新方法,能源,10,12,2067(2017)
[76] Wei,L。;苏·R。;王,B。;李,X。;邹强,深度特征表征和手工特征的集成以改进N6-甲基腺苷位点的预测,神经计算,324,3-9(2019)
[77] Xiao,X。;Cheng,X。;苏,S。;Nao,Q.,pLoc-mGpos:将关键基因本体信息合并到通用PseAAC中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。,9, 331-349 (2017)
[78] 谢海林。;Fu,L。;Nie,X.D.,基于Chou’s PseAAC的一般形式,使用集成SVM识别人类GPCR的N-连接糖基化位点,Protein Eng.Des。选择。,26, 735-742 (2013)
[79] 邢鹏伟,利用多区间核苷酸对位置特异性和支持向量机识别N6-甲基腺苷位点,科学。代表,746757(2017)
[80] 熊大鹏;曾杰。;Gong,H.,使用分层策略改进远程残余接触预测的深度学习框架,生物信息学,33,17,2675-2683(2017)
[81] Xu,Y。;邵晓杰。;Wu,L.Y。;Deng,N.Y.,iSNO-AAPair:将氨基酸成对偶联到PseAAC中以预测蛋白质中半胱氨酸S-亚硝基化位点,Peer J.,1,e171(2013)
[82] Xu,Y。;文,X。;邵晓杰。;Deng,N.Y.,iHyd-PseAAC:通过将二肽位置特异性倾向纳入伪氨基酸组成来预测蛋白质中的羟脯氨酸和羟赖氨酸,国际分子科学杂志。(IJMS),第15期,第7594-7610页(2014年)
[83] Yang,H。;邱伟荣。;刘,G。;郭富斌。;Chen,W。;Lin,H.,iRSpot-Pse6NC:通过将六聚体成分纳入一般PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学。,14, 883-891 (2018)
[84] 张杰。;X.赵。;Sun,P。;Ma,Z.,PSNO:通过将各种序列衍生特征纳入Chou’S PseAAC的一般形式来预测半胱氨酸S-亚硝基化位点,国际分子科学杂志。,15, 11204-11219 (2014)
[85] Zhang,M.,用核苷酸物理化学性质的启发式选择改进N6-甲基腺苷位点预测,Anal。生物化学。,508, 104-113 (2016)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。