×

iRNA-PseKNC(2甲基):通过卷积神经网络和Chou的伪组分识别RNA 2'-O-甲基化位点。 (英语) Zbl 1406.92217号

小结:2'-O-甲基化转移酶参与了2'-O甲基化过程。在催化过程中,核苷酸核糖部分的2-羟基接受甲基。这种甲基化过程是一种转录后修饰,发生在各种细胞RNA中,在转录后水平的基因表达调控中起着至关重要的作用。通过生化实验,2'-O-甲基化位点产生了良好的结果,但这些生化过程和探索技术非常昂贵。因此,需要开发一种计算方法来识别2'-O-甲基化位点。在这项工作中,我们提出了一种简单而精确的卷积神经网络方法,即:iRNA-PseKNC(2methyl)来识别2'-O-甲基化位点。现有技术使用手工特征,而该方法使用所提出的卷积神经网络模型自动提取2'-O-甲基化特征。所提出的预测iRNA-PseKNC(2甲基)方法的准确度为98.27%,敏感性为96.29%,特异性为100%,MCC为0.965家庭智者数据集。报告结果表明,就所有评估参数而言,我们提出的方法获得了比现有方法更好的结果。这些结果表明,iRNA-PseKNC(2methyl)方法可能有利于学术研究和药物设计。

理学硕士:

92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 青木,G。;Sakakibara,Y.,非编码RNA序列比对分类的卷积神经网络,生物信息学,34,i237-i244(2018)
[2] 巴切列里,J.-P。;Cavaille,J。;Hüttenhofer,A.,不断扩大的snoRNA世界,Biochimie,84775-790(2002)
[3] 蔡,L。;黄,T。;苏,J。;张,X。;Chen,W。;张,F。;He,L。;Chou,K.-C.,《精神分裂症中新发现的大脑eQTL基因及其相互作用物的意义》,摩尔-泰尔-核酸,12433-442(2018)
[4] 蔡永德。;Feng,K.-Y。;卢,W.C。;Chou,K.-C.,使用LogitBoost分类器预测蛋白质结构类别,J.Theor。《生物学》,238172-176(2006)·Zbl 1445.92220号
[5] 曹博士。;徐Q-S。;Liang,Y.-Z.,propy:生成周氏PseAAC各种模式的工具,生物信息学,29960-962(2013)
[6] Chen,W。;Lin,H。;Chou,K.-C.,《伪核苷酸组成或PseKNC:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634 (2015)
[7] Chen,W。;冯,P.-M。;Lin,H。;Chou,K.-C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,e68(2013)
[8] Chen,W。;Lei,T.-Y。;金,D.-C。;Lin,H。;Chou,K.-C.,PseKNC:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60 (2014)
[9] Chen,W。;冯·P。;丁·H。;Lin,H。;Chou,K.-C.,iRNA-methyl:使用伪核苷酸组成识别N6-甲基腺苷位点,Ana。生物化学。,490, 26-33 (2015)
[10] Chen,W。;Tang,H。;Ye,J。;Lin,H。;Chou,K.-C.,iRNA-PseU:识别RNA假尿苷位点,分子疗法-核酸,5(2016)
[11] Chen,W。;冯·P。;Tang,H。;丁·H。;Lin,H.,通过整合核苷酸化学性质和核苷酸组成来识别2'-O-甲基化位点,《基因组学》,107,255-258(2016)
[12] Chen,W。;丁·H。;周,X。;Lin,H。;Chou,K.-C.,iRNA(m6A)-PseDNC:使用伪二核苷酸成分识别N6-甲基腺苷位点,分析。生物化学。,561, 59-65 (2018)
[13] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.-C,iRNA-3typeA:鉴定RNA腺苷位点的三种类型的修饰,Mol.Ther-核酸,11468-474(2018)
[14] Cheng,X。;Xiao,X。;Chou,K.-C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,341448-1456(2017)
[15] Cheng,X。;Xiao,X。;Chou,K.-C,pLoc-mEuk:通过将关键GO信息提取到一般PseAAC中来预测多标记真核蛋白的亚细胞定位,基因组学,110,50-58(2018)
[16] Cheng,X。;Xiao,X。;Chou,K.-C.,pLoc-mGneg:通过通用PseAAC的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学,110,231-239(2018)
[17] Cheng,X。;赵,S.-G。;林,W.-Z。;Xiao,X。;Chou,K.-C.,pLoc-mAnimal:预测动物蛋白质的亚细胞定位,生物信息学,33,3524-3531(2017)
[18] Cholet,F.,Keras:茶诺和张量流的深度学习库(2015),7
[19] Chou,K.-C.,使用缩放窗口预测信号肽,肽,221973-1979(2001)
[20] Chou,K.-C.,伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用,Curr。蛋白质组学,6262-274(2009)
[21] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号
[22] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。,11, 218-234 (2015)
[23] 周,K.C.,由生物科学进步推动的药物化学的一场前所未有的革命,Curr。顶部。医药化学。,17, 2337-2358 (2017)
[24] 周,K.-C。;Elrod,D.W.,G蛋白偶联受体的生物信息学分析,《蛋白质组研究杂志》,1429-433(2002)
[25] 周,K.-C。;Shen,H.-B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63 (2009)
[26] 周,K.-C。;Cheng,X。;Xiao,X.,pLoc_bal-mHum:利用PseAAC和准平衡训练数据集预测人类蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[27] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001)
[28] Chou,K.C。;Cai,Y.D.,蛋白质亚细胞位置顺序效应和伪氨基酸组成的预测和分类,J.Cell。生物化学。,90, 1250-1260 (2003)
[29] 科洛伯特,R。;韦斯顿,J。;博图,L。;卡伦,M。;Kavukcuoglu,K。;Kuksa,P.,自然语言处理(几乎)从头开始,J.Mach。学习。第12号决议,2493-2537(2011年)·兹比尔1280.68161
[30] 迪凯特,W.A。;Fournier,M.J.,rRNA修饰和核糖体功能,《生物化学趋势》。科学。,27, 344-351 (2002)
[31] 东,Z.-W。;邵,P。;刁,L.-T。;周,H。;于春华。;Qu,L.-H.,RTL-P:检测RNA分子中2'-O-甲基化位点的敏感方法,《核酸研究》,40,e157(2012)
[32] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC-Builder:一个跨平台的独立程序,用于生成各种特殊的Chou伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012)
[33] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.-C.,iRNA-PseColl:通过将核苷酸的集体效应纳入PseKNC,Mol.Ther,来确定不同RNA修饰的发生位置-核酸,7155-163(2017)
[34] 冯·P。;Yang,H。;丁·H。;Lin,H。;Chen,W。;Chou,K.-C.,iDNA6mA-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC-来识别DNA N6-甲基腺苷位点,基因组学(2018)
[35] 海亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,271,10-17(2011)·Zbl 1405.92217号
[36] 海亚特,M。;Tahir,M.,PSOFuzzySVM-TMH:利用集成模糊支持向量机的集成特征空间识别跨膜螺旋片段。,11, 2255-2262 (2015)
[37] 胡,L。;黄,T。;施,X。;卢,W.C。;蔡永德。;Chou,K.-C.,基于加权蛋白质相互作用网络和蛋白质杂交特性预测小鼠蛋白质功能,《公共科学图书馆·综合》,6,e14556(2011)
[38] 贾,C。;林,X。;Wang,Z.,基于自适应正态分布双profile Bayes和Chou的伪氨基酸组成预测蛋白质S-亚硝化位点,国际分子科学杂志。,15, 10410-10423 (2014)
[39] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[40] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.C.,pSuc-Lys:利用PseAAC和集合随机森林方法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230(2016)·Zbl 1343.92153号
[41] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,iCar PseCp:通过蒙特卡洛采样识别蛋白质中的羰基化位点,并将序列偶联效应纳入一般PseAAC,肿瘤靶点,734558(2016)
[42] 贾,J。;张,L。;刘,Z。;Xiao,X。;Chou,K.-C.,pSumo-CD:通过将序列耦合效应纳入一般PseAAC,使用协方差判别算法预测蛋白质中的sumoylation位点,生物信息学,32,3133-3141(2016)
[43] 贾,J。;李,X。;邱伟。;Xiao,X。;Chou,K.-C.,iPPI-PseAAC(CGR):通过将混沌游戏表示纳入PseAAC,J.Theor来识别蛋白质相互作用。生物学,460195-203(2019)·Zbl 1406.92189号
[44] Ju,Z。;He,J.-J.,通过将k间距氨基酸对的组成合并到Chou的一般PseAAC中来预测赖氨酸巴豆酰化位点,J.摩尔图。型号。,7700-204(2017)
[45] Ju,Z。;Wang,S.-Y.,通过将k间距氨基酸对纳入Chou的一般伪氨基酸组成预测瓜氨酸化位点,Gene,664,78-83(2018)
[46] Ju,Z。;曹建忠。;Gu,H.,通过将k间距氨基酸对合并到Chou的一般PseAAC中,J.Theor,用模糊支持向量机预测赖氨酸磷酸甘油化。生物学,397145-150(2016)
[47] Kiss,T.,《小核仁RNA:具有多种细胞功能的大量非编码RNA》,《细胞》,109145-148(2002)
[48] 李,F。;李,C。;Marquez-Lago,T.T。;Leier,A。;Akutsu,T。;Purcell,A.W。;Ian Smith,A。;Lithgow,T。;Daly,R.J。;Song,J.,Quokka:快速准确预测人类蛋白质组中激酶家族特异性磷酸化位点的综合工具,生物信息学(2018)
[49] 李,F。;Wang,Y。;李,C。;Marquez-Lago,T.T。;Leier,A。;罗林斯,N.D。;哈法里,G。;Revote,J。;Akutsu,T。;Chou,K.C.,《蛋白酶特异性底物和裂解位点预测的二十年生物信息学研究:对现有方法的全面回顾和基准测试》,Brief。生物信息(2018)
[50] 李,J。;杨,Z。;Yu,B。;刘杰。;Chen,X.,甲基化保护拟南芥中的miRNAs和siRNAs免受3′末端尿苷化活性的影响,Curr。生物学,1501-1507(2005)
[51] 刘,B。;Wu,H。;Chou,K.-C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,2017年9月67日
[52] 刘,B。;杨,F。;Chou,K.-C.,2L-piRNA:一种用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther-核酸,7,267-277(2017)
[53] 刘,B。;王,S。;朗·R。;Chou,K.-C.,iRSpot-EL:用集成学习方法识别重组点,生物信息学,33,35-41(2016)
[54] 刘,B。;杨,F。;黄,D.-S。;Chou,K.-C.,iPromoter-2L:通过基于多窗口的PseKNC识别启动子及其类型的双层预测因子,生物信息学,34,33-40(2017)
[55] 刘,B。;李凯。;黄,D.-S。;Chou,K.-C.,iEnhancer-EL:使用集成学习方法识别增强子及其强度,生物信息学(2018)
[56] 刘,B。;翁,F。;黄,D.-S。;Chou,K.-C.,iRO-3wPseKNC:通过基于三个窗口的PseKNC识别DNA复制起源,生物信息学,1,8(2018)
[57] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71(2015)
[58] 刘,Z。;Xiao,X。;Yu,D.-J。;贾,J。;邱伟荣。;Chou,K.-C.,pRNAm-PC:通过物理化学性质预测RNA序列中的N6-甲基腺苷位点,分析。生物化学。,497, 60-67 (2016)
[59] Nanni,L.,预测蛋白质相互作用的超平面,神经计算,69,257-263(2005)
[60] 纳扎里一世。;塔亚拉,H。;Chong,K.T.,利用深度学习进行RNA剪接中的分支点选择,IEEE Access,1(2018)
[61] Oubouyt,M。;Louadi,Z。;塔亚拉,H。;Chong,K.T.,基于分布式特征表示的选择性剪接预测深度学习模型,IEEE Access,658826-58834(2018)
[62] 潘·G。;江,L。;Tang,J。;Guo,F.,利用DNA序列信息和物理化学性质检测DNA甲基化位点的新计算方法,国际分子科学杂志。,19, 511 (2018)
[63] 潘,X。;Rijnbeek,P。;严,J。;Shen,H.-B.,使用深度卷积和递归神经网络预测RNA蛋白序列和结构结合偏好,BMC基因组学,19511(2018)
[64] 邱伟荣。;Xiao,X。;林,W.-Z。;Chou,K.-C.,iMethyl-PseAAC:通过伪氨基酸组成方法鉴定蛋白质甲基化位点,生物医药研究国际(2014),2014
[65] 邱伟荣。;Xiao,X。;林,W.-Z。;Chou,K.C.,iUbiq-Lys:通过灰色系统模型提取序列进化信息预测蛋白质中的赖氨酸泛素化位点,J.Biomol。结构。动态。,33, 1731-1742 (2015)
[66] 邱伟荣。;Xiao,X。;徐,Z.C。;Chou,K.-C.,iPhos-PseEn:通过将不同的伪成分融合到集成分类器中来识别蛋白质中的磷酸化位点,Oncotarget,751270(2016)
[67] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Chou,K.-C.,iPTM mLys:鉴定多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123(2016)
[68] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Chou,K.-C.,iHyd-PseCp:通过将序列偶联效应纳入一般PseAAC来识别蛋白质中的羟脯氨酸和羟赖氨酸,Oncotarget,744310(2016)
[69] 邱伟荣。;江,S.-Y。;徐,Z.C。;Xiao,X。;Chou,K.-C.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178(2017)
[70] 邱伟荣。;江,S.-Y。;孙碧琴。;Xiao,X。;Cheng,X。;Chou,K.-C.,iRNA-2methyl:通过将序列耦合效应纳入一般PseKNC和集成分类器,Med.Chem.,识别RNA 2'-O-甲基化位点。,13, 734-743 (2017)
[71] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;贾俊华。;Chou,K.C.,iKcr-PseEns:使用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酰化位点,基因组学,110,239-246(2018)
[72] 邱伟荣。;孙碧琴。;Xiao,X。;徐,D。;Chou,K.C.,iPhos‐PseEvo:通过灰色系统理论将进化信息纳入一般PseAAC,识别人类磷酸化蛋白质,Mol.Inf.,36,Article 1600010 pp.(2017)
[73] 曲,W。;王,D。;Feng,S。;Zhang,Y。;Yu,G.,基于多模态深度学习的新型跨模态哈希算法,科学。中国信息科学。,第60条,第092104页(2017年)
[74] Ramachandran,V。;Chen,X.,拟南芥中一个外核糖核酸酶家族对microRNAs的降解,科学,3211490-1492(2008)
[75] 宋,J。;Wang,Y。;李,F。;Akutsu,T。;罗林斯,北卡罗来纳州。;韦伯,G.I。;Chou,K.-C.,iProt-Sub:一个用于准确绘制和预测蛋白酶特异性底物和裂解位点的综合软件包,简介。生物信息(2018)
[76] 孙伟杰。;李,J.-H。;刘,S。;吴杰。;周,H。;Qu,L.-H。;Yang,J.-H.,《RMBase:从高通量测序数据解码RNA修饰景观的资源》,《核酸研究》,44,D259-D265(2015)
[77] 塔希尔,M。;Hayat,M.,iNuc STNC:通过扩展SAAC和Chou’s PseAAC的概念,鉴定基因组中核小体定位的基于序列的预测因子,Mol.Bioyst。,12, 2587-2593 (2016)
[78] 塔希尔,M。;Hayat,M.,基于机器学习的蛋白质相互作用识别,使用物理化学特性和进化剖面的衍生特征,Artif。智力。医学,78,61-71(2017)
[79] 塔希尔,M。;海亚特,M。;Kabir,M.,通过应用Chou三核苷酸组成的一般形式区分增强子及其类型的基于序列的预测,计算。方法生物识别程序。,146, 69-75 (2017)
[80] 塔希尔,M。;海亚特,M。;Khan,S.A.,《利用伪K元组核苷酸组成的混合特征速度区分增强子及其类型的双层计算模型》,《阿拉伯科学杂志》。工程师,43,6719-6727(2018)
[81] 塔希尔,M。;海亚特,M。;Khan,S.A.,iNuc-ext-PseTNC:通过将Chou的PseAAC概念扩展到伪三核苷酸组成,Mol.Genet,一种有效的集成模型,用于识别核小体定位。基因组学,1-12(2018)
[82] 塔亚拉,H。;Chong,K.,使用一级密集连接特征金字塔网络在高分辨率航空图像中进行目标检测,Sensors,18,3341(2018)
[83] 塔亚拉,H。;Soo,K.G。;Chong,K.T.,使用卷积回归神经网络在高分辨率航空图像中检测和计数车辆,IEEE Access,62220-2230(2018)
[84] Xiao,X。;Cheng,X。;陈,G。;毛泽东,Q。;Chou,K.-C.,pLoc_bal-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[85] 谢海林。;Fu,L。;Nie,X.-D.,基于Chou’s PseAAC的一般形式,使用集成SVM识别人类GPCR的N-连接糖基化位点,Protein Eng.Des。选择。,26, 735-742 (2013)
[86] Xu,Y。;Chou,K.-C.,预测蛋白质翻译后修饰位点的最新进展,Curr。顶部。医药化学。,16, 591-603 (2016)
[87] Xu,Y。;丁,J。;Wu,L.-Y。;Chou,K.-C.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,e55844(2013)
[88] Xu,Y。;王,Z。;李,C。;Chou,K.-C.,iPreny-PseAAC:通过将两层序列偶联纳入PseAAC,Med.Chem。,13, 544-551 (2017)
[89] Xu,Y。;邵,X.-J。;Wu,L.-Y。;邓,N.-Y。;Chou,K.-C.,iSNO-AAPair:将氨基酸成对偶联到PseAAC中以预测蛋白质中半胱氨酸S-亚硝基化位点,PeerJ,1,e171(2013)
[90] Xu,Y。;文,X。;邵晓杰。;邓,N.-Y。;Chou,K.-C.,iHyd-PseAAC:通过将二肽位置特异性倾向纳入伪氨基酸组成来预测蛋白质中的羟脯氨酸和羟赖氨酸,国际分子科学杂志。,15, 7594-7610 (2014)
[91] Xu,Y。;文,X。;Wen,L.-S。;Wu,L.-Y。;邓,N.-Y。;Chou,K.-C.,iNitro-Tyr:预测具有一般伪氨基酸组成的蛋白质中的硝基酪氨酸位点,PLoS One,9,文章e105018 pp.(2014)
[92] 杨,B。;刘,F。;Ren,C。;欧阳,Z。;谢,Z。;博,X。;Shu,W.,BiRen:利用基于深度学习的模型单独使用DNA序列预测增强子,生物信息学,33,1930-1936(2017)
[93] Yang,H。;邱伟荣。;刘,G。;郭,F.-B。;Chen,W。;周,K.-C。;Lin,H.,iRSpot-Pse6NC:通过将六聚体成分纳入一般PseKNC,Int.J.Biol,识别酿酒酵母中的重组点。科学。,14, 883 (2018)
[94] Zhang,C.T。;Chou,K.C.,《从氨基酸组成预测蛋白质结构类别的优化方法》,《蛋白质科学》。,1, 401-408 (1992)
[95] 张杰。;X.赵。;Sun,P。;Ma,Z.,PSNO:通过将各种序列衍生特征纳入Chou’S PseAAC的一般形式来预测半胱氨酸S-亚硝基化位点,国际分子科学杂志。,2014年11月15日至1219日
[96] Zhang,Y。;谢瑞。;Wang,J。;Leier,A。;Marquez-Lago,T.T。;Akutsu,T。;韦布,G.I。;周,K.-C。;Song,J.,通过在综合机器学习框架中利用信息特征对赖氨酸丙二酰化位点进行计算分析和预测,Brief。生物信息。(2018), 5
[97] 苏斯特,R。;塞万提斯·巴拉根,L。;哈布扬,M。;R·迈尔。;纽曼,B.W。;Ziebuhr,J.等人。;Szretter,K.J。;贝克,S.C。;巴切,W。;Diamond,M.S.,核糖2'-O-甲基化为区分依赖RNA传感器Mda5、Nat.Immunol.、。,12, 137 (2011)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。