×

iMethyl-STTNC:通过将SAAC的概念扩展到Chou的PseAAC来确定N(^6)-甲基腺苷位点,以形成RNA序列。 (英语) Zbl 1406.92448号

摘要:N-甲基腺苷(m6A)是一种重要的转录后修饰,在RNA水平上增加了另一层表观遗传调控。它对影响蛋白质表达的mRNA进行化学修饰。RNA序列包含许多遗传密码基序(GAC)。在这些密码中,甲基化或非甲基化GAC基序的识别是非常必要的。然而,由于后基因组时代产生了大量的RNA序列,如何准确、快速地表征这些序列成为一项具有挑战性的任务。有鉴于此,智能的概念与计算模型相结合,真实快速地反映所需类的主题。提出了一种智能计算模型“iMethyl-STTNC”模型来识别RNA中的甲基腺苷位点;伪二核苷酸复合、伪三核苷酸复合、分裂三核苷酸复合和分裂四核苷酸复合(STTNC)用于真正的数字描述符。采用概率神经网络、支持向量机(SVM)和K近邻三种不同的分类算法进行预测。在检查了预测模型在每个特征空间上的结果后,使用STTNC特征空间的SVM在数据集1和数据集2上分别报告了69.84%和91.84%的最高准确率。报告结果表明,与目前的研究方法相比,我们提出的预测方法取得了令人鼓舞的结果。最后,我们认为我们开发的模型可能有助于深入分析基因组和药物开发。

MSC公司:

92D20型 蛋白质序列,DNA序列
92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚当斯,J.M。;Cory,S.,《小鼠骨髓瘤mRNA中的修饰核苷和奇异5′末端》,《自然》,255,5503,28-33(1975)
[2] Afridi,T.H。;A.Khan。;Lee,Y.S.,Mito-GSAAC:利用遗传集成分类器和分裂氨基酸组成预测线粒体,《氨基酸》,42,4,1443-1454(2012)
[3] 艾哈迈德,S。;卡比尔,M。;Hayat,M.,《通过将二肽成分纳入Chou的一般PseAAC,Compute,鉴定热休克蛋白家族和J蛋白类型》。方法生物识别程序。,122, 2, 165-174 (2015)
[4] Ahmad,K。;Waris,M。;Hayat,M.,通过将二肽成分纳入Chou的一般伪氨基酸成分预测蛋白质亚线粒体位置,J.Membr。生物学,1-12(2016)
[5] 阿克巴,S。;艾哈迈德,A。;Hayat,M.,结合支持向量机使用离散小波变换识别指纹(2014)
[6] Akbar,S.,iACP-GAEnsC:利用混合特征空间基于进化遗传算法的抗癌肽集成分类,Artif。智力。医学,79,62-70(2017)
[7] Alashwal,H。;Deris,S。;Othman,R.M.,使用支持向量机预测蛋白质相互作用的结构域和疏水性特征的比较,国际期刊信息技术。,3, 1, 18-24 (2007)
[8] 阿里,F。;Hayat,M.,使用投票特征区间结合Chou的伪氨基酸组成对膜蛋白类型进行分类,J.Theor。生物学,384,78-83(2015)·Zbl 1343.92006年
[9] 阿隆尼,Y。;Dhar,R。;Khoury,G.,核猴病毒40 RNA的甲基化,J.Virol。,32, 1, 52-60 (1979)
[10] Arif,M。;海亚特,M。;Jan,Z.,iMem-2LSAAC:通过将SAAC的概念扩展到Chou的伪氨基酸组成中来区分膜蛋白及其类型的两级模型,J.Theor。生物(2018)·Zbl 1397.92180号
[11] 比蒙,K。;Keith,J.,Rous肉瘤病毒基因组中N6-甲基腺苷的定位,分子生物学杂志。,113, 1, 165-179 (1977)
[12] Bodi,Z.,《酵母靶向mRNA甲基化》,《核酸研究》,gkq266(2010)
[13] Chen,W.,iNuc-PhysChem:一种基于序列的预测因子,用于通过物理化学性质识别核小体,PLoS One,7,10,e47843(2012)
[14] Chen,W.,PseKNC:一种用于生成伪K元组核苷酸组成的灵活网络服务器,分析。生物化学。,456, 53-60 (2014)
[15] Chen,W.,iRNA-methyl:使用伪核苷酸组成识别N6-甲基腺苷位点,Ana。生物化学。,490, 26-33 (2015)
[16] Chen,W.,iRNA-PseU:识别RNA假尿苷位点,分子治疗学。核酸,5(2016)
[17] Chen,W。;Tang,H。;Lin,H.,MethyRNA:用于识别N6-甲基腺苷位点的网络服务器,J.Biomol。结构。动态。,35683-687(2017)
[18] Cheng,X。;Xiao,X。;Chou,K.-C,pLoc-mPlant:通过将最佳GO信息纳入一般PseAAC,Mol.Biosyst.,预测多位置植物蛋白的亚细胞定位。,13, 9, 1722-1727 (2017)
[19] Cheng,X。;Xiao,X。;Chou,K.-C.,pLoc-mEuk:通过将关键GO信息提取到通用PseAAC中来预测多标签真核蛋白的亚细胞定位,基因组学(2017)
[20] Cheng,X。;Xiao,X。;Chou,K.-C.,pLoc-mHum:通过通用PseAAC预测多位置人类蛋白质的亚细胞定位,以筛选出关键的GO信息,生物信息学,1,9(2017)
[21] 周,K.-C。;Shen,H.-B.,Cell PLoc:一套用于预测蛋白质在各种生物体中的亚细胞定位的网络服务器,Nat.Protoc。,3, 2, 153 (2008)
[22] 周,K.-C。;Shen,H.-B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 02, 63 (2009)
[23] 周,K.-C。;吴振中。;Xiao,X.,iLoc-Euk:预测单复合体和复合真核蛋白亚细胞定位的多标记分类器,PLoS One,6,3,e18258(2011)
[24] 周,K.-C。;吴振中。;Xiao,X.,iLoc-Hum:利用累积-标签尺度预测人类蛋白质在单位点和多位点的亚细胞位置,Mol.Biosyst。,8, 2, 629-641 (2012)
[25] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。生物信息。,43, 3, 246-255 (2001)
[26] Chou,K.-C.,《利用亚基偶联预测信号肽》,《蛋白质工程》,第14、2、75-79页(2001年)
[27] Chou,K.-C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,1,10-19(2004)
[28] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273,1,236-247(2011)·Zbl 1405.92212号
[29] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。,11, 3, 218-234 (2015)
[30] 周,K.C.,由生物科学进步推动的药物化学的一场前所未有的革命,Curr。顶部。医药化学。,17, 21, 2337-2358 (2017)
[31] Clancy,M.J.,《诱导酿酒酵母产孢导致mRNA中N6甲基腺苷的形成:IME4基因活性的潜在机制》,核酸研究,30,20,4509-4518(2002)
[32] 科尔特斯,C。;Vapnik,V.,支持向量网络,马赫。学习。,20, 3, 273-297 (1995) ·Zbl 0831.68098号
[33] 减粘剂,R。;弗里德里奇,K。;Rottman,F.,Novikoff肝癌细胞信使RNA中甲基化核苷的鉴定,Proc。国家。阿卡德。科学。,71, 10, 3971-3975 (1974)
[34] Ding,H.,iCTX-Type:一种基于序列的预测因子,用于识别靶向离子通道中的芋螺毒素类型,BioMed。Res.Int.,2014(2014)
[35] Dominissini,D.,m6A-seq揭示的人类和小鼠m6A RNA甲基体拓扑,《自然》,4857397201-206(2012)
[36] 杜,P。;Yu,Y.,SubMito-PSPCP:通过位置特异性物理化学特性与伪氨基酸成分杂交预测蛋白质亚线粒体位置,BioMed。Res.Int.,2013(2013)
[37] 杜,P。;顾S。;Jiao,Y.,PseAAC-general:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3, 3495-3506 (2014)
[38] Feng,P.,iRNA PseColl:通过将核苷酸的集体效应结合到PseKNC,Mol.Ther.中来识别不同RNA修饰的发生位点。核酸,7155-163(2017)
[39] Feng,P.,iDNA6mA-PseKNC:通过将核苷酸的物理化学性质纳入PseKNC-来识别DNA N6-甲基腺苷位点,基因组学(2018)
[40] 加德扎德,M。;Rebecca,F。;Standring,A.,《不同神经网络早期检测前列腺良性增生癌的性能比较》,Appl。医学信息,33,3,45-54(2013)
[41] Guo,S.-H.,iNuc-PseKNC:基于序列的预测因子,用于预测具有伪k元组核苷酸组成的基因组中的核小体定位,生物信息学,btu083(2014)
[42] 海亚特,M。;Iqbal,N.,通过将伪平均化学位移合并到Chou的通用PseAAC和支持向量机来识别蛋白质结构类,Compute。方法生物识别程序。,116, 3, 184-192 (2014)
[43] 哈亚特,M。;Khan,A.,通过将复合蛋白序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,271,1,10-17(2011)·Zbl 1405.92217号
[44] 海亚特,M。;Khan,A.,MemHyb:通过SAAC和PSSM杂交预测膜蛋白类型,J.Theor。生物,29293-102(2012)·Zbl 1307.92308号
[45] 海亚特,M。;Tahir,M.,PSOFuzzySVM-TMH:利用集成模糊支持向量机的集成特征空间识别跨膜螺旋片段。,11, 8, 2255-2262 (2015)
[46] 海亚特,M。;A.Khan。;酵母素,M.,使用分裂氨基酸和集合分类预测膜蛋白,氨基酸,42,6,2447-2460(2012)
[47] 海亚特,M。;Khan,A.,基于Chou的PseAAC,Protein Pept的一般形式,使用模糊K-最近邻算法识别外膜蛋白。莱特。,19, 4, 411-421 (2012)
[48] He,X.,《TargetFreeze:通过使用序列进化信息和伪氨基酸组成的权重组合识别防冻蛋白》,J.Membr。生物,248,6,1005-1014(2015)
[49] 黄伟杰。;Wen,K.-W.,基于部分距离搜索的快速kNN分类算法,Electron。莱特。,34, 21, 2062-2063 (1998)
[50] 伊克巴尔,M。;Hayat,M.,iSS-Hyb-mRMR:使用伪三核苷酸和伪四核苷酸组成的杂交空间识别剪接位点,计算。方法生物识别程序。,128, 1-11 (2016)
[51] 核RNA中的N6-甲基腺苷是肥胖相关FTO,Nat.Chem的主要底物。生物学,7,12,885-887(2011)
[52] 贾,C。;林,X。;Wang,Z.,基于自适应正态分布双profile Bayes和Chou的伪氨基酸组成预测蛋白质S-亚硝化位点,国际分子科学杂志。,15, 6, 10410-10423 (2014)
[53] Jia,J.,iPPI-Esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到PseAAC,J.Theor中来识别蛋白质的相互作用。《生物学》,377,47-56(2015)
[54] Jia,J.,iSuc-PseOpt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56 (2016)
[55] Ju,Z。;Wang,S.-Y.,通过将k间距氨基酸对纳入Chou的一般伪氨基酸组成预测瓜氨酸化位点,Gene,664,78-83(2018)
[56] Keller,J.M。;格雷,M.R。;Givens,J.A.,模糊最近邻算法,系统。人类网络。IEEE传输。,4, 580-585 (1985)
[57] A.Khan。;M.Khan。;Choi,T.-S.,变换域中基于邻近性的GPCR预测,生物化学。生物物理学。Res.Commun.公司。,371, 3, 411-415 (2008)
[58] Khan,A.,鉴于预期攻击,基于机器学习的自适应水印解码,模式识别。,41, 8, 2594-2610 (2008) ·Zbl 1151.68585号
[59] Z.U.Khan。;海亚特,M。;Khan,M.A.,利用Chou的伪氨基酸组成结合概率神经网络模型识别酸性和碱性酶,J.Theor。生物学,365197-203(2015)·Zbl 1314.92069号
[60] 利维斯,R。;Penman,S.,《双翅目果蝇细胞的poly(A)+细胞质信使RNA和poly(A+)+及poly(A-异质核RNA的5′末端结构》,《分子生物学杂志》。,120, 4, 487-515 (1978)
[61] Li,W.C.,iORI-PseKNC:利用伪k元组核苷酸组成识别复制起源的预测因子,《化学》。智力。实验室系统。,141, 100-106 (2015)
[62] Lin,H.,iPro54-PseKNC:基于序列的预测因子,用于识别具有伪k元组核苷酸组成的原核生物中的sigma-54启动子,核酸研究,42,21,12961-12972(2014)
[63] Liu,Z.,iDNA-甲基:通过伪三核苷酸组成鉴定DNA甲基化位点,Ana。生物化学。,474, 69-77 (2015)
[64] Liu,B.,《Pse-in-One:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,43,W1,W65-W71(2015)
[65] Liu,B.,iMiRNA-PseDPC:用伪距离-对合成方法鉴定microRNA前体,J.Biomol。结构。动态。,34, 1, 223-235 (2016)
[66] 刘,B。;Wu,H。;Chou,K.-C.,《Pse-in-One 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,9, 04, 67 (2017)
[67] 刘,B。;杨,F。;Chou,K.-C.,2L-piRNA:一种用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。编号。酸,7267-277(2017)
[68] 梅,J。;赵,J.,通过周氏一般伪氨基酸组成和基序特征分析和预测突触前和突触后神经毒素,J.Theor。生物学,447,147-153(2018)
[69] Meyer,K.D.,《mRNA甲基化的综合分析揭示了3′UTR和近终止密码子的富集》,《细胞》,149,7,1635-1646(2012)
[70] Narayan,P。;Rottman,F.M.,信使RNA内部腺苷残基精确甲基化的体外系统,《科学》,24248821159-1162(1988)
[71] Nichols,J.,《含有多聚(A)的玉米RNA中的“Cap”结构,生物化学与生物物理学报(BBA)核酸蛋白质合成》。,563, 2, 490-495 (1979)
[72] 邱,W.-R.,iMethyl-PseAAC:通过伪氨基酸组成方法鉴定蛋白质甲基化位点,生物医学。Res.Int.,2014(2014)
[73] 邱伟荣。;Xiao,X。;Chou,K.-C.,iRSpot-TNCPseAAC:用三核苷酸成分和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 2, 1746-1766 (2014)
[74] 邱,W.-R.,iUbiq-Lys:通过灰色系统模型提取序列进化信息预测蛋白质中的赖氨酸泛素化位点,J.Biomol。结构。动态。,1-12(2014),提前发布
[75] 邱,W.-R.,iUbiq-Lys:通过灰色系统模型提取序列进化信息预测蛋白质中的赖氨酸泛素化位点,J.Biomol。结构。动态。,33, 8, 1731-1742 (2015)
[76] 邱,W.-R.,iPTM-mLys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,20,3116-123(2016)
[77] Qiu,W.-R.,iPhos PseEn:通过将不同的伪组分融合到集成分类器中来鉴定蛋白质中的磷酸化位点,Oncotarget,7,3251270(2016)
[78] 邱,W.-R.,iRNA-2methyl:通过将序列耦合效应纳入一般PseKNC和集成分类器,《医学化学》,识别RNA 2′-O-甲基化位点。,13, 8, 734-743 (2017)
[79] 邱,W.-R.,iRNAm5C-PseDNC:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,25,41178(2017)
[80] 邱,W.,通过将伪位置特异性评分矩阵合并到一般Chou的伪氨基酸组成中来预测蛋白质的亚线粒体位置,J.Theor。生物学,450,86-103(2018)·兹比尔1397.92228
[81] Rao,P.N.,蛋白质超家族分类的概率神经网络方法,J.Theor。申请。技术信息。,6, 1, 101-105 (2009)
[82] Sitamahalakshmi,T.,用于泰卢固语字符识别的径向基函数网络和概率神经网络的性能比较,全球计算机杂志。科学。技术。,11, 4 (2011)
[83] Song,J.,PREvaIL,一种在机器学习框架中使用序列、结构和网络特征推断催化残基的综合方法,J.Theor。生物学,443125-137(2018)
[84] Specht,D.F.,概率神经网络,神经网络。,3, 1, 109-118 (1990)
[85] Wang,Y.,N 6-甲基腺苷修饰破坏胚胎干细胞中发育调节因子的稳定性,《自然细胞生物学》。,16, 2, 191 (2014)
[86] 魏春明。;Gershowitz,A。;Moss,B.,HeLa细胞mRNA中的5′-末端和内部甲基化核苷酸序列,生物化学,15,2,397-401(1976)
[87] 伍顿,J.C。;Federhen,S.,氨基酸序列和序列数据库局部复杂性统计,计算机。化学。,17, 2, 149-163 (1993) ·Zbl 0825.92102号
[88] Xiao,X。;王,P。;Chou,K.-C.,iNR-PhysChem:一种基于序列的预测因子,用于通过物理化学属性矩阵识别核受体及其亚家族,PLoS One,7,2,e30869(2012)
[89] Xiao,X.,iAMP-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 2, 168-177 (2013)
[90] Xiao,X.,pLoc-mGpos:通过准平衡训练数据集和PseAAC预测革兰氏阳性细菌蛋白质的亚细胞定位,基因组学(2018)·Zbl 1406.92173号
[91] Xu,Y.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,2,e55844(2013)
[92] Xu,Y.,iHyd-PseAAC:通过将二肽位置特异性倾向纳入伪氨基酸组成来预测蛋白质中的羟脯氨酸和羟赖氨酸,国际分子科学杂志。,15, 5, 7594-7610 (2014)
[93] Xu,Y.,iNitro-Tyr:预测具有一般伪氨基酸组成的蛋白质中的硝基酪氨酸位点,PLoS One,9,8,Article e105018 pp.(2014)
[94] Yu,Y。;刘杰。;He,C.,RNA N6-甲基腺苷甲基化在转录后基因表达调控中的作用,Genes Dev.,29,13,1343-1355(2015)
[95] 张,L。;Kong,L.,iRSpot-ADMP:通过将相关的二核苷酸产物模型合并到Chou的伪组分中来识别重组点,J.Theor。生物(2018)
[96] 张,L。;Kong,L.,iRSpot-PDI:通过将二核苷酸属性多样性信息纳入Chou的伪成分来识别重组点,基因组学(2018)
[97] Zhang,J.,PSNO:通过将各种序列衍生的特征结合到Chou’S PseAAC的一般形式中来预测半胱氨酸S-亚硝基化位点,Int.J.Mol.Sci。,15, 7, 11204-11219 (2014)
[98] Zheng,G.,ALKBH5是一种影响RNA代谢和小鼠生育能力的哺乳动物RNA脱甲基酶,Mol.Cell,49,1,18-29(2013)
[99] Zhong,S.,MTA是拟南芥信使RNA腺苷甲基化酶,与性别特异剪接因子的同源物植物细胞,20,5,1278-1288(2008)相互作用
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。