×

使用Chou's PseKNC的复合编码特征识别RNA序列中的5-甲基胞嘧啶位点。 (英语) Zbl 1397.92232号

摘要:本研究探讨了准确有效的计算方法,用于识别RNA修饰中5-甲基胞嘧啶位点。5-甲基胞嘧啶(m\(^5\)C)的出现在许多生物过程中起着至关重要的作用。为了更好地理解生物功能和机制,有必要准确识别RNA中的m(^5)C位点。实验室技术和程序可用于鉴定RNA中的m(^5)C位点,但这些程序需要大量时间和资源。本研究开发了一种提取RNA序列特征的新计算方法。该方法首先通过复合特征向量对RNA序列进行编码,然后使用最小冗余-最大相关算法选择判别特征。其次,所使用的分类方法是基于支持向量机,通过折刀交叉验证测试。该方法有效地从非m5C位点中识别m5C位,在基准数据集上的灵敏度为90.0,特异性为96.66,结果为93.33%。结果表明,与现有的计算技术相比,该算法具有显著的识别性能。本研究扩展了有关RNA修饰发生位点的知识,为更好地理解生物用途和机制铺平了道路。

MSC公司:

92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agris,P.F.,《为翻译带来秩序:转移RNA反密码域修饰的贡献》,EMBO代表,9,629-635,(2008)
[2] 艾哈迈德,S。;卡比尔,M。;Hayat,M.,《通过将二肽组分纳入Chou的一般pseaac来识别热休克蛋白家族和J蛋白类型》,计算。生物识别方法程序。,122165-174(2015年)
[3] Bartenhagen,C。;Klein,H.-U。;拉克特,C。;蒋,X。;Dugas,M.,微阵列基因表达数据可视化的无监督降维技术比较研究,BMC生物信息学,11,567,(2010)
[4] 蔡永德。;Chou,K.-C.,预测杂交空间中蛋白质的亚细胞定位,生物信息学,201151-1156,(2004)
[5] 蔡永德。;周国平。;Chou,K.-C.,通过使用功能域组成预测膜蛋白类型的支持向量机,Biophys。J.,84,3257-3263,(2003)
[6] Chen,W。;冯·P。;丁·H。;Lin,H。;Chou,K.-C.,Irna-methyl:使用伪核苷酸组成识别N6-甲基腺苷位点,Ana。生物化学。,490, 26-33, (2015)
[7] Chen,W。;冯·P。;Yang,H。;丁·H。;Lin,H。;Chou,K.-C.,Irna-AI:识别RNA序列中腺苷到肌苷的编辑位点,Oncotarget,84208,(2017)
[8] Chen,W。;Lei,T.-Y。;金博士。;Lin,H。;Chou,K.-C.,Pseknc:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456, 53-60, (2014)
[9] Chen,W。;Lin,H。;Chou,K.C.,《伪核苷酸组成或pseknc:分析基因组序列的有效配方》,Mol.Biosyst。,11, 2620-2634, (2015)
[10] Chen,W。;Lin,H。;冯,P.-M。;丁,C。;左Y.C。;Chou,K.-C.,《Inuc-physchem:通过物理化学性质识别核小体的基于序列的预测因子》,《公共科学图书馆·综合》,第7期,e47843页,(2012年)
[11] Chen,W。;Tang,H。;Ye,J。;Lin,H。;Chou,K.-C.,Irna pseu:鉴定RNA假尿苷位点,分子生物学。核酸,5,(2016)
[12] Cheng,X。;Xiao,X。;Chou,K.-C.,Ploc-meuk:通过将关键GO信息提取到通用pseaac中来预测多标签真核蛋白的亚细胞定位,基因组学,(2017)
[13] Cheng,X。;Xiao,X。;Chou,K.-C.,《Ploc-mplant:通过将最佳GO信息合并到一般pseaac中来预测多位置植物蛋白的亚细胞定位》,Mol.Biosyst。,13, 1722-1727, (2017)
[14] Cheng,X。;Xiao,X。;Chou,K.-C.,Ploc-mvirus:通过将最佳GO信息合并到通用pseaac中来预测多位置病毒蛋白的亚细胞定位,Gene,628,315-321,(2017)
[15] Cheng,X。;Xiao,X。;Chou,K.-C.,Ploc-mgneg:通过通用pseaac的深层基因本体学习预测革兰氏阴性细菌蛋白质的亚细胞定位,基因组学,(2017)
[16] Cheng,X。;赵,S.-G。;林,W.-Z。;Xiao,X。;Chou,K.-C.,《动物:预测动物蛋白质的亚细胞定位(单位点和多位点)》,生物信息学,33,3524-3531,(2017)
[17] Cheng,X。;赵,S.-G。;Xiao,X。;Chou,K.C.,Iatc-misf:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346,(2016)
[18] Cheng,X。;赵,S.-G。;Xiao,X。;Chou,K.-C.,Iatc-myb:一种用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget,8,58494,(2017)
[19] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。生物信息。,43, 246-255, (2001)
[20] Chou,K.-C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273,236-247,(2011)·Zbl 1405.92212号
[21] Chou,K.-C.,《关于预测分子生物系统中多标签属性的一些评论》,《分子生物学》。,9, 1092-1100, (2013)
[22] Chou,K.-C.,生物信息学对药物化学的影响,医学化学。,11, 218-234, (2015)
[23] 周,K.C.,由生物科学进步推动的药物化学的一场前所未有的革命,Curr。顶部。医药化学。,17, 2337-2358, (2017)
[24] 周,K.-C。;Shen,H.-B.,Euk-mploc:通过合并多个位点进行大规模真核蛋白质亚细胞定位预测的融合分类器,《蛋白质组研究》,61728-1734,(2007)
[25] 周,K.-C。;Shen,H.-B.,《开发用于预测蛋白质属性的网络服务器的最新进展》,《自然科学》。,1, 63, (2009)
[26] 周,K.-C。;Zhang,C.-T.,蛋白质结构类预测,生物化学评论。分子生物学。,30, 275-349, (1995)
[27] Chow,C.S.公司。;Lamichane,T.N。;Mahto,S.K.,通过转录后修饰扩展核糖体的核苷酸库,ACS化学。生物学,2610-619,(2007)
[28] Denoeux,T.,基于Dempster-Shafer理论的k近邻分类规则,IEEE Trans。系统。,人,赛博。,25, 804-813, (1995)
[29] Edelheit,S。;施瓦茨,S。;穆姆巴赫,M.R。;俄克拉荷马州沃特泽尔。;Sorek,R.,细菌、古生菌和酵母中5-甲基胞苷RNA修饰的转录组宽映射揭示了古生菌mrnas中的m 5 C,《公共科学图书馆·遗传学》,9,(2013)
[30] 冯·P。;Chen,W。;Lin,H.,通过整合DNA物理化学性质预测cpg岛甲基化状态,基因组学,104,229-233,(2014)
[31] 冯·P。;丁·H。;Chen,W。;Lin,H.,《通过伪核苷酸成分识别RNA 5-甲基胞嘧啶位点》,《分子生物学》。,12, 3307-3311, (2016)
[32] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.-C.,Irna-psecoll:通过将核苷酸的集体效应纳入pseknc,Mol.Ther,确定不同RNA修饰的发生位置。核酸,7155-163,(2017)
[33] 冯·P。;蒋,N。;Liu,N.,使用伪核苷酸成分预测DNA酶I超敏位点,科学。《世界杂志》,2014,(2014)
[34] 冯·P。;Yang,H。;丁·H。;Lin,H。;Chen,W。;Chou,K.-C.,Idna6ma-pseknc:通过将核苷酸的物理化学性质纳入pseknc来识别DNA N6-甲基腺苷位点,基因组学,(2018)
[35] 冯,P.-M。;Chen,W。;Lin,H。;Chou,K.-C.,Ihsp-pseraaac:使用伪还原氨基酸字母组合识别热休克蛋白家族,Ana。生物化学。,442, 118-125, (2013)
[36] Fu,L。;牛,B。;朱,Z。;Wu,S。;Li,W.,CD-HIT:加速聚类下一代测序数据,生物信息学,283150-3152,(2012)
[37] Guo,S.-H。;邓永中。;徐立清。;丁·H。;Lin,H。;Chen,W.,Inuc-pseknc:一种基于序列的预测因子,用于预测具有伪k元组核苷酸组成的基因组中的核小体定位,生物信息学,(2014),p.btu083
[38] 海亚特,M。;Khan,A.,基于Chou’s pseaac,Protein Pept的一般形式,使用模糊K-最近邻算法识别外膜蛋白。莱特。,19, 411-421, (2012)
[39] 海亚特,M。;塔希尔,M。;Khan,S.A.,使用多轮廓贝叶斯和双图概率特征空间的混合空间预测蛋白质结构类,J.Theor。生物学,346,8-15,(2014)·Zbl 1412.92243号
[40] Helm,M.,RNA的转录后核苷酸修饰和选择性折叠,核。酸。决议,34,721-733,(2006)
[41] 侯赛因,S。;Sajini,A.A。;布兰科,S。;迪特曼,S。;伦巴第,P。;Sugimoto,Y.,Nsun2介导的拱顶非编码RNA的胞嘧啶-5甲基化决定了其加工成调节性小核糖核酸,Cell Rep.,4255-261,(2013)
[42] 伊克巴尔,M。;Hayat,M.,“iss-hyb-mrmr”:使用伪三核苷酸和伪四核苷酸组成的杂交空间识别剪接位点,计算。生物识别方法程序。,128, 1-11, (2016)
[43] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,Ippi-esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到pseaac,J.Theor中来识别蛋白质的相互作用。生物学,377,47-56,(2015)
[44] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,Icar-psecp:通过蒙特卡罗采样识别蛋白质中的羰基化位点,并将序列耦合效应纳入一般pseaac,Oncotarget,734558,(2016)
[45] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.-C.,Ippbs-opt:一种基于序列的集成分类器,用于通过优化不平衡训练数据集来识别蛋白质结合位点,Molecules,21,95,(2016)
[46] 卡比尔,M。;伊克巴尔,M。;艾哈迈德,S。;Hayat,M.,Itis-pseknc:使用伪k元组核苷酸组成鉴定人类基因中的翻译起始位点,计算。生物医学,66252-257,(2015)
[47] Kandaswamy,K.K。;周,K.-C。;马丁内茨,T。;Möller,S。;Suganthan,P。;Sridharan,S.,AFP-pred:从序列衍生特性预测抗冻蛋白的随机森林方法,J.Theor。生物学,270,56-62,(2011)
[48] A.Khan。;M.Khan。;Choi,T.-S.,变换域中基于邻近性的GPCR预测,生物化学。生物物理学。Res.Commun.公司。,371, 411-415, (2008)
[49] M.Khan。;海亚特,M。;汗,S.A。;Iqbal,N.,Unb-DPC:通过将无偏倚的二肽成分纳入Chou的一般pseaac,J.Theor中来识别分枝杆菌膜蛋白类型。生物,415,13-19,(2017)
[50] 科达米,V。;凯恩斯,B.R.,《RNA胞嘧啶甲基转移酶直接靶点和修饰碱基的鉴定》,《国家生物技术》。,31, 458-464, (2013)
[51] Li,Z.-C。;周,X.-B。;戴,Z。;Zou,X.-Y.,通过Chou的伪氨基酸组成预测蛋白质结构类别:使用连续小波变换和主成分分析的方法,氨基酸,37,415,(2009)
[52] 林,S.-X。;Lapointe,J.,《理论与实验生物学》,在一场研讨会上发表,以纪念郭振秋教授50周年和理查德·吉格教授40周年的科学生涯,J.Biomed。科学。工程师,6435(2013)
[53] 林,W.-Z。;方,J.-A。;Xiao,X。;Chou,K.-C.,Idna-prot:使用灰色模型随机森林识别DNA结合蛋白,《公共科学图书馆·综合》,6,e24756,(2011)
[54] 刘,B。;方,L。;刘,F。;王,X。;Chou,K.-C.,Imirna-psedpc:用伪距离-对合成方法鉴定microrna前体,J.Biomol。结构。动态。,34, 223-235, (2016)
[55] 刘,B。;刘,F。;方,L。;王,X。;Chou,K.-C.,Repdna:一个python包,通过结合用户定义的物理化学特性和序列序效应,为DNA序列生成各种模式的特征向量,生物信息学,311307-1309,(2015)
[56] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.-C.,Pse-in-one:一个网络服务器,用于生成DNA、RNA和蛋白质序列的各种伪成分模式,Nucleic。酸。第43号决议,W65-W71,(2015年)
[57] 刘,B。;朗·R。;Chou,K.-C.,Idhs-EL:通过将三种不同模式的伪核苷酸组成融合到集成学习框架中来识别dnase I超敏位点,生物信息学,32,2411-2418,(2016)
[58] 刘,B。;王,S。;朗·R。;Chou,K.-C.,Irspot-EL:用集成学习方法识别重组点,生物信息学,33,35-41,(2016)
[59] 刘,B。;徐,J。;兰,X。;Xu,R。;周,J。;Wang,X.,Idna-prot | dis:通过将氨基酸距离-首字母和简化字母组合纳入一般伪氨基酸组成来识别DNA-结合蛋白,PLoS One,9,(2014)
[60] 刘,B。;杨,F。;Chou,K.-C.,2L-pirna:一种用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7,267-277,(2017)
[61] 刘,L.-M。;Xu,Y。;Chou,K.-C.,Ipgk-pseaac:通过将四个不同层次的氨基酸成对偶联信息合并到通用pseaac,Med.Chem.,确定蛋白质中的赖氨酸磷酸甘油化位点。,13, 552-559, (2017)
[62] 刘,Z。;Xiao,X。;邱伟荣。;Chou,K.-C.,Idna-methyl:通过伪三核苷酸组成识别DNA甲基化位点,Ana。生物化学。,474,69-77,(2015年)
[63] 刘,Z。;Xiao,X。;Yu,D.-J。;贾,J。;邱伟荣。;Chou,K.-C.,Prnam-PC:通过物理化学性质预测RNA序列中的N6-甲基腺苷位点,分析。生物化学。,497, 60-67, (2016)
[64] Machnicka,文学硕士。;Milanowska,K。;Oglou,O.O。;Purta,E。;Kurkowska,M。;Olchowik,A.,《MODOMICS:RNA修饰途径数据库——2012年更新》,核。酸。研究,(2012),第gks1007页
[65] Motorin,Y。;Helm,M.,通过修饰核苷酸稳定Trna,生物化学,49,4934-4944,(2010)
[66] 彭,H。;长,F。;Ding,C.,基于MAX相关性、MAX相关性和MIN冗余的互信息准则的特征选择,IEEE Trans。模式分析。机器。智力。,27, 1226-1238, (2005)
[67] 冯鹏勉,医学博士。;陈伟;林浩,通过伪核苷酸组成鉴定RNA 5-甲基胞嘧啶位点,分子生物学。,(2016)
[68] 邱伟荣。;蒋S.-Y。;孙碧琴。;Xiao,X。;Cheng,X。;Chou,K.-C.,Irna-2methyl:通过将序列耦合效应纳入通用pseknc和集成分类器,《医学化学》,确定RNA 2′-O-甲基化位点。,13, 734-743, (2017)
[69] 邱伟荣。;蒋S.-Y。;徐,Z.C。;Xiao,X。;Chou,K.-C.,Irnam5C-psednc:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178,(2017)
[70] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;Chou,K.-C.,Iptm-mlys:识别多个赖氨酸PTM位点及其不同类型,生物信息学,32,3116-3123,(2016)
[71] 邱伟荣。;Xiao,X。;Chou,K.-C.,Irspot-tncpseaac:用三核苷酸成分和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 1746-1766, (2014)
[72] 宋,J。;李,F。;Takemoto,K。;哈夫法里,G。;Akutsu,T。;Chou,K.-C.,Prevail,《利用机器学习框架中的序列、结构和网络特征推断催化残基的综合方法》,J.Theor。生物学,443125-137,(2018)·Zbl 06898995号
[73] 斯奎尔斯,J.E。;帕特尔,H.R。;努什,M。;Sibbritt,T。;汉弗莱斯,D.T。;Parker,B.J.,5-甲基胞嘧啶在人类编码和非编码RNA中的广泛存在,核。酸。研究,(2012),第gks144页
[74] 孙伟杰。;李,J.-H。;刘,S。;吴杰。;周,H。;Qu,L.-H.,Rmbase:从高通量测序数据解码RNA修改景观的资源,Nucleic。酸。研究,(2015),第gkv1036页
[75] 汤普森,T.B。;周,K.-C。;郑,C.,HIV-1蛋白酶裂解位点的神经网络预测,J.Theor。生物学,177369-379,(1995)
[76] 王,M。;杨,J。;徐,Z.-J。;Chou,K.-C.,SLLE预测膜蛋白类型,J.Theor。生物学,232,7-15,(2005)·Zbl 1442.92118号
[77] Xiao,X。;Cheng,X。;苏,S。;毛,Q。;Chou,K.-C.,Ploc-mgpos:将关键基因本体信息合并到通用pseaac中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。,9, 330, (2017)
[78] Xiao,X。;Min,J.-L。;王,P。;Chou,K.C.,Icdi-psefpt:利用伪指纹和分子指纹识别细胞网络中的通道-药物相互作用,J.Theor。《生物学》,337,71-79,(2013)·兹比尔1411.92115
[79] Xiao,X。;王,P。;Chou,K.-C.,Inr-physchem:一种基于序列的预测因子,用于通过物理化学属性矩阵识别核受体及其亚家族,PLoS One,7,e30869,(2012)
[80] Xiao,X。;王,P。;林,W.-Z。;贾俊华。;Chou,K.-C.,Iamp-2L:用于识别抗菌肽及其功能类型的两级多标签分类器,Ana。生物化学。,436, 168-177, (2013)
[81] Xu,Y。;丁,J。;Wu,L.-Y。;Chou,K.-C.,Isno-pseaac:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,e55844,(2013)
[82] Xu,Y。;王,Z。;李,C。;Chou,K.-C.,Ipreny-pseaac:通过将两层序列偶联纳入pseaac,Med.Chem。,13, 544-551, (2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。