×

NucPosPred:通过普通PseKNC的四种不同模式预测物种特异性基因组核小体定位。 (英语) Zbl 1397.92010号

摘要:核小体是真核细胞染色质的基本结构,在DNA转录、复制和修复、RNA剪接等许多生物过程的调控中发挥着重要作用。由于核小体的重要性,决定核小体在基因组中定位的因素应该被研究。高分辨率核小体定位图现在可用于生物体,包括酿酒酵母,黑腹果蝇秀丽隐杆线虫,通过应用计算工具识别核小体定位。在这里,我们描述了一种称为NucPosPred的新型预测器,该预测器专门用于大规模识别核小体定位秀丽隐杆线虫D.黑腹果蝇基因组。NucPosPred针对每个物种分别进行了优化,用于四种类型的DNA序列特征提取,并考虑了两种分类算法(梯度增强决策树和支持向量机)。使用NucPosPred获得的总准确度为92.29%秀丽隐杆线虫88.26%D.黑腹果蝇优于先前的方法,并证明了核小体定位的物种特异性预测的潜力。为了方便大多数实验科学家,预测器NucPosPred的网络服务器位于http://121.42.167.206/NucPosPred/index.jsp.

MSC公司:

92-08 生物学问题的计算方法
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Afridi,T.H。;A.Khan。;Lee,Y.S.,Mito GSAAC:使用遗传集合分类器和分裂氨基酸组成的线粒体预测,氨基酸,421443-1454,(2012)
[2] Arif,M。;海亚特,M。;Jan,Z.,Imem-2LSAAC:通过将SAAC的概念扩展到Chou的伪氨基酸组成中来区分膜蛋白及其类型的两级模型,J.Theor。生物学,442,11-21,(2018)·Zbl 1397.92180号
[3] Awazu,A.,通过将三种不同核苷酸片段长度的频率和分布合并到一般伪k元组核苷酸组成中来预测核小体定位,生物信息学,33,42-48,(2017)
[4] 贝巴哈尼,M。;Mohabatkar,H。;Nosrati,M.,利用三种不同模式的Chou的一般伪氨基酸组成分析和比较真菌和细菌之间的木质素过氧化物酶,J.Theor。生物学,411,1-5,(2016)
[5] 伯恩斯坦,B.E。;Liu,C.L。;汉弗莱,E.L。;E.O.Perlstein。;Schreiber,S.L.,酵母中的全球核小体占有率,基因组生物学。,5,R62,(2004)
[6] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32, (2001) ·Zbl 1007.68152号
[7] 蔡,R。;钱,D。;王,D。;朱,P。;科学,S.O。;University,J.,具有生物学和物理特性的E基因签名方法——以p53基因家族为例,计算机。工程应用,(2017)
[8] Chang,C.C。;Lin,C.J.,LIBSVM:支持向量机库,ACM Trans。智力。系统。技术。,2, 1-27, (2011)
[9] Chen,W。;罗,L.F。;Zhang,L.R.,《剪接位点周围核小体的组织》,《核酸研究》,38,2788-2798,(2010)
[10] Chen,W。;Tang,H。;Lin,H.,Methyrna:用于识别N-6-甲基腺苷位点的网络服务器,J.Biomol。结构。动态。,35, 683-687, (2017)
[11] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,Irspot-psednc:用伪二核苷酸成分识别重组点,核酸研究,41,e68,(2013)
[12] Chen,W。;Lei,T.Y。;Jin,D.C。;Lin,H。;Chou,K.C.,Pseknc:用于生成伪K元组核苷酸组成的灵活web服务器,Ana。生物化学。,456,53-60,(2014)
[13] Chen,W。;冯,P.M。;丁·H。;Lin,H。;Chou,K.C.,使用变形能量分析基因组中的核小体定位,基因组学,107,69-75,(2016)
[14] Chen,W。;Lin,H。;冯,P.M。;丁,C。;Zuo,Y.C。;Chou,K.C.,Inuc-physchem:一种基于序列的预测因子,用于通过物理化学性质识别核小体,Plos One,7,(2012),doi:ARTN e4784310.1371/journal.pone.0047843
[15] Chen,W。;冯,P.M。;Yang,H。;丁·H。;Lin,H。;Chou,K.C.,Irna-AI:识别RNA序列中腺苷-肌苷编辑位点,Oncotarget,84208-4217,(2017)
[16] 陈,X。;邱建德。;史,S.P。;索,S.B。;黄S.Y。;Liang,R.P.,结合关键位置和氨基酸残基特征识别泛素结合位点的一般和物种特异性,生物信息学,291614-1622,(2013)
[17] Cheng,X。;Xiao,X。;Chou,K.C.,Ploc-meuk:通过将关键GO信息提取到通用pseaac中来预测多标签真核蛋白的亚细胞定位,基因组学,110,50,(2017)
[18] Cheng,X。;Zhao,S.G。;Xiao,X。;Chou,K.C.,Iatc-misf:预测解剖治疗化学物质类别的多标签分类器,生物信息学,33,341-346,(2016)
[19] Cheng,X。;Zhao,S.G。;Xiao,X。;Chou,K.C.,Iatc-myb:一种用于预测解剖治疗化学物质分类的混合多标签分类器,Oncotarget,8,58494,(2017)
[20] Cheng,X。;Zhao,S.G。;Lin,W.Z。;Xiao,X。;Chou,K.C.,Ploc-manimal:预测动物蛋白质的亚细胞定位,单位点和多位点,生物信息学,33,3524,(2017)
[21] 乔达瓦拉普,R.K。;Feng,S。;Bernatavichute,Y.V。;陈,P.Y。;斯特劳德,H。;Yu,Y。;Hetzel,J。;Kuo,F。;Jin,K。;Cokus,S.J.,核小体定位和DNA甲基化之间的关系,《自然》,466388,(2010)
[22] 周,K。;Chen,利用伪氨基酸组成预测蛋白质细胞属性,蛋白质结构。功能。生物信息。,44, 246-255, (2001)
[23] Chou,K.C.,使用缩放窗口预测信号肽,肽,221973-1979,(2001)
[24] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,(2005),牛津大学出版社
[25] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6,(2009)
[26] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273,236-247,(2011)·Zbl 1405.92212号
[27] Chou,K.C.,关于预测分子生物系统中多标签属性的一些评论,Mol.Bioyst。,9, 1092-1100, (2013)
[28] Chou,K.C.,生物信息学对药物化学的影响,医学化学。,11, (2015)
[29] 周,K.C.,《生物科学进步推动的药物化学史上前所未有的革命》,Curr。顶部。医药化学。,17, 2337-2358, (2017)
[30] Dehzangi,A。;Heffernan,R。;Sharma,A。;Lyons,J。;帕利瓦尔,K。;Sattar,A.,通过将基于进化的描述符合并到chou’s general pseaac,J.Theor中,对革兰氏阳性和革兰氏阴性蛋白质进行亚细胞定位。生物学,364,284,(2015)·Zbl 1405.92092号
[31] Ehsan,A。;Mahmood,K。;Y.D.Khan。;汗,S.A。;Chou,K.C.,《信号肽分类的数学生物学新模型》,《科学》。8号代表(2018年)
[32] 冯·P。;丁·H。;Yang,H。;Chen,W。;Lin,H。;Chou,K.C.,Irna-psecoll:通过将核苷酸的集体效应纳入pseknc,Mol.Ther,来确定不同RNA修饰的发生位置。核酸,7155-163,(2017)
[33] 冯·P。;Yang,H。;丁·H。;Lin,H。;Chen,W。;Chou,K.C.,Idna6ma-pseknc:通过将核苷酸物理化学性质纳入pseknc来识别DNA N6-甲基腺苷位点,基因组学,(2018)
[34] 冯,P.M。;Chen,W。;Lin,H。;Chou,K.C.,Ihsp-pseraaac:使用伪还原氨基酸字母组合识别热休克蛋白家族,Ana,Biochem。,442, 118-125, (2013)
[35] Friedman,J.H.,《贪婪函数近似:梯度提升机》,《Ann.Stat.》,第29期,第1189-1232页,(2001年)·Zbl 1043.62034号
[36] Gao,J.J。;杰伦。;Dunker,A.K。;Xu,D.,Musite,通用和激酶特异性磷酸化位点全球预测工具,分子细胞。蛋白质组学,92586-2600,(2010)
[37] Guo,S.H。;邓,E.Z。;徐立清。;丁·H。;Lin,H。;Chen,W。;Chou,K.C.,Inuc-pseknc:基于序列的预测因子,用于预测具有伪K元组核苷酸组成的基因组中的核小体定位,生物信息学,30,1522-1529,(2014)
[38] 古普塔,S。;丹尼斯·J。;瑟曼,R.E。;R.金斯顿。;Stamatoyannopoulos,J.A。;Noble,W.S.,从一级序列预测人类核小体占有率,PLoS Comput。生物学,4,(2008),doi:ARTN e1000134 10.1371/journal.pcbi.1000134
[39] 海亚特,M。;Khan,A.,Memhyb:通过SAAC和PSSM杂交预测膜蛋白类型,J.Theor。生物,29293-102,(2012)·Zbl 1307.92308号
[40] He,W.Y。;Jia,C.Z.,Enhancerpred2.0:基于位置特异性三核苷酸倾向和电子-离子相互作用势特征选择预测增强子及其强度,分子生物学。,13, 767-774, (2017)
[41] Ioshikhes,I。;Bolshoy,A。;Derenshteyn,K。;博罗多夫斯基,M。;Trifonov,E.N.,实验定位序列多重比对揭示的核小体DNA序列模式,《分子生物学杂志》,262,129-139,(1996)
[42] 吉,G。;杨,Z。;You,W.,基于PLS的肿瘤特异性基因的基因选择和鉴定,IEEE Trans。系统。人类网络。C部分,41830-841,(2011)
[43] 贾,C。;刘,T。;Chang,A.K。;Zhai,Y.,使用双profile Bayes特征提取预测疟疾寄生虫的线粒体蛋白质,Biochimie,93,778-782,(2011)
[44] 贾成泽。;刘,T。;Wang,Z.P.,O-glcnacpred:捕获蛋白质O-glcn酰化位点的敏感预测因子,《分子生物学》。,9, 2909-2913, (2013)
[45] 贾成泽。;张建杰。;Gu,W.Z.,RNA-methylpred:鉴定RNA中N6-甲基腺苷的高精度预测因子,Ana。生物化学。,510, 72-75, (2016)
[46] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.C.,Isuc-pseopt:通过将序列耦合效应纳入伪组分并优化不平衡训练数据集来识别蛋白质中的赖氨酸琥珀酰化位点,Ana。生物化学。,497, 48-56, (2015)
[47] 贾,J。;张,L。;刘,Z。;Xiao,X。;Chou,K.C.,Psumo-CD:通过将序列耦合效应纳入通用pseaac,使用协方差判别算法预测蛋白质中的sumoylation位点,生物信息学,32,3133-3141,(2016)
[48] 贾,J。;刘,Z。;Xiao,X。;刘,B。;Chou,K.C.,Psuc-lys:用伪随机森林法和集合随机森林法预测蛋白质中的赖氨酸琥珀酰化位点,J.Theor。生物学,394223-230,(2016)·Zbl 1343.92153号
[49] 卡普兰,N。;印度摩尔。;Fondufe-Mittendorf,Y。;Gossett,A.J。;蒂洛,D。;字段,Y。;LeProust,E.M。;休斯·T·R。;利伯,J.D。;Widom,J。;Segal,E.,真核生物基因组的DNA编码核小体组织,《自然》,458362-366,(2009)
[50] Lee,W。;蒂洛,D。;布雷,N。;莫尔斯,R.H。;Davis,R.W。;休斯·T·R。;Nislow,C.,《酵母核小体占有率的高分辨率图谱》,《自然遗传学》。,39, 1235-1244, (2007)
[51] 廖振杰。;黄,Y。;岳,X.D。;卢海杰。;Xuan,P。;Ju,Y.,使用基于机器学习的新型SVM和GBDT方法对γ-氨基丁酸a型受体进行电子预测,BioMed Res.Int.,(2016),doi:Artn 2375268 10.1155/2016/2375268
[52] 刘,B。;杨,F。;Chou,K.C.,2L-pirna:一种用于识别piwi相互作用RNA及其功能的双层集成分类器,Mol.Ther。核酸,7267-277,(2017)
[53] 刘,B。;Wu,H。;Chou,K.C.,《Pse-in-one 2.0:一个改进的网络服务器包,用于生成DNA、RNA和蛋白质序列的各种伪成分模式》,《自然科学》。,09, 67-91, (2017)
[54] 刘,B。;王,S。;朗·R。;Chou,K.C.,Irspot-EL:用集成学习方法识别重组点,生物信息学,33,35-41,(2017)
[55] 刘,B。;杨,F。;黄,D.S。;Chou,K.C.,Ipromoter-2L:通过基于多窗口的pseknc识别启动子及其类型的双层预测因子,生物信息学,34,33-40,(2018)
[56] 刘,B。;刘,F。;王,X。;陈,J。;方,L。;Chou,K.C.,《Pse-in-one:生成DNA、RNA和蛋白质序列的各种伪成分模式的网络服务器》,《核酸研究》,第43期,W65-W71,(2015)
[57] 刘,Z。;Xiao,X。;邱伟荣。;Chou,K.C.,Idna-methyl:通过伪三核苷酸组成识别DNA甲基化位点,Ana。生物化学。,474, 69-77, (2015)
[58] 刘,Z。;Xiao,X。;Yu,D.J。;贾建华。;邱伟荣。;Chou,K.C.,Prnam-PC:通过物理化学性质预测RNA序列中的N-6-甲基腺苷位点,分析。生物化学。,497, 60-67, (2016)
[59] Mavrich,T.N。;Ioshikhes,I.P。;Venters,B.J。;江,C。;汤绍,L.P。;齐,J。;舒斯特,S.C。;艾伯特,I。;Pugh,B.F.,《用于核小体在酵母基因组中统计定位的屏障核小体模型》,《基因组研究》,第18期,第1073-1083页,(2008年)
[60] Mavrich,T.N。;江春珍。;Ioshikhes,I.P。;李晓云。;Venters,B.J。;赞顿,S.J。;Tomsho,L.P。;齐,J。;Glaser,R.L。;舒斯特,S.C。;Gilmour,D.S。;艾伯特,I。;Pugh,B.F.,果蝇基因组中的核小体组织,《自然》,453,358,(2008),-U27
[61] Meher,P.K。;Sahu,T.K。;塞尼,V。;Rao,A.R.,《通过将成分、物理化学和结构特征纳入Chou的一般假设中,以更高的准确性预测抗菌肽》,Sci。代表,742362,(2017)
[62] 奈尔,A.S。;Sreenadhan,S.P.,采用电子-离子相互作用赝势(EIIP)的编码测量方案,生物信息,1197-202,(2006)
[63] 佩克姆,H.E。;瑟曼,R.E。;Fu,Y.T.先生。;Stamatoyannopoulos,J.A。;Noble,W.S。;斯特鲁尔,K。;Weng,Z.P.,基因组DNA中的核小体定位信号,基因组研究,17,1170-1177,(2007)
[64] 邱伟荣。;蒋S.-Y。;孙碧琴。;Xiao,X。;Cheng,X。;Chou,K.-C.,Irna-2methyl:通过将序列耦合效应纳入通用pseknc和集成分类器,《医学化学》,识别RNA 2′-O-甲基化位点。(沙迦(阿拉伯联合酋长国),(2017年)
[65] 邱伟荣。;Xiao,X。;Chou,K.C.,Irspot-tncpseaac:用三核苷酸组成和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 1746-1766, (2014)
[66] 邱伟荣。;姜世勇(Jiang,S.Y.)。;徐,Z.C。;Xiao,X。;Chou,K.C.,Irnam5C-psednc:通过将物理化学性质纳入伪二核苷酸组成来识别RNA 5-甲基胞嘧啶位点,Oncotarget,8,41178-41188,(2017)
[67] 邱伟荣。;孙碧琴。;Xiao,X。;徐,Z.C。;贾建华。;Chou,K.C.,Ikcr-pseens:用伪组分和集成分类器识别组蛋白中的赖氨酸-巴豆酸化位点,基因组学,(2017)
[68] Rao,K.D。;Swarny,M.N.S.,使用DSP技术进行基因组学和蛋白质组学分析,IEEE Trans。电路系统。爱尔兰。帕普。,55358-366(2008年)
[69] T·J·里士满。;Davey,C.A.,核小体核心DNA的结构,《自然》,423145-150,(2003)
[70] Rish,I.,朴素贝叶斯分类器的实证研究,J.Univers。计算。科学。,1, 127, (2001)
[71] Sakhnovich,A.,《关于Bäcklund-Darboux变换的GBDT版本及其在线性和非线性方程和Weyl理论中的应用》,数学。模型1。自然现象。,5, 340-389, (2010) ·兹比尔1200.37070
[72] Schones,D.E。;Cui,K.R。;库达帕,S。;卢武铉。;Barski,A。;王,Z.B。;魏,G。;赵金杰,核小体在人类基因组中定位的动态调控,细胞,132887-898,(2008)
[73] Schonlau,M.,《增强回归(boosting):入门教程和stata插件》,stata J.,5330-354,(2005)
[74] 西格尔,E。;Fondufe-Mittendorf,Y。;Chen,L.Y。;Thastrom,A。;字段,Y。;印度摩尔。;Wang,J.P.Z。;Widom,J.,核小体定位的基因组代码,《自然》,442772-778,(2006)
[75] 塞曼jski,I。;Gautama,S.,基于众包数据的智能城市移动应用梯度增强树,用于移动预测和分析,传感器,1515974-159887,(2015)
[76] 宋,J。;李,F。;Takemoto,K。;哈法里,G。;Akutsu,T。;Chou,K.C。;Webb,G.I.,Prevail,《利用机器学习框架中的序列、结构和网络特征推断催化残留物的综合方法》,J.Theor。生物学,443125-137,(2018)·Zbl 06898995号
[77] 塔希尔,M。;Hayat,M.,Inuc-STNC:通过扩展SAAC和Chou’s pseaac的概念来识别基因组中核小体定位的基于序列的预测因子,Mol.Biosyst。,12, 2587-2593, (2016)
[78] 瓦卢耶夫,A。;一川,J。;吨,T。;斯图亚特·J。;南卡罗来纳州Ranade。;佩克姆,H。;曾,K。;Malek,J.A。;科斯塔·G。;McKernan,K。;Sidow,A。;火灾,A。;Johnson,S.M.,秀丽线虫的高分辨率核小体位置图揭示了缺乏通用序列定位,《基因组研究》,18,1051-1063,(2008)
[79] 魏,C。;Hao,L。;Chou,K.C.,《伪核苷酸组成或pseknc:分析基因组序列的有效公式》,Mol.Biosyst。,11, 2620-2634, (2015)
[80] 向,C。;X.Xuan。;Chou,K.C.,Ploc-mvirus:通过将最佳GO信息合并到通用pseaac中来预测多位置病毒蛋白的亚细胞定位,Gene,13,(2017)
[81] Xiao,X。;Cheng,X。;苏,S。;毛,Q。;Chou,K.C.,Ploc-mgpos:将关键基因本体信息合并到通用pseaac中,以预测革兰氏阳性细菌蛋白质的亚细胞定位,自然科学。,09, 330-349, (2017)
[82] Xing,Y.Q。;赵晓杰。;Cai,L.,利用位置相关评分函数预测酿酒酵母核小体占有率,基因组学,98,359-366,(2011)
[83] Xing,Y.Q。;刘国强。;赵晓杰。;Cai,L.,《基于信息含量的核小体定位分析与预测》,《染色体研究》,21,63-74,(2013)
[84] Xu,Y。;邵晓杰。;Wu,L.Y。;邓,纽约。;Kuo-Chen,C.,Isno-aapair:将氨基酸成对偶联到pseaac中以预测蛋白质中的半胱氨酸-硝基化位点,PeerJ,1,e171,(2013)
[85] Ye,J。;Chow,J.H。;陈,J。;Zheng,随机梯度增强分布式决策树,(ACM信息与知识管理会议,(2009)),2061-2064
[86] 于东,C。;Kuo-Chen,C.,预测杂交空间中蛋白质的亚细胞定位,生物信息学,201151,(2004)
[87] 张长杰。;Tang,H。;Li,W.C。;Lin,H。;Chen,W。;Chou,K.C.,Iori人:通过将二核苷酸的物理化学性质结合到伪核苷酸组成中来鉴定复制的人类起源,肿瘤靶点,736783-69793,(2016)
[88] Zhang,Y。;Shin,H。;Song,J.S。;雷,Y。;Liu,X.S.,从芯片序列中识别人类中具有表观遗传标记的定位核小体,BMC Genomics,9,537,(2008)
[89] 张志强。;Zhang,Y.S。;Gutman,I.,《预测酵母中核小体位置:使用绝对频率》,J.Biomol。结构。动态。,29, 1081-1088, (2012)
[90] 张志强。;Zhang,Y.S。;Chen,W。;古特曼,I。;Li,Y.C.,利用DNA片段的二核苷酸绝对频率预测核小体定位,Match-Commun。数学。计算。化学。,68, 639-650, (2012)
[91] X.赵。;裴,Z。;刘杰。;秦,S。;Cai,L.,利用多样性增量结合二次判别分析预测核小体DNA形成潜力和核小体定位,《染色体研究》,18,777-785,(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。