摘要
随着后基因组时代产生的生物序列雪崩,计算生物学中最具挑战性的问题之一是如何有效地制定生物样本(如DNA、RNA或蛋白质)的序列用一个离散模型或向量来有效地反映其序列模式信息或捕捉其相关的关键特征。尽管开发了几个web服务器和独立工具来解决这个问题,但所有这些工具只能处理一种类型的示例。此外,其内置属性的数量有限,因此用户通常很难根据其所需的特征或属性制定生物序列。在本文中,我们将使用大量内置属性,提出一种更加灵活的web服务器,称为Pse-In-One(http://bioinformatics.hitsz.edu.cn/Pse-in-One/)它可以通过28种不同的模式生成几乎所有可能的DNA、RNA和蛋白质序列特征载体。特别地,它还可以生成那些具有用户自己定义的属性的特征向量。这些特征向量可以很容易地与机器学习算法相结合,为生物信息学和系统生物学中的各种任务开发计算预测器和分析方法。预计Pse-in-One网络服务器将成为计算蛋白质组学、基因组学以及生物序列分析中非常有用的工具。此外,为了最大限度地方便用户,还可以从http://bioinformatics.hitsz.edu.cn/Pse-in-One/download/,并直接在Windows、Linux、Unix和Mac OS上运行。
©作者2015。由牛津大学出版社代表核酸研究出版。
PubMed免责声明
类似文章
-
生物序列分析:基于机器学习方法的DNA、RNA和蛋白质序列分析平台。
刘B。
刘B。
简要生物信息。2019年7月19日;20(4):1280-1294. doi:10.1093/bib/bbx165。
简要生物信息。2019
PMID:29272359
-
repRNA:生成RNA序列的各种特征向量的网络服务器。
刘斌、刘凤、方磊、王旭、周朝晖。
刘B等。
分子遗传学。2016年2月;291(1):473-81. doi:10.1007/s00438-015-1078-7。Epub 2015年6月18日。
分子遗传学。2016
PMID:26085220
-
BioSeq-Analysis2.0:基于机器学习方法,在序列水平和残基水平分析DNA、RNA和蛋白质序列的更新平台。
刘斌,高X,张浩。
刘B等。
核酸研究2019年11月18日;47(20):e127。doi:10.1093/nar/gkz740。
2019年核酸研究。
PMID:31504851
免费PMC文章。
-
全面回顾和评估从RNA序列预测RNA转录后修饰位点的计算方法。
Chen Z、Zhao P、Li F、Wang Y、Smith AI、Webb GI、Akutsu T、Baggag A、Bensmail H、Song J。
Chen Z等。
简要生物信息。2020年9月25日;21(5):1676-1696. doi:10.1093/bib/bbz112。
简要生物信息。2020
PMID:31714956
审查。
-
伪核苷酸组成或PseKNC:分析基因组序列的有效配方。
陈伟、林浩、周家钦。
陈伟等。
分子生物晶体。2015年10月;11(10):2620-34. doi:10.1039/c5mb00155b。
摩尔生物催化剂。2015
PMID:26099739
审查。
引用人
-
通过采用多特征和随机森林算法的深度学习框架预测lncRNA-protein相互作用。
Liang Y、Yin X、Zhang Y、Guo Y、Wang Y。
梁毅等。
BMC生物信息学。2024年3月12日;25(1):108. doi:10.1186/s12859-024-05727-4。
BMC生物信息学。2024
PMID:38475723
免费PMC文章。
-
MRM-BERT:一种融合BERT表示和序列特征的新型深度神经网络预测多RNA修饰。
王磊、周瑜。
王磊等。
RNA生物学。2024年1月;21(1):1-10. doi:10.1080/15476286.2024.2315384。Epub 2024年2月15日。
RNA生物学。2024
PMID:38357904
免费PMC文章。
-
识别piRNA相关分子的数据库和计算方法:综述。
郭C,王X,任H。
郭C等。
《计算结构生物技术杂志》2024年1月22日;23:813-833. doi:10.1016/j.csbj.2024.01.011。eCollection 2024年12月。
计算结构生物技术杂志2024。
PMID:38328006
免费PMC文章。
审查。
-
SARS-CoV-1和SARS-CoV-2编码的circRNA的鉴定、表征和表达分析。
牛M、王C、陈毅、邹Q、徐磊。
Niu M等人。
简要生物信息。2024年1月22日;25(2):bbad537。doi:10.1093/bib/bbad537。
简要生物信息。2024
PMID:38279648
免费PMC文章。
-
基于机器学习和深度学习预测蛋白质序列中赖氨酸丙二酰化位点的技术和工具的分析和评述。
Ramazi S、Tabatabaei SAH、Khalili E、Nia AG、Motarjem K。
Ramazi S等人。
数据库(牛津)。2024年1月19日;2024年:巴德094。doi:10.1093/database/baad094。
数据库(牛津)。2024
PMID:38245002
免费PMC文章。
审查。
工具书类
-
- 周克川。生物信息学对药物化学的影响。医药化学。2015;11:218–234.-公共医学
-
- Chou K.C.使用伪氨基酸成分预测蛋白质细胞属性。蛋白质。2001;43:246–255.-公共医学
-
- Chou K.C.使用两亲性伪氨基酸组成预测酶亚科类别。生物信息学。2005;21:10-19。-公共医学
-
- Du P.,Gu S.,Jiao Y.PseAAC-General:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的一般形式的各种模式。国际分子科学杂志。2014;15:3495–3506.-项目管理咨询公司-公共医学
-
- Chen W.,Feng P.M.,Lin H.,Chou K.C.iRSpot-PseDNC:识别假二核苷酸组成的重组点。2013年《核酸研究》;第41页:e68。-项目管理咨询公司-公共医学
引用