标签:下一步基因测序(NGS)

序列读取存档使用SRA Lite精简数据

为了响应您对紧凑和快速交付数据的要求,NIH序列片段归档(SRA)现在提供了一种新的数据格式–SRA精简版(图1)。SRA Lite支持使用当前工具进行可靠、快速的数据传输、下载和分析。SRA Lite用简化的读取质量分数取代了提交的基本质量分数(BQS),将平均读取大小减少了约60%,以便更有效地分析和存储大型数据集。该格式旨在反映下一代测序的改进,包括平均读取长度和序列覆盖率的增加。事实上,数据已经改善到足以消除一些质量分数提高基因型准确性(预防性维修识别码:项目经理4439189).

图1。FASTQ公司从SRA Lite格式和SRA配置对话框转储。FASTQ将每个基的质量分数设置为30(ASCII编码中的“?”)。在SRA配置对话框中选择“首选具有简化基本质量分数的SRA Lite文件”以使用SRA Lite。 继续阅读“序列读取存档使用SRA Lite精简数据”

Magic-BLAST 1.6.0版在这里!

Magic-BLAST 1.6.0版在这里!

我们刚刚发布了的新版本(1.6.0)魔术爆破,基于BLAST的下一代比对工具,具有以下改进:

  • 使用报告-您可以通过共享有关搜索的有限信息来帮助改进Magic BLAST。这个BLAST用户手册包含有关收集的信息、如何使用以及如何选择退出的详细信息。
  • Magic BLAST可以访问NCBISRA公司当您使用-战略风险评估-sra_批次选项。请参阅Magic-BLAST食谱了解更多详细信息。
  • 如果目标BLAST数据库中存在NCBI分类ID,则会在SAM输出中报告它们。
  • 通过使用-out_unaligned<文件名>选项。您还可以使用-未对齐的fmt选项。默认格式与主报告的格式相同。

1.6.0版可执行文件可从NCBI FTP站点。请参阅发行说明,的NCBI GitHub站点和魔法爆炸出版了解更多信息。

5月19日网络研讨会:使用新的网络RAPT服务组装和注释原核基因组

5月19日网络研讨会:使用新的网络RAPT服务组装和注释原核基因组

2021年5月19日东部时间下午12点加入我们,学习如何使用新的RAPT试点服务只需点击按钮,即可组装和注释公共或私人Illumina基因组,读取细菌或古细菌分离物的序列。RAPT由基因组组装器SKESA和原核基因组注释管道(PGAP)两个主要组成部分组成,并在几个小时内生成质量与RefSeq相当的注释基因组。

  • 日期和时间:2021年5月19日星期三12:00 PM–12:45 PM EDT
  • 注册

注册后,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI网络研讨会播放列表在上NLM YouTube频道。您可以在网络研讨会和课程页面.

12月2日网络研讨会:使用新的Read assembly and Annotation Pipeline Tool(RAPT)组装和注释微生物基因组

12月2日网络研讨会:使用新的Read assembly and Annotation Pipeline Tool(RAPT)组装和注释微生物基因组

12月2日加入我们,学习如何使用读取程序集和注释管道工具(RAPT)。有了RAPT,你可以在测序机器外组装和注释微生物基因组!提供简短的基因组读取或SRA运行输入,并返回带有完整基因集注释的序列。该组件使用SKESA构建,并使用PGAP进行注释。此外,RAPT还使用平均核苷酸识别工具验证基因组的分类分配。在本次网络研讨会中,您将了解如何在自己的计算机或谷歌云平台上运行RAPT。

  • 日期和时间:2020年12月2日,星期三,12:00 PM–12:45 PM EST
  • 注册

注册后,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程页面.

我们想听听您对NIH序列读取档案数据格式和存储的更改

RFI_SRA_大NIH的序列读取档案(SRA公司)是从人类、非人类和微生物来源收集的下一代测序数据中最大、最多样化的。由国家生物技术信息中心主办(美国国立生物技术信息中心)在国家医学图书馆(国家土地管理局),SRA数据也可在谷歌云平台上获得(GCP公司)和亚马逊网络服务(美国焊接学会)作为NIH发现、实验和可持续性科学技术研究基础设施的一部分(大步)主动性。

SRA目前包含超过36 PB的数据,预计到2023年将增长到43 PB。尽管这种资源的价值随着每个新样本的增加而增加,但过去十年中经历的指数增长(图1)威胁到SRA的可持续性。存储空间的维护成本越来越高,数据也越来越难以大规模使用。局势已达到临界点。必须重构SRA,以支持未来的公平数据原则。

Sra增长(_G)图1。过去十年,SRA数据呈指数级增长。

NIH仍致力于SRA,并希望制定一个长期的资源持续增长计划。考虑因素包括一个模型,其中无基本质量分数(BQS)的标准化工作文件可通过云平台和NCBI FTP站点随时获得,较大的源文件和有基本质量分数的标准化文件将根据流行的用例和使用需求分布在云平台上。可以获得有关数据格式的更多详细信息在这里.

作为SRA用户,您必须通过评论这些发展如何影响您的数据使用,参与对建议的数据格式和基础设施的审查和测试。NIH准备了一份信息请求(RFI)详细说明了计划的发展,并将非常感谢科学界的反馈。

继续阅读“我们想听听您对NIH序列读取存档数据格式和存储的更改”

5月20日网络研讨会:使用BigQuery探索云中的SRA元数据

5月20日网络研讨会:使用BigQuery探索云中的SRA元数据

5月20日加入我们,学习如何使用谷歌的大查询从中快速搜索数据云中的序列读取存档(SRA)加快你的生物信息研究和发现项目。BigQuery是一个使用类似SQL的查询探索基于云的数据表的工具。在本次网络研讨会中,我们将向您介绍如何使用BigQuery挖掘SRA提交者提供的元数据以及SRA运行的分类分析结果。您将看到真实的案例研究,其中演示了如何找到有关SRA运行的关键信息,并为您自己的分析管道识别数据集。

  • 日期和时间:2020年5月20日星期三12:00 PM–12:45 PM EDT
  • 注册

注册后,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程页面.

4月8日网络研讨会:利用SRA在云中加速基因组学发现

4月8日网络研讨会:利用SRA在云中加速基因组学发现

2019年4月8日星期三下午12点,NCBI工作人员将向您展示如何利用云加速您的研究和发现。您将了解新的和现有的工具和数据,包括大查询,SRA工具包等等。您将了解云中的真实工作流,其中包括NCBI使用SRA数据和来自SRA云客户的案例研究

在本次网络研讨会结束时,您将知道从哪里寻找NCBI的新云产品,访问帮助信息以开始,并将了解如何在云中高效运行分析。

  • 日期和时间:2020年4月8日星期三12:00 PM–12:45 PM EDT
  • 注册

注册后,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程页面.