云中的SRA
概述
序列读取档案(SRA)数据可在谷歌云平台(GCP)和亚马逊网络服务(AWS)云中获得。所有公共可用、未组装的读取数据和授权访问的人工数据都可以通过这些云提供商进行访问和计算。
你喜欢吃云彩吗?
在云中使用SRA数据有几个好处:
- 访问原始提交的数据文件
- 更快的下载速度
- 从我们的云存储桶到您的存储桶的无限并发下载
访问云中的SRA数据需要设置实例。
您可以使用AWS中的Athena或Google中的BigQuery执行云本地数据搜索。使用Athena和BigQuery,您可以:
- 编写自己的SQL来搜索特定的数据集
- 以极低的成本在几秒钟内获得搜索结果
- 计算SRA可用数据的统计信息
- 使用多个API库访问数据
搜索数据
BigQuery(在谷歌云中)
BigQuery提供对SRA元数据的快速编程访问,并支持大量客户端库。
雅典娜(AWS)
AWS提供了对SRA元数据的快速编程访问,并支持大量客户端库。
NCBI的Entrez搜索引擎
下载/访问数据
SRA工具包允许您以所需格式和云存储桶创建下一代序列文件。您还可以下载某些数据集的原始提交文件。
要从云中下载dbGaP数据,需要使用SRA工具包的最新版本和JWT文件,而不是NGC文件。
云数据交付服务允许将SRA工具包无法访问的文件直接交付给您的AWS和GCP存储桶。
YouTube上的SRA:教程
Engage(接合)
NCBI希望您在云中对SRA进行反馈。联系人sra@ncbi.nlm.nih.gov如果您想提供有关新功能的输入,请回答问题。
入门
云快速入门
设置
云数据访问
访问dbGAP
搜索
SRA分析
SRA数据格式