国家医学图书馆及其合作伙伴国际核苷酸数据库合作(INSDC)联合发表声明,鼓励科学界将其SARS-CoV-2序列提交给INSDC数据库。这些数据库提供了广泛的开放存取和集成数据、文献和工具,我们认为这些功能在研究界共同理解和打击新型冠状病毒肺炎时至关重要阅读下面的完整陈述。
国际核苷酸序列数据库合作组织(INSDC)的数据库网址:http://www.insdc.org/)捕获、组织、保存和呈现核苷酸序列数据,作为开放科学记录的一部分。INSDC成员机构–EMBL欧洲生物信息学研究所(EMBL-EBI公司)日本NIG DNA数据库(NIG-DDBJ公司)以及NIH国家医学图书馆的国家生物技术信息中心(美国国立生物技术信息中心)–致力于继续提供科学基础设施的这一关键要素。
全球新冠肺炎危机迫切需要快速公开共享疫情相关数据。最重要的是,获取SARS-CoV-2病毒基因组的序列数据对于我们了解新冠肺炎的生物学和传播至关重要。为了帮助这项工作,INSDC的三个成员都优先处理了严重急性呼吸系统综合征冠状病毒2型序列数据,并简化了提交流程。
通过INSDC数据库获得的数据提供了:
-
- 快速开放访问–INSDC快速将提交的数据免费提供给每个人,不限制重复使用
- 将原始序列读取数据链接到基因组集合,使研究人员能够验证集合的完整性,并调查基因组序列中的断言突变和变化
- 将SARS-CoV-2序列与整个INSDC数据集成,包括相关冠状病毒基因组序列,以便进行物种间的比较
- 序列与已发表文献的链接
- 工具–INSDC合作伙伴提供集成数据分析工具,如BLAST,以增强发现过程
为了支持全球应对新冠肺炎危机,INSDC呼吁研究界:
-
- 向INSDC数据库提交SARS-CoV-2原始数据
- 向INSDC的数据库提交一致/汇总的严重急性呼吸系统综合征冠状病毒2型数据
- 作为序列提交的一部分,提供与序列隔离物或样品相关的信息;应至少提供隔离/采样的时间和地点以及隔离/采样标识符,以使序列的值最大化。
- 如果科学家已经向其他数据库提交了资料,则这些资料应与INSDC的资料同时继续提交
INSDC数据库与全球生物信息学数据基础设施的集成,包括工具、二级数据库、计算能力和管理过程,确保了数据的快速传播,并推动了其最大影响。
除了INSDC成员机构在共享病毒序列数据方面的这些基本作用外,各机构还迅速建立了针对新冠肺炎的项目和资源:欧洲新冠肺炎数据平台来自EMBL-EBI,DDBJ新型冠状病毒研究数据资源和NCBI SARS-CoV-2资源这些资源既证明了INSDC数据库与更广泛的生物信息学倡议的联系,也为新冠肺炎研究增加了直接价值。
盖伊·科克伦(EMBL-EBI公司),Ilene Karsch-Mizrachi公司(NCBI-NLM-NIH公司), &Masanori Arita公司(DDBJ公司)代表国际核苷酸序列数据库合作组织