美国国旗

美国政府的官方网站

如何提交到dbSNP

 

公告: 开始 2017年9月1日 ,dbSNP不再接受非人类生物数据的提交。您可以将数据提交至欧洲变体档案( http://www.ebi.ac.uk/eva/ ),我们在国际核苷酸序列数据库合作(INSDC)中的合作伙伴之一。有关此更改的其他详细信息,请参阅NCBI Insights( https://go.usa.gov/x5MUQ网址 ). 
 
 

二、。介绍和提交概述

4.2版;2017年5月1日

dbSNP提交简介

虽然SNP是“单核苷酸多态性”的缩写,但dbSNP是所有短序列变异的通用公共档案,不仅是在人群中频繁发生的被称为多态性的单核苷酸替换,还包括罕见的变异,包括ClinVar中临床断言的变异。dbSNP包括广泛的简单遗传变异集合,例如单核苷酸替换、小规模多碱基缺失或插入以及微卫星重复。提交给dbSNP的数据可以来自任何生物体(限制部分)基因型和等位基因频率数据(如果这些数据可用)。dbSNP接受所有类别的简单序列变异的提交,并通过我们与ClinVar的整合关系,提供对具有临床意义的生殖系或体细胞起源变异的访问。由于dbSNP和ClinVar密切合作,所有具有临床断言的变体都应提交给ClinVar公司,它将处理并加入变体,然后将提交文件转发给dbSNP进行映射和加入。

dbSNP将变异映射到其相应的参考基因组集合(只要可用),并提供链接到临床断言的等位基因的医学影响的详细信息。长度超过50bp的大规模插入/删除、反转和移位数据应提交给数据库变量,基因组结构变异的NCBI数据库。dbSNP接受单个研究人员以及大型研究(例如1000基因组)提交的数据。提交材料可以来自任何生物体、基因组的任何部分,如果这些数据可用,还可以包括基因型和等位基因频率数据。dbSNP接受所有类别的简单序列变异提交,由于dbSNP提交不受等位基因频率的限制,我们的数据库包括多态性以及罕见的、医学上重要的等位基因。

dbSNP接受的变体类型和大小

  • dbSNP接受简单的变化<50个基点;结构变化>50bp应提交给数据库变量
  • dbSNP接受来自基因组任何部分的变异
  • dbSNP接受单碱基核苷酸替换
  • dbSNP接受小规模的多基删除或插入
  • dbSNP接受微卫星重复
  • dbSNP接受变异基因型数据
  • dbSNP接受变异等位基因频率数据

变量类型和大小dbSNP不接受

提交与疾病或其他表型相关的变异

  • 将临床相关数据提交至ClinVar公司。您提交给ClinVar的文件将被处理,分配ClinVar加入(SCV),并将在dbSNP或dbVar中添加新的变量位置(视情况而定)。
  • 将敏感临床数据提交给dbGaP公司。如果您提交的材料中包含识别信息或其他临床敏感材料,或者如果您观察到变异的个人没有签署同意书,允许在免费公共网站上显示其遗传信息,请将您的研究提交给NCBI的基因型和表型数据库(dbGaP公司). 敏感信息将存储在dbGaP的受控访问之后,而去掉个人识别信息的聚合数据将转发给dbSNP。
  • 在表型尚未被解释为功能或临床意义的个体中发现的变异应酌情提交给dbSNP或dbVar。dbSNP或dbVar工作人员可以代理向BioSample数据库提交有关样本的表型信息。
  • 提交现有变异的临床断言更新ClinVar公司.

dbSNP提交概述

  1. 熟悉本文中dbSNP提交的介绍材料和dbSNP文件的10个主要元素。
  2. 完成dbSNP提交前流程。
  3. 格式化dbSNP元数据文件这将伴随您的数据提交。
  4. 以VCF或表格格式格式化提交内容,并将其发送给dbSNP。
  5. 如果您在提交时需要帮助,请联系dbSNPsnp-sub@ncbi.nlm.nih.gov
  6. 如果您还没有准备好让数据公开可用,请参阅dbSNP的HUP(Hold Until Published)策略;请参阅上一节。
  7. 请参阅我们的文档,以便稍后更新或撤回您提交的数据。
  8. 了解dbSNP关于加入、周转时间以及dbSNP如何通知您的处理状态的政策给你。

dbSNP提交的10个主要数据元素

1.序列上下文(要求的)

向dbSNP提交的一个重要组成部分是提交的变体的明确位置。dbSNP现在最低限度地要求您将变量位置作为断言的位置参考序列INSDC公司序列。

a.断言位置

断言位置是基于实验证据的陈述,该实验证据表明变体位于序列中附加的特定位置INSDC公司数据库或参考序列,以及位于NCBI程序集资源。如果您有从头组装,则可以将序列提交给GenBank(基因银行)分配的程序集加入可用于dbSNP提交。

重要事项:NCBI组件资源中组件的一部分序列上报告的变量位置将收到提交的SNP(ss)编号和参考SNP(rs或RefSNP)编号。分配了refSNP编号的变体作为dbSNP的一部分进行分发,它允许报告的变体出现在组件的地图或图形表示上,并与NCBI的其他资源集成,如Gene、ClinVar、dbGAP或PubMed。

在以下情况下,dbSNP将接受RefSeq或INSDC序列中与NCBI程序集资源中的程序集无关的断言位置的数据:
*还没有序列与之对齐的组件,或
*提交的序列与现有程序集中的间隙对齐
在这种情况下,将只为您提交的变体分配一个ss编号,您可以使用dbSNP访问该编号“ID搜索“工具或通过 FTP下载。因为在这些情况下提交的变体仅具有ss编号, 它不会出现在组件的地图或图形表示上,也不会与NCBI的其他资源集成然而,ss将在“提交的SNP”网络报告中进行报告。然而,如果在未来某个日期创建了一个新程序集或更新了一个旧程序集,从而使报告的变体序列与NCBI程序集资源中的程序集对齐,则此时将为报告的变体分配一个rs号,这将允许它作为dbSNP的一部分分发,显示在组件的地图或图形表示上,并与其他NCBI资源集成。

b.侧翼序列

请注意dbSNP不再接受使用侧翼序列提交的变体.dbSNP要求提交者使用VCF(沃尔沃汽车金融公司)格式。 

*如果您不知道序列是否是dbSNP assembly Resource中的程序集的一部分,请联系dbSNPsnp-sub@ncbi.nlm.nih.gov*


2.小巷(要求的)

通道定义每个变体类别。dbSNP在其提交方案中将单核苷酸变体定义为G、A、T或C,并且在变体的等位基因定义中不允许使用模糊的IUPAC代码,例如N。注:dbSNP的等位基因长度限制为<=50bp。将长度大于50核苷酸的等位基因提交给基因组结构变异数据库(数据库VAR)。


3.方法(要求的)

每个提交者在其提交的文件中定义了用于分析变异的技术或用于估计等位基因频率的技术。dbSNP按方法类对方法进行分组,以便于使用通用实验技术作为查询字段进行查询。提交者在方法的自由文本描述中提供了这些技术的所有其他细节。提交者还可以使用METHOD_EXCEPTION字段描述对特定数据集的通用协议的更改(特定于批的详细信息)。提交者通常在一次提交中只定义一次方法。

4.声称的巷源(要求的)

提交者可以提供一个声明(断言),以支持变异体具有特定等位基因起源的实验证据。对单个refSNP的断言进行了总结,并给出了种系或未知的属性值。体细胞起源的变体应提交给ClinVar。未来将添加其他属性(例如父亲属性)。

5.人口(要求的)

每个提交者将人群样本定义为最初用于识别变异的组,或用于识别人群特定的等位基因频率测量值的组。在一些实验设计中,这些群体可能是一个并且是相同的。尽管dbSNP已根据样本的地理来源将种群分配到一个种群类别,但由于大多数种群描述现在都提交给BioSample,我们将在不久的将来逐步取消这种做法。我们鼓励您向BioSample注册您的样品,以获得指定的登录,您可以在其dbSNP提交中使用。

6.样本量(可选)

dbSNP中有两个样本大小字段。SNPASSAY SAMPLE SIZE是一个字段,用于报告样本中用于初步确定或发现变异的染色体数量。另一个样本大小字段SNPPOPUSE sample size报告了在计算等位基因频率估计值时用作分母的染色体数量。这两项措施不一定相同。

7.特定人群的等位基因频率(可选)

等位基因在不同的人群中以不同的频率存在;一个群体中非常常见的等位基因在另一个群体可能非常罕见。此外,当特定群体与邻近群体进行生殖隔离时,等位基因变体可以作为私人多态性出现,就像隔离或偏远群体的情况一样。频率数据作为等位基因计数或二进制频率间隔提交给dbSNP,这取决于用于测量的实验方法的精度。dbSNP包含特定人群样本的等位基因频率记录,由每个提交者定义并用于验证提交的变异。

8.人群特异性基因型频率(可选)

与等位基因类似,基因型在人群中具有可提交给dbSNP的频率,并用于验证提交的变异。

9.个体基因型(可选)

dbSNP接受捐赠者提供的样本中的单个基因型,这些样本同意将其DNA序列保存在公共数据库中(例如HapMap或1000基因组项目)。dbSNP中报告的基因型包含与种群和方法描述的链接。一般基因型数据为个体单倍型定义提供了基础,并有助于在新实验中选择阳性和阴性对照试剂。

10.验证信息(可选)

dbSNP接受没有验证证据的单个分析记录(ss编号)。然而,在可能的情况下,dbSNP会尝试区分高质量的验证数据和未确认(通常是计算性的)变化报告。提交人通过验证部分直接验证的分析显示了用于确认差异的证据类型。此外,如果出现以下情况,dbSNP将标记为已验证的分析变异:

  • 使用至少一种非计算方法向refSNP集群提交多个独立的提交,

  • 该变异由HapMap项目进行基因分型,由1000基因组项目或其他大型测序项目进行测序。

有关dbSNP的一般信息,或有关refSNP集群、注释和映射的详细信息,请参阅dbSNP手册.

联系dbSNP

如果您在如何提交到dbSNP文档系列,联系dbSNP提交snp-sub@ncbi.nlm.nih.gov,我们将尽力回答您的提交问题或帮助您解决困难的提交问题。

中的标题如何提交到dbSNP系列:

上次更新时间:2017-10-06T12:37:35-04:00