dbVar帮助和常见问题解答
- 引言
- dbVar研究浏览器
- dbVar研究页面
- dbVar变量页面
- 变量调用和区域类型
- dbVar变量渲染
- dbVar放置
- 档案传输站
- dbVar Entrez搜索
- 常见问题解答
上次更新时间:2020年6月
引言
dbVar是一个人类基因组结构变异数据库,用户可以在其中搜索、查看和下载提交的研究数据。2017年11月1日,dbVar停止支持非人类生物体的数据;然而,现有的非人类数据仍然可以通过FTP下载获得。根据结构变异的一般定义,大多数变异的长度大于50个碱基对,但也可能发现少数较小的变异。dbVar提供了对原始数据的访问,以及从NCBI和其他地方访问其他资源的链接。有关结构变化的更多信息,请参阅结构变化概述第页。有关常见问题,请参阅dbVar帮助和常见问题解答第页。
dbVar是由国家生物技术信息中心开发和维护的免费资源(网络控制比)在美国国家医学图书馆(国家土地管理局)位于美国国立卫生研究院(国家卫生研究院)马里兰州贝塞斯达。
dbVar研究浏览器
dbVar中的数据由Study组织。“研究”通常指的是出版物,但一些研究是社区资源,定期用新数据更新(例如,临床结构变体-ClinVar,nstd102)。每个研究都有一个以-std:非甾体抗炎药如果研究提交给NCBI,预计如果提交给EBI,以及数据处理系统如果提交给DDBJdbVar研究浏览器(图1)总结了dbVar中的研究。浏览器可以按研究加入,有机体,研究 类型,方法,编号 属于 变量区域,变量调用数,或出版物。提供了每个研究的研究页面和PubMed摘要的链接。浏览器右侧的过滤器允许您按研究类型、方法或变体区域数量缩小内容范围。
![研究浏览器](/core/assets/dbvar/images/study_browser_2020.png)
图1:dbVar研究浏览器
dbVar研究页面
dbVar中的每个研究都有一个研究页面,显示有关研究的基本信息。顶部是描述研究基本信息的一般信息部分,包括以下链接生物项目, 公共医学,数据库间隙P和提交者的实验室页面(如果可用)。接下来是详细信息部分,您可以从中下载当前研究的变量数据(变量区域、变量调用、两者或全部通过FTP),或以选项卡格式浏览变量摘要、样本集、实验详细信息或验证的详细信息。
![研究页](/core/assets/dbvar/images/study_page_2020.png)
图2a:一般信息和变量摘要选项卡(研究页面)-变量摘要选项卡显示每个染色体上当前研究的变量调用数和变量区域数、放置类型(即,提交的组件和/或重新映射的组件上是否有数据),以及到NCBI上变量图形显示的链接序列查看器。表格上方的下拉菜单允许您在提交的程序集或数据已重新映射到的任何程序集上显示当前研究的数据。
![研究页面-样本集选项卡](/core/assets/dbvar/images/samplesets_tab.png)
图2b:样本集选项卡(研究页面)-“样本集”选项卡描述了研究中样本的任何逻辑划分。详细信息包括名称、描述、大小和相关表型(如有)。请注意,通过下载样本数据可以找到样本集中有关单个受试者的其他详细信息。如果受试者未被同意公开显示其数据(如上例所示),临床信息和遗传变异之间的链接将存储在NCBI的受控访问后面数据库间隙P。然后将样本和变体匿名化,然后转发给dbVar。
![图2c:实验细节选项卡(研究页面)](/core/assets/dbvar/images/experimental_details.png)
图2c:实验细节选项卡(研究页面)-“实验细节”选项卡提供了研究中使用的方法和分析的信息。方法和分析的每个独特组合都被命名为“实验”。可以在Excel提交模板中找到允许的方法类型和分析类型的完整列表,也可以单击在这里实验可以是三种类型之一:发现、验证或基因分型。在“实验细节”选项卡中,您还可以访问研究原始数据的链接(例如,序列跟踪或存储在外部数据库(如Trace或array Express)中的阵列数据)。
![图2d:验证选项卡(研究页面)](/core/assets/dbvar/images/samplesets_tab.png)
图2d:验证选项卡(研究页面)-如果执行验证实验以确认发现实验生成的变量调用,则验证实验将被分配唯一ID,并与验证选项卡中的相关方法一起列出。可以通过从研究页面下载变量数据本身来访问单个验证结果。如果没有对给定的研究执行验证实验,验证选项卡将指示没有向dbVar提交验证数据。
dbVar变量页
每个dbVar Variant页面都显示有关所添加Variant Region的详细信息。页面顶部有一个部分,包含变异区域的一般信息(研究、支持变异调用的数量、区域大小等,见图3a),以及显示变异在基因组上位置的染色体表意图。接下来是带有完整变体详细信息的选项卡式部分:基因组视图、变体区域详细信息和证据、验证信息、临床断言和基因型信息(有关每个选项卡的信息,请参阅下面的图例)。
![变体页面](/core/assets/dbvar/images/variant_page.png)
图3a:一般信息(顶部)和基因组视图选项卡(变体页面)-基因组视图选项卡显示了NCBI序列查看器中已知基因和当前研究中其他变体数据的当前变体。使用下拉菜单选择要查看的部件。每个黑色条表示变量区域(当前区域居中并突出显示),而彩色条表示支持每个区域的变量调用。默认显示是折叠所有支持的变体调用,但可以通过单击“配置…变体…全部显示”进行调整(例如,显示所有单独的调用)。单击任何变量区域或变量调用将显示弹出式工具提示,其中包含有关变量的信息以及指向其dbVar页面的链接。
![变量页面–VRDE选项卡](/core/assets/dbvar/images/var_regn_detls_evidnc_tab.png)
图3b:变量区域详细信息和证据选项卡(变量页面)-此选项卡包含变量区域在最初提交区域的部件上的放置坐标,以及随后映射到的部件。如果是重新映射的位置,“分数”列指示重新映射的质量–完美、良好或通过(有关详细信息,请参阅dbVar放置第节)。变量区域信息下方是有关支持变量调用的详细信息,这些调用被合并以定义区域,包括它们的位置(在已提交和/或重新映射的程序集上)。始终可以使用变体页面选项卡部分上方的链接下载完整的详细信息。
![变量页面–验证信息选项卡](/core/assets/dbvar/images/validation_tab.png)
图3c:验证信息选项卡(变量页面)-如果使用其他方法验证任何变量调用结果,此选项卡将提供验证中使用的方法和分析的详细信息,以及结果(每个测试调用的通过或失败)。
![变体页面–临床断言选项卡](/core/assets/dbvar/images/clin_assertions_tab.png)
图3d:临床断言选项卡(变体页面)-如果在研究过程中,变异调用与受试者观察到的表型之间建立了关联,则此处提供了详细信息。变量调用ID之后是观察到的样本(如果样本公开,则带有链接)、事件类型(插入、删除、拷贝数增加等)、变异体的亲本来源(如果已确定)、与变异体相关的表型以及作者对其可能致病性的评估。有关如何处理涉及敏感临床和遗传信息的研究的提示,请参阅图2b图例以上。
变量调用和区域类型
dbVar支持下表1中列出的结构变化类型。使用第一列中的变量调用类型之一提交每个变量调用;相应的序列本体ID和定义列在中间一列中;最后一列显示了变量区域类型(用于合并类似调用形成的区域)。(有关呼叫和地区之间差异的解释,请参阅我们的结构变化概述第页)
变量调用类型 |
序列本体ID |
变体区域类型 |
复代换
|
销售订单:1000005(复杂替换)当没有简单或定义明确的DNA突变事件描述观察到的DNA变化时,应使用关键字“complex”。通常,对这种变化有多种同样合理的解释。
|
复代换
|
拷贝数增益
|
销售订单:0001742一种序列改变,其中给定区域的拷贝数大于参考序列。
|
拷贝数变化
|
拷贝数丢失
|
销售订单:0001743一种序列改变,其中给定区域的拷贝数小于参考序列。
|
拷贝数变化
|
拷贝数变化
|
销售订单:0001019一种增加或减少给定区域拷贝数的变体。
|
拷贝数变化
|
删除
|
销售订单:0000159切除一个或多个相邻核苷酸的点。
|
拷贝数变化
|
复制
|
销售订单:0001742(拷贝数增益)序列改变,其中给定区域的拷贝数大于参考序列。
|
拷贝数变化
|
熟食
|
销售订单:1000032一种序列改变,包括插入和删除,影响两个或多个碱基。
|
熟食
|
插入
|
销售订单:0000667序列中两个相邻核苷酸之间添加的一个或多个核苷酸的序列。
|
插入
|
染色体间易位
|
销售订单:0002060涉及不同染色体区域的易位。
|
易位,复杂染色体重排
|
染色体内易位
|
销售订单:0002061涉及的区域来自同一染色体的易位。
|
易位,复杂染色体重排
|
反转
|
销售订单:1000036一个连续的核苷酸序列在相同的位置颠倒。
|
反转
|
移动元件插入
|
销售订单:0001837插入序列是移动元素的一种插入。
|
移动元件插入
|
铝插入
|
销售订单:0002063从Alu系列移动元件插入序列。
|
移动元件插入
|
LINE1插入
|
因此:0002064从Line1系列移动图元中插入。
|
移动元件插入
|
SVA插入
|
销售订单:0002065从SVA系列移动元件中插入序列。
|
移动元件插入
|
HERV插入
|
所以:0002187插入HERV系列活动元件的序列。
|
移动元件插入
|
新序列插入
|
销售订单:0001838序列无法映射到参考基因组的插入。
|
新序列插入
|
移动元素删除
|
销售订单:0002066在比较参考序列(具有移动元素)和单个序列(没有移动元素)时删除移动元素。
|
移动元素删除
|
Alu删除
|
销售订单:0002070相对于引用删除Alu移动元素。
|
移动元素删除
|
LINE1删除
|
销售订单:0002069相对于引用删除LINE1移动元素。
|
移动元素删除
|
SVA删除
|
销售订单:0002068相对于引用删除SVA移动元素。
|
移动元素删除
|
HERV删除
|
销售订单:0002067相对于引用删除HERV移动元素。
|
移动元素删除
|
层序蚀变
|
销售订单:0001059sequence_alteration是一个sequence_feature,其范围是与另一个序列的偏差。
|
层序蚀变
|
短串联重复变异
|
销售订单:0002096一种序列变体,其中串联重复序列相对于参考进行扩展或收缩。
|
短串联重复变异
|
串联复制
|
销售订单:1000173由两个相同的相邻区域组成的复制。
|
串联复制
|
表1:变量调用和区域类型
dbVar变量渲染
![呈现断点模糊](/core/assets/dbvar/images/secondary_rendering_table.png)
图4a:呈现断点模糊性。如上表所示,大多数变型(SV或SSV)有四种常见情况。然而,在一端具有定义的断点,另一端具有未定义的断口范围的混合情况也是可能的。在这里,我们使用(CNV SV)作为示例。
![变量渲染-示例](/core/assets/dbvar/images/primary_rendering_table.png)
图4b:呈现变量类型。变体在多个位置进行可视化表示:变体页面的“基因组视图”选项卡;dbVar基因组浏览器;和NCBI的序列查看器。颜色区分结构变体的类型(拷贝数增益/丢失、插入、反转等)。断点歧义由变量端的半透明和/或箭头表示。
dbVar放置
大多数变体作为特定程序集上的断言位置提交给dbVar;此程序集并不总是当前程序集。此外,所有研究都没有使用相同的组件进行分析。为了比较不同研究的数据,有必要获得同一组组件上所有变体的位置。对于大多数变体,我们使用具有以下参数的内部重映射软件进行此操作:
- 必须重新映射的基的最小比率:0.5
- 源长度与目标长度之差的最大比值:4.0
- “合并”功能已启用。
- 可以返回多个位置。
我们使用相对宽松的参数,因为许多结构变异体位于基因组中可能在组装过程中发生变化的区域内。覆盖分数的计算方法是,将目标程序集中的特征长度除以源程序集中特征的长度。得分为1表示该地区在议会之间相对不变(注:不评估单个基地);得分>1表示插入目标程序集,得分<1表示删除目标程序集。我们对网页上的重新映射状态进行了定性评估:
- 完美:覆盖分数等于1
- 良好:覆盖率得分在1的5%以内
- 通过:覆盖范围偏离1超过5%
提交给dbVar的变体数量相对较少,是按顺序定义的。这些是典型的插入序列,无法放置在研究分析中使用的组件上。此类序列提交给GenBank(基因银行)/欧洲工商管理学院/DDBJ公司并使用分配的accession.version在dbVar中进行跟踪。这些序列使用内部开发的称为NG对准器(未出版)的过程与较新的组件对齐。将符合>95%覆盖率和98%一致性的序列视为已放置。
进化程序集的本质是,对早期程序集调用的变体有时无法清晰地映射到较新(可能更准确)的程序集。在这些情况下,Remaper可能会输出多个备选位置,即使它们被评分,人们也无法确切地知道在哪里以及在多大程度上可以将变体放置在较新的组件上。因此,dbVar实现了一组过滤重映射结果的规则,目的是根据不完美的重映射数据为用户提供最佳估计。在某些情况下,变体可能无法完全重新映射(dbVar FTP下载文件中指出这些变体无法重新映射),应该被视为可疑变量。
作用域中的程序集
dbVar显示研究分析中使用的部件的放置数据(“已提交”放置)。对于大多数生物体,如果可以的话,我们还将尝试在“当前”组件上找到一个变体的位置。当程序集更新时,我们将支持“当前”和“以前”程序集长达一年。例如,我们目前支持在GRCh37和GRCh38上放置人类数据。
档案传输站
dbVar中的所有数据都可以从我们的FTP站点下载:https://ftp.ncbi.nlm.nih.gov/pub/dbVar/data/。数据通过组装和研究进行组织。可用下载的完整列表可用联机。如果您通过程序集下载,请注意,某些变量调用或变量区域可能已在正在下载的程序集之外的程序集上提交;这些变体将被重新映射,以反映它们在下载的程序集上的相应位置,可以在FTP目录中的单独文件中找到它们的位置。例如,GRCh37组件下载包括在GRCh37上提交的所有变体,以及在其他组件上提交的变体,以及重新映射到GRCh37的变体。重新映射状态显示在下载文件中。
有关FTP站点组织的更多信息,请访问:https://ftp.ncbi.nlm.nih.gov/pub/dbVar/data/README.txt。
dbVar Entrez搜索
每个dbVar页面顶部都提供了一个搜索栏,带有一个下拉菜单,可以使用Entrez搜索dbVar和其他NCBI资源(请参阅Entrez帮助以获得进一步的细节)。
dbVar搜索返回研究,带有指向的链接研究页面、和变体,带有指向的链接变体页面。页面左侧的筛选器允许用户根据各种数据字段缩小结果范围。
高级搜索
dbVar Advanced搜索页面允许用户通过选择以下选项来构建Entrez搜索查询搜索字段和下拉菜单中的值。
dbVar搜索字段
以下字段可用于搜索dbVar:
字段名称 |
字段别名 |
说明 |
加入 |
ACC、ACCN |
访问任何内部或外部标识符。从GENBANK附件中删除的版本。 |
受试者年龄 |
年龄 |
受试者年龄(年) |
所有字段 |
所有人* |
所有可搜索字段中的所有术语 |
装配 |
ASSM公司 |
放置程序集的加入或名称 |
作者 |
澳大利亚授权 |
期刊中包含的所有作者 |
生物项目 |
项目 |
相关生物项目的加入或名称 |
Chr公司 |
CH、铬、染色体 |
放置染色体 |
Chr结束 |
CHR_END、CHR_STOP、END |
染色体放置结束 |
ChrPos公司 |
底座、底座_位置、CHR_POS、CHR_START、启动 |
开始在染色体上放置 |
临床解释 |
临床_评估 |
变体的临床解释(受控词汇) |
临床表型 |
疾病,PHENO,PHONOTYPE,PTYPE |
样本/受试者研究或参考样本的表型 |
过滤器 |
过滤,过滤,子集,某人,过滤 |
限制记录 |
频率 |
FREQ、GLOB_FREQ |
全球等位基因频率 |
基因 |
发电机名称,SYM |
与变体位于同一位置的基因的名称或别名 |
有临床 |
哈斯克林 |
标志指示受试者有临床解释:0=无;1=是 |
网格 |
MH公司 |
分配给出版物的医学主题标题 |
MeSH标识 |
MHID公司 |
NLM MeSH浏览器唯一ID |
方法类型 |
方法 |
方法类型(受控词汇表) |
OMIM公司 |
MIM公司 |
人类的在线孟德尔遗传 |
对象类型 |
OT公司 |
dbVar中的对象类型(STUDY,VARIANT) |
有机体 |
ORG、ORGN |
生物体名称(爆炸) |
原产地 |
ALLELE_ORGIN公司 |
等位基因起源(受控词汇),包括二者=种系+体细胞 |
致病重叠范围 |
路径_RNG |
致病性变体的相互重叠范围 |
人口 |
流行音乐 |
通话频率数据的受试人群(主要大陆组) |
出版物 |
PMID,PUBMED_ID |
PubMed的唯一标识符 |
出版日期 |
PDAT,发布 |
期刊出版日期 |
样品 |
SMPL公司 |
研究或参考样本的样本/受试者ID |
样本计数 |
SC,斯科特 |
研究中的样本数量 |
受试者性别 |
性别,性别 |
受试者性别(受控词汇) |
研究 |
STDY公司 |
研究ID、别名、显示名称或出版物名称 |
研究类型 |
风格 |
NCBI指定的研究类型 |
受试者表型状态 |
子卫星 |
标志指示受试者有一个表型:0=否;1=是 |
分类ID |
TAX,TAX_ID,TAXID,分类 |
分类ID |
液体 |
液体 |
Entrez中分配给研究或变体的唯一编号 |
变量大小 |
威士奇VLEN |
变体的大小 |
变量类型 |
VT、VTYPE、VARTYPE |
变量区域或调用的类型(受控词汇表) |
合度 |
ZYG公司 |
变体的奇偶性(受控词汇表) |
dbVar常见问题解答
常见问题(FAQ):
- 什么是“dbVar”?
- dbVar与基因组变异数据库(DGV)有何不同?
- 什么是“结构变化”?
- dbVar接受什么类型的结构变化数据?
- 我如何检测结构变化重要吗?
- 我可以提交任何生物体的结构变异数据吗?
- 我可以提交人类临床或癌症研究的结构变化数据吗?
- dbVar能区分致病性变体和良性变体吗?
- dbVar接受基因型数据吗?
- 我会得到一个唯一的dbVar ID用于发布吗?
- dbVar访问之间的区别是什么?
- 为什么dbVar中的数据与发布中提供的数据不同?
- 为什么某些dbVar变量的位置大于1?
- nsv和nssv有什么区别?
- 我可以下载整个数据库吗?
- 我如何知道dbVar中的给定变量是真实的(还是高质量的)?
- 如何从给定区域或基因下载所有数据?
- 有没有办法将dbVar数据与dbSNP数据集成?
- 我可以在提交的数据中包含任何临床信息吗?
- 我的提交包含敏感的私人临床信息。dbVar如何保证信息保持私有?
- dbVar接受的最小大小的结构变量是什么?
- 我的研究已经确定了新的插入序列,我没有这些序列的基因组坐标。如何将这些提交给dbVar?
- Variant Page的Variant Call Information表中的“Other Calls in this Sample”数量与我对同一研究和样本ID进行dbVar搜索时返回的变体数量不同。发生了什么?
- dbVar如何将提交到一个程序集(例如NCBI36)上的数据放置到其他程序集(如GRCh37)上?
- 如何提交给dbVar?
- 我应该如何引用dbVar?
-
什么是“dbVar”?
dbVar是人类基因组结构变异的NCBI数据库。有关如何导航dbVar的信息,请参阅dbVar帮助第页。
-
dbVar与基因组变异数据库(DGV)有何不同?
DGV公司在收集和整理人类结构变异数据方面,一直是人类遗传学界的有用资源。 DGV公司、dbVar及其欧洲柜台DGVa公司,包含健康对照人类样本的数据,而后两个也包括来自ClinVar公司.
-
什么是“结构变化”?
结构变异(SV)通常被定义为参与反转和平衡易位或基因组不平衡(插入和缺失)的任何DNA区域,通常被称为拷贝数变异(CNV)。有关更多信息,请参阅结构变化概述第页。
-
dbVar接受什么类型的结构变化数据?
dbVar是一个结构变异数据库,用于存储大小≥1bp的变异DNA数据。实际上,我们建议将大于50bp的变化数据提交给dbVar,将小于等于50bp的波动数据提交给数据库SNP我们可以接受各种类型的事件,包括反转、插入和移位。我们不鼓励提交体细胞和癌症相关变体,因为它们往往是复杂的和样本特异的,并且更适合存储在自定义数据库中。
-
我如何检测结构变化重要吗?
dbVar接受基于全基因组或全基因组下一代测序(NGS)分析(包括配对映射、分载对和读取深度)以及基于微阵列的实验(包括阵列CGH和SNP基因分型)的提交。支持的方法和分析的完整列表可以在dbVar帮助第页。
-
我可以提交任何生物体的结构变化数据吗?
从2017年9月1日开始,dbVar停止接受任何非人类生物的提交。非人类SV数据可以提交给DGVa公司.
-
我可以提交临床或癌症研究的结构变化数据吗?
否。所有与临床相关的结构变化都应提交给ClinVar公司或数据库间隙P. 我们不鼓励向dbVar提交躯体和癌症相关SV。
-
dbVar能区分致病性变体和良性变体吗?
是的,dbVar将明确标记并允许搜索已知致病性变体,提供与OMIM公司如果可用。
-
dbVar接受基因型数据吗?
是的,dbVar可以接受基因型数据。
-
我会得到一个唯一的dbVar ID用于发布吗?
是的,dbVar将为每个研究、每个提交的变体区域和每个支持级别变体提供唯一的登录号。
-
dbVar访问之间的区别是什么?
dbVar与DGVa公司EBI和合资公司-SV在DDBJ加入基因组结构变体。NCBI已处理前缀为“n”的访问(数据库变量,EBI带有“e”(DGVa公司),和“d”by(DDBJ公司NCBI、EBI和DDBJ提供了三个级别的材料:
- (n | e | d)std:研究id-表示提交的研究
- (n | e | d)sv:结构变量id-标识提交的变化区域
- (n | e | d)ssv:支持结构变体id-它标识了用于调用提交的变异区域的支持变异区域(通常是特定样本)
-
为什么dbVar中的数据有时与出版物中提供的数据不同?
在发布后加载提交给dbVar的研究可能会突出质量控制检查期间的错误。在这些情况下,将联系提交者并更正错误。在其他情况下,提交者可能会在提交之前检测到错误,或决定编辑其数据。这通常会记录在研究记录中。
-
为什么某些dbVar变体有多个位置?
有两个原因:
当提交者向我们提供从UCSC公司,我们将其转换为本地装配坐标,并将序列(染色体和未定位/未缩放的序列)映射到它们的accession.versions。UCSC公司将未定位/未缩放的序列连接到伪caffold对象中,这些对象称为chr*random。在某些情况下,提交者提供了跨越“chr*_random”序列空白的数据,这意味着该特征实际上映射到两个不同的、不相关的序列。
如果变体是换位事件的结果,则还可以提供一个以上的位置。在这种情况下,将提供捐赠者和受赠者现场的坐标,以尽可能多地保留关于变体事件的信息。
-
nsv和nssv有什么区别?
非传染性病毒和非小细胞病毒分别是变量区域和变量调用(或实例)的加入前缀。通常,一个或多个变量实例(非小细胞病毒–直接基于实验证据的变量调用)合并到变量区域(非传染性病毒–一对起始坐标,反映提交者对受变异实例影响的基因组区域的断言)。sv或ssv前面的“n”表示变体已提交给NCBI(dbVar)。电子稳定电视和埃斯维斯代表相同的变体实体,但那些提交给EBI(DGVa)的实体;类似地,数字电视和数字支持向量机提交给DDBJ(JVar-SV)。
请参阅结构变化概述了解更多信息。
-
我可以下载整个数据库吗?
所有数据都可以在我们的FTP站点数据以每次研究和每次组装为基础。
-
我如何知道dbVar中的给定变量是否是真实的/高质量的?
dbVar是一个档案。我们报告提交给我们的变体,通常与同行评审的出版物相关。数据再现性由提交研究者负责。dbVar鼓励但不要求通过至少一种替代方法验证所有变体,并且我们提供了一种将验证结果包含在提交模板中的机制。所有提交的验证数据均作为研究数据的组成部分。要将变体列为“已验证”变体,必须至少使用一种或多种其他独立方法进行确认。如果作为dbVar数据的使用者,对特定的变体或数据集有顾虑,我们建议您联系相关的提交者以获取更多支持信息。
-
如何从给定区域或基因中找到数据?
您可以使用基因名称执行搜索。返回的结果将包括与该基因重叠的所有变体,以及与这些变体相关的研究。
-
有没有办法将dbVar数据与dbSNP数据集成?
对,变体查看器在这方面提供了一些功能。或者,用户可以使用可用的生物信息学工具手动集成数据。
-
我可以在提交的数据中包含任何临床信息吗?
否,所有具有临床相关结构变化的提交文件都应提交给ClinVar公司.
-
我提交的资料包含敏感的私人临床信息。dbVar如何保证信息保持私有?
带有敏感患者信息的提交应提交给数据库间隙P.
-
dbVar接受的最小大小的结构变量是什么?
结构变化数据没有大小限制。我们建议将小于50 bp的变体提交给数据库SNP但我们将接受小到单个碱基对的变异,只要变异是插入或删除,而不是单个核苷酸的改变。
-
我的研究已经确定了新的插入序列,我没有这些序列的基因组坐标。如何将这些提交给dbVar?
如果您有新的插入序列数据,请先将其作为WGS项目。这将为所有新的插入序列提供唯一的标识符,然后可以对其进行跟踪。然后可以将数据提交给dbVar,这些新的插入序列可以引用从WGS提交中获得的序列标识符。有了稳定的序列标识符,我们可以将序列映射到更新的集合,并获得该序列的染色体上下文。
-
Variant Page的Variant Call Information表中的“Other Calls in this Sample”数量与我对同一研究和样本ID进行dbVar搜索时返回的变体数量不同。发生了什么?
变量页面上表格中的数字表示变量调用(SSV)。搜索研究和样本ID将返回变量区域(SV)。
-
dbVar如何将在一个程序集(例如GRCh37)上提交的数据放置在其他程序集(如GRCh38)上?
dbVar使用内部软件在程序集之间映射变量。基于人类的研究中报告的所有变体都会自动重新映射到GRCh37和GRCh38。
-
我如何提交给dbVar?
我们鼓励您通过完成我们提供的一个模板(Excel、制表符、XML)或通过VCF将数据提交给dbVar,并将其发送到dbvar@ncbi.nlm.nih.gov。请参阅dbVar提交信息了解更多信息。
-
我应该如何引用dbVar?
引用dbVar时请参考以下出版物:
Lappalainen I、Lopez J、Skipper L、Hefferon T、Spalding JD、Garner J、Chen C、Maguire M、Corbett M、Zhou G、Paschall J、Ananiev V、Flicek P、Church DM。DbVar和DGVa:基因组结构变异的公共档案。 核酸研究2013年1月;41(数据库问题):D936-41。doi:10.1093/nar/gks1213。Epub 2012年11月27日。PMID:23193291; PMCID:PMC3531204。
如果您希望引用特定提交的材料,请引用研究加入,例如。,nstd166型; 如果您希望引用特定变体,请引用变体区域或变体调用附件,例如。,新南威尔士州4136077或nssv15910013.