关于使用ClinVar的常见问题
请参阅我们提交的常见问题有关提交过程的问题。
如何搜索ClinVar
- 如何高效搜索ClinVar?
- 如何按位置顺序检索基因中的变体列表?
- 如何按基因特定顺序对结果进行排序?
- 如何从ClinVar检索批量数据?
- 我如何在一个位置找到其他变体,或者找到导致相同蛋白质变化的其他变体?
使用web显示
- SCV和RCV是什么意思?
- 为什么同一变体有不同的分类?
- 为什么在ClinVar中对同一变异体有多个RCV感染?
- 我对提交时带有“未指定”条件的变体感兴趣。这是什么意思?
- 如果ClinVar记录是“ 提供的标准, 单个提交者“但有多个提交?
- 我认为ClinVar中的变体分类错误。我该怎么办?
- 我在一张ClinVar唱片上看到了多个约会。它们是什么意思?
- 如何判断在创建月度VCF文件后,记录是否在ClinVar网站上公开?
- 当变异可能存在于多个基因中时,ClinVar报告了什么?
- ClinVar中的一个变体被描述为基因组DNA中的1-nt缺失,而mRNA中的60-nt缺失。这是一个错误吗?
- 我的浏览器不显示记录断言方法的pdf文件。我该怎么办?
数据源和处理
- ClinVar中包含哪些数据源?
- 为什么ClinVar记录中不包含HGMD标识符?
- 为什么ClinVar中的一些变体没有基因组位置?
- 是否为SCV记录中的任何更改分配了新版本号?
- 当一个基因有多个RefSeq时,ClinVar是否选择一个子集用于报告?
- 当有多个选项(左对齐或右对齐)时,ClinVar表示长度差异的变化位置的惯例是什么?
- 我在提交的材料中包括了个人的具体年龄和地理来源;为什么它们被报告为一个范围和更大的地理区域?
报告
- 为什么VCF文件不包含XML文件中的所有数据?
- 我在哪里可以找到有关ClinVar提交数量的统计数据?
- 在提交者摘要页面上,为什么提交的数量有时与该提交者的记录数量不同?
引用ClinVar
- 我应该如何在书面报告中引用ClinVar记录?
- 我应该如何引用ClinVar?
如何搜索ClinVar
1.如何高效搜索ClinVar?
如更详细的记录在这里,ClinVar可以使用以下术语进行搜索
注意,默认情况下,搜索使用提供的确切搜索词;例如,搜索“Noonan”可以找到包含单词Noonan的记录,但找不到包含单词“Noonan's”的记录。如果你想扩大搜索范围,可以考虑做一个通配符搜索,比如“Noonan*”。此外,ClinVar查询在默认情况下搜索数据的所有字段。有关如何通过搜索中的特定字段来缩小查询范围的详细信息,请参见ClinVar帮助文档。如果您有自己喜欢的定期查询,可以登录到MyNCBI公司并保存您的搜索。保存的搜索可以实时运行,也可以定期收到包含搜索结果的电子邮件更新。
2.如何按位置顺序检索基因中的变体列表?
您可以在ClinVar中搜索基因符号:
- 结果按提升基因组位置的顺序返回
- 染色体正链上基因的变异按升序排列
- 染色体负链上的基因变异按降序排列;目前,我们没有选项可以使这些变量按相反的顺序排序
- 使用页面右上角的“发送到”将结果保存到文件
或者您可以从FTP站点获取数据。你可以看看VCF文件或variant_summary.txt格式为感兴趣的基因归档,并按蛋白质位置解析蛋白质表达式以进行排序。
3.如何按基因特定顺序对结果进行排序?
当一个基因位于负链上时,相对于该基因的变异位置按照与基因组上位置相反的顺序排序。ClinVar表格显示的位置列是染色体的位置,因此排序似乎违反直觉。目前,我们没有提供按相反顺序排序的方法。
4.如何从ClinVar检索数据批次?
ClinVar目前不支持批处理查询界面,但仍有几种方法可以满足您的需求:
5.我如何在一个位置找到其他变体,或找到导致相同蛋白质变化的其他变体?
变体查看器建议根据位置进行搜索。从ClinVar记录中,单击右侧浏览器视图部分中的变体查看器链接。此浏览器显示感兴趣变体区域中ClinVar、dbSNP和dbVar的所有变体。可以使用蛋白HGVS表达,或通过查询基因符号和一个或三个字母的蛋白质变化来搜索导致相同蛋白质变化的其他变体。
使用web显示
1.SCV和RCV是什么意思?
阅读我们对ClinVar中标识符的描述,包括SCV和RCV编号。
2.为什么同一变体有不同的分类?
ClinVar是我们的提交者进行分类的档案。提交人可能不同意如何对变体进行分类;阅读更多关于ClinVar如何计算不同类型分类中的共识和冲突ClinVar不会仲裁和解决这些冲突。然而,如果我们从专家小组或专业协会提交了该变体,则会显示专家小组或职业协会的声明,而其他提交人的不同解释不会被报告为冲突。
对于不同条件下的相同变体,VCV记录也可能具有不同的分类。查看RCV记录可能有助于区分这些情况。有关更多信息,请参阅下一个问题。
3.为什么在ClinVar中对同一变异体有多个RCV输入?
在ClinVar中加入RCV是基于变异条件组合,而不仅仅是变异。选择这种代表性是为了将不同的材料分配给导致不同疾病的变体。每个提交的分类都分配了一个格式为SCV00000000.0的加入,如果提交者更新记录,则会进行版本控制(例如SCV00000001.1将更新为SCV000000001.2)。方差条件关系的每一个独特组合都被聚合为一个ClinVar记录,并加入格式为RCV00000000.0的记录。
临床遗传学一直存在的一个问题是,对于如何描述由已知疾病基因变异导致的临床状况缺乏共识。因此,我们认识到,对于可能被视为相同或重叠的条件,通常会有多个RCV品种分配给同一变体。我们预计,随着专家小组审查数据并决定如何描述情况,这种情况将随着时间的推移而改变。当更新产生匹配条件时,将合并RCV加入。
一些变体有不止一个RCV,因为该变体位于与不同疾病相关的基因中。例如,RYR1的变体可能对恶性热疗和中心核心肌病有不同的分类。
4.我对提交时带有“未指定”条件的变体感兴趣。这是什么意思?
一些提交者希望断言,变异对于特定条件而言是良性的,这就留下了它与不同条件在临床上相关的可能性。其他提交者希望报告该变异通常是良性的,因为它似乎不会导致任何应该观察到的遗传疾病,因为它具有高度渗透性。ClinVar与ClinGen项目的成员合作,要求提交者提供“未指定”作为条件,表示它们没有指定任何单一条件,而是表示变体通常是良性的。将来可能会重新评估此类提交中此术语的使用。
5.如果ClinVar记录是“提供的标准,单个提交者”,但有多个提交,这意味着什么?
“按单个提交人分类”的审查状态基于非专家小组提交的文件,其中包括分类、断言标准和变体分类证据。一些提交给ClinVar的文件缺乏断言标准、分类证据,或变体分类本身不太常见。这些提交包括在变体的提交计数中,但它们可能不会影响变体的审查状态。阅读有关ClinVar审核状态的更多信息.
6.我认为ClinVar中的变体分类错误。我该怎么办?
ClinVar数据库的目标是代表我们提交者提供的分类;因此,ClinVar工作人员无法更改提交给我们的分类。如果您认为ClinVar中的变体分类不正确,我们鼓励您提交自己的变体分类以及证据,例如最近的出版物。这个ClinVar提交向导可用于以最少的时间提交单变量分类。虽然您的提交不会改变其他提交者的分类,但它会改变总体分类,以表明存在相互冲突的致病性报告,用户应查看所有可用的证据。带有冲突的ClinVar记录也可能会提示以前的提交者或专家小组审查变体分类。
7.我在ClinVar记录中看到多个日期。它们是什么意思?
阅读我们的描述ClinVar记录上的日期.
8.我如何判断在创建月度VCF文件后,记录是否在ClinVar网站上公开?
ClinVar记录的左下方是一个名为“上次更新”的日期。如果此日期晚于VCF文件上的日期,则web显示的数据比VCF文件中的数据新。网站每周更新一次,而VCF文件则每月创建一次。
9.当变异影响多个基因时,ClinVar报告了什么?
有几种情况下,变异可能被认为与多个基因有关。所报告的一个或多个基因以及首选名称的选择如下:
提交身份: |
报告为 |
在cDNA上定位,有或没有识别基因 |
根据cDNA提交或计算的基因,以及根据该基因的cDNA参考标准计算的首选名称 |
基因组定位覆盖多个非重叠基因,无特定基因 |
基于最新的NCBI注释发布在该区域中计算的所有基因。优选的名称是没有基因符号的基因组HGVS表达。 |
覆盖多个重叠基因的基因组定位,包括具有共享外显子的基因 |
所有基因都有报道,但首选的描述是基于对应于外显子位置的RefSeq的选择。如果变异位于一个以上基因的外显子中,则首选描述将不包括基因符号,而仅基于基因组位置。 |
ClinVar中的一个变体被描述为基因组DNA中的1-nt缺失,而mRNA中的60-nt缺失。这是一个错误吗?
这种变异可能代表基因组DNA中的1-nt缺失,导致外显子跳跃,因此mRNA中的缺失更大。
11.我的浏览器不显示记录断言方法的文件。我该怎么办?
某些浏览器中的设置可能需要调整,以显示以pdf格式提供的文件。有几个选项可用于显示文件的内容:
- 使用FireFox。在编写本文时,.pdf文件显示起来没有困难。
-
下载文件,然后使用您自己的工具进行显示
- 右键单击断言方法的名称。
- 选择“将链接另存为…”并定义文件的保存位置
- 使用Acrobat Reader从保存文件的目录中读取文件。
-
更改插件的设置(Chrome)
- 连接到chrome://设置/内容
- 按照链接管理单个插件
- 这将打开chrome://插件
- 禁用Chrome PDF查看器
- 启用Adobe Reader
- 返回到chrome://设置/内容然后单击“完成”
-
查看兼容性设置(Internet Explorer)https://msdn.microsoft.com/en-us/library/dn321449.aspx
数据源和处理
1.ClinVar中包含哪些数据源?
在ClinVar主页上,单击页面顶部导航栏中的统计链接,然后单击“提交者列表”。这将带您查看ClinVar提交者的摘要。
2.为什么ClinVar记录中不包含HGMD标识符?
来自HGMD的等位基因信息尚未公开,因此ClinVar无法将变体准确连接到HGMD中的相应记录。
3.为什么ClinVar中的一些变体没有基因组位置?
ClinVar接受提交者提供的变体描述。我们相信,这有助于我们的公众找到记录,即使变种在定义序列上的位置可能不确定。在某些情况下,最初的测定是在蛋白质水平上进行的,并且该蛋白质的编号系统是不确定的,或者可能产生蛋白质变化的核苷酸变化是不确定的。在其他情况下,已经报道了相对于转录物的缺失,并且尚不清楚基因组中的核苷酸变化是由相应的基因组变化引起的,还是由另一个基因组位置产生的异常剪接引起的。许多提交的论文都有支持性引文,但ClinVar没有资源审查文献以确定准确的核苷酸位置。我们欢迎能够为我们改进这些数据的提交。
换言之,ClinVar确实将加入指定给描述人类变异的提交,而不是基于明确的公共核苷酸序列。在这种情况下,搜索结果表中没有显示变体的核苷酸位置,也没有向观众提供链接。如果确定了等位基因的位置,则更新记录。如果NCBI工作人员能够根据文献审查确定变体的位置,则可能不需要提交人重新提交。
4.是否为SCV记录中的任何更改分配了新版本号?
提交者对任何SCV记录所做的任何更改都会导致版本号增加。如果NCBI提供的数据发生变化,例如等位基因频率、额外的HGVS表达或某种疾病的MedGen ID,SCV版本号不会增加。NCBI提供的数据仅打包在VCV和RCV访问中,对这些数据的更改也不会导致VCV或RCV版本增加。如果存在新版本的SCV、删除SCV或将更多SCV聚合到VCV或RCV中,则会将新版本分配给VCV或RCV。
5.当一个基因有多个RefSeq时,ClinVar是否选择一个子集用于报告?
不,ClinVar报告了一个基因的所有RefSeq转录本上变体的位置。
6.当有多个选项(左对齐或右对齐)时,ClinVar用长度差异表示变化位置的约定是什么?
为了符合HGVS符号的约定,ClinVar将在最右边的位置表示序列变化的位置。然而,VCF的标准是POS坐标基于变量的最左侧可能位置因此,dbSNP rs号表示的位置可能位于HGVS符号表示的位置的左边。
7.我在提交的材料中包括了个人的具体年龄和地理来源;为什么它们被报告为一个范围和更大的地理区域?
基于可识别性的考虑,当提交个人的特定年龄时,ClinVar会将该年龄作为相应的十年进行报告。同样,小国被报告为较大的地理区域,例如哥斯达黎加被公开报告为中美洲。
报告
1.为什么VCF文件不包含XML文件中的所有数据?
ClinVar的VCF文件目前仅限于具有精确基因组位置的ClinVar变体。目前ClinVar的VCF文件中不包括启动和停止不精确的变异,如外显子缺失和微阵列检测到的CNV。
ClinVar VCF文件可以从ClinVar's ftp站点检索:
https://ftp.ncbi.nlm.nih.gov/pub/clinvar网址/
而且有有关README文件中VCF文件的更多信息.
2.我在哪里可以找到提交给ClinVar的人以及有关ClinVar提交数量的统计数据?
ClinVar报告全球统计ClinVar提交的提交数量、基因和变体。我们还提供了提交者列表,以及每个提交者的计数。请注意,变异是根据ClinVar数据模型表示的,因为变异是以可能有一个或多个成员的集合表示的。例如,在顺式是单个集合的成员,并且在统计数据中作为一个变体进行计数。
3.在提交者摘要页面上,为什么提交的数量有时与提交者的记录数量不同?
提交者页面上的提交数是该提交者提交的变体分类数。这可能包括提交相同变体但条件不同的文件。搜索该提交者时返回的记录数就是提交者报告的变体数。由于提交者可能报告了同一变体在不同条件下的多个分类,因此搜索结果中的变体数量可能小于提交者摘要页面上的提交数量。
引用ClinVar
1.我应该如何在书面报告中引用ClinVar记录?
ClinVar记录应附有登录号和版本号。重要的是要包括版本号,因为分类可能会随着时间而改变;版本号允许您区分以前的版本和当前的版本。如果您需要基于ClinVar登录构建URL,请注意以下说明构建到ClinVar的链接.
2.我应该如何引用ClinVar?
引用ClinVar的原始论文:
Landrum MJ、Lee JM、Riley GR、Jang W、Rubinstein WS、Church DM、Maglott DR.ClinVar:序列变异与人类表型之间关系的公共档案。核酸研究2014年1月1日;42(1):D980-5。doi:10.1093/nar/gkt1113。[公共医疗PMID:24234437]在ClinVar的介绍页面上找到ClinVar团队其他出版物的链接。
如果您希望引用特定提交的记录,请引用SCV的加入和版本。
如果您希望引用ClinVar总记录,请引用VCV或RCV分保和版本。