什么是ClinVar?
ClinVar是一个可自由访问的公共档案,其中记录了针对疾病和药物反应分类的人类变异报告,并附有支持性证据。因此,ClinVar有助于获取和交流人类变异与观察条件之间的关系,以及这些断言的历史。ClinVar处理提交的报告,报告患者样本中发现的变体、疾病分类和药物反应、提交者信息以及其他支持数据。提交文件中描述的变体映射到参考序列,并根据HGVS标准进行报告。ClinVar在网站上为交互式用户提供数据,在FTP网站上以及通过API为那些希望在日常工作流和其他本地应用程序中以编程方式使用ClinVar的用户提供数据。ClinVar与相关组织合作,尽可能高效地满足医学遗传学界的需求。
ClinVar支持不同复杂程度的提交。提交文件可以简单地表示变体、疾病或药物反应的分类以及最少的证据(有时称为差异级别提交)。或者它可以是详细的,提供关于观察到变异的个体的结构化数据(总体或案例级)或关于变异影响的功能数据。一个主要目标是支持对变体分类的重新评估,并使关于变体和相关条件的知识不断发展。ClinVar是ClinGen项目的积极合作伙伴,通过公认的专家小组和实践指南提供者.ClinVar存档和版本提交,这意味着当提交者更新其记录时,会保留以前的版本以供审查。阅读有关向ClinVar提交数据的更多信息.
变异调用和分类的准确性的置信度在很大程度上取决于支持证据,因此,如果可用,这些信息将被收集并对用户可见。由于支持证据的可用性可能会有所不同,特别是在从已发表的文献中汇总的回顾性数据方面,档案馆接受来自多个群体的提交,并汇总相关信息,以透明地反映共识和相互矛盾的临床意义断言。审查状态也会分配给任何记录,以支持关于任何分类可信度的沟通。鼓励领域专家申请认证为专家小组.
每个提交的记录都会分配一个登录号,格式为SCV00000000.0。如果有多个提交的关于相同变化/条件对的记录,则会在ClinVar的数据流中进行汇总,并以RCV00000000.0格式作为参考加入进行报告。由于这种模式,每当报告一个变种的不同条件时,该变种将被纳入多个RCV品种。相同变更的提交记录也将汇总并报告为VCV00000000.0格式的加入。此聚合允许用户查看变体的所有提交数据,而不管其分类的条件如何。
ClinVar对提交的信息进行归档,并添加标识符和其他可能从其他公共资源获得的关于变体或条件的数据。然而,ClinVar既不策划提交的内容,也不修改独立于明确提交的分类。如果您的数据与ClinVar中当前的数据不同,我们鼓励您提交数据和支持您分类的证据。
如果您提交的变体被归类为NIH资助工作的一部分,请咨询您的项目官员,了解对提交给ClinVar的期望。
参考文献
有关ClinVar的更多信息,请参阅以下来源:
-
Landrum,M.J.、Chitipiiralla,S.、Brown,G.R.、Chen,C.、Gu,B.、Hart,J.、Hoffman,D.、Jang,W.、Kaur,K.、Liu,C.、Lyoshin,V.、Maddipatla,Z.、Maiti,R.、Mitchell,J.,O’Leary,N.、Riley,G.,Shi,W.,Zhou,G.、Schneider,V.,Maglott,D.、Holmes,J.B.、Kattman,B.L.ClinVar:数据访问改进。核酸研究2020;48(D1):D835-D844。doi:10.1093/nar/gkz972。[公共医疗PMID:31777943]
-
Landrum MJ,Kattman BL.ClinVar五年:兑现承诺。哼,变种。2018年11月;39(11):1623-1630. doi:10.1002/humu.23641。[公共医疗PMID:30311387]
-
Landrum MJ、Lee JM、Benson M、Brown GR、Chao C、Chitipiiralla S、Gu B、Hart J、Hoffman D、Jang W、Karapetyan K、Katz K、Liu C、Maddipatla Z、Malheiro A、McDaniel K、Ovetsky M、Riley G、Zhou G、Holmes JB、Kattman BL、Maglott DR.ClinVar:改进对不同解释和支持证据的获取。核酸研究2018年1月4日;46(D1):D1062-D1067。doi:10.1093/nar/gkx1153。[公共医疗PMID:29165669]
-
Landrum MJ、Lee JM、Benson M、Brown G、Chao C、Chitipiiralla S、Gu B、Hart J、Hoffman D、Hoover J、Jang W、Katz K、Ovetsky M、Riley G、Sethi A、Tully R、Villamarin-Salomon R、Rubinstein W、Maglott DR.ClinVar:临床相关变异解释的公共档案。核酸研究2016年1月4日;44(D1):D862-8。doi:10.1093/nar/gkv122。[公共医疗PMID:26582918]
-
Landrum MJ、Lee JM、Riley GR、Jang W、Rubinstein WS、Church DM、Maglott DR.ClinVar:序列变异与人类表型之间关系的公共档案。核酸研究2014年1月1日;42(1):D980-5。doi:10.1093/nar/gkt1113。[PubMed项目管理ID:24234437]
-
NCBI手册。梅丽莎·朗德鲁姆(Melissa Landrum)博士、詹妮弗·李(Jennifer Lee)博士、乔治·莱利(George Riley)博士、汪海·张(Wonhee Jang)博士、温迪·鲁宾斯坦(Wendy Rubinstein)博士、迪安娜·丘奇(Deanna Church)博士和唐娜·马格洛特(Donna Ma。临床变量。[书架编号:NBK174587]
范围
ClinVar接受基因组任何部分的变异,从单核苷酸变异和小插入/缺失到大拷贝数变异。变体必须能够映射到基因组。变异可分为孟德尔病、癌症或药物反应。
ClinVar目前包括通过多种数据收集方法确定的变体分类,包括临床测试、研究和文献报告(仅限文献)。请参见我们关于提交收集方法的文档了解更多详细信息。
ClinVar目前不包括来自GWAS研究的未经处理的数据集,尽管通过GWAS识别的变体以及单独处理以提供疾病分类的变体仍在范围内。
代表医学表型
ClinVar地图向MedGen提交了病况,MedGen根据UMLS、GeneReviews®、MeSH、Mondo和OMIM®等来源的遗传基础汇总了疾病名称。MedGen还包括人类表型本体(HPO)、OMIM®和其他来源的表型或临床特征。
表示变体
根据HGVS标准,人类变异是指相对于mRNA、基因组和蛋白质参考序列(如果合适)的序列变化。默认值为“c”以及任何蛋白质序列的改变。基因组序列以RefSeqGene/LRG坐标表示,以及染色体上的位置(作为版本化的材料和每个组件名称,如NCBI36/hg18和GRCh37/hg19)。NCBI的变体数据库(dbSNP和dbVar)中添加了新的变体。
表示变量和条件之间的关系
ClinVar旨在支持我们对变异与疾病或药物反应之间关系的不断理解。ClinVar通过聚合关于变异分类的信息,支持建立人类变异的临床有效性。
ClinVar记录包含以下元素:
ClinVar接入和版本
- 提交加入号/版本号,由分配给每个提交记录的十进制数(SCV00000000.0)分隔。
- 参考登录号/版本以十进制(RCV00000000.0)分隔,分配给关于相同变化/条件对的提交记录集。
- 变更登记号/版本以小数(VCV00000000.0)分隔,分配给关于相同变更的提交记录集。
每个变体或一组变体的标识符
- HGVS表达式
- 公布的等位基因名称
- 数据库标识符
每个条件的属性
- 姓名
- 数据库标识符
疾病或药物反应变体的分类
- 审查分类状态
- 分类提交人
- 分类-参见分类的完整文档
-
分类证据摘要
- 描述分类基本原理的自由文本摘要
- 变异个体数
- 变异个体的临床特征和其他数据
- 体外,生物信息学,或体内研究
- 测试或研究的描述
-
继承方式
- 引文,包括URL
- 提交人姓名
- 首次提交和更新的日期
- NCBI计算添加的数据,例如SCV加入
有关数据元素的详细描述,请参阅ClinVar数据字典.
表示变化和断言的证据
提交后,将存档支持变体分类的证据,以便用户和专家小组对证据进行深入审查。
代表性用例
位置搜索
临床医生、研究人员和其他用户搜索DNA或蛋白质位置,看看该位置的变体是如何分类的。
审查有关变更的证据
临床医生和研究人员审查了与变异体相关的疾病的证据,以便确定或重新评估变异体的致病性。明确报告任何冲突或不确定性。ClinVar不计算结论,只报告来自外部数据提交者的结论。
变体断言的处理
专家审查证据,为针对变体或变体集所做的断言指定适当的置信度,并提交专家审查的记录。
集成到测试人员的工作流程中
临床实验室将ClinVar提供的信息整合到其工作流程中,既提交变体分类,又使用可用信息对测试中识别的变体进行分类。
数据共享
ClinVar中存档的信息可供用户和组织免费使用,以确保医学遗传学社区的最广泛用途。为此,我们与提交者和其他档案馆合作,确保数据结构的设计能够促进数据交换,以便与愿意共享数据的组织双向共享。
属性对于识别变体分类的来源、促进沟通和给予提交者应有的信任非常重要。每个提交者都得到明确的认可,并提供更详细的提交者联系信息,以促进遗传学界的交流与合作。数据源可用于查询。
ClinVar的目标是共同努力,使档案能够代表最广泛的高质量变化/状况信息。不重复不必要的努力,而是尽可能公开整合,这符合社区的最大利益。
历史
2012年发布了ClinVar的初步视图,2013年4月首次公开发布。初始数据集包括OMIM®、GeneReviews®、一些特定于本地的数据库(LSDB)、贡献测试实验室等的变体。ClinVar积极参与ClinGen项目,从而改进了内容和内容的表示。ClinVar继续发展,以满足临床遗传学界的需求。
我们欢迎您的反馈。
ClinVar适应遗传学界的需求;我们邀请评论和回复,以帮助使此资源成为我们所有用户社区尽可能有效的工具。发送电子邮件至clinvar@ncbi.nlm.nih.gov。