美国国旗

美国政府的官方网站

ClinVar中的标识符

加入号码

ClinVar为其记录分配登录号。ClinVar中的加入数字有3个字母和9个数字的模式。这些字母是:

  • SCV(在ClinVar中提交的记录)
  • RCV(参考ClinVar记录-通过方差条件对聚合的数据)
  • VCV(变异ClinVar记录-按变异汇总的数据)

每个登录号都分配了一个版本号。

  • 当提交者更新记录时,SCV上的版本会增加。
    • 大多数更新涉及对数据的更改,例如分类或上次评估的日期。
    • 提交者可以更新或重新提交除提交日期外无数据更改的变体。这种更新也会导致版本更改。
  • 当记录的内容因添加、更新或删除其所基于的SCV访问而更改时,RCV或VCV上的版本将增加。
    • ClinVar工作人员编辑RCV和VCV记录上的数据,如rs数字和HGVS表达式,但这些更改不会导致版本更改。

SCV公司

Web显示

“SCV”是指分配给ClinVar中提交记录的加入编号的前3个字母,例如SCV000020145。

如果您根据该登录号向ClinVar提交查询,例如 SCV000020145年,您将被自动定向到包含该提交记录的VCV页面。SCV登录号和版本显示在其中一个提交部分中,视情况而定,可以是提交-日耳曼语或提交-索马里语。

XML版本

SCV登录在ClinVar XML文件中表示如下。

ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)

  • SCV加入/ClinicalAssertion/ClinVarAccession/@accession
  • SCV登录版本/ClinicalAssertion/ClinVarAccession/@版本

ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)

  • SCV加入/ClinVarAssertion/ClinVar加入/@Acc
  • SCV登录的版本/ClinVarAssertion/ClinVar登录/@版本

ClinVarVariation发布(https://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/clinvar_variation网站/)

  • SCV加入/ClinicalAssertion/ClinVarAccession/@accession
  • SCV登录版本/ClinicalAssertion/ClinVarAccession/@版本

ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)

  • SCV加入/ClinVarAssertion/ClinVar加入/@Acc
  • SCV登录的版本/ClinVarAssertion/ClinVar登录/@版本

请参阅README文件获取有关XML文件的更多信息。

tab_delimited目录中的文件

中有两个文件ftp站点上的tab分隔目录包含特定于已提交记录的信息。

  • 提交_摘要.txt.gz
    • 每个提交记录的当前版本中报告的分类、条件和观察结果概述
  • 摘要_冲突_解释.txt
    • 变体分类中的所有成对差异,不考虑条件

VCF文件

ClinVar的VCF文件中未报告SCV的加入。

RCV公司

Web显示

“RCV”是指ClinVar计算的前3封加入函,用于汇总所有提交的记录中相同变体和条件分类的信息。 

如果您根据RCV加入向ClinVar提交查询,例如 RCV000009910号,您将被引导到特定于该记录的页面。该记录的断言和证据详细信息部分列出了所有支持提交的记录及其SCV申请。

XML版本

RCV加入在ClinVar XML文件中表示如下。

ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)

  • RCV加入/RCVList/RCVAccession/@加入
  • RCV加入版本/RCVList/RCVAccession/@版本

ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)

  • RCV登录/ReferenceClinVarAssertion/ClinVarAccession/@Acc
  • RCV加入版本/ReferenceClinVarAssertion/ClinVarAccession/@版本

ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)

  • RCV加入//RCV列表/RCVAccession/@accession
  • RCV加入版本//RCVList/RCVAccession/@版本

ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)

  • RCV加入/ReferenceClinVarAssertion/ClinVarAccession/@Acc
  • RCV加入版本/ReferenceClinVarAssertion/ClinVarAccession/@版本

请参阅README文件有关我们的XML版本的更多信息。

tab_delimited目录中的文件

variant_summary包含一列RCVacession,其中列出了变体的RCV加入。

VCV(沃尔沃汽车公司)

Web显示

“VCV”是指ClinVar计算的前3个加入函,用于汇总来自相同变体分类的所有提交记录的信息。 

如果您根据VCV登录向ClinVar提交查询,例如 VCV000009325型,您将被定向到特定于该记录的页面。本页的提交资料-种姓和提交资料-躯体部分列出了所有支持提交的记录及其SCV申请。

XML发布

VCV加入在ClinVar XML文件中表示如下。

ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)

  • VCV加入//ClinVarVariationRelease/VariationArchive/@accession
  • VCV加入版本//ClinVarVariationRelease/VariationArchive/@版本

ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)

  • VCV加入//ReferenceClinVarAssertion/MeasureSet/@Acc
  • VCV加入版本//ReferenceClinVarAssertion/MeasureSet/@版本

ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)

  • VCV登录//ClinVarVariationRelease/VariationArchive/@登录
  • VCV加入版本//ClinVarVariationRelease/VariationArchive/@版本

ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)

  • VCV加入//ReferenceClinVarAssertion/MeasureSet/@Acc
  • VCV加入版本//ReferenceClinVarAssertion/MeasureSet/@版本

请参阅README文件获取有关XML文件的更多信息。

tab_delimited目录中的VCF和文件

VCF文件或任何制表符分隔的文件中都不会报告VCV加入。请注意,VCV登录号是使用变体ID和前缀VCV以及等于九位数字的零数构造的。因此,可以使用变体ID代替VCV登录号;它在ID列的VCF文件和以下以tab分隔的文件中报告:

  • variant_summary.txt格式
  • 变量转换.txt
  • 摘要_冲突_解释.txt
  • hgvs4变量.txt.gz
  • variation_allele.txt变量
  • 提交摘要.txt

请参阅README文件有关制表符分隔文件的更多信息。

ClinVar特有的标识符

变体ID

ClinVar为每个设置提交的记录中描述的变体。ClinVar中提交的大多数记录用于单个变体的分类,即使集合中只有一个变体,也会分配变体ID。

变体ID有两个子类:

  • 对于直接分类(分类)的变体
  • 对于仅分类为包含在较大变体集合中的变体(包括)

ClinVar中的大多数变体ID都是针对分类变体的,这意味着它们是提交记录的重点,该变体的分类由提交者提供。然而,有提交的记录描述了复合杂合子、单倍体或二倍体,ClinVar尚未收到对每个个体变异分类的独立提交。较大集合中的单个变体(但没有直接分类)由“included”类的变体ID表示。

请注意以下示例变更ID 561,表示具有三个变体的单倍型。单倍型中的两个变体,通道ID38382和15600,在ClinVar中没有直接对该变体进行分类的提交记录,因此这些变体中的每一个都被视为“包含”。单倍型中的第三个变异体Allele ID 38381确实提交了直接对变异体进行分类的记录,因此它被视为分类变异体。分配给每个单独变体的变体ID(分别为242755、242821、242756)可以在名为ClinVarVCV释放酶.Allele ID和Variation ID之间的对应关系见variation_allele.txt变量.

Web显示

变体ID用于锚定ClinVar的VCV页面,该页面用于设置变体(尽管大多数集合中只有一个变体)。以变体ID 561为例。

  • URL中的值561https://www.ncbi.nlm.nih.gov/clinvar/variation/561/是变体ID。
  • 值561已分配给Allele(s)部分中报告的3个不同的简单变体集。
  • 变体ID也会明确显示在VCV页面上。

XML文件

变体ID在ClinVar XML文件中表示如下。

ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)

  • /变体档案/@VariationID
  • /SimpleAllele/@VariationID
  • /单倍体/@VariationID
  • /基因型/@VariationID

ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)

  • //度量集/@ID

ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)

  • /变体档案/@VariationID
  • /SimpleAllele/@VariationID
  • /单倍体/@VariationID
  • /基因型/@VariationID

ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)

  • //测量集/@ID

中的报告tab_delimited目录

在tab-delimited目录中有多个文件引用变体ID。包含这些值的列被清楚地标记。报告VariationID和AlleleID之间关系的文件是variation_allele.txt.gz。

  • variant_summary.txt格式
  • 变量转换.txt
  • 摘要_冲突_解释.txt
  • hgvs4变量.txt.gz
  • variation_allele.txt变量
  • submission_summary.txt

VCF文件

变体ID在VCF文件中报告为ID,位于第3列。

通道ID

一个唯一的整数标识符Allele ID被分配给ClinVar中的每个单独变量。描述了通道ID和变体ID的编号系统在上面重叠,因此重要的是要注意任何整数标识符的上下文。

XML发布

Allele ID在ClinVar XML文件中表示如下。

ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)

  • /SimpleAllele/@ID
  • /单倍型/@ID
  • /基因型/@ID

ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)

  • //测量/@ID

ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)

  • /SimpleAllele/@ID
  • /单倍型/@ID
  • /基因型/@ID

ClinVarFull发布

  • //测量/@ID

tab_delimited目录中的文件

tab-delimited目录中有多个文件引用了Allele ID。包含Allele标识的列已明确标记。报告VariationID和AlleleID之间关系的文件是variation_allele.txt.gz。

  • 等位基因.txt
  • 交叉引用.txt
  • hgvs4变量txt.gz
  • 方差_汇总.txt.gz
  • 变量转换.txt
  • 变量allele.txt.gz

VCF文件

通道ID在VCF文件中报告为ALLELEID INFO标记。

变异ID和等位基因ID之间的关系

变体ID表示一个或多个通道ID。任何等位基因ID都可能是一组或多组离散变体的组成部分(也称为变体ID)。例如,考虑一份提交文件具有单核苷酸变体的分类(等位基因ID n,分配的变体ID a),以及一份不同的提交文件具有相同单核苷酸变体(等位蛋白ID n)与不同单核苷酸变体组合的分类(等等位基因ID m),该组合被分配变异ID b。变异ID和等位基因ID之间的对应关系在变量allele.txt.gz.

要查找由变体ID表示的所有通道ID,请尝试以下操作

zcat variation_allele.txt.gz | awk'$1==561{print}'

它查找第一列中的值(变体ID)为561的所有行,并报告561对应于具有分类的单倍型(第4列中为yes),Allele ID位于第3列。

561单倍型15600是561单倍型38381是561单倍型38382是

要查找由Allele ID表示的所有变体ID,请尝试以下操作

zcat variation_allele.txt.gz | awk'$3==15600{print}'

它查找第三列中的值(Allele ID)为15600的所有行,并报告15600是具有分类的单倍型的一部分(第4列中为yes),还由变体ID 242821表示(具有单个变体的集合),该变体在ClinVar中没有分类。

561单倍型15600是242821变型15600号

ClinVar XML文件中的其他标识符

ClinVar的XML文件报告除MeasureSet和Measure之外的多个元素的整数@ID值。这些值对应于ClinVar用于表示数据的关系数据库表中使用的唯一键。目前,这些值可用于识别从一个报告到另一个报告的任何元素,例如//Trait/@ID,但ClinVar不将这些视为公共标识符,并保留更改编号系统的权利。

特定于其他NCBI资源的标识符

ClinVar维护其他NCBI资源的多个标识符。其中包括BookShelf、dbSNP、dbVar、Gene、MedGen的CUI、PubMed和PubMedCentral。

  • 在XML中,这些在XRef元素中报告。
  • 在tab-delimited目录中,这些报告在
    • 交叉引用.txt
    • 变量转换.txt

特定于NCBI以外资源的标识符

ClinVar维护NCBI外部资源的多个标识符。

  • 在XML中,这些在XRef元素中报告。
  • 在以tab分隔的目录中,这些内容在
    • 交叉引用.txt
    • 变量转换.txt
  • 在主clinvar目录中,gene_condition_source_id报告clinvar、gene、GTR和MedGen中使用的基因-疾病关系

上次更新时间:2024-04-04T22:45:07Z