ClinVar中的标识符
加入号码
ClinVar为其记录分配登录号。ClinVar中的加入数字有3个字母和9个数字的模式。这些字母是:
- SCV(在ClinVar中提交的记录)
- RCV(参考ClinVar记录-通过方差条件对聚合的数据)
- VCV(变异ClinVar记录-按变异汇总的数据)
每个登录号都分配了一个版本号。
- 当提交者更新记录时,SCV上的版本会增加。
- 大多数更新涉及对数据的更改,例如分类或上次评估的日期。
- 提交者可以更新或重新提交除提交日期外无数据更改的变体。这种更新也会导致版本更改。
- 当记录的内容因添加、更新或删除其所基于的SCV访问而更改时,RCV或VCV上的版本将增加。
- ClinVar工作人员编辑RCV和VCV记录上的数据,如rs数字和HGVS表达式,但这些更改不会导致版本更改。
SCV公司
Web显示
“SCV”是指分配给ClinVar中提交记录的加入编号的前3个字母,例如SCV000020145。
如果您根据该登录号向ClinVar提交查询,例如 SCV000020145年,您将被自动定向到包含该提交记录的VCV页面。SCV登录号和版本显示在其中一个提交部分中,视情况而定,可以是提交-日耳曼语或提交-索马里语。
XML版本
SCV登录在ClinVar XML文件中表示如下。
ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)
- SCV加入/ClinicalAssertion/ClinVarAccession/@accession
- SCV登录版本/ClinicalAssertion/ClinVarAccession/@版本
ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)
- SCV加入/ClinVarAssertion/ClinVar加入/@Acc
- SCV登录的版本/ClinVarAssertion/ClinVar登录/@版本
ClinVarVariation发布(https://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/clinvar_variation网站/)
- SCV加入/ClinicalAssertion/ClinVarAccession/@accession
- SCV登录版本/ClinicalAssertion/ClinVarAccession/@版本
ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)
- SCV加入/ClinVarAssertion/ClinVar加入/@Acc
- SCV登录的版本/ClinVarAssertion/ClinVar登录/@版本
请参阅README文件获取有关XML文件的更多信息。
tab_delimited目录中的文件
中有两个文件ftp站点上的tab分隔目录包含特定于已提交记录的信息。
- 提交_摘要.txt.gz
- 每个提交记录的当前版本中报告的分类、条件和观察结果概述
- 摘要_冲突_解释.txt
VCF文件
ClinVar的VCF文件中未报告SCV的加入。
RCV公司
Web显示
“RCV”是指ClinVar计算的前3封加入函,用于汇总所有提交的记录中相同变体和条件分类的信息。
如果您根据RCV加入向ClinVar提交查询,例如 RCV000009910号,您将被引导到特定于该记录的页面。该记录的断言和证据详细信息部分列出了所有支持提交的记录及其SCV申请。
XML版本
RCV加入在ClinVar XML文件中表示如下。
ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)
- RCV加入/RCVList/RCVAccession/@加入
- RCV加入版本/RCVList/RCVAccession/@版本
ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)
- RCV登录/ReferenceClinVarAssertion/ClinVarAccession/@Acc
- RCV加入版本/ReferenceClinVarAssertion/ClinVarAccession/@版本
ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)
- RCV加入//RCV列表/RCVAccession/@accession
- RCV加入版本//RCVList/RCVAccession/@版本
ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)
- RCV加入/ReferenceClinVarAssertion/ClinVarAccession/@Acc
- RCV加入版本/ReferenceClinVarAssertion/ClinVarAccession/@版本
请参阅README文件有关我们的XML版本的更多信息。
tab_delimited目录中的文件
variant_summary包含一列RCVacession,其中列出了变体的RCV加入。
VCV(沃尔沃汽车公司)
Web显示
“VCV”是指ClinVar计算的前3个加入函,用于汇总来自相同变体分类的所有提交记录的信息。
如果您根据VCV登录向ClinVar提交查询,例如 VCV000009325型,您将被定向到特定于该记录的页面。本页的提交资料-种姓和提交资料-躯体部分列出了所有支持提交的记录及其SCV申请。
XML发布
VCV加入在ClinVar XML文件中表示如下。
ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)
- VCV加入//ClinVarVariationRelease/VariationArchive/@accession
- VCV加入版本//ClinVarVariationRelease/VariationArchive/@版本
ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)
- VCV加入//ReferenceClinVarAssertion/MeasureSet/@Acc
- VCV加入版本//ReferenceClinVarAssertion/MeasureSet/@版本
ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)
- VCV登录//ClinVarVariationRelease/VariationArchive/@登录
- VCV加入版本//ClinVarVariationRelease/VariationArchive/@版本
ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)
- VCV加入//ReferenceClinVarAssertion/MeasureSet/@Acc
- VCV加入版本//ReferenceClinVarAssertion/MeasureSet/@版本
请参阅README文件获取有关XML文件的更多信息。
tab_delimited目录中的VCF和文件
VCF文件或任何制表符分隔的文件中都不会报告VCV加入。请注意,VCV登录号是使用变体ID和前缀VCV以及等于九位数字的零数构造的。因此,可以使用变体ID代替VCV登录号;它在ID列的VCF文件和以下以tab分隔的文件中报告:
- variant_summary.txt格式
- 变量转换.txt
- 摘要_冲突_解释.txt
- hgvs4变量.txt.gz
- variation_allele.txt变量
- 提交摘要.txt
请参阅README文件有关制表符分隔文件的更多信息。
ClinVar特有的标识符
变体ID
ClinVar为每个设置提交的记录中描述的变体。ClinVar中提交的大多数记录用于单个变体的分类,即使集合中只有一个变体,也会分配变体ID。
变体ID有两个子类:
- 对于直接分类(分类)的变体
- 对于仅分类为包含在较大变体集合中的变体(包括)
ClinVar中的大多数变体ID都是针对分类变体的,这意味着它们是提交记录的重点,该变体的分类由提交者提供。然而,有提交的记录描述了复合杂合子、单倍体或二倍体,ClinVar尚未收到对每个个体变异分类的独立提交。较大集合中的单个变体(但没有直接分类)由“included”类的变体ID表示。
请注意以下示例变更ID 561,表示具有三个变体的单倍型。单倍型中的两个变体,通道ID38382和15600,在ClinVar中没有直接对该变体进行分类的提交记录,因此这些变体中的每一个都被视为“包含”。单倍型中的第三个变异体Allele ID 38381确实提交了直接对变异体进行分类的记录,因此它被视为分类变异体。分配给每个单独变体的变体ID(分别为242755、242821、242756)可以在名为ClinVarVCV释放酶.Allele ID和Variation ID之间的对应关系见variation_allele.txt变量.
Web显示
变体ID用于锚定ClinVar的VCV页面,该页面用于设置变体(尽管大多数集合中只有一个变体)。以变体ID 561为例。
- URL中的值561https://www.ncbi.nlm.nih.gov/clinvar/variation/561/是变体ID。
- 值561已分配给Allele(s)部分中报告的3个不同的简单变体集。
- 变体ID也会明确显示在VCV页面上。
XML文件
变体ID在ClinVar XML文件中表示如下。
ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)
- /变体档案/@VariationID
- /SimpleAllele/@VariationID
- /单倍体/@VariationID
- /基因型/@VariationID
ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)
ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)
- /变体档案/@VariationID
- /SimpleAllele/@VariationID
- /单倍体/@VariationID
- /基因型/@VariationID
ClinVarFull发布(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_xml_old_format/)
在tab-delimited目录中有多个文件引用变体ID。包含这些值的列被清楚地标记。报告VariationID和AlleleID之间关系的文件是variation_allele.txt.gz。
- variant_summary.txt格式
- 变量转换.txt
- 摘要_冲突_解释.txt
- hgvs4变量.txt.gz
- variation_allele.txt变量
- submission_summary.txt
VCF文件
变体ID在VCF文件中报告为ID,位于第3列。
通道ID
一个唯一的整数标识符Allele ID被分配给ClinVar中的每个单独变量。描述了通道ID和变体ID的编号系统在上面重叠,因此重要的是要注意任何整数标识符的上下文。
XML发布
Allele ID在ClinVar XML文件中表示如下。
ClinVarVCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/)
- /SimpleAllele/@ID
- /单倍型/@ID
- /基因型/@ID
ClinVarRCV释放(ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/RCV_release/)
ClinVarVariation发布(ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/VCV_xml_old_format(文件格式)/)
- /SimpleAllele/@ID
- /单倍型/@ID
- /基因型/@ID
ClinVarFull发布
tab_delimited目录中的文件
tab-delimited目录中有多个文件引用了Allele ID。包含Allele标识的列已明确标记。报告VariationID和AlleleID之间关系的文件是variation_allele.txt.gz。
- 等位基因.txt
- 交叉引用.txt
- hgvs4变量txt.gz
- 方差_汇总.txt.gz
- 变量转换.txt
- 变量allele.txt.gz
VCF文件
通道ID在VCF文件中报告为ALLELEID INFO标记。
变异ID和等位基因ID之间的关系
变体ID表示一个或多个通道ID。任何等位基因ID都可能是一组或多组离散变体的组成部分(也称为变体ID)。例如,考虑一份提交文件具有单核苷酸变体的分类(等位基因ID n,分配的变体ID a),以及一份不同的提交文件具有相同单核苷酸变体(等位蛋白ID n)与不同单核苷酸变体组合的分类(等等位基因ID m),该组合被分配变异ID b。变异ID和等位基因ID之间的对应关系在变量allele.txt.gz.
要查找由变体ID表示的所有通道ID,请尝试以下操作
zcat variation_allele.txt.gz | awk'$1==561{print}'
它查找第一列中的值(变体ID)为561的所有行,并报告561对应于具有分类的单倍型(第4列中为yes),Allele ID位于第3列。
561单倍型15600是561单倍型38381是561单倍型38382是
要查找由Allele ID表示的所有变体ID,请尝试以下操作
zcat variation_allele.txt.gz | awk'$3==15600{print}'
它查找第三列中的值(Allele ID)为15600的所有行,并报告15600是具有分类的单倍型的一部分(第4列中为yes),还由变体ID 242821表示(具有单个变体的集合),该变体在ClinVar中没有分类。
561单倍型15600是242821变型15600号
ClinVar XML文件中的其他标识符
ClinVar的XML文件报告除MeasureSet和Measure之外的多个元素的整数@ID值。这些值对应于ClinVar用于表示数据的关系数据库表中使用的唯一键。目前,这些值可用于识别从一个报告到另一个报告的任何元素,例如//Trait/@ID,但ClinVar不将这些视为公共标识符,并保留更改编号系统的权利。
特定于其他NCBI资源的标识符
ClinVar维护其他NCBI资源的多个标识符。其中包括BookShelf、dbSNP、dbVar、Gene、MedGen的CUI、PubMed和PubMedCentral。
- 在XML中,这些在XRef元素中报告。
- 在tab-delimited目录中,这些报告在
特定于NCBI以外资源的标识符
ClinVar维护NCBI外部资源的多个标识符。
- 在XML中,这些在XRef元素中报告。
- 在以tab分隔的目录中,这些内容在
- 在主clinvar目录中,gene_condition_source_id报告clinvar、gene、GTR和MedGen中使用的基因-疾病关系