变体词汇表
本文件包括NCBI变体资源所用术语的定义和描述。它包括序列本体(SO)术语、变更报告术语和VCF文件标签的描述。
NCBI变体资源与欧洲生物信息学研究所(EBI)基于由序列本体(SO),尤其是树下的术语层序转换当NCBI所需的概念未在SO中表示时,我们会向SO请求这些概念。
词汇表术语
临床频道
用于指示向dbSNP提交临床变异的临床频道。它们包括来自基因座特异性数据库(LSDB)、基因检测实验室、我们与LRG公司,以及我们对OMIM公司的等位基因变体。它过去也适用于包括表型报告或因任何基因特异性管理过程而提交的提交。这一术语已被废弃,从未表示有医疗影响或临床意义。它被替换为指向的链接ClinVar公司以表明有关于变异的临床数据。
临床意义
临床意义是评估等位基因、单倍型或基因型对临床表型的影响。术语包括对致病性、风险和药物反应的解释。有关更多详细信息,请参阅ClinVar的临床意义。
ClinVar VCF文件
ClinVar生成的VCF格式的数据文件,用于报告与GRCh37和GRCh38对应的临床断言的人类变异。它们可在ClinVar FTP存储库中获得ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar公司/.
ClinVar VCF文件目前代表了已向ClinVar报告的具有精确终点的所有变体。
ClinVar VCF文件是等位基因特定的-每行代表该位置的一个等位基因,而不是dbSNP VCF文件中的每rs数一行。
通用
常见的是一类代表在生殖系中观察到的等位基因的变体,其等位基因频率较小(MAF公司)至少1000个基因组III期中>=0.01主要人口至少两个来自不同家庭的个体具有相同的次要等位基因。 COMMON是在dbSNP VCF文件.
常见的可能还包括具有医学意义的等位基因。 COMMON的定义可能仅基于主要人群中的一个人群。这些主要人群可能包括也可能不包括您正在研究的人群。A类n等位基因在一个主要人群中很常见可能并非在所有人群中都常见。
dbSNP VCF文件
由dbSNP生成的VCF格式的数据文件,用于报告没有临床断言的人类变异,这些变异已映射到GRCh37和GRCh38。它们在dbSNP FTP存储库中可用ftp://ftp.ncbi.nlm.nih.gov/snp/latest_release/VCF/.
数据库SNP人类VCF文件表示已提交给dbSNP的所有变体。
从头开始
从头开始是由于父母之一的生殖细胞发生突变,或在早期胚胎发生过程中受精卵自身发生突变,首次在一个家庭成员中出现的新变异。
NCBI变体资源报告变体属于从头开始起源于以下病例:(1)由提交者明确报告,(2)根据研究推断,因为尽管在父母身上没有观察到,但在先证者身体的所有组织中都观察到了。兄弟姐妹中发生的证据是不必要的,因为该事件可能没有发生在亲代生殖细胞中。假设出现变化从头开始是可以传播的。
筛选的VCF文件
VCF格式的数据文件包含根据某些标准过滤的变体子集,如每个染色体的变体。
功能后果
功能后果是序列变化对功能的观察结果。本体论,如VariO公司和序列本体(SO)用于标准化术语,记录如下:ftp://ftp.ncbi.nlm.nih.gov/pub/GTR/standard_terms/functional_consequence.txt。正如NCBI的资源所使用的那样,功能结果是通过实验确定的,而分子结果是通过序列注释计算的。
生殖系
用于表示变异来源,从而表示变异的遗传力的术语。在对父亲进行精子分析或植入前基因诊断(作为辅助生殖技术的一部分)的情况下,可以直接确认来源于父母生殖系。亲本体细胞组织的分析是直接证明变异起源于种系的一种可接受的替代方法。间接证据可以从兄弟姐妹中存在的变异或等位基因中获得,特别是如果变异在人群中罕见。变异资源报告称,当提交者明确报告变异源于种系,或相关研究根据对与遗传一致的系谱的观察推断变异源于种系时,变异源即为种系。
次要等位基因频率(MAF)
MAF是次要等位基因的频率。MAF通常是在1000基因组和其他大型测序项目确定的等位基因频率的背景下报告的。当有两个以上的llele时,MAF指第二最常见的等位基因。
分子后果
分子后果表示编码核苷酸序列的改变对蛋白质产品的影响。NCBI计算分子结果,并分配基于位置的本体术语由建立序列本体(SO)基于变异体相对于基因、RNA和/或编码区的位置。
每个转录物对蛋白质产品的影响
对于变异体部分或完全位于编码区内的每个RNA,我们将指定以下分子后果之一,作为序列变化对特定蛋白质产品的计算影响。
因为这些是分配的每个编码成绩单,单个变体可能具有多个相关的分子结果。
基于位置的本体术语
每当变体的删除间隔的任何部分(根据认为它们是序列上的删除和插入间隔对的变体的表示)与基因、RNA特征或编码区域之一重叠时,就会将基于位置的本体术语分配给变体(见下图)。如果变异体重叠于多个区域,或者如果涉及多个转录物(如该区域相对于基因组位置的情况),则报告所有相关的SO术语,没有特定的顺序。
躯体(起源)
在合子后产生的变异,因此并不存在于身体的所有细胞中。该术语不限于肿瘤过程中发生的躯体事件。NCBI变体资源将报告,当提交者明确报告变体是体细胞起源时,或者相关研究推断变异是体细胞来源,因为它是在体细胞子集中观察到的,没有证据表明在兄弟姐妹或父母中发生(即,观察结果与受精后变异的解释一致)。
我们将这个术语应用于生殖细胞中受精后产生的变体,这样传给后代就不会影响体细胞分类。
SPDI公司
NCBI开发的通用数据模型变更服务,将遗传变异表示为序列的四倍:位置:删除:插入(SPDI公司).
变量类型
变量类型是相对于参考序列报告的任何序列变化的类型。
变更服务
第套,共套程序这是为ClinVar开发的,用于比较和分组遗传变异。
有关NCBI中不同变体资源使用的INFO标记的描述,请参阅:
dbSNP中的VCF标记
重新设计的dbSNP中的VCF标记
有关NCBI变体资源中使用的可比较INFO标记的描述,请参阅:
可比较的VCF标签