Variation Overview

Deanna Church; Stephen Sherry; Lon Phan; Minghong Ward; Melissa Landrum; Donna Maglott

NCBI书架。美国国立卫生研究院国家医学图书馆的一项服务。

NCBI手册[互联网]。第二版。贝塞斯达（医学博士）：美国国家生物技术信息中心；2013-.

本出版物仅供历史参考，信息可能已过时。

本出版物仅供历史参考，信息可能已过时。

NCBI手册[互联网]。第二版。

显示详细信息

<上一个下一步>

变体概述

迪安娜教堂，博士，斯蒂芬·雪莉，博士，Lon Phan公司，博士，明洪区，理学硕士，梅丽莎·朗德鲁姆、博士和唐娜·马格洛特，博士。

作者信息和附属机构

创建：2013年11月14日.

预计阅读时间：9分钟

范围

本章概述了美国国立生物技术信息中心的数据库以及可用于访问和使用这些数据的工具的摘要。本节中的资源特定章节提供了所有详细信息；本概述将这些章节联系在一起，并填补了尚未提供章节的空白。变体主页(http://www.ncbi.nlm.nih.gov/variation网站)是NCBI的门户网站，可访问与变体相关的数据库和工具。

历史

代表变化的主要数据库美国国立生物技术信息中心是数据库存档关于变异位置和类型的信息，即dbSNP用于小于约50个碱基对（bp）的变异，dbVar用于更长的变异，结构变化然后从NCBI的多个站点访问这些数据（例如，基因、核苷酸、，参考序列)或者通过在变异和多种表型之间建立联系，包括疾病名称、临床特征和基因表达（ClinVar、dbGaP和PheGenI公司). NCBI上的变更表示包括已收到提交的所有分类群。其范围为病毒将细菌病原体传染给人类。变异不一定是可遗传的；还介绍了在肿瘤或其他体细胞来源中观察到的序列变异。

尽管变异信息保存在不同的数据库中，但这些数据库中的表示正在标准化，以改进搜索、报告、评估和分析。例如，变异类型的表示（单核苷酸、插入、拷贝数增加），变异结果的表示（无意义、错义、，移帧)和功能后果(外显子损失）与序列本体中的术语一致(http://sequenceontology.org/). 随着2013年推出ClinVar，临床意义的标准化报告正从档案数据库转移到ClinVar。

dbSNP和短变差

排序项目的一个主要重点是识别差异并评估其后果。从1998年开始，国家生物技术信息中心(美国国立生物技术信息中心)建立了一个数据库，数据库SNP(http://www.ncbi.nlm.nih.gov/snp)，管理有关人类变异的信息。即使如此，数据库的范围也不限于存储有关单核苷酸多态性（SNP）的信息，而是接受所有类型变异的提交，不受等位基因频率.

从一开始，dbSNP就为每一个提交的变体分配了一个加入（提交的SNP公司或ss标识符）。对相同变异及其属性的多次提交进行整合，以创建参考记录（参考SNP或rs标识符。在特定人群中观察到的等位基因频率也可以接受，但不是必需的。

早期提交给dbSNP的绝大多数文件都支持人类基因组单体型图(http://hapmap.ncbi.nlm.nih.gov)并代表单核苷酸变异，根据次要基因的定义，这些变异确实具有多态性等位基因频率至少1%。因此，有一种常见的误解是，如果dbSNP中存在变异，那么它确实是一种多态性单核苷酸变化。

dbSNP继续支持面向不同用户的工具和报告，从人口遗传学家到医学遗传学家。例如美国国立生物技术信息中心Variation Viewer工具最近被完全重写，用于报告所有类型的人类变异。

dbVar和结构变化

数据库变量(网址：http://www.ncbi.nlm.nih.gov/dbvar)基因组档案信息结构变化来自提交给任何生物体的研究。一般来说，这些变体的长度超过50 bp。每个变量实例都分配了一个以nssv开头的标识符。同一位置的一个或多个变体实例被分配一个以nsv开头的标识符。此标识符标记基因组提交者定义为包含结构变化。变量区域指向一组样本变量实例，这些实例支持区域包含变量的断言。因为dbVar与DGVa交换数据(1)，对于实例和区域，某些记录可能具有以essv或esv开头的加入。

随着档案数据库（dbSNP和dbVar）的建立，越来越多的数据被生成，以利用这种变异来提高我们对种群遗传学的理解，识别基因组影响罕见和常见疾病，并确定变异对基因表达因此，最初存档所有这些数据的dbSNP开始剥离或与具有特定范围的研究合作。这些资源包括下表中的资源：

人类基因组单体型图	网址：www。hapmap.org网站; 现居住于美国国立生物技术信息中心	人口结构；连锁不平衡和共同变异块的识别
1000个基因组	国际项目；dbSNP和dbVar维护观察到变化的位置的标识符	了解更多明显健康个体群体的变异
基因型	无专用接口	维护基因型来自1000基因组和GO-ESP的信息。支持在1000基因组和变体视图浏览器中显示
PheGenI公司	网址：http://www.ncbi.nlm.nih.gov/gap/phegeni	用于查看的关联的界面表型普通变异
ClinVar公司	网址：http://www。ncbi.nlm.nih.gov/clinvar公司	医学上重要变异的解释历史

数据模型

存档提交内容

dbSNP和dbVar的一个主要功能是归档提交。因此，每个人都管理有关提交者、提交日期、生成数据的研究以及内容的信息。存档功能的一部分包括验证提交，例如确定数据是否与基因组为其提供了提交文件。这些档案由dbSNP附加、分配ss标识符，并由dbVar酌情分配nssv标识符。

ClinVar还存档提交的文件，即与健康状态相关的序列变化解释。这些提交的文件被分配了一个12个字符的附件，以字母SCV开头，后面是填充到9位的数字。如果提交者提交更新，则会为登录分配一个新版本。

综合数据

dbSNP在基因组和变化类型。此聚合的结果被分配给参考SNP（rs）标识符，通常用于在后续研究和出版物中引用该变体位置。必须强调的是，rs标识符并不表示某个位置的显式序列更改。换言之，一个rs被分配到基因组上存在单核苷酸变异的位置，即使在该位置观察到了所有4个核苷酸。

ClinVar根据变化和表型这些集合被指定为12个字符的登录，以字母RCV开头，后面是填充到9位的数字。如果更新了SCV或将新SCV添加到集合中，则会对RCV添加进行版本控制，并分配新版本。

解释数据

变体资源会计算存档信息的某些解释。例如，对于人类变体，dbSNP和dbVar确定变体的HGVS表示(http://www.ncbi.nlm.nih.gov/variation/hgvs网站). dbVar和ClinVar基于序列位置计算ISCN坐标；变异组根据美国国立生物技术信息中心注释发布。其他解释，如临床意义、变异的功能后果或关联结果仅在提交时表示。

访问

变体资源通过Web提供交互式访问，通过E-Utilities或其他基于应用程序的访问美国石油学会，数据提取文件传输协议传输和专门的下载。变体门户页面是发现感兴趣的变体信息的推荐起点。

相关工具

图1。

上引入变异相关资源的概述美国国立生物技术信息中心.

临床再映射

这个NCBI临床再映射服务投影位于参考SeqGene或LRG到装配，或从程序集到任何可用RefSeqGene或指定的目标RefSeqGeneres或LRG列表的坐标。

由于临床再映射服务接受BED、GVF、HGVS和VCF格式，因此它可以用于在更大的基因组背景下查看具有断言位置的新变体。查询时，Clinical Remap服务提供完整的映射报告，一个变体报告，显示映射到相同位置的已知dbSNP变体（包括具有预测结果或相关临床信息的变体），以及可用于进一步数据分析的注释数据报告和基因组工作台文件。

ClinVar公司

ClinVar公司是一个数据库它通过收集患者样本中发现的变异、对每个变异的临床断言以及支持特定变异的相关数据，来记录变异与其可能的表型之间的关系临床断言ClinVar数据库可用作获取变异体额外表型信息的网关，包括：

断言与变量关联的条件
支持特定的可用证据临床断言对于变体
临床意义的当前解释

ClinVar Summary和Individual Accession Reports到相关dbSNP记录的链接位于“Allele Description”部分SNP公司跟踪“序列视图”部分。

尽管参考SNP报告页面提供了临床意义的断言（如果可用），截至本文撰写之日，它们目前尚未链接到ClinVar记录。dbSNP预计未来会从rs报告页面与ClinVar建立交互链接。

dbGaP公司

dbGaP公司存档和分发研究数据，以检查表型和基因型这些研究包括全基因组关联研究（GWAS）、医学测序和分子诊断分析。dbGaP允许开放存取对于非敏感数据，包括研究文件、表型变量和基因型-表型分析，但对限制性数据的访问进行控制，包括系谱、预先计算的基因型/表型关联以及研究参与者的未确定表型和基因型。

dbGaP受控访问记录与dbSNP中的相关变化数据之间的链接可用，但dbSNP记录与dbGaP之间没有相互链接，因为dbGaP数据安全措施禁止从任何外部资源访问dbGaP个别级别的数据。这个参考SNP报告“关联”部分将链接到NHGRI_GWAS和/或PheGenI公司关联数据可用时。

dbMHC公司

dbMHC公司提供了一个平台，用户可以在该平台上访问、提交和编辑与人类主要组织相容性复合体（也称为人类白细胞抗原（人类白细胞抗原）。

dbMHC和dbSNP都存储定义特定人类白细胞抗原等位基因。dbMHC在单倍型而dbSNP在单倍型水平上提供了对相关dbMHC记录的访问。

基因

这个基因数据库是美国国立生物技术信息中心基因相关数据的资源。Gene提供了一个变异部分，当已知数据可用时，该部分提供了变异数据和工具的链接。

人类基因组单体型图

这个国际人类基因组单体型图计划该网站允许访问其统计相关变异目录，也被称为单倍型，适用于许多不同的人类群体，对于那些寻找与特定基因相关变异的研究人员来说，它是一个有用的资源。HapMap单倍型可以通过诸如参考SNP数字或基因符号，以及按序列区域或染色体区域。生成的HapMap报告包括一个表意图，其中包含可以更改以提供所需数据的各种轨迹，报告中的适当轨迹将提供到refSNP的直接链接集群记录。

表型基因积分器（PheGenI）

PheGenI公司允许研究人员使用临床或身体特征、基因名称、染色体位置或dbSNP ID编号（ss或rs）来搜索、查看或下载各种数据美国国立生物技术信息中心单个响应页面中的资源。如果可用，PheGenI搜索结果可以包括以下数据：

来自全基因组关联研究（GWAS）的相关关联结果，包括相关PubMed摘要的链接
相关dbGaP研究数据
相关表达定量性状位点(eQTL公司)数据
包含相关基因的注释表奥米姆链接
dbSNP变体注释表
的交互式视图基因组用搜索结果装饰

PheGenI公司可以使用位于参考SNP报告“关联”字段。如果记录没有相关的关联数据，则此链接将不可用。PheGenI也可通过“表型”部分顶部提供的链接从Gene访问，标记为审查eQTL公司和表型使用PheGenI在该区域的关联数据。

公共医学

公共医学可以访问尚未在特定数据库例如查询 http://www.ncbi.nlm.nih.gov/pubmed/？term=%28mutation网站[标题]+OR+变体[标题]%29+AND+新颖[标题]将检索标题中有突变或变异的文章，标题中有新颖的文章，甚至仅限于可获得免费全文的文章(http://www.ncbi.nlm.nih.gov/pubmed/？term=%28mutation网站[标题]+OR+变体[标题]%29+AND+新颖[标题]%20 AND%20%22无标题%20完整%20文本%22[sb]).

变更批提交（VarBatch）

变量批处理是一个基于电子表格的在线界面，便于提交和更新关于人类变异的信息，称为HGVS表达式。当通过VarBatch处理断言的临床变异时，将为其分配提交的dbSNPSNP公司（ss）加入以及ClinVar加入（格式：SCV00000000.0），因为ClinVar加入代表所声称的变化/表型关系。

变更报告器

变更报告器将提交的变体调用与中的变体匹配美国国立生物技术信息中心的数据库，并报告NCBI用于匹配变体的元数据。如果变体对NCBI来说是新的，并且该变体靠近NCBI注释的特征，则变体报告器将根据该注释特征的变化报告预测的分子结果。

变体查看器

变体查看器允许用户查看多种序列特征上下文中的变体，并将结果过滤到感兴趣的子集。用户可以选择装配; 在基因组; 上传本地数据以在可用内容的上下文中查看美国国立生物技术信息中心; 通过基因符号导航，外显子，rs，nssv加入，细胞遗传学条带；保留历史；并按变量类型、分子结果、次要筛选显示等位基因频率来自1000个基因组（1000个基因组MAF），来自GO-ESP的次要等位基因频率，以及在dbSNP、dbVar和ClinVar中的表现。序列显示基于NCBI的图形查看器，提供多轨迹选项，包括片段复制、同源区域、NCBI和Ensembl的注释发布、体细胞变体、常见变体、内含子特征的RNAseq支持和重复。轨迹选择旨在支持对感兴趣区域中的变化进行评估。

1000基因组浏览器

这个1000基因组浏览器提供对1000个基因组数据的访问，包括在参考文献GRCh37的上下文中的变异、基因型和序列读取比对装配1000基因组计划使用(2)用于分析。该浏览器允许您配置显示，以包括多个感兴趣的数据轨迹，并提供指向各种美国国立生物技术信息中心资源。1000基因组浏览器允许用户快速查看变异，等位基因按人群分组的频率或计数，以及对齐读取以支持对调用序列所用证据的审查。详细的说明书提供了有关如何使用浏览器的信息。

工具书类

1: Lappalainen I、Lopez J、Skipper L、Hefferon T、Spalding JD、Garner J、Chen C、Maguire M、Corbett M、Zhou G、Paschall J、Ananiev V、Flicek P、Church DM。DbVar和DGVa：基因组结构变异的公共档案。核酸研究。2013;41：D936–D941。[PMC免费文章：PMC3531204] [公共医学: 23193291]
2: 1000基因组项目联盟，Abecasis GR，Auton A，Brooks LD，DePristo MA，Durbin RM，Handsaker RE，Kang HM，Marth GT，McVean GA。1092人类基因组遗传变异综合图。自然。2012;491:56–65.[PMC免费文章：PMC3498066] [公共医学: 23128226]

书架编号：NBK169030