跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2020年3月1日;36(6):1902-1907.
doi:10.1093/bioinformatics/btz856。

SPDI:NCBI变体和应用的数据模型

附属公司

SPDI:NCBI变体和应用的数据模型

J布拉德利·霍姆斯等。 生物信息学. .

摘要

动机:将参考序列变异标准化,将其投影到一致序列中,并聚合其不同的表示,对于阐明疾病和生物功能的遗传基础至关重要。变量调用方、本地数据库和工具之间的变量表示不一致,导致差异,使分析复杂化。NCBI的遗传变异资源dbSNP和ClinVar需要一套稳健、可扩展的原则来管理断言的序列变异。

结果:SPDI数据模型将变体定义为四个属性的序列:序列、位置、缺失和插入,并可应用于核苷酸和蛋白质变体。NCBI web服务在HGVS、VCF和SPDI之间转换表示,并提供两个函数来聚合变体。一种是基于NCBI变量超精度校正算法,返回一种称为“上下文等位基因”的唯一规范化表示。SPDI数据模型有四种操作,它精确定义了受变体影响的参考子序列,即使是在重复区域,例如均聚物和其他序列重复。第二个函数跨同余序列投影变体,并依赖于非汇编NCBI RefSeq序列(前缀为NM、NR和NG)以及组间和组内相关基因组序列(NC、NT和NW)的比对数据集,支持跨同余顺序和汇编版本的变体稳健投影。变体被投射到所有一致的上下文Alleles。其中一个上下文等位基因,通常是基于最新组装版本的等位基因代表整个集合,被指定为唯一的“规范等位基因”,并直接用于聚合同余序列中的变体。

可用性和实施:SPDI服务可在以下地址开放访问:https://api.ncbi.nlm.nih.gov/variation/v0。

补充信息:补充数据可在生物信息学网站上获得。

PubMed免责声明

数字

图1。
图1。
对于rs756655831,表示各种序列之间的比对以及产生的SPDI。值得注意的是,该RefSNP映射到两个RefSeqGenes(TBCE NG_009230.1和B3GALNT2,NG_033219.2)。每一个都有自己的一组转录本,其中所有当前转录本都与GRCh38染色体序列NC_000001.11对齐。所有以前的版本仅与序列的当前版本对齐。NW_014040927.1是1号染色体的一个新补丁,仅与一个RefSeqGene对齐,但与所有转录本对齐。带有红色轮廓的位置是这组变体的标准表示,它允许将任何序列上的提交组合在一起
图2。
图2。
以下示例(A类)反向和(B类)对齐特殊情况下的索引。坐标是两个虚构的同余序列的基于0的跨基坐标。(A) 对于反向定位,染色体的边界85对应于基因的边界28。但是,核苷酸85与核苷酸27对齐。为了调整方向的变化,必须将其增加一。(B) 在某些情况下,indels存在于一个序列中,而不是另一个序列。仅重新映射间隔可能不会返回任何结果,因为它会重新映射为间隙。在本例中,NC_1.1和NC_1.2指的是同一染色体序列的序列版本,而不是两条不同的染色体。有关其他重新映射示例,请参见补充图S2
图3。
图3。
(A类)前一个dbSNP Build中42个RefSNP的示例集(B类)现在在新的分布式dbSNP构建中合并为一个(rs55883101),该构建使用SPDI和VOCA,减少了序列上注释的RefSNP数量。SNP轨迹着色方案已在两条轨迹之间更新,但在这两种情况下,SNV都是红色的。在(A)中,删除是蓝色的,带有向下的三角形,在(B)中,是紫色的,带有往下的三角形。*和†(A)中的标记变体是两对相同的等位基因

类似文章

  • 临床变异:临床相关变异解释的公共档案。
    Landrum MJ、Lee JM、Benson M、Brown G、Chao C、Chitipiralla S、Gu B、Hart J、Hoffman D、Hoover J、Jang W、Katz K、Ovetsky M、Riley G、Sethi A、Tully R、Villamarin-Salomon R、Rubinstein W、Maglott DR。 Landrum MJ等人。 核酸研究2016年1月4日;44(D1):D862-8。doi:10.1093/nar/gkv1222。Epub 2015年11月17日。 2016年核酸研究。 PMID:26582918 免费PMC文章。
  • ClinVar:序列变异和人类表型之间关系的公共档案。
    Landrum MJ、Lee JM、Riley GR、Jang W、Rubinstein WS、Church DM、Maglott DR。 Landrum MJ等人。 核酸研究,2014年1月;42(数据库问题):D980-5。doi:10.1093/nar/gkt1113。Epub 2013年11月14日。 核酸研究2014。 PMID:24234437 免费PMC文章。
  • 基因:NCBI以基因为中心的信息资源。
    Brown GR、Hem V、Katz KS、Ovetsky M、Wallin C、Ermolaeva O、Tolstoy I、Tatusova T、Pruitt KD、Maglott DR、Murphy TD。 Brown GR等人。 核酸研究,2015年1月;43(数据库问题):D36-42。doi:10.1093/nar/gku1055。Epub 2014年10月29日。 2015年核酸研究。 PMID:25355515 免费PMC文章。
  • Entrez Gene:NCBI以基因为中心的信息。
    Maglott D、Ostell J、Pruitt KD、Tatusova T。 Maglott D等人。 《核酸研究》,2005年1月1日;33(数据库问题):D54-8。doi:10.1093/nar/gki031。 核酸研究,2005。 PMID:15608257 免费PMC文章。 已更新。
  • 小鼠等位基因和转基因符号:确保命名独特、简洁和信息丰富。
    明尼苏达州佩里,加利福尼亚州史密斯。 Perry MN等人。 哺乳动物基因组。2022年3月;33(1):108-119. doi:10.1007/s00335-021-09902-3。Epub 2021年8月14日。 哺乳动物基因组。2022 PMID:34389871 免费PMC文章。 审查。

引用人

  • vcfdist:准确地对人类基因组中的阶段性小变异调用进行基准测试。
    Dunn T,Narayanasamy S。 Dunn T等人。 国家公社。2023年12月9日;14(1):8149. doi:10.1038/s41467-023-43876-x。 国家公社。2023 PMID:38071244 免费PMC文章。
  • 基因同步第5阶段:用于共享动态注释的FHIR格式基因组变体的可计算工件。
    Dolin R、Heale BSE、Gupta R、Alvarez C、Aronson J、Boxwala A、Gothi SR、Husami A、Shalaby J、Babb L、Wagner A、Chamala S。 Dolin R等人。 学习健康系统。2023年8月30日;7(4):e10385。doi:10.1002/lrh2.10385。eCollection 2023年10月。 学习健康系统。2023 PMID:37860057 免费PMC文章。
  • 自动化HL7v2 LRI信息学框架,用于简化基因组-EHR数据集成。
    Dolin RH、Gupta R、Newsom K、Heale BSE、Gothi S、Starostik P、Chamala S。 Dolin RH等人。 J病理信息。2023年8月15日;14:100330. doi:10.1016/j.jpi.2023.100330。eCollection 2023年。 J病理信息。2023 PMID:37719179 免费PMC文章。
  • 变异效应多重分析报告的最低信息和指南。
    Claussnitzer M、Parikh VN、Wagner AH、Arbesfeld JA、Bult CJ、Firth HV、Muffley LA、Nguyen Ba AN、Riehle K、Roth FP、Tabet D、Bolognesi B、Glazer AM、Rubin AF。 Claussnitzer M等人。 ArXiv[预打印]。2023年6月26日:arXiv:2306.15113v1。 ArXiv公司。2023 PMID:37426450 免费PMC文章。 预打印。
  • GA4GH酚包:实用介绍。
    Ladewig MS、Jacobsen JOB、Wagner AH、Danis D、El Kassaby B、Gargano M、Groza T、Baudis M、Steinhaus R、Seelow D、Bechrakis NE、Mungall CJ、Schofield PN、Elemento O、Smith L、McMurry JA、Munoz-Torres M、Haendel MA、Robinson PN。 Ladewig MS等人。 Adv Genet(霍博肯)。2022年8月25日;4(1):2200016。doi:10.1002/ggn2.202200016。电子收款2023年3月。 Adv Genet(霍博肯)。2022 PMID:36910590 免费PMC文章。

工具书类

    1. Altschul S.F.等人(1990)基本局部对齐搜索工具。分子生物学杂志。,215, 403–410.-公共医学
    1. Assmus J.等人(2013)等效索引——数据库中的模糊函数类和冗余。公共科学图书馆One,8,e62803。-项目管理咨询公司-公共医学
    1. Carter T.C.,He M.M.(2016)为精确医学确定临床可操作的遗传变异的挑战。J.健康。工程,2016年1月。-项目管理咨询公司-公共医学
    1. Danecek P.等人(2011年)《变量调用格式和VCFtools》。生物信息学,27,2156–2158。-项目管理咨询公司-公共医学
    1. Deans Z.C.et al.(2016)HGVS术语在实践中的应用:英国国家外部质量评估计划的一个例子。嗯,变种。,37, 576–578.-公共医学

出版物类型