常见问题解答

请通过以下方式引用MARRVEL的用法:

Julia Wang、Rami Al-Ouran、Yanhui Hu、Seon-Young Kim、Ying-Wooi Wan、Michael F.Wangler、Shinya Yamamoto、Shoao-Tuan Chao、Aram Comjean、Stephanie E.Mohr、UDN、Norbert Perrimon、Zhandong Liu、Hugo J.Bellen。“MARRVEL:整合人类和模式生物遗传资源以促进人类基因组的功能注释”,《美国人类遗传学杂志》,第100期,2017年6月1日至11日。数字对象标识:10.1016/j.ajhg.2017.04.010

MARRVEL代表稀有变异体扩增的模式生物聚集资源。

您可以插入人类变体(允许多种格式)和基因,也可以搜索单个基因。您可以从五个数据库(OMIM、ExAC、Geno2MP、DGV和DECIPHER)中进行选择。

要按非人类基因(如老鼠、苍蝇、酵母等)进行搜索,请首先单击“模型生物体搜索选项卡”。选择您选择的模型生物体并输入基因符号。单击“搜索”将显示假定的人类直系亲属列表。当您决定要了解哪些人类直系亲属的信息时,请单击“MARRVEL it”。

目前,搜索字段将接受以下命名:

  1. 基因组坐标
    • 17-29490284-C-G号
    • 色谱:29490284C>G
    • 17:29490284C>G
  2. 人类基因组变异学会
    • NM_012160.3:c.541A>G
  3. 蛋白质/氨基酸
    • IRF2BPL:p.Pro372组织
    • IRF2BPL:第372R页
    • IRF2BPL:p.Gln126*

如果在多个数据库中看不到结果,然后我们建议您首先检查您的变体坐标、基因名称、,和参考核苷酸通过使用http://genomi.ucsc.edu/cgi-bin/hgTracks?db=hg19https://mutalyzer.nl/。

有关氨基酸的变化,请查看您的命名变压器无功功率.

如果这些信息是正确的,那么请提交一份反馈报告供我们的团队审查。

OMIM公司

从OMIM获得许可证后,我们使用OMIM API检索OMIM数据。

通过基因符号的信号群ID来自:

集成GRCh37 REST API(http://grch37.rest.ensembl.org/)

HGNC ID和Entrez ID通过基因符号或信号群ID来自:

HGNC REST API(http://www.genenames.org/help/rest-web-service-help)

ClinVar公司

我们通过人类基因的HGNC标识符搜索ClinVar,并提供变异、位置、条件、频率、临床意义和审查状态。此数据每2周更新一次。

ExAC公司

我们下载了版本0.3.1的VCF格式的变体站点文件。
文件可用位置:ExAC FTP(0.3.1版)
ExAC数据库:http://exac.broadinstitute.org/
组件:GRCh 37(hg19)

gnomAD

我们从gnomAD数据库:http://gnomad.broadinstitute.org/
组件:GRCh 37(hg19)

君主

直接从Monarch Gene页面(https://kinastinitiative.org/gene(君主制)/{{HGNC:id}}#比较)

IMPC公司

直接从IMPC基因页面(https://www.mousephinotype.org/data/genes/MGI:{{id}})

基因2MP

我们下载了变体站点VCF文件:“Geno2MP.variants.VCF”。VCF文件最后一次更新是在2016年10月10日。
VCF文件位于:http://geno2mp.gs.washington.edu/geno2mp/#/terms
Geno2MP数据库:网址:http://geno2mp.gs.washington.edu/
组件:GRCh 37(hg19)

Geno2MP表型信息:

直接从Geno2MP网站
上次更新:10月15日15:46 UTC(MARRVEL爬虫)

DGV公司

我们下载了DGV变体文件,该文件可用作制表符分隔的文本文件。
文件可用位置:http://dgv.tcag.ca/dgv/docs/GRCh37_hg19_variants_2016-05-15.txt
发布日期:2016-05-15
数据库:http://dgv.tcag.ca/dgv/app/home
组件:GRCh 37(hg19)

DECIPHER控制数据

我们于2016年9月7日下载了“人口拷贝数变化频率”文件。
文件可用位置:https://decipher.sanger.ac.uk/about下载/数据
数据库:https://decipher.sanger.ac.uk/
组件:GRCh 37(hg19)

变压器无功功率

我们从下载了2.4.0版https://github.com/zwdzwd/transvar

数据库NSFP

我们从下载了dbNSFP4.0b1a版本https://sites.google.com/site/jpopgen/dbNSFP

GO术语

人类:

EMBL-EBI快速入门(ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/HUMAN/goa_HUMAN.gaf.gz)
修改日期:11/28/16,9:35:00 AM(文件)

大鼠:

RDG上的FTP(ftp://ftp.rgd.mcw.edu/pub/ontology/nannotated_rgd_objects_by_ontology/rattus_genes_go)上次更新:2017年3月3日

鼠标:

MGI结果页面->所有GO注释->GO图表:图表下方的表格(http://www.informatics.jax.org/marker/gograph/{{MGI ID}})
上次更新:11月19日00:01 UTC(MARRVEL爬虫)

斑马鱼

ZFIN结果页面->基因形态学->“GO术语(全部?)”(http://zfin.org/action/marker/marker-go-view/{{ZFIN ID}})
上次更新:11月18日21:56 UTC(MARRVEL爬虫)

飞行:

直接从FlyBase结果页面(http://flybase.org/reports/{{flybase-id}}.html)
只有“基于实验证据的术语”
上次更新:10月26日20:01 UTC(MARRVEL爬虫)

蠕虫:

WormBase REST API(http://www.wormbase.org/about/userguide/for_developers/API-REST/Go_term#0--10)
上次更新:11月9日22:17 UTC(MARRVEL爬虫)

萌芽酵母:

直接从SGD结果页面(http://www.yeastgenome.org/locus(酵母基因组)/{{SGD ID}}/overview)
上次更新:11月18日22:11 UTC(MARRVEL爬虫)

裂变酵母:

直接从PomBase结果页面(http://www.pombase.org/spombe/result/{{pombase id}})上次更新:11月18日23:04 UTC(MARRVEL爬虫)

器官/组织表达数据

人类

GTEx公司

http://www.gtexport.org/static/datasets/gtex_analysis_v6p/rna_seq_data/gtex_analysis-v6p_RN-seq_rna-SeQCv1.1.8_gene_median_rpkm.gct.gz
V6发动机

蛋白质图谱

网址:http://www.proteinalas.org/{{集合ID}}.xml
更新时间:2016年12月14日17:18 UTC

老鼠

大鼠体型图:Yu,Y.、Fuscoe,J.C.、Zhao,C.、Guo,C.,Jia,M.、Qing,T.、Bannon,D.I.、Lancashire,L.、Bao,W.、Du,T.等(2014)。跨越11个器官和4个发育阶段的大鼠RNA-Seq转录体BodyMap。国家通讯社。5, 3230.

鼠标

MGI结果页,“突变、等位基因和表型”部分,“表型概述”。
上次更新时间:11月8日22:17 UTC

斑马鱼

ZFIN可下载数据(http://zfin.org/下载),“野生型鱼类的表达数据”
上次更新:2016.11.07(文件)

飞行

FlyBase结果页面->FlyAtlas解剖微阵列->下载数据(TSV)

仅当“背靠背比例尺”或“热图”可用时。
上次更新:11月7日18:52 UTC(MARRVEL爬虫)

蛋白质结构域

直接从DIOPT最佳成绩页面
上次更新:2017年3月6日(MARRVEL爬虫)

未诊断疾病网络的模型生物筛查中心与刘占东博士和诺伯特·佩里蒙博士的生物信息学团队合作,开发了MARRVEL作为公共工具,用于有效分析罕见或未诊断疾病患者的潜在致病性变体。

人类孟德尔在线遗传(OMIM)

我们从OMIM中获得的三个主要信息是:基因功能、相关表型和报告的等位基因。了解一个基因是否是已知孟德尔表型的一部分是很有帮助的,其分子基础是已知的(#条目)。如果患者的表型与文献中报道的疾病和表型以及患者的表型不匹配,那么没有这方面知识的基因是新基因发现和这类基因的候选基因,这就增加了提供表型扩展的机会。

ExAC公司

ExAC包含60000多个外显子,除gnomAD外(http://gnomad.broadinstitute.org/)是针对具有严重早发型孟德尔表型的个体选择的最大外显子公共集合。就MARRVEL的目的而言,ExAC是最佳的控制人群次要等位基因频率。我们对ExAC的两组输出感兴趣。第一个输出是以基因为中心的预期与观察到的错义和功能丧失等位基因数量的概述。一个称为pLI(功能丧失不耐受概率)的指标范围在0到1之间,可能与一个基因的两个拷贝在生育年龄之前的重要性有关。pLI评分为1意味着该基因对任何功能缺失变体都非常不耐受,并且处于选择性约束下。第二个输出是来自ExAC的与特定变体相关的数据。

gnomAD

作为各种疾病特异性和群体遗传学研究的一部分,gnomAd共包含123136个外显子序列和15496个来自无关个体的全基因组序列。在MARRVEL中,我们显示了与特定变体相关的人群频率。

ClinVar公司

ClinVar是关于人类变异和表型之间关系的报告的公共档案,有支持性证据。研究人员和临床医生报告的具有解释的变异对于分析变异致病的可能性很有价值。

基因2MP

Geno2MP是从华盛顿大学孟德尔遗传学中心收集的样本。它包含约5000个受影响个体和未受影响亲属的外显子。该数据库将表型和遗传模式信息与特定等位基因联系起来。对于表型,我们专注于将患者受影响的器官系统与Geno2MP中受影响的个体进行比较。等位基因、遗传模式和表型的匹配增加了变异可能致病的可能性。然而,由于样本量较小,负相关并不一定会降低变体的致病优先级。

基因组变异数据库(DGV)

据我们所知,DGV是来自54000多人的结构变体的最大公共获取集合。该数据库包括在确定时来自多达72项不同研究的健康个体样本。该数据的可能局限性包括所获得数据的来源和方法的差异,缺乏有关致病性CNV不完全外显率的信息,以及个人在数据收集后是否会发生相关疾病。

DECIPHER公司(控件)

MARRVEL上显示的数据包括来自对照人群的常见变异。显示的数据包括覆盖输入变体基因组位置的结构变体。DECIPHER还包含受影响个体的变异和表型信息(但只能在http://decipher.sanger.ac.uk).

DIOPT公司

DIOPT提供了六种模型生物体中最佳预测同源序列与感兴趣人类基因的蛋白质序列的多重蛋白质序列比对。该比对将提供关于特定氨基酸和功能蛋白质域的保护信息

新加坡元PomBase系列蠕虫基础FlyBase飞基ZFIN公司MGI公司、和RGD公司

我们从多个模型生物数据库中收集了数据,并对DIOPT得出的预测直向同源物的生物学和遗传功能进行了总结。

用户使用MARRVEL提供的数据的多种方法之一是遵循下图所示的用户驱动分析。

您可以通过单击门户右侧的“反馈”按钮报告任何错误并提供反馈。

在下一版本中,我们计划添加:

  • AJHG摘要
  • GeneReviews公司
  • 致病性预测算法
  • 批量分析功能
  • 3D蛋白质结构
  • 以及其他

我们欢迎用户就未来数据库提出建议,以纳入我们的MARRVEL分析管道。请通过右侧显示的“反馈”按钮提交任何建议。