dbVar现在提供易于使用的人类非冗余SV参考数据集,以帮助解释结构变量

dbVar现在提供易于使用的人类非冗余SV参考数据集,以帮助解释结构变量

dbVar非冗余SV(NR-SV)数据集包括220多万次删除、110万次插入和300000次重复。这些数据来自150多项研究,包括1000基因组3期西蒙斯基因组多样性项目ClinGen公司、ExAC等。您可以使用NR SV数据文件过滤和注释广泛应用中的变量:

  1. 临床医生可以很容易地过滤患者的基因组数据,以找到与先前报道的具有临床意义的变异重叠的SV。
  2. 研究人员可以将他们自己的全基因组SV调查结果与dbVar NR数据进行比较,以确定新的或罕见的变异,以及可能致病的变异,并在某些情况下获得匹配变异的等位基因频率。用户还可以使用NR SV和其他基因组注释注释SV数据,以优先考虑那些最可能影响生物功能的变体。
  3. 开发人员变量分析管道可以使用dbVar NR数据来帮助识别新的变量,校准其算法,或者简单地将数据集成到下游分析工具和工作流中。

dbVar的NR SV参考数据每月更新一次。这些更新包括新的数据库提交。我们欢迎您的反馈这些文件的内容和可用性,以便我们可以改进它们。

有关更多信息,请参阅我们的github网站,其中包括简介教程并通过>FTP访问NR SV数据集。

留下回复