跳到内容

最新提交

 

历史

历史

结构变量集

文件夹和文件

姓名姓名
上次提交消息
上次提交日期

父目录

..
 
 
 
 

dbVar结构变量(SV)数据集

正在进行的工作,可能会更改

基因组技术的进步揭示了结构变异(SV)在所有人类DNA中普遍存在,随后的研究越来越多地将SV与表型多样性和疾病联系在一起。在未来几年内,数百万基因组将被测序,从而发现数百万SV,需要对其进行分析以了解其功能影响。变异分析和解释中的一个关键步骤是将个体或人群中发现的SV与公共数据库(如dbVar)中的已知变异进行比较。这种比较可以从生物学角度深入了解新变体的可能功能。为了满足SV参考的需要,dbVar正在创建已知SV的结构变异数据集,并使用丰富的基因组和生物注释,用于新的SV分析、注释和相关工作流。

dbVar是一个人类基因组结构变异的NCBI数据库,从157项人类研究中提交了500多万个SV。这些数据包括来自大型多样性项目的数据,如1000基因组项目和全球人口CNV调查(Sudmant等人,2015年)以及临床资源,如ClinVar和ClinGen。我们利用这个庞大的变体集合生成了几个非冗余SV数据集,并根据变体类型进行了分离。我们已经开始使用有关基因、分子后果、临床意义、剂量敏感性、调节区域和相关基因组结构特征的可用信息来注释这些数据集,例如重复区域、片段重复和组装-组装对齐异常区域。这些参考数据和注释旨在促进dbVar SV数据与其他基因组注释(如疾病表型和人群频率)的集成和比较,并提供SV对生物功能影响的见解。

生成的字母释放数据集目前以制表符分隔格式提供,位于https://github.com/ncbi/dbvar/tree/master/Structure_Variant_Sets/Nonredundant_Structural_Variants我们的目标是定期更新这些文件,包括新的变体提交、基因组特征、基因、RefSeq、ClinVar和其他可用的注释信息。我们鼓励用户通过电子邮件测试这些文件并提供反馈dbvar@ncbi.nlm.nih.gov或直接在https://github.com/ncbi/dbvar/issues.

============================