DGW公司 swMATH编号: 33138 软件作者: 索利乌斯·卢卡斯(Saulius Lukauskas)、罗伯托·维辛塔纳(Roberto Visintainer)、吉多·桑吉内蒂(Guido Sanguinetti)、加布里埃尔·B·施韦克特(Gabriele B.Schweikert) 描述: DGW:一种探索性数据分析工具,用于表观基因组标记的聚类和可视化。背景:功能基因组和表观基因组研究基本上依赖于ChIP-seq等基于测序的方法来检测DNA与蛋白质的相互作用。这些技术返回具有视觉复杂结构的大型、高维数据集,例如扩展到大基因组区域的多峰。目前用于可视化和数据探索的工具仅在有限程度上代表和利用这些复杂功能。结果:我们提出了DGW,这是一个开源软件包,用于同时对齐和聚集多个表观基因组标记。DGW使用动态时间扭曲(Dynamic Time Warping)自适应地重新缩放和对齐基因组距离,从而将感兴趣的区域分组为形状相似的区域,从而捕获表观基因组标记的结构。我们在模拟研究和ENCODE项目的真实表观基因组数据集上证明了该方法的有效性。结论:我们的结果表明,DGW能够自动识别和对齐重要的基因组特征,例如组蛋白标记的转录起始位点和剪接位点。DGW是一个开源Python包。 主页: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-016-1306-0 相关软件: github;小偷;银河;猴子;蝴蝶结2;铬HMM;modENCODE(模式编码);PuFFIN公司;BED工具;Clustal X公司;肌肉;集群;ClustalW公司;伦敦银行支持向量机;GLPK公司 引用于: 1文件 全部的 前5名6位作者引用 1 伊芙琳·M·邦尼克。 1 哈桑,马里兰州阿比德 1 卡琳·勒罗赫 1 斯特凡诺·洛纳尔迪 1 潘伟华 1 安东·波利什科 0连载引用 在1个字段中引用 1 生物学和其他自然科学(92-XX) 按年份列出的引文