精确TAD
preciseTAD:用于精确TAD边界预测的机器学习框架
生物导体版本:释放(3.19)
preciseTAD提供了在基本分辨率下预测拓扑相关域(TAD)和染色质环边界位置的功能。作为输入,它采用从低分辨率Hi-C数据中检测到的域边界的BED格式的基因组坐标,以及ENCODE或其他联盟的高分辨率基因组注释的坐标。preciseTAD采用多种特征工程策略和重采样技术来解决类不平衡问题,并训练优化的随机森林模型来预测低分辨率域边界。在基准面上翻译,preciseTAD预测每个基准成为边界的概率。基于密度的聚类和可扩展分区技术用于检测精确的边界区域和顶点。与低分辨率边界相比,精确TAD边界对于CTCF、RAD21、SMC3和ZNF143信号高度富集,并且在细胞系中更加保守。预处理模型可以使用该细胞系的CTCF、RAD21、SMC3和ZNF143注释数据准确预测另一细胞系的边界。
作者:斯皮罗·斯蒂利亚努达基斯〔aut〕,米哈伊尔·多兹莫罗夫〔aut,cre〕
维护人员:米哈伊尔·多兹莫罗夫(Mikhail Dozmorov)
引文(从R中输入引文(“preciseTAD”)
):
安装
要安装此软件包,请启动R(版本“4.4”)并输入:
如果(!require(“BiocManager”,悄悄地=TRUE))install.packages(“BiocManager”)BiocManager::安装(“preciseTAD”)
对于R的旧版本,请参阅相应的生物导体释放.
文档
要查看系统中安装的此软件包版本的文档,请启动R并输入:
浏览幻影(“preciseTAD”)
细节
生物视图 |
分类,群集,特征提取,功能基因组学,HiC公司,排序,软件 |
版本 |
1.14.0 |
在生物导体中 |
生物柴油3.12(R-4.0)(4年) |
许可证 |
MIT+文件许可证 |
取决于 |
R(>=4.1) |
进口 |
S4载体,I范围,基因组范围,随机森林,ModelMetrics(模型度量),e1071号,PRROC公司,pROC公司,插入符号,实用程序,集群,聚类算法,多斯诺,foreach公司,pbapply(应用程序),统计,并行,gtools公司,rCGH公司 |
系统要求 |
|
统一资源定位地址 |
https://github.com/dozmorovlab/preciseTAD |
错误报告 |
https://github.com/dozmorovlab/preciseTAD/issues |
查看更多
程序包档案
跟随安装在R会话中使用此包的说明。