跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然方法。作者手稿;PMC 2013年2月20日提供。
以最终编辑形式发布为:
2012年2月28日在线发布。 doi(操作界面):10.1038/nmeth.1906
预防性维修识别码:项目经理3577932
尼姆斯:NIHMS441097标准
采购管理信息:22373907

ChromHMM:自动化染色质状态发现和表征

关联数据

补充资料

使用染色质修饰模式组合的染色质状态注释已成为发现调节区域及其细胞类型特异性活动模式以及解释疾病关联研究的一种强有力的方法1-5然而,从多种细胞类型的大量染色质修饰数据集学习染色质状态模型的计算挑战仍然需要广泛的生物信息学专业知识,使得更广泛的科学界无法使用它。为了应对这一挑战,我们开发了ChromHMM,这是一个自动计算系统,用于学习染色质状态,表征其生物功能以及与大规模功能数据集的相关性,并可视化染色质状态注释的全基因组图。

ChromHMM基于多元隐马尔可夫模型,该模型使用独立伯努利随机变量的乘积对染色质标记的观察组合进行建模2,这使得能够对许多染色质修饰的复杂模式进行稳健的学习。作为输入,它接收每个染色质标记的对齐读取列表,根据泊松背景分布,该列表自动转换为基因组中每个标记的存在或不存在调用。控制数据集对齐读取的可选附加输入可用于调整存在或不存在阈值,或作为独立输入功能(补充说明)或者,用户可以输入包含独立峰值调用者呼叫的文件。默认情况下,染色质状态以大约近似核小体大小的200碱基对间隔进行分析,但可以指定更小或更大的窗口。我们还开发了一种新的参数初始化程序,可以相对有效地推断不同状态数下的可比模型(补充说明).

然后,ChromHMM输出学习的染色质状态模型参数和每个基因组位置的状态分配。学习的发射和转换参数以文本和图像格式返回(图1),自动将具有类似发射参数或近端基因组位置的状态分组,尽管也可以使用用户特定的重新排序(补充图1-2,补充说明)ChromHMM能够基于丰富的不同外部注释和实验数据来研究每种染色质状态可能的生物学作用,如热图和表格所示(图1)直接基因组重叠和与一个州的不同距离(补充图3)ChromHMM还生成自定义UCSC基因组浏览器轨迹6在稠密视图(单色编码轨迹)或扩展视图(每个状态单独显示)中显示染色质状态分割结果(图1). ChromHMM默认生成的所有文件都会在它创建的网页上进行汇总(补充数据).

保存图片、插图等的外部文件。对象名为nihms-441097-f0001.jpg
ChromHMM的样本输出

()从ChromHMM生成并在UCSC基因组浏览器中可视化的状态注释轨迹示例6,包括作为单个轨迹的分段的密集视图(顶部),以及作为单独轨迹显示每个状态的分段的扩展视图(底部)。(b条)ChromHMM自动生成的热图显示发射(左)和过渡(右)参数。(c(c))ChromHMM自动生成的状态功能丰富的热图示例。这些列表示每个状态(第一列)所代表的基因组的相对百分比和相对折叠富集:RefSeq转录起始位点(TSS);CpG群岛;TSS周围的2000个碱基对间隔;外显子;基因;转录终末位点(TES);进化守恒;和核纹相关区域(补充说明).a-c公司。所示示例对应于在九种单元类型中学习到的先前模型.

ChromHMM还可以分析多种细胞类型的染色质状态。当染色质标记在所有细胞类型中通用时,可以通过所有细胞类型的染色体的虚拟“串联”来学习通用模型。或者,可以通过跨单元类型的所有标记的虚拟“堆叠”来学习模型,或者可以在每个单元类型中学习独立的模型。最后,ChromHMM支持基于排放参数相关性对不同状态数的模型进行比较(补充图4).

补充材料

补充数字、注释和数据

单击此处查看。(777K,pdf)

致谢

我们感谢麻省理工学院计算生物学小组成员和B.Bernstein就这项工作进行的有益讨论。这项工作得到了美国国家科学基金会(NSF)向JE颁发的博士后奖学金0905968以及美国国家卫生研究院(NIH 1-RC1-HG005334和NIH 1 U54 HG004570)的资助。

脚注

该软件是用Java编写的,可以在几乎任何计算机上运行,可以在以下网站上免费获得更多文档:http://compbio.mit.edu/ChromHMM.

工具书类

1Day N等人。生物信息学。2007;23:1424–1426.[公共医学][谷歌学者]
2Ernst J,Kellis M。国家生物技术。2010;28:817–825. [PMC免费文章][公共医学][谷歌学者]
三。Ernst J等人。自然。2011;473:43–49. [PMC免费文章][公共医学][谷歌学者]
4Filion GJ等人。单元格。2010;143:212–224. [PMC免费文章][公共医学][谷歌学者]
5Roy S等人。科学。2010;330:1787–1797. [PMC免费文章][公共医学][谷歌学者]
6Kent WJ等人。基因组研究。2002年;12:996–1006. [PMC免费文章][公共医学][谷歌学者]