介绍
肝脏具有许多生命必需的复杂功能,包括葡萄糖的摄取和储存、胆汁酸的合成、血浆蛋白的产生和药物解毒。这些功能由肝细胞执行,肝细胞构成肝组织的大部分。我们和其他人已经开始使用基因组规模的方法来确定肝细胞的转录调控回路(弗里德曼等, 2004;奥多姆等, 2004;普勒等, 2005;鲁宾斯等, 2005;张等, 2005). 这些研究受到了限制,因为它们侧重于少数调节因子,并且使用了低分辨率技术,仅探索了哺乳动物基因组中近端启动子的子集。我们使用染色质免疫沉淀(ChIPs)结合DNA微阵列(代表大多数注释人类基因的启动子区域的大部分(10 kb))绘制了原代人类肝细胞中六个主调节器的启动子占据率。我们的结果提供了人类肝细胞核心转录回路的高分辨率全基因组概览。
结果和讨论
转录因子结合位点的鉴定
为了启动原代人类肝细胞转录调控回路的绘图,我们根据小鼠或人类的遗传实验选择了已知对肝细胞生物学至关重要的调控因子(HNF1α、HNF4α、FOXA2/HNF3β、HNF6/ONECUT1、CREB1和USF1)(,补充表S1) (郭等, 1992;帕尼等, 1992;Cereghini 1996年;邓肯等, 1998;扎雷特2002;科斯塔等, 2003;蒙敏伊等, 2004;帕朱坎塔等, 2004;李等, 2005). 这些富含肝脏的转录因子也可以在其他组织(如肾脏和胰岛)中发挥重要作用(Bell和Polonsky,2001年). 然后,我们通过将ChIP与具有高分辨率和广泛启动子覆盖的微阵列相结合来确定这六种调节因子的启动子占有率(材料和方法)。我们使用了包含60个寡核苷酸探针的DNA微阵列,该探针覆盖了大约18000个注释人类基因转录起始位点的−8到+2 kb区域,这些基因是从五个独立的数据库中编译而来的(博伊尔等, 2005). 大多数已知的转录因子结合位点发生在转录起始位点的-8/+2 kb范围内(博伊尔等2005); 尽管在其他区域也发现了一些结合位点,但这里研究的转录因子也是如此(特龙什等, 1997;拉达·伊格莱西亚斯等, 2005). 转录因子占据的位点由跨越相邻探针的富含ChIP的DNA峰表示(例如补充图S1). 启动子区域的覆盖率平均为每250个碱基60个mer(博伊尔等, 2005).
表1
调节器 | 功能 | PFAM类别 | 基因结合 |
---|
HNF1α | 代谢控制 | POU同源域 | 1016 |
HNF4α | 发育、代谢 | 核受体 | 4519 |
HNF6(一个切口1) | 开发 | CUT同源域 | 1306 |
HNF3β(FOXA2) | 开发 | 叉头(Forkhead) | 890 |
CREB1号机组 | cAMP响应 | bZIP地址 | 2197 |
美国F1 | 葡萄糖、脂质代谢 | 基本螺旋–回路–螺旋 | 1632 |
转录调控基序的鉴定
我们使用先前报道的方法分析了这些高分辨率数据(李等, 2002)识别转录网络调控基序(网络结构的最简单单位),从而确定这六个关键的肝细胞调控因子是如何参与自动调节环、多成分环、前馈环和多输入基序的(,补充表S2) (李等, 2002;米洛等, 2002;Shen-Orr公司等, 2002;奥多姆等, 2004).
(A类)人类肝细胞核心调节电路中的转录因子串扰和自身调节。调节子显示为黑色椭圆形,启动子区域的基因组占位由蓝色或红色(用于自动调节环)线表示。(B类)核心肝细胞调控网络中网络基序的频率。为清楚起见,对于二、三和四因子多输入基序,仅显示了可能控制20个或更多基因的组合。(另请参见补充表S2).
这些主调节器中存在的调节电路的几个方面已经在前面提到或提出过。网络高度互联()组合控制在指导基因表达中起着重要作用(Krivan和Wasserman,2001年). HNF4α和HNF1α相互结合启动子;FOXA2启动子被HNF6和FOXA2结合;HNF4α启动子被多个HNF因子占据(,补充图S1) (帕尼等, 1992;邓肯等, 1998;贝利等, 2001;科斯塔等, 2003;布里扬松等, 2004;奥多姆等, 2004). 我们的数据进一步表明,转甲状腺素(一种典型的肝细胞基因)的启动子被HNF1α、HNF4α、FOXA2和HNF6占据,这与广泛的位点特异性和基于序列的分析预测的结果一致(补充图S1)(在中审查科斯塔等, 2003).
观察到七种转录调节因子组合的前馈环路(). FOXA2涉及三个独立的前馈基序,并可能通过180多个基因的前馈模序充当主调节器。这与之前的建议一致,即FOXA2在肝脏和其他组织中处于调控层次的顶端(李等, 2005). 所有六个调节器都存在单输入基序,尽管目前被归类为单输入的许多基因很可能受到其他as-yet-uncharacterized因子的协调调控和结合。大多数转录调控因子组合都存在多输入基序(,补充表S2).
肝细胞调节器中自身调节的患病率
我们在这里研究的肝细胞调节回路部分的一个显著特征是自动调节回路的频率:六个调节器中有五个(83%)占据了它们自己的启动子(,补充图S2). 与此一致,我们使用假设驱动的结合序列分析(麦克萨克等, 2006)确定每个转录因子的优化结合序列,以及它们在每个自我调节结合事件附近的存在(补充信息). 大多数细菌转录因子形成自动调节环(蒂埃弗里等, 1998;Shen-Orr公司等, 2002). 然而,对几乎所有酵母转录因子的分析表明,只有10%的酵母具有自我调节环,这表明这种形式的调节在真核生物中发生的几率要小得多(李等, 2002;哈比森等, 2004). 这些观察促使我们考虑到,自我调节基序可能是处于调控层次顶部的真核转录因子的一般特征,或在主要细胞过程中发挥关键作用。当我们检查酵母中所有转录因子的数据时(哈比森等, 2004;补充信息),我们发现关键细胞过程的主调节器比其他调节器更容易自动调节(补充表S3和S4,补充材料). 例如,STE12和TEC1形成自动调节环:STE12是交配的主调节器,TEC1是假菌丝生长的关键调节器(Zeitlinger公司等, 2003).
在哺乳动物细胞中,具有自动调节环的转录因子通常被认为是组织或关键过程的主调节器。例如,这些包括胚胎干细胞中的OCT4(博伊尔等, 2005;Okumura-Nakanishi公司等, 2005)肌肉中的MyoD和MyoG(Tapscott和Weintraub,1991年;布莱斯等, 2005),肝细胞中的FOXA2(帕尼等, 1992;李等, 2005)髓系细胞中的PU.1(陈等, 1995) (补充表S5). 重要的是,由于哺乳动物转录因子在特定组织或细胞过程中起着关键作用,因此对其大多数特征进行了研究。然而,有些转录因子(如USF1)并不占据它们自己的启动子(补充表S6)这表明,自我调节不仅仅是哺乳动物转录因子的一个普遍特征(贝特曼,1998年).
自我调节基序可能是转录因子的一般特征,在主要细胞过程中发挥关键作用,因为它们赋予调节网络稳定性(Becskei和Serrano,2000年;布兰德曼等, 2005). 众所周知,肝细胞的主调节因子与其他组织的主调节因子一样,发挥着积极和消极的调节作用(布里扬松等, 2004); 正反馈回路和负反馈回路都允许系统抵抗噪声(Becskei和Serrano,2000年;罗森菲尔德等, 2002;布兰德曼等, 2005). 这些特征可能对高等真核生物中负责组织特异性程序的调节器至关重要。
多重结合事件的统计富集及启动子占有率与基因表达的相关性
特征良好的肝脏启动子通常由多个富含肝脏的转录因子组合控制(Cereghini,1996年;Krivan和Wasserman,2001年;科斯塔等, 2003;弗里德曼等, 2004;普勒等, 2005;拉达·伊格莱西亚斯等, 2005). 这促使我们检查我们的全基因组结合数据,以获得组合启动子占用富集的证据。将实验数据与随机结合数据(通过假设所有因子独立结合而随机)进行比较,发现由两个或多个转录调控因子结合的启动子数量在统计学上显著增加。通常,随着转录调控因子结合的数量增加,富集程度增加(,补充图S3). 例如,1188个基因由三个或三个以上的调节因子结合,而我们可以随机地看到345个基因由3个或更多因素结合(z(z)-得分45.8)。对四个、五个和六个约束调节器组合的类似分析得出z(z)-分数随着受约束监管机构数量的增加而增加(). 这些结果与先前的建议一致,即肝脏转录调控是由多种转录因子协同作用控制的。
(A类)使用假设结合事件的二项式分布计算的期望值,启动子区域的组合占用显著丰富。预期绑定事件和实际绑定事件之间的数字差异用z(z)-差异得分(绿色)(另请参见补充图S3). (B类)结合转录因子数量与基因表达的比较。P(P)-通过超几何计算确定值,并通过分析公开可用的组织特异性基因表达简编(另见补充图S4).
可以预期,启动子区域存在大量肝脏特异性转录因子将增加相关基因表达的可能性。我们通过根据肝脏中转录物的存在与否对基因进行分类来验证这一假设(苏等, 2004)并将这些类别与与相应发起人绑定的监管机构数量进行比较。我们发现这两个值之间有很强的对应关系()尽管由于高多输入基序中的基因数量较少,高多输入模序的统计显著性下降。这封信与要求提供笔录的严格程度无关(补充图S4). 然而,有转录物在没有这六个主调控因子结合的情况下表达,还有一些基因受多种因子结合,这些因子在人类肝细胞中没有明显表达。这些观察结果突显了肝细胞转录程序的复杂性。
结论
我们使用了一种系统的方法来确定由六个主调控因子结合的人类启动子集合,这些主调控因子对肝脏的正常发育和功能至关重要。结果表明,这些调控因子在人类肝细胞中形成了高度互联的核心电路,识别了调控因子与基因相互作用产生的局部调控网络基序,并揭示了自身调控是肝脏富集转录因子的主要主题。这些数据支持先前的预测,即这些因子共占用许多基因来控制肝细胞基因的表达,并且与启动子区域结合的调节器数量与基因表达的概率之间存在直接对应关系。对人类肝脏中一部分调节回路的初步分析应该为未来更全面地阐明肝脏转录程序奠定基础。
数据访问号码
ArrayExpress的数据登录号为E-WMIT-9。