跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
基因组研究。2006年8月;16(8): 962–972.
数字对象标识:10.1101/gr.5113606
预防性维修识别码:项目经理1524868
PMID:16809671

酵母基因组中广泛的低亲和力转录相互作用

摘要

主要的实验和计算工作的目标是在基因组尺度上表征转录网络。这些研究的最终目的是通过定义明确的结合位点构建转录因子与基因相关的网络。除了发生在高亲和力结合位点的调控相互作用外,其他较弱的调控相互关系在很大程度上被忽视,也没有得到很好的理解。在这里,我表明低亲和力相互作用在体内是丰富的,并且可以从当前的高通量ChIP实验中量化。我开发了一些算法,可以根据序列和ChIP数据预测DNA结合能,并利用它们揭示低亲和力转录因子结合的广泛功能。进化分析表明,许多转录因子的结合能即使在缺乏经典结合位点的启动子中也是保守的。基因表达分析表明,这些启动子可以产生显著的表达。我估计,虽然只有一小部分基因组受到典型转录因子的强烈调节,但在一个数量级上,更多的基因组可能参与较弱的相互作用。因此,低亲和力转录因子与DNA的相互作用可能在进化和功能上都很重要。

转录程序通常通过识别顺式-基因调控区中的元件及其与序列特异性转录因子(TFs)的关联。高度流行的工作假设在这里表示转录网络的“数字”模型(图。(图1A),1安培)TF要么与序列基序完美结合,要么根本无法结合。因此,转录调控的复杂性被隐含地假定为源于一个组合码,该组合码关联着几个定义明确的结合位点,而不是源于许多潜在结合位点和许多候选TF的更松散的综合贡献。很明显,转录调控背后的反应要比用来描述它的简单逻辑复杂得多。例如,控制随机和噪声基因表达的机制的特征(Elowitz等人,2002年;保尔森2004;Raser和O'Shea 2005)或转录开关的精确定量分析(Ronen等人,2002年;Bintu等人,2005年)需要一个“模拟”框架。然而,在大多数全基因组研究中,都假设数字模型是一个合理的折衷方案,特别是考虑到数据的质量。随着基因组技术的出现,我们可能会重新审视我们描述大规模转录调控方法的基本假设。

保存图片、插图等的外部文件。对象名为962fig1.jpg

酵母中的转录程序:数字还是模拟?根据普遍存在的转录调控“数字”假设(A类)复杂的调控程序是使用将TF与基因确定性关联的接线图来描述的。在替代的“模拟”模型中(B类),许多TF可能以截然不同的特异性水平影响每个基因。200个ChIP结合谱和6000个酵母基因的双向聚类(C类)揭示了在所有200个ChIP实验中具有显著相似结合比率的基因组。同质子矩阵中的条目很少代表高特异性TF–基因关联。这些簇及其与生物功能的关联(补充表1)表明,ChIP实验可能反映了低亲和力TF-基因相互作用的复杂且具有功能意义的组织。

最近,染色质免疫沉淀(ChIP)和芯片技术(ChIP on ChIP)的结合为转录因子结合的全基因组定位开辟了道路(Ren等人,2000年;Iyer等人,2001年). 在一系列广泛的实验中,对200个芽苗酵母转录因子的综合库进行了分析,以在标准生长条件和几个额外的环境中结合(Lee等人,2002年;Harbison等人,2004年). 目前,一种类似的方法正在应用于人类系统,希望能加深对疾病中转录调控和错误调控的理解(Li等人,2003年;Cawley等人,2004年;Odom等人,2004年). 尽管ChIP-on-ChIP技术产生定量读数,但当前的分析协议(Harbison等人,2004年)遵循数字范式:对数据进行分析,以便P(P)-值阈值将测量值转换为一组二元TF-基因相互作用。因此,目前的方案假设ChIP实验无法定量解释,TF与基因之间相互作用的功能本质可以通过无参数网络来描述。

这里我展示了转录开关的模拟模型(图。(图1B)1B年)是数字模型的一个实用且有利的替代方案,尤其是在使用ChIP实验分析复杂监管网络时。ChIP实验不是集中于每个TF的几十个高特异性点击,而是使用数千个启动子的TF结合亲和力(可能有噪声)估计值进行定量分析。结果表明,定量方法大大增强了许多TF结合偏好的表征,并优于当前的分析方法。重要的是,结果表明TF与低亲和力启动子的结合在体内大量发生,由启动子序列决定,并构成TF与DNA之间相互作用的很大一部分(因此在ChIP实验中可广泛检测到)。此外,分析表明低亲和力TF结合可能在功能上很重要:来自不同酵母物种的同源启动子的预测TF结合能比中性预测的更保守。保守性分析表明,单个TF的选择可能会影响基因组的重要部分(10%-20%),远远超出严格结合位点上纯化选择的预期。这一发现得到了基因表达分析的支持。在激活TF的条件下,可以将TF结合亲和力与基因组大部分(10%或更多)的基因表达的可测量变化相关联。根据这些结果,低亲和力TF-基因相互作用是基因组调控程序的重要特征,可能在微调转录表型和为其持续修饰提供丰富的进化原料方面发挥作用。

结果

ChIP结合率在整个特异性范围内具有信息性

利用ChIP-on-ChIP实验对酵母转录网络进行了广泛的绘制,量化了在富媒体和其他几种条件下200个TF的全基因组结合谱(Harbison等人,2004年). 为了大致确定低亲和力TF-基因相互作用中存在多少信息,并在这一广泛的数据集中可视化可能的全球模式,根据ChIP TF-结合比率对基因间区域和TF进行双向聚类(方法)。簇表示在数十个TF中具有类似ChIP结合比率的基因组。只有一小部分基因被认为是每个TF的高特异性靶点(hits),因此聚类模式是指非特异性结合的ChIP值的相似性的结果。功能富集与某些簇的特定生物功能密切相关(方法;补充表1)。例如,簇7中的基因主要由核糖体蛋白质组成(P(P)< 10−66)并且在所有200个TF中表现出显著相似的结合率,尽管只有少数TF(例如,Fhl1、Ifh1、Rap1、Sfp1)(Schawalder等人,2004年;Wade等人,2004年)与高亲和力核糖体蛋白调节有关。即使TF对集群中的基因具有负的结合比率,这种相似性仍然存在。非特异性结合图谱中如此高的信息含量可能是实验或标准化伪影的结果,也可能表明TF–DNA相互作用在功能上是有组织的,即使在定义明确的结合位点上没有反映高度特异的相互作用。

ChIP数据和PWM预测在宽动态范围内相互关联

通过比较TF亲和力与ChIP结合比率的基于序列的预测,我们可以测试ChIP检测到的低特异性结合是否为体内结合强度的可变性提供了定量指示,或者大体上是高特异性靶标的生物学情况的嘈杂指示。根据序列预测TF-DNA相互作用的常用方法是基于位置权重矩阵(PWM)(1989年Stormo和Hartzell III),已知其为体外结合作用提供了合理的能量近似值(刘和克拉克2002). 根据我们的结果(见补充表2),PWM预测和ChIP结合率高度相关。分析首先使用的PWM来自Harbison等人(2004)只使用基因到hits中的定性分割生成研究和(P(P)<0.001)和非命中(P(P)> 0.001). 虽然没有使用定量信息来推断PWM,但即使仅限于具有ChIP的启动子集,ChIP与PWM的相关性也很强P(P)-值高于常见的0.001阈值,甚至更宽容的0.01阈值。图2A2安培事实上,没有阈值可以将基因分为两组,在这两组中,序列不能预测ChIP,并且通常阈值以上和以下的基因都存在相关性。例如,对于MBP1,即使对于具有ChIP结合的基因,也可以观察到ChIP值和序列之间的高度依赖性P(P)-值超过0.2,该值当前不被视为指示正在发生任何绑定。

保存图片、插图等的外部文件。对象名为962fig2.jpg

定量ChIP与序列相关。(A类)高于和低于a的ChIP和PWM相关性P(P)-值阈值。显示的是日志P(P)-ChIP结合比和PWM能量预测之间的Spearman相关性值(-轴)。使用一系列可能的阈值(x个-轴),分别计算ChIP值低于阈值(红色)和高于阈值(黑色)的基因的相关性。在所有情况下,在这两组基因和所有阈值选择中都观察到显著的相关性。(B类)序列-ChIP相关性显示体内低特异性结合。所示为特定间隔内具有ChIP值的基因组PWM结合能的平均值和累积概率分布(CPD)。在所有情况下都观察到显著的单调性,并且预测了具有更高重要性的群的能量P(P)-值(左边)始终高于不显著组P(P)-值(正确的). 这种单调性适用于非常低的特异性范围,表明ChIP谱在广泛的动态特异性范围内具有信息性。

3、B和C,进一步说明了广泛的ChIP-序列相关性。显示了PWM预测是如何随着ChIP值的降低而单调下降的,即使ChIP范围远低于高显著性水平。例如,Mbp1曲线的分布表明,PWM对ChIP基因的预测P(P)-0.3-0.5范围内的值显著高于ChIP基因的值P(P)-0.5–0.75范围内的值(P(P)< 10−10; KS试验)。

保存图片、插图等的外部文件。对象名为962fig3.jpg

Motif回归揭示了已知和新的结合位点。(A类)PREGO算法。PREGO算法用于将PWM模型拟合到原始ChIP-on-ChIP配置文件。该算法结合ChIP和序列数据,在整个亲和谱上建立具有最佳预测精度的PWM模型。(B类)PWM能量预测的稳健性。将PREGO算法独立应用于单个实验,证明了导出的能量模型的稳健性。这里显示的是两个Aft2实验之间的相关性(左边),从中导出的两个PWM模型(中间的)以及这两个PWM的能量预测相关性。显著的再现性表明,可以定量使用PREGO衍生PWM。(C类)使用低亲和力启动子可以提高基序识别敏感性。图中显示了由PREGO算法从ChIP剖面推断出的PWM示例,其中模体查找方法无法找到模体。文献中的其他证据证实了所有病例。有关PWM分数的定义,请参见方法。“模型“表示使用两个不同阵列生成的PWM能量预测的Spearman相关性。“数据“表示用于构建两个PWM的两个原始ChIP配置文件的Spearman相关性。

使用定量ChIP曲线进行PWM回归

基于上述PWM预测和ChIP测量之间相关性大小的结果,开发了一种将PWM模型回归到整个ChIP结合曲线的算法。PREGO算法利用了全谱结合能中的信息,与现有的模体查找算法有很大不同,这些算法搜索区分“点击”和“非点击”的PWM模型。为了使用ChIP数据作为TF绑定能量的定量代理,对775份原始ChIP剖面进行了广泛的低水平分析(补充说明1)。消除了以前未考虑的重大实验偏差。这些主要包括与可变探针GC含量相关的影响(补充图1),但也包括低复杂度序列的系统影响[如聚(A/T)束]。PREGO算法内在地控制着这种影响:它报告了PWM模型,这些模型在缺乏核苷酸组成或低复杂性序列基序相关性的标准化轮廓下非常重要(方法)。整个算法管道(图。(图3A;3A级; 补充图2)分别应用于单个阵列,以比较来自三次实验的原始数据的结果,并确保推断模型的质量(图。(图3B3B公司).

PREGO算法应用于来自Harbison等人(2004)研究。在使用motif finding方法之前在这些数据中检测到的所有已知PWM也使用PREGO进行检测,在许多情况下,该算法检测到的PWM与文献证据相匹配,但之前在ChIP数据中无法检测到。图4C4摄氏度提供了几个示例来证明该方法的有效性(我的网站上有其他信息,网址:http://ukbar.rockefeller.edu/~atanay/prego公司).

保存图片、插图等的外部文件。对象名为962fig4.jpg

测试数字模型。(A类)规范化ChIP数据。PREGO对ChIP数据进行内部归一化,以消除结合比率与单核苷酸或二核苷酸组成或低复杂度序列[通常为聚(A)或聚(T)束]的任何相关性。图中显示了原始Mbp1-ChIP结合比与推断校正的散布和趋势,涉及几个二核苷酸和AAAA/TTTT基序的贡献。还显示了归一化和ChIP数据中使用的每个序列特征的Spearman相关性(正确的). (B、 C类)离散模型与模拟模型。如果TF-基因相互作用可以合理近似为发生或不发生(命中或未命中),那么ChIP和PWM预测的联合分布应反映出这两个理想基因组子集内的零协方差(左边). 如果ChIP和PWM提供了体内结合亲和力的定量估计,那么基因组的任何分割都无法消除它们的相关性(正确的). 因此,可以通过对数据拟合两种分布并分析其参数来测试数字假设的有效性。()ChIP序列相关性反映了一种模拟行为。对三个TF的ChIP/PWM联合分布的分析表明,由于两种分布的混合,无法解释它们的定量相关性(方法)。所示为推断出的命中(较暗)和未命中(较亮)的最大似然分布。混合系数(ρ)和相关系数()显示。分析表明,约五分之一的基因组受每个TF的影响,并且至少五分之一基因组的ChIP和基于序列的亲和力估计值以定量方式相关。

利用模体回归发现已知和新的PWM

Gat1是一种GATA因子,在调节氮分解代谢中具有已知功能(Kuruvilla等人,2001年). 该因子的已知结合基序(GATAAG)无法使用Harbison等人(2004)。仅使用对比分析成功检测到基序酵母菌属物种。将PREGO应用于三个原始Gat1-ChIP图谱(用雷帕霉素治疗后测量),并在所有病例中成功地恢复了已知的基序,无需使用额外数据,且具有良好的重复性(两个不同阵列的结合能预测值=0.99)。对雷帕霉素作用下的三个Dal82结合图谱的分析表明了PREGO的不同重要优势。已知Dal82参与DAL基因的调节,并与UIS相关所有使用标准报告分析的元素(Dorrington and Cooper 1993年). 自UIS以来所有元素相当长,Dal82精确的绑定首选项尚不详细。此前,将主题发现应用于62个Dal82 ChIP点击集,得到了GATAAG主题(Harbison等人,2004年). 然而,PREGO分析表明GATAAG与Dal82结合无关,提示AANNTGCG为功能基序。有趣的是,已知的UIS所有序列中不包含GATA元件,但所有序列都包含AANNTGCG的拷贝,这表明GATAAG被识别为Dal82相关基序是GATA盒和UIS同时出现的结果所有在DAL启动子中,并且可以使用本文报道的基序更准确地模拟Dal82结合偏好。因此,PREGO可以有效地控制共现伪影,这些伪影可能会使标准基序查找器的结果产生偏差。

通常在酵母数据集中,ChIP分析对特定TF产生的高特异性点击很少或没有。即使在这种情况下,PREGO也可以利用整个特异性范围来表征TF的结合偏好。众所周知,Opi1因子参与磷脂基因的调节。它的ChIP配置文件只产生了三个重要的点击,阻止了模体查找器检测到任何PWM。PREGO分析显示,在两个三倍体中存在CCGGTTCG基序,而在第三个三倍体中有一个更短的基序(GGTTC)。该基序类似于先前确定的Opi1-bound元件(反向补语TCGAAyC)。Xbp1是一种已知的压力调节器,可能在细胞周期和细胞大小的调节中发挥作用(Mai and Breeden 1997年;Miled等人,2001年). 尽管在轻度H22在治疗之前,即使使用比较基因组学,也无法在它们中发现基序。PREGO算法能够将模体CTCGAG与三个可用Xbp1配置文件中的每一个都紧密关联,从而证实了之前关于Xbp1结合共识GC的报告CTCGAR公司GMGR公司(Mai and Breeden 1997年). 有趣的是,在之前的工作中(Tanay等人,2004年a),我们已经通过进化分析确定CTCGAG是一个可能的基序,但无法将其与TF关联。之前通过CIT2 UAS突变分析显示Rtg3因子结合GGTCAC基序(Jia等人,1997年). PREGO分析显示GTCAT基序与雷帕霉素和H下的Rtg3亲和力谱显著相关22.图案GTCACG,更类似于UAS也与雷帕霉素谱有关,但比GTCAT弱。与之前的案例一样,模体发现算法未能在与Rtg3相关的52个基因集中找到任何丰富的重要模体。

量化低特异性TF–DNA结合量

使用整个ChIP值范围推断PWM在上文中已证明具有相当大的实用性。然而,低特异性ChIP值与序列之间的相关性性质尚不清楚。重要的是,这种相关性不太可能是由于对某些核苷酸、二核苷酸或任何其他低复杂度序列特征的系统偏见而导致的实验伪影,因为这些特征是通过PREGO算法标准化的(见图。图4A4A级例如)。

低特异性靶点的ChIP序列相关性令人费解的一个可能原因可能是ChIP实验的不完善性。可以说,TF的目标本质上是“数字”的(命中或未命中),但由于实验噪声,随着ChIP值的降低,它们反映出观察到命中的概率较小,因此与(同样不完美的)基于序列的预测呈正相关。如果是这种情况(图。(图4B),4B类)然后,将基因按点击和非点击进行一些(未知)划分将消除ChIP与序列的相关性:例如,如果我们能够准确地知道非点击集,我们应该观察到ChIP和其内部PWM预测之间的零相关性。基于这种直觉,我们可以通过将ChIP–PWM二维分布拟合为两种分布的混合物来估计ChIP数据中定量信息的范围:一种表示“命中”的典型ChIP和PWM值,另一种表示这些“非命中”(方法)。然后,我们可以测试这些分布的相对权重(指示有多少基因可以归类为“hits”)和分布的协方差(指示数据中存在多少定量信息)。

图4D4D(四维)显示了三个TF的这种分析结果,清楚地表明数据是惊人的非“数字”数据-使用两个协方差为零的分布来解释ChIP和PWM的相关性是不可能的,事实上,在这三种情况中的每一种情况下,约20%的启动子被推断与TF相互作用,并且观察到高度显著的ChIP–序列相关性。因此,与非常弱的位点结合的频率可能足以在ChIP实验中进行检测。个体的低亲和力启动子不能被确定为确定的TF靶点,因为结合在体内发生的概率很高,但我们仍然可以从序列中大致预测这种结合的水平。

即使缺乏强结合位点,结合能也在进化上保持不变

启动子序列和低亲和力ChIP值之间的显著相关性,以及回归方法在检测以前在ChIP数据中无法检测到的PWM模型方面的成功,表明(1)TF与低亲和力结合位点的概率或瞬时结合经常发生,在ChIP实验中可以量化,并且(2)这种结合的大小由启动子序列决定(因此可由PWM预测)。测试这些丰富而微弱的TF-基因相互作用是否具有功能相关性的一种方法是评估它们的进化保守性水平。比较基因组学被广泛用于将TF结合位点表征为保守位点(Cliften等人,2003年;Kellis等人,2003年)提出了几个模型来描述影响它们的选择压力(Moses等人,2003年;Tanay等人,2004年a). 如果TF与低亲和力启动子的结合在功能上很重要,那么我们可以观察到选择不仅在单个结合位点上起作用,而且在每个启动子与TF的总亲和力上也起作用。在进化过程中,受TF弱调控的基因可能会被推到保持这种状态,但压力不会集中在一个特定的位点上,而是分散在整个启动子上,在许多可能的弱位点上选择综合结合能。为了测试这种选择是否存在,我使用了同源酵母启动子,并制定了一个保守性评分,将预测的启动子总结合能中观察到的进化变化与中性模型中预期的进化变化进行比较(方法)。因此,该分析测试了TF和整个启动子的积分相互作用能是否比偶然预期的更保守。对具有类似启动子的组进行了保守性分析酿酒酵母结合能,可以表征亲和力和守恒之间的关系。分析如图所示图55表明能量守恒超越了结合位点的守恒。

保存图片、插图等的外部文件。对象名为962fig5.jpg

预测结合能的进化守恒。绘制了低基因的保守性得分(左边)到高(正确的)TF-结合能。(x个-轴)酿酒酵母结合能百分位数。(-轴)保护得分(方法)。在所有情况下,高亲和力启动子的结合能都是保守的。对于一些TF,在基因组的很大一部分(10%-20%)上观察到保守,这反映了对缺乏高亲和力结合位点的启动子的结合能的广泛选择。

根据结果,在大量启动子中可以检测到能量守恒,大大超过了预测具有显著结合位点的前几个亲和力百分位数。例如,据估计,Gcn4和Cbf1大约影响基因组的10%(Gcn4可能影响更弱,额外影响10%)。预测其他TF的能量守恒可能更广泛。Mbp1和Ume6的保守性峰值位于前5%,但在亲和谱的一半上仍然显著。Mbp1结合细胞周期盒ACGCGT(带有附加因子)(Simon等人,2001年). 它在调节细胞周期中的作用可能取决于结合相互作用的精确定量性质,因此增加了选择压力。对于减数分裂的关键调节因子Ume6(Strich等人,1994年)此外,结合能的广泛守恒可能与该因子在广泛存在的基于Rpd3–Sin3的染色质修饰中的作用有关(卡多什和斯特鲁尔1997).

图形分析图55基于许多简化假设(例如,求和PWM概率以估计结合能,模拟中性模型,忽略TF之间的组合相互作用)。仍然有证据表明,观察到的弱相互作用能量守恒反映了真正的选择。仿真中使用的中性模型基于所分析的精确区域的进化动力学,建模与环境相关的突变,并使用直接从数据中估计的参数(方法)。因此,观察到的保守性不太可能是GC含量保守性或其他简单背景效应的结果。分析几种酵母菌的序列时也得到了类似的结果(参见支持网站,http://uqbar.rockefeller.edu/~atanay/prego公司,了解详细信息)。作为额外的对照,对活性较低的启动子部分(−600到−350)和通常活性较高的启动子的部分(−350到−100)重复进行保守性分析。事实上,在不太活跃的范围内,观察到的序列结合能守恒性要少得多(参见支持网站,http://uqbar.rockefeller.edu/~atanay/prego公司). 应该注意的是,在某些情况下,在分析一种TF的弱结合能时观察到的守恒可能是另一种TF的最佳结合位点选择的副产品。由于观察到的守恒常偏向于亲和力的上百分位,这种间接影响可能主要适用于结合非常相似PWM的TF。对弱结合能的选择压力广度的惊人估计的另一个支持来自对基因表达的分析(见下文)。

低亲和力启动子可能产生弱基因表达

TF结合能广泛保守的一个可能解释是低亲和力启动子产生基因表达的能力。弱的TF-基因相互作用不太可能在表达水平上产生重大影响。尽管如此,细微的TF结合偏好可能会调节表达噪音水平或对转录开关产生其他轻微影响。人们可以通过将具有类似预测结合能的基因组合在一起,并分析它们在适当条件下的行为,观察到表达的微小变化。图66显示了三个TF的此类分析结果。对于Gcn4,表达测量取自两个突变体(数据来自Hughes等人,2000年). 由于Gcn4是许多基因的阳性调节因子全球通信网络4该菌株一般表现出Gcn4相关基因的抑制基因表达。对于前五个亲和力百分位数的基因,这种影响最强,但对于90-95百分位数甚至85-90百分位数的基因,观察到显著性抑制(与Gcn4进化保护谱相比,图。图5)。5). 瑞士文4诱导Gcn4基因的菌株。α-因子诱导的细胞Mbp1靶点分析(数据来自Roberts等人,2000年)或在第3类应变(数据来自Spellman等人,1998年)类似地,也证实了不在前五个亲和力百分位的启动子产生可观察表达的能力。对于Ume6(在通用电气公司6应变)(数据来自Williams等人,2002年). 大量基因表达谱的分析(参见支持网站,http://uqbar.rockefeller.edu/~atanay/prego公司)揭示了表达谱与弱预测结合能之间存在显著相关性的更多情况,从而表明图中的示例图66可能不是传闻。

保存图片、插图等的外部文件。对象名为962fig6.jpg

低亲和力启动子产生基因表达。图中所示为低启动子产生的基因表达(左边)到高(正确的)预测的TF-结合能。(x个-轴)预测TF-结合能的百分比(-轴)5个亲和力百分位数的箱子中对数折叠表达变化的中位数。每个图的实验条件不同,并在图上注明。表示显著上调或下调(方法)的垃圾桶用圆圈标记。曲线图表明,即使缺乏明确的结合位点,一些TF(例如Gcn4、Mbp1)也可能对大量基因的表达产生微弱影响。

讨论

低亲和性TF-DNA相互作用在体内广泛存在,可能具有功能和进化意义。转录因子随机结合DNA,因此预计它们将在不同的特异性水平上与启动子相互作用,这取决于DNA序列决定的亲和力(至少部分决定)。之前开发了几个模型来描述TF和DNA在可变亲和力下的相互作用(Gerland等人,2002年;Rajewsky等人,2002年;Brown和Callan Jr.2004;Mustonen和Lassig 2005). 然而,尚不清楚现存的各种细胞机制是如何调节特异性与非特异性TF结合水平的,以及体内转录网络的不同部分的准确性和确定性如何。目前的研究表明,我们可以使用ChIP实验来量化较弱的转录相互作用,并将其与启动子序列分析相结合。到目前为止,ChIP实验被认为只指示高亲和力TF靶标。因此,人们可以利用全面的ChIP实验来概述转录网络的“模拟”模型,并探索低特异性、概率性TF-DNA相互作用在基因组调控程序中的作用。目前的工作应该促使TF-DNA相互作用的机制模型进一步适应于全基因组数据集的分析,而不仅仅是这里使用的简单PWM。

低特异性TF–DNA相互作用可能是功能性的,也可能是非功能性的。非功能性相互作用不太可能影响基因表达,并且会暂时发生,对转录程序产生边际影响。功能相互作用可能会虚假地影响基因表达,或者与其他机制一起对转录程序形成显著影响,或者通过增加或减少与启动子的零星结合水平来调节基因表达的随机性水平(Raser和O'Shea 2005). 根据本文报道的进化和基因表达分析,酵母中许多低特异性的转录相互作用可能是弱功能的。研究表明,对于基因组的大部分,总结合能(不仅仅是结合位点的存在)是保守的,平均而言,预测结合亲和力较低的启动子仍然可以产生基因表达。在使用有限的实验资源研究主要调控效应时,对转录网络的离散确定性观点可能仍然是一个合理的折衷方案,但调控程序实际上可能以不同特异性水平的随机相互作用的更复杂组合为特征。从进化上讲,通过低亲和力相互作用的组合来软化离散逻辑的转录程序可能更加灵活。这样的程序可以使变化逐渐累积,从而减轻对特定位点(例如经典结合位点)的选择压力,并提高其进化能力。

在技术层面上,这项工作为ChIP实验的分析提出了一个新的框架。这里提出的方法相对直接,试图推断TF结合能的标准模型,忽略了结合过程的重要方面(例如竞争、饱和)(Nachman等人,2004年;Tanay和Shamir 2004;Bintu等人,2005年;格拉内克和克拉克2005). 尽管如此,新技术在基因组规模上的应用被证明比以前使用的几种成熟且微调算法的组合结果更有效(Harbison等人,2004年). 新的PREGO算法优于现有的方法,因为它以生物合理的方式使用了更多的信息。在除酵母以外的几个模型系统中,调控网络的广泛绘图正在顺利进行,人们对哺乳动物和疾病中转录调控研究的革命性进展寄予厚望。其中许多工作都是基于ChIP-on-ChIP技术,使用越来越多的复杂基因组覆盖率(Cawley等人,2004年;Odom等人,2004年;Ren和Dynlacht 2004). 应用定量方法分析这些研究,并仔细评估TF–DNA相互作用在特征明确的结合位点之外的作用,可能对这些研究非常有益。这里关于酵母的结果(见补充图3,用于分析小型人类ChIP数据集)表明,这种定量方法可能比预期的更快实用。

方法

数据处理

原始ChIP GenePix文件从ArrayExpress站点下载(加入W-MIT-10)。更改了几种数组类型的注释,以正确分配探测(在ArrayExpress中更新了这些注释)。当提及绑定时P(P)-值P(P)-中报告的值Harbison等人(2004)(摘自论文的支持网站)。在引用原始值时,使用了最初由GenePix软件计算的绑定比率。酵母启动子序列从SGD下载(http://www.yeastgenome.org),已更正米卡塔酵母菌基因开始注释,如中所示Tanay等人(2005).SGD GO注释下载自(http://www.geneontology.org). 从60多份出版物中收集的酵母基因表达简编被用作Tanay等人(2004年b; 参考资料见支持网站)。使用标准双向进行聚类k个-意味着。使用TANGO程序(可从支持网站获得)进行功能富集。

ChIP归一化

作为PREGO预处理的一部分,对所有ChIP剖面进行了归一化(补充图2)。归一化确保单核苷酸和二核苷酸探针频率以及长度大于5的Poly-X或Poly-XY形式的序列与归一化ChIP谱无关。

测试定量ChIP–序列相关性

将每个TF的ChIP数据和PWM预测结合起来,生成二维联合分布。使用EM算法检测给定数据的两个二正态分布的最大似然混合。混合模型通过两个分布的均值和协方差矩阵(一个表示“命中”,另一个表示非命中)以及确定两个分布相对权重的混合系数进行参数化。EM是从多个起点进行的,具有完美的收敛一致性,表明发现了全局最优。在假设两个分布的协方差均为零(如数字假设所示)的模型上执行EM会产生显著较低的可能性。此外,从这种零方差模型重新估计后验分布在所有情况下都产生了显著的协方差,再次确认了ChIP和序列之间的相关性确实是定量的,无法用数字现象的噪声近似值来解释。

预测结合能

一个PWMP(P)长度的正在定义概率分布我-通过设置Pr的mer序列(1. . .)至∏第页(i、 秒). 给定启动子序列,我们将PWM预测结合能定义为作为E类(P、 秒) = ∑j个Π第页(i、 秒+j个)(总结所有可能职位的贡献)。除非另有说明,否则本研究的结果是使用启动子位置−600到0得出的。

能量回归算法

给定芯片配置文件R(右),指定每个启动子的结合比率G公司,和一组启动子序列,我们希望搜索PWM模型P(P)这样的话E类(P、 秒)最佳预测R(右).使用Spearman相关性量化预测精度E类(P、 秒)和R(右)使用新开发的PREGO程序将PWM拟合到原始ChIP轮廓。PREGO算法由两个阶段组成。在第一阶段(类似于REDUCE算法[Bussemaker等人,2001年],但使用非参数秩相关统计),PREGO筛选了大量组合基序(全部k个-只有一个缺口的mers,这里k个< 9). 对于每个组合基序,该算法快速逼近k个-启动子中mer的出现和ChIP结合率。该算法计算P(P)-基于相关系数的独立性假设值,并使用Bonferroni因子对其进行多重检验。每当它发现k个-mer与P(P)-值超过显著性阈值(P(P)<0.01),继续到第二阶段。在第二阶段,PREGO使用相关k个-mers启动PWM回归算法。PWM是非线性的,因此不可能进行精确的线性回归。相反,开发了一种有效的局部优化程序,使模型的相关性最大化。补充图1给出了算法伪码。

进化分析

研究中酵母启动子区域的中性进化模拟是使用考虑突变背景的模型进行的(Siepel和Haussler 2004年). 该模型用于模拟启动子序列,例如,S.mikatae公司给定直系同源序列酿酒酵母发起人。要模拟S.mikatae公司核苷酸位置,该模型使用酿酒位置二核苷酸− 1,和模拟米卡塔核苷酸位置− 1. 模型参数是通过计算多个比对中的二核苷酸比对来估计的严格的感觉发起人(Cliften等人,2003年). 表示对齐的数量酿酒-米卡塔二核苷酸ab和cdn个美国广播公司然后定义Pr(d日|美国广播公司)=n个美国广播公司/∑x个(n个美国广播公司x个). 测试PWM预测的结合亲和力的守恒性第页2500个同源基因S.mikatae公司已鉴定出至少含有400bp的启动子。然后将启动子分为20组,每组具有特定范围的PWM能量酿酒酵母(因此,每组由五个能量百分位数组成)。使用中性模型,然后生成10个模拟的全基因组直系启动子集合(10个足以获得具有统计意义的结果,因为使用了每组中的基因集合)。结合能在每个酿酒酵母启动子及其真随机性S.mikatae公司计算正交曲线,并收集20组中每一组的能量变化绝对值。使用Kolmogorov-Smirnov统计,比较了实际能量变化和随机能量变化的分布P(P)-计算值以拒绝每个垃圾箱中的中性假设。每组基因的保守性得分定义为−log10(P(P)),其中P(P)是KSP(P)-值。

基因表达分析

为了测试结合亲和力对基因表达的影响,从一个大型简编中选择了感兴趣的TF活性的实验。使用TF的PWM,基因被分为20组,预测结合能增加。然后计算各组的基因表达分布及其中位数。此外,将各组中基因表达的分布与亲和力较小的所有集合的组合分布进行比较(例如,将85-90百分位中亲和力较高的基因的表达与0-85百分位的亲和力较高基因的表达进行比较)。这个P(P)-图中报告的值图66使用这两组数据的KS测试生成。

鸣谢

我感谢R.Shamir、I.Gat Viks、M.Kupiec、D.Peer和E.Siggia对手稿的讨论和批判性阅读;三名匿名裁判征求意见;和罗斯柴尔德基金会提供支持。

脚注

[补充材料可在线获取,网址:网址:www.genome.org以及http://uqbar.rockefeller.edu/~atanay/prego公司.]

文章在印刷前在线发布。文章和发布日期为http://www.genome.org/cgi/doi/10.1101/gr.5113606

工具书类

  • Bintu L.、Buchler N.E.、Garcia H.G.、Gerland U.、Hwa T.、Kondev J.、Phillips R.、Buckler N.E.,Garcia HG.、Gerland U.,Hwa T、Kondve J.、菲利普斯R.、加西亚H.G.,Gerland U、Hwa.T.、Kondev J、菲利普斯R、Gerland-U.、Hwa T。数字的转录调控:模型。货币。操作。遗传学。开发。2005;15:116–124. [PMC免费文章][公共医学][谷歌学者]
  • Brown C.T.、Callan C.G.,Jr.、Callan C.G.、Jr.进化比较表明,许多新的cAMP反应蛋白结合位点存在于大肠杆菌.程序。国家。阿卡德。科学。2004;101:2404–2409. [PMC免费文章][公共医学][谷歌学者]
  • Bussemaker H.J.、Li H.、Siggia E.D.、Li H、Siggica E.D.、SiggiaE.D.使用表达相关性检测调节元件。自然遗传学。2001;27:167–171.[公共医学][谷歌学者]
  • Cawley S.、Bekiranov S.、Ng H.H.、Kapranov P.、Sekinger E.A.、Kampa D.、Piccolboni A.、Sementchenko V.、Cheng J.、Williams A.J.、Be基拉诺夫S.、吴H.H.,Kapranov P.、赛金格E.A.、坎帕D.、皮科波尼A.、Sementchenko V.、程J.、威廉姆斯A.J。,Kapranov P.、Sekinger E.A.、Kampa D.、Piccolboni A.、Sementchenko V.、Cheng J.、Williams A.J.、Sekinger E.A.和Kampa D。,Cheng J.、Williams A.J.、威廉姆斯A.J.等。沿着人类染色体21和22的转录因子结合位点的无偏定位表明非编码RNA的广泛调控。单元格。2004;116:499–509.[公共医学][谷歌学者]
  • Cliften P.、Sudarsanam P.、Desikan A.、Fulton L.、Fultan B.、Majors J.、Waterston R.、Cohen B.A.、Johnston M.、Sudarsanam P.、Desican A.、Fu尔顿L.、Majorston R.、科恩B.A.、约翰斯顿M.、Desakan A.、富尔顿L。,Cohen B.A.、Johnston M.、Fulton B.、Majors J.、Waterston R.、Cohen B.A.、Johnton M.、Majors.J.、Walterston R、Cohen-B.A.、约翰斯顿M.、沃特斯顿R.、科恩B.A.、庄斯顿M.和Johnston M酵母菌基因组通过系统发育足迹。科学。2003;301:71–76.[公共医学][谷歌学者]
  • Dorrington R.A.、Cooper T.G.、Cooper T.G.的DAL82蛋白酿酒酵母绑定到DAL上游感应序列(UIS)。核酸研究。1993;21:3777–3784. [PMC免费文章][公共医学][谷歌学者]
  • Elowitz M.B.,Levine A.J.,Siggia E.D.,Swain P.S.,Levine A.J.,Siggia E.D.Swain P.S.,Sigia E.D.,Swain P.P.S。科学。2002;297:1183–1186.[公共医学][谷歌学者]
  • Gerland U.、Moroz J.D.、Hwa T.、Moroz J.D.、Hwa T.、Hwa T.转录因子-DNA相互作用的物理约束和功能特征。程序。国家。阿卡德。科学。2002;99:12015–12020. [PMC免费文章][公共医学][谷歌学者]
  • Granek J.A.、Clarke N.D.和Clarke ND.转录因子结合和基因调控的显式平衡建模。基因组生物学。2005;6:R87。 [PMC免费文章][公共医学][谷歌学者]
  • Harbison C.T.、Gordon D.B.、Lee T.I.、Rinaldi N.J.、Macisaac K.D.、Danford T.W.、Hannett N.M.、Tagne J.B.、Reynolds D.B.、Yoo J.、Golden D.B.、Lee T.I.,Rinaldi N.J.,Macisaac K.D.,Danford T.W.、汉内特N.M.,Tagnet J.B.、雷诺兹D.B.、Youo J.、Lee T.I.、里纳尔迪N.J。,Rinaldi N.J.、Macisaac K.D.、Danford T.W.、Hannett N.M.、Tagne J.B.、Reynolds D.B.、Yoo J.、MACISAC K.D.,Danford T.W.、汉内特N.M.,Tagne B.B.、Renolds D.B、Yoo.J.、丹福德T.W.,Hannett M.、塔根J.B.、雷诺兹D.B.、尤奥J.、泰根J.B。,等。真核生物基因组的转录调控代码。自然。2004;431:99–104. [PMC免费文章][公共医学][谷歌学者]
  • Hughes T.R.、Marton M.J.、Jones A.R.、Roberts C.J.、Stoughton R.、Armour C.D.、Bennett H.A.、Coffey E.、Dai H.、He Y.D.、Marton MJ.、琼斯A.R.,Roberts C.J.、斯托顿R.、阿莫尔C.D.、贝内特H.A.、科菲E.、戴H.、何Y.D.,Jones A.R、罗伯茨C.J。,Stoughton R.、Armour C.D.、Bennett H.A.、Coffey E.、Dai H.、He Y.D.、Stoughtone R.、Ammour C.、Bennett H.A.、Coffey E.和Dai H..、He Y.D.、Armor C.D.、Benett H.A、Coffey.E.、Dai-H.、何Y.D.和Coffey H.D.、Coffey-E.、Dai.H.、和Y.D。通过表达式概要进行功能发现。单元格。2000;102:109–126.[公共医学][谷歌学者]
  • Iyer V.R.、Horak C.E.、Scafe C.S.、Botstein D.、Snyder M.、Brown P.O.、Horack C.E.、Scafe C.S.和Botsteen D.、Snider M.、棕色P.O.和Scafe C.S.、Botstein D、Snyer M.、褐色P.O.,Botstean D.、Sneder M.和Brown P.O。酵母细胞周期转录因子SBF和MBF的基因组结合位点。自然。2001;409:533–538.[公共医学][谷歌学者]
  • Jia Y.、Rothermel B.、Thornton J.、Butow R.A.、Rotherme B.、Thronton J.、Bootow R.A、Thoronton J.和Butow R.A.。酵母功能中的基本螺旋-环-螺旋-亮氨酸拉链转录复合物,位于线粒体到细胞核的信号通路中。分子细胞。生物。1997;17:1110–1117. [PMC免费文章][公共医学][谷歌学者]
  • Kadosh D.,Struhl K.,Struhel K.。Ume6的抑制涉及到向靶启动子招募包含Sin3辅阻遏物和Rpd3组蛋白脱乙酰酶的复合物。单元格。1997;89:365–371.[公共医学][谷歌学者]
  • Kellis M.、Patterson N.、Endrizzi M.、Birren B.、Lander E.S.、Patterson N.、Endrizzi M.、Birren B.、Lander E.S.、Endrizzi M.、Birren B.、Lander E.S.酵母物种的测序和比较,以鉴定基因和调控元件。自然。2003;423:241–254.[公共医学][谷歌学者]
  • Kuruvilla F.G.、Shamji A.F.、Schreiber S.L.、Shamgi A.F.和Schreibe S.L.翻译的碳和氮质量信号由不同的GATA型转录因子介导。程序。国家。阿卡德。科学。2001;98:7283–7288. [PMC免费文章][公共医学][谷歌学者]
  • Lee T.I.、Rinaldi N.J.、Robert F.、Odom D.T.、Bar-Joseph Z.、Gerber G.K.、Hannett N.M.、Harbison C.T.、Thompson C.M.、Simon I.、Renaldi NJ.、罗伯特F.、奥多姆D.T.,Bar-Josseph Z.,Gerber GK.、汉内特N.M.,哈比森C.T.,汤普森C.M.,西蒙I.、Rober F.,Odom D.、Bar-约瑟夫Z.、格伯G.K。,Odom D.T.、Bar-Joseph Z.、Gerber G.K.、Hannett N.M.、Harbison C.T.、Thompson C.M.、Simon I.、Bar-Joseph Z、Gerber-G.K.、汉内特N.M。,Thompson C.M.、Simon I.、Siman I.等酿酒酵母.科学。2002;298:799–804.[公共医学][谷歌学者]
  • Li Z.,Van Calcar S.,Qu C.,Cavenee W.K.,Zhang M.Q.,Ren B.,Van Cacar S..,Qu C..,Cavenee-W.K..,Zang M.Q.、Ren B.、Ren B..、RenB.、Cavenee W.K.、Zhang MQ.、Len B..。C-Myc在Burkitt淋巴瘤细胞中的全球转录调控作用。程序。国家。阿卡德。科学。2003;100:8164–8169. [PMC免费文章][公共医学][谷歌学者]
  • Liu X.,Clarke N.D.,Clarke N.D.,真核转录因子基因调控的合理化:根据预测的结合亲和力计算调控区占有率。分子生物学杂志。2002;323:1–8.[公共医学][谷歌学者]
  • Mai B.,Breeden L.,Breedn L.Xbp1,一种应激诱导的酿酒酵母Swi4/Mbp1系列。分子细胞。生物。1997;17:6491–6501. [PMC免费文章][公共医学][谷歌学者]
  • Miled C.,Mann C.,Faye G.,Mann C..,Faye.G.,Faye-G.Xbp1-介导的CLB(爬升)基因表达有助于改变酵母细胞形态和氮限制生长期间的细胞周期。分子细胞。生物。2001;21:3714–3724. [PMC免费文章][公共医学][谷歌学者]
  • Moses A.M.、Chiang D.Y.、Kellis M.、Lander E.S.、Eisen M.B.、Chiand D.Y.,Kellis M、Lander E.S.、艾森M.B.、凯利斯M.、兰德E.S.,艾森M.B..、艾森M.B.、转录因子结合位点进化速率中的位置特异性变异。BMC演变。生物。2003;:19. [PMC免费文章][公共医学][谷歌学者]
  • Mustonen V.,Lassig M.,Lassig M.启动子的进化群体遗传学:预测结合位点和功能系统发育。程序。国家。阿卡德。科学。2005;102:15936–15941. [PMC免费文章][公共医学][谷歌学者]
  • Nachman I.、Regev A.、Friedman N.、Regeve A.、弗里德曼N.、弗里德曼·N。从表达数据推断调控网络的定量模型。生物信息学。2004;20(补充1):I248–I256。[公共医学][谷歌学者]
  • Odom D.T.、Zizlsperger N.、Gordon D.B.、Bell G.W.、Rinaldi N.J.、Murray H.L.、Volkert T.L.、Schreiber J.、Rolfe P.A.、Gifford D.K.、Zizls perger N..、Gorden D.B.、贝尔G.W.,Rinaldi.N.J.,Murray HL、Volker T.L.,SchreiberJ.、罗尔夫P.A.、吉福德D.K.,Gordon D.、Bell GW.、里纳尔迪N.J。,Gifford D.K.、Bell G.W.、Rinaldi N.J.、Murray H.L.、Volkert T.L.、Schreiber J.、Rolfe P.A.、Giford D.K.,Rinaldi.N.J.,Murray HL、Volker T.L.,SchreiberJ.、罗尔菲P.A.、吉福德D.K.(Gifford.D.K.)、Murrey H.L。,Rolfe P.A.、Gifford D.K.、Giffard D.K.等。通过HNF转录因子控制胰腺和肝脏基因表达。科学。2004;303:1378–1381. [PMC免费文章][公共医学][谷歌学者]
  • Paulsson J.总结基因网络中的噪音。自然。2004;427:415–418.[公共医学][谷歌学者]
  • Rajewsky N.,Vergassola M.,Gaul U.,Siggia E.D.,Vergassiola M..,Gaul.,Sigia E.D顺式-早期应用于身体模式的调节模块果蝇属胚胎。BMC生物信息学。2002;:30. [PMC免费文章][公共医学][谷歌学者]
  • Raser J.M.、O'Shea E.K.、O'Shea E.K.基因表达中的噪音:起源、后果和控制。科学。2005;309:2010–2013. [PMC免费文章][公共医学][谷歌学者]
  • Ren B.、Dynlacht B.D.和Dynlach B.D.染色质免疫沉淀分析在哺乳动物转录因子全基因组定位分析中的应用。方法酶制剂。2004;376:304–315.[公共医学][谷歌学者]
  • Ren B.、Robert F.、Wyrick J.J.、Aparicio O.、Jennings E.G.、Simon I.、Zeitlinger J.、Schreiber J.、Hannett N.、Kanin E.、Robert F、Wyrick J.J.,Aparicio.O、Jenning E.G、Simon I、Zeitringer J.,Schreiber.J、HannettN.、Kenin J.、Kanett N.、Wyick J.、Caparicio.、Jenings E.G、西蒙I.、泽林格J.、泽林杰J.、汉内特N.、卡宁E.、Aparico.O、。,Jennings E.G.、Simon I.、Zeitlinger J.、Schreiber J.、Hannett N.、Kanin E.、Jennings E.G.,Simon I、Zeitliner J.、施赖伯J.、汉内特N.、卡宁E.、Simon I,Zeitlingler J.,SchreiberJ.、Hannett N..、Kanin-E.、Schreiper J。DNA结合蛋白的全基因组定位和功能。科学。2000;290:2306–2309.[公共医学][谷歌学者]
  • Roberts C.J.、Nelson B.、Marton M.J.、Stoughton R.、Meyer M.R.、Bennett H.A.、He Y.D.、Dai H.、Walker W.L.、Hughes T.R.、Ne尔森B.、Marton M.J.,Stoughton-R.、Meyer-MR.、Bennett H.A.、He Y.D、Dai R.、Day M.R。,Bennett H.A.、He Y.D.、Dai H.、Walker W.L.、Hughes T.R.、Meyer M.R.、Bennett H.A.、He Y.D.、Dai H、Walker W.L.,Hughes T-R.、Benett H.A、He Y.D.、戴H.、Waker W.L、Hughles T.R.,He Y.D.、Dai H.、Walker W/L.、休斯T.R.和Dai H。全球基因表达谱矩阵揭示了多重MAPK通路的信号和电路。科学。2000;287:873–880.[公共医学][谷歌学者]
  • Ronen M.、Rosenberg R.、Shraiman B.I.、Alon U.、Rosenberg R.,Shraimam B.I.,Alon U..、Shraidan B.I..、Alon U。为箭头分配数字:使用准确的表达动力学参数化基因调控网络。程序。国家。阿卡德。科学。2002;99:10555–10560. [PMC免费文章][公共医学][谷歌学者]
  • Schawalder S.B.、Kabani M.、Howald I.、Choudhury U.、Werner M.、Shore D.、Kabany M.、Hawald I..、Choudury U.、沃纳M.、肖尔D.、霍华德I.、乔杜里U.、维尔纳M.,肖尔D.、乔杜利U.、韦纳M。自然。2004;432:1058–1061.[公共医学][谷歌学者]
  • Siepel A.、Hausler D.、Haussler D.通过最大似然法对环境相关替代率进行系统发育评估。分子生物学。进化。2004;21:468–488.[公共医学][谷歌学者]
  • Simon I.,Barnett J.,Hannett N.,Harbison C.T.,Rinaldi N.J.,Volkert T.L.,Wyrick J.J.,Zeitlinger J.,Gifford D.K.,Jaakkola T.S.,Barnet J.,汉内特J.,Harbinet N.,哈比森C.T。,Gifford D.K.、Jaakkola T.S.、Harbison C.T.、Rinaldi N.J.、Volkert T.L.、Wyrick J.J.、Zeitlinger J.、Giffords D.K.,Jaakkola-T.S.、Rinalddi N.J.,Volkert TL.、Wy里克J.J.,Zeitlingger J.、Jifford D.、Jaakcola T.S.,Volkert T.L.,Wyricck J.J.J。,Zeitlinger J.、Gifford D.K.、Jaakkola T.S.、Giford D.K.,Jaakkola T.S.和Jaakkolla T.S.等人。酵母细胞周期中转录调控因子的系列调控。单元格。2001;106:697–708.[公共医学][谷歌学者]
  • Spellman P.T.、Sherlock G.、Zhang M.Q.、Iyer V.R.、Anders K.、Eisen M.B.、Brown P.O.、Botstein D.、Futcher B.、Sherock G.,Zhang MQ.、Alyer V.R、Eisen-MB.、Brown-PO.、Botstein D..、Futcher-B.、Zhang-M.Q.,Iyer-V.R.、安德斯K.、艾森M.B.、布朗P.O。,Futcher B.、Anders K.、Eisen M.B.、Brown P.O.、Botstein D.、Futcher B、Eisen-MB.、Brown-P.O.、Botstein D、Futcher-B.、Brown-P.O、Botsstein D、Fotcher B.和Futcher-B.酵母细胞周期调控基因的综合鉴定酿酒酵母通过微阵列杂交。分子生物学。单元格。1998;9:3273–3297. [PMC免费文章][公共医学][谷歌学者]
  • Stormo G.D.,Hartzell G.W.,III,Hartzell G.W.,III从未对齐的DNA片段中鉴定蛋白质结合位点。程序。国家。阿卡德。科学。1989;86:1183–1187. [PMC免费文章][公共医学][谷歌学者]
  • Strich R.、Surosky R.T.、Steber C.、Dubois E.、Messenguy F.、Esposito R.E.、Suroski R.T.,Steber C、Duboies E.、Messenguy F.,EspositoR.E.、DuboisE.、Messhenguy F、EspositioR.E.,Dubois E,MessenguyF.、Esposito.R.E.、Messenguy E.、Espositiono R.E.,Espositio R.E.UME6是氮抑制和减数分裂发育的关键调节器。基因与发育。1994;8:796–810.[公共医学][谷歌学者]
  • Tanay A.、Shamir R.和Shamir R。转录调控的多水平建模和推断。J.计算。生物。2004;11:357–375.[公共医学][谷歌学者]
  • Tanay A.、Gat-Viks I.、Shamir R.、Gat-Viks I.、沙米尔R.、沙米尔R.酵母进化中选择力的全球观点顺式-监管。基因组研究。2004年a;14:829–834. [PMC免费文章][公共医学][谷歌学者]
  • Tanay A.、Sharan R.、Kupiec M.、Shamir R.、Sharan R、Kupiec M.、沙米尔R.、库皮埃克M.、莎米尔R.和沙米尔R。通过高度异质性全基因组数据的综合分析揭示酵母分子网络的模块性和组织性。程序。国家。阿卡德。科学。2004年b;101:2981–2986. [PMC免费文章][公共医学][谷歌学者]
  • Tanay A.、Regev A.、Shamir R.、Regev.A.、Shamicr R.和Shamir R。调节网络中的保护和进化:酵母中核糖体调节的进化。程序。国家。阿卡德。科学。2005;102:7203–7208. [PMC免费文章][公共医学][谷歌学者]
  • Wade J.T.、Hall D.B.、Struhl K.、Hall D.B.、Struxl K.、Struhel K.转录因子Ifh1是酵母核糖体蛋白基因的关键调节因子。自然。2004;432:1054–1058.[公共医学][谷歌学者]
  • Williams R.M.、Primig M.、Washburn B.K.、Winzeler E.A.、Bellis M.、de Sarrauste Menthiere C.、Davis R.W.、Esposito R.E.、Primig-M.、Walshburn B.、Winzeller E.A.、Ballis M.、de Sarlauste Minthiere C.Davis R.W.、Esposito R.E.、Winzele E.A.、Berlis M.,de Sarruaste Menthiere C.、Davis R.W.,Esposito-R.E.、Winziler E.A.和Bellis M。,de Sarrauste Menthiere C.、Davis R.W.、Esposito R.E.、Bellis M.、de Sarrouste Menthiere C.、Davis R.W.,Esposito-R.E.、de Sarlauste Minthiere C.Davis R.W.、Esposito R.E.、Daviss R.W.EspositoR.E.、Espositio R.E.。Ume6调节子协调酵母中的代谢和减数分裂基因表达。程序。国家。阿卡德。科学。2002;99:13431–13436. [PMC免费文章][公共医学][谷歌学者]

文章来自基因组研究由以下人员提供冷泉港实验室出版社