跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2005; 33(1): 272–279.
2005年1月12日在线发布。 数字对象标识:10.1093/nar/gki167
预防性维修识别码:项目编号:546154
PMID:15647509

推断转录的组合调控生物信息学

关联数据

补充资料

摘要

在本文中,我们提出了一个关于生物信息学转录调控的预测。我们提出了一种预测由转录因子组合相互作用调节的生物功能的方法。使用严格的统计数据,该方法将基因上游序列中转录因子结合位点的存在与与这些基因相关的基因本体术语交叉。我们证明,对于一组经过充分研究的骨骼肌相关转录因子Myf-2、Mef和TEF,可以预测其正确的功能。此外,从脂多糖刺激后表达的基因的特征良好的启动子开始,我们预测该刺激的功能靶点。这些结果与微阵列数据非常一致。

引言

转录调控是控制基因时空活动的主要机制,从而控制真核生物生物过程的组织。复杂的信号机制将外部和内部刺激传递给转录因子的活动,转录因子是转录调控的主要手段。通过这一点,真核细胞能够充分适应环境,并协调增殖和分化等事件。与原核生物不同,原核生物的转录调控可以通过单个因子的诱导来理解,而真核生物的调控主要是通过多种转录因子的复杂相互作用来实现的。此外,调控位点分布在基因组的大区域,包括内含子序列(1,2). 很少有个别结合位点是高度保守的,只有组合作用才能引起特定的控制。因此,理解高等生物中复杂的基因调控网络是一项极其困难的任务。

考虑到转录调控的重要性和大量可用的基因组数据,基因调控网络的自动推断是后基因组时代的一大挑战。然而,直接搜索由一致序列或权重矩阵表示的转录因子结合位点会导致误报。Wasserman和Sandelin()估计对结合位点的简单搜索只会导致每1000个预测中只有一个功能位点。因此,必须利用基因调控的其他可用生物学特性来改进计算预测。例如,来自表达谱的共同调控基因组(4,5),系统发育保守区域(6,7)和结合位点的聚类(8)进行了研究。然而,结合位点预测的特异性仍然不令人满意()以及昂贵的实验研究,如ChIP芯片实验(2,9,10)都是必要的。

在本文中,我们通过利用基因本体中编译的专家知识的日益系统化表示,提出了基因调控网络的功能视图(11). 我们使用公共软件提取基因的上游区域(12)并预测结合位点簇(8). 然后从基因本体中搜索在其上游区域具有公共簇的基因,以获取与注释的统计关联。为此,使用了一个新的程序GOSSIP(基因本体论意义统计解释程序;N.Blüthgen、K.Brand、B.Cajavec、M.Swat、H.Herzel和D.Beule,提交出版),该程序精确考虑了多样本校正。这种方法可以预测由转录因子组合作用控制的生物功能。在前面的一篇论文中,我们证明了这种方法可以预测单个因素和两个特征明确的因素的组合的功能调节(13). 在这里,我们讨论了几个转录因子对更复杂的组合调控的推断。首先,我们使用一组经过充分研究的共同调节骨骼肌基因表达的转录因子来测试和验证我们的算法(14). 结果表明,在不使用关于这些因素的功能目标的先验知识的情况下,我们可以正确地预测它们的功能。随后,我们表明,我们的方法也可以弥合单基因调控的详细研究和全基因组分析之间的差距。费塞尔. (15)揭示了在脂多糖(LPS)刺激单核细胞时对趋化因子RANTES表达进行差异调节的转录因子。我们将我们的框架应用于这组转录因子,并将预测的功能与公开的微阵列数据进行比较。结果显示出显著的相似性,尽管微阵列数据是在不同的生物体中产生的,并且经过长时间的刺激,也允许间接调节。

材料和方法

算法

本文中的分析结合了两种算法(参见图1). 首先,我们对潜在受考虑因素调控的基因进行全基因组搜索。为此,Cluster-Buster程序(8)用于预测基因上游区域的转录因子结合位点簇。为了避免主观参数调整带来的问题,我们使用程序的默认参数。

保存图片、插图等的外部文件。对象名称为gki167f1.jpg

我们方法中的数据流:使用Cluster-Buster算法,我们搜索假定启动子区域中的结合位点簇。然后将启动子中具有簇的基因列表传递给GOSSIP,GOSSIP使用基因本体检测与生物过程的关联。报告了显著相关的过程。

其次,我们测试具有预测簇的基因是否与生物过程相关。这是由GOSSIP(N.Blüthgen、K.Brand、B.Cajavec、M.Swat、H.Herzel和D.Beule,提交出版)使用基因本体注释执行的(11). 该算法测试基因本体中的每个术语,以对比来自参考组的基因注释是否丰富。这里,测试组包含Cluster-Buster报告其结合位点簇的基因。参考组由研究中的所有基因组成。使用基于超几何分布的单侧Fisher精确检验,GOSSIP计算出P(P)-空假设的值,即测试组的注释是从参考组中随机抽样的。由于该测试是在所有条件下进行的,因此必须考虑多次测试产生的问题。因此,我们决定不使用单一测试P(P)-但以错误发现率(FDR)作为重要程度的适当度量。FDR(α)量化了单个测试中相对于阳性NP(α)总数的预期错误发现数<NFD(α)>P(P)-阈值α:

财务总监(α)=非金融机构(α)NP公司(α),
1

使用超几何分布,可以计算每个错误发现的预期数量〈NFD(α)〉P(P)-阈值α依据

非金融机构(α)=j个第页(f)(j个,Z轴,T型,N个)<α小时(j个,Z轴,T型,N个),
2

其中第一个和超过所有项来自基因本体论,在第二个和中j个用术语注释的基因只要单边费舍尔精确测试第页(f)(j个,Z轴,T型,N个)不超过α。Z轴表示用该术语注释的基因数量在参照组中。T型N个分别表示测试组和参考组中的基因数。小时(j个,Z轴,T型,N个)表示超几何分布:

小时(j个,Z轴,T型,N个)=Z轴!T型!(N个Z轴)!(N个T型)!N个!j个!(Z轴j个)!(T型j个)!(N个Z轴T型+j个)!.

在本文中,我们设置了阈值α,使FDR保持在5%以下。更多详细信息和GOSSIP软件程序可在网站上获得http://itb.biologie.hu-berlin.de/~nils/八卦/.

数据准备

对于16032个人类UniGene簇,我们提取了Ensembl报告的转录起始位点上游的序列(16). 我们发现了15362个独特的上游区域,因为几个UniGene簇指向Ensembl中的相同基因。我们将重复项视为单个基因,并加入其基因本体注释。我们测试了TSS上游长度为250、500、750、1000、1250、1500、2000的序列,发现使用1000 bp的序列显示最低的P(P)-值(参见补充图S2),其他长度没有产生额外的术语。这与Dieterich的估计一致. (17)大多数发起人应该与这些地区重叠。

基因本体定义了一个层次化的受控词汇来注释基因。它包含三个分支:生物过程、分子功能、细胞定位。我们将分析局限于描述生物过程的分支。使用HomGL将基因本体的注释分配给基因(12). 每个注释都意味着基因本体层次结构中向上的一系列更通用的注释,我们也将其考虑在内。

在本文中,我们分析了两组转录因子。第一组由参与骨骼肌特异性基因表达的转录因子组成。它由位置频率矩阵表示,由体外测量值(Mef-2、Myf和SRF)和非肌肉特异性基因(Sp-1和TEF)(14). 在第二部分中,我们分析了在LPS刺激下调节单核细胞RANTES/CCL5启动子的转录因子组合(15,18). 该组由转录因子AP1、CEBP、CREB、ETS、NF-κB(p50和p65)和Sp-1组成。它由Transfac矩阵表示(19)注册号:V$AP1_Q6_01、V$CEBP_Q2、V$CREB_Q4、V$ETS_Q4、V$NFKAPPAB50_01、V$NFS PPAB65_01和V$SP1_Q6 _01。此外,我们通过分析细胞信号联盟产生的LPS刺激单核细胞的微阵列数据集来评估第二组结果的生物学有效性,该数据集可在信号网关微阵列数据中心获得(http://www.signaling-gateway.org/data/micro/cgi-bin/micro.cgi?expt=operon),注册号:MAE040216Z53、MAE0402017Z53、MA E040218Z53、M AE040216Z 63、M AE0040217Z63和M AE0402018Z63。这些是LPS处理后4小时小鼠单核细胞的表达谱,包括染色和三次复制。通过GOSSIP,我们获得了每个微阵列的生物图谱。在该分析中,背景集由显著表达的基因组成(两个通道的“isWellAboveBG”),而受调控基因集包含的基因P(P)-值小于0.01('logRatioPValue'<0.01)。这两个集合都用HomGL映射到UniGene簇,以避免列表中每个基因出现多个条目,因为这可能会使分析产生偏差。所有六个微阵列的图谱显示出与上调基因相关的相同术语,而与下调基因无关。

结果

肌肉转录因子调节的过程

Wasserman和Fickett(14)研究了与骨骼肌特异性基因表达相关的转录因子家族。在确定了调节骨骼肌特异性基因的转录因子后,作者构建了一组包含五个基于结合位点(Mef-2、Myf、SRF)的位置频率矩阵体外或作用于在肌肉特异性表达中不起任何作用的启动子(Sp-1、TEF)。骨骼肌特异基因的启动子故意不用于生成基质。将我们的方法应用于所有五种基质会产生显著相关的生物过程:肌肉发育(FDR=0.003)、肌肉收缩(FDR:0.008)和B细胞激活(FDR=0.017)。由于Sp-1因子参与了许多其他功能的调节,我们对所有26个矩阵子集进行了详细研究,其中包含了原始五个矩阵中的至少两个矩阵(结果见补充表S1)。在12例患者中,未发现基因本体术语显著过度表达。由Mef-2、Myf和TEF矩阵组成的集合最适合肌肉收缩。此外,横纹肌收缩一词在这里的意义最高。这些矩阵的结果如所示图2有趣的是,在所有分析数据集中,平滑肌收缩都不显著。这一发现独立地证实了所选转录因子可能有助于骨骼肌特异性表达(14). 大多数含有Mef-2矩阵的亚群产生了与B细胞激活相关的术语。Mef-2家族的转录因子在B细胞中有差异表达,这些细胞具有含Mef-2C的Mef-2特异性DNA结合复合物,这表明Mef-2C在B细胞活性中可能起作用(20).

保存图片、插图等的外部文件。对象名为gki167f2.jpg

已知调节肌肉特异性基因表达的一组转录因子Mef-2、Myf和TEF的结果(14). 黑色和灰色方框对应预测目标基因内基因本体的显著过度表达生物过程【FDR阈值分别≤0.01和FDR阈值≤0.05】。菱形显示了生物过程的根节点。()分析复杂性的一个例证:在所有655个指定给具有预测结合位点簇的基因的术语的上下文中绘制的过度代表术语。(b条)强调所有明显过度代表的术语的片断。

从单个基因对脂多糖诱导的反应到功能谱

趋化因子RANTES/CCL5在炎症疾病的病理学中起着不同的作用(15). 它是T细胞和单核细胞的化学吸引剂,用LPS刺激后单核细胞迅速产生。LPS是革兰氏阴性菌的细胞壁成分. (15)研究了人类单核细胞中RANTES/CCL5表达对LPS刺激的调节。他们发现CREB、CEBP、p50/p65、Sp-1、ETS和AP1转录因子与未经处理和LPS刺激的单核细胞中RANTES/CCL5启动子的结合不同。此外,作者还构建了生物信息学启动子模型,并发现四个基因与其模型匹配(21).

我们假设在单核细胞中有更多LPS诱导的基因受到相同因子的调节。如果这个假设成立,我们可以通过将我们的框架应用于这组转录因子,在单核细胞中找到受LPS刺激调节的功能。这组转录因子的结果剖面如所示图3a,统计细节见补充表S2。我们发现几个重要的生物过程,包括对压力的反应、对生物刺激的反应以及趋化性和细胞通讯。它们都能在单核细胞接触细菌脂多糖后的反应中发挥作用。压力反应和生物刺激反应这两个术语在基因本体论层次结构中是炎症反应的更通用术语。细胞通讯包括趋化因子的分泌,例如趋化因子RANTES在LPS刺激下上调。此外,调控与趋化性有关的基因似乎是合理的,因为巨噬细胞会向细菌移动并分泌趋化因子以吸引其他巨噬细胞。

保存图片、插图等的外部文件。对象名称为gki167f3.jpg

黑色和灰色方框表示显著相关的生物过程[FDR分别≤0.01和FDR≤0.05]()我们的方法预测的转录因子CREB、CEBP、p50/p65、Sp-1、ETS和AP1的集合;(b条)单核细胞LPS刺激后上调基因(来自细胞信号联盟的微阵列数据)。

接下来,我们将我们的预测与细胞信号联盟(AfCS)在LPS刺激后4小时从小鼠单核细胞获得的微阵列数据进行比较。用GOSSIP分析上调基因列表产生了类似的富集基因本体术语模式(参见图3b)对所有六个微阵列进行分析。重要的是,除细胞通讯和细胞粘附外,我们在微阵列数据中发现所有预测的靶功能。毫不奇怪,我们从一个基因(RANTES)的调控开始分析,在微阵列数据中发现了额外的功能。除了导致RANTES表达的途径和转录因子外,LPS治疗后的反应可能还涉及其他途径和转录因素。表达谱预计将包括由其他途径控制的反应,从而导致更多的术语。

接下来,研究了在微阵列实验中,预测受选定转录因子调控的基因是否确实上调。此外,我们还研究了使用重要的基因本体术语进行过滤是否可以改进目标基因的预测。为了解决这个问题,我们定义了三组基因:存在于微阵列上的基因,在上游区域具有预测的结合位点簇的基因,以及另外参与预测的生物过程之一的基因。对于这三组基因,我们计算了微阵列实验中fold变化的分布,如图4在整个微阵列中,11 617个基因中的216个(1.8%)具有2倍或更高的倍变化。在来自微阵列的1144个基因中,上游区域具有预测的结合位点簇,其中35个基因(3%)上调(显著富集,P(P)<0.005,使用χ2-测试)。在考虑了这些用预测的基因本体术语附加注释的基因后,特异性进一步增加(P(P)< 0.02). 在360个与此类别匹配的基因中,18个基因(5%)的折叠变化大于2。没有通过最后一步筛选的784个基因与总体分布没有显著差异(P(P)≈ 0.6). 这些结果表明,部分预测的目标基因上调,并且与基因本体的交叉显著提高了这一比率。这证实了我们最初的假设,即许多基因通过同一组转录因子的调节对LPS作出反应。此外,它表明功能注释的使用可以提高转录因子靶点全基因组鉴定的特异性。这尤其有趣,因为我们的预测是针对人类序列进行的,而实验是在小鼠单核细胞中进行的,这反映了高度的进化保守性。

保存图片、插图等的外部文件。对象名称为gki167f4.jpg

所有基因的微阵列数据集中平均倍数变化的归一化累积直方图(开放条),其中Cluster Buster检测到一簇结合位点的基因(灰色条),以及在用基因本体论进行额外过滤后(封闭条)。

特异性和敏感性

为了评估我们的结果的特异性,我们将其与从位置频率矩阵的随机集中获得的结果进行了比较。这些随机集是通过排列矩阵的位置来构造的,从而保持了它们的信息含量和GC含量。对1200组置换肌肉相关矩阵Mef-2、Myf和TEF进行分析,得出76组(6.3%)具有一个或多个显著项。有趣的是,所有排列的数据集都没有得出与肌肉发育或B细胞激活相关的结果。平均而言,我们发现了0.46个错误发现P(P)<0.0008(这是P(P)-最不显著项淋巴细胞分化值)。考虑到原始数据集中的八个有效项,这对应于5.8%的FDR。

对于介导LPS刺激反应的转录因子,我们进行了类似的分析:在2000组置换矩阵中,545(27%)组与至少一个有效项相关,共2231个有效项。然而,在解释这些结果时必须小心,因为该集合包含识别GC含量高的位点的因子(Sp-1,NF-κB p50)。尽管Cluster-Buster使用的背景模型考虑了GC-variation,但这些因素更倾向于GC-rich上游地区的站点。这会影响分析,因为这些区域本身与某些过程相关联。上游区域中GC含量最高的10%的基因与35个术语显著相关,这些术语描述了发育/神经发生、转录调控、离子转运、磷酸化和信号转导等过程(见图S1)。从报告的置换矩阵的重要项来看,1725项(77%)与GC-富集上游区域相关的项相同,平均每个项出现在54个置换集合中。有趣的是,与GC-rich上游地区无关的术语平均只报告了1.8组。因此,为了进行正确的解释,必须考虑位置频率矩阵的组成,因为GC-丰富矩阵可能会导致更多误报。在这种情况下,可以使用对置换矩阵的分析来找出错误发现的预期数量。然而,原始LPS相关矩阵集合的有效项与GC-rich启动子相关的有效项没有明显重叠。此外,在排列分析中很少有报道:四组(细胞通讯),两组(趋化性,趋化性),一组(对生物刺激的反应),无一组(应激反应,细胞粘附)。

由于缺乏高等真核生物组合基因调控的功能数据,因此很难构建真正的阳性集,因此也很难估计我们分析的敏感性。然而,也有一些具有被同一因子识别的结合位点簇的启动子,例如在昼夜节律时钟基因的启动子中发现的电子盒簇(22). 这些集群可以足够具体,以揭示其功能目标。例如,转录因子E2F的结合位点簇可以清楚地与细胞周期的S期相关联(13). 因此,对单个因素的分析可能会提供对敏感性的粗略估计。将我们的方法应用于Jaspar中哺乳动物因子的78个矩阵(23)以及人类上游区域,我们发现了20个重要的功能特征,共142个术语。由于我们不知道真函数,所以我们通过置换分析来估计假轮廓的数量。这里我们发现平均0.9个配置文件包含4.3个术语。鉴于这些数字,我们估计,在研究的78个因素中,约有19个因素可以与其功能目标正确关联。由于目前尚不清楚78个转录因子中的哪一部分在其靶基因中表现出结合位点簇,因此这个数字不能直接转化为特异性。

基因本体论的许多术语,尤其是更具体的术语,只注释了几个基因。例如,在一组由15362个独特的上游区域组成的集合中,三个基因被注释为术语同型转换。在Mef-2/Myf/TEF转录因子集的例子中,Cluster-Buster检测到上游区域(共15362个)中499个区域的结合位点簇。描述同型转换的所有三个基因都在这499个基因中。这个P(P)-这种符合值为0.00012(费希尔精确测试),多次测试后,FDR为0.017。这表明,仅注释少数基因的术语可能具有重要意义。只要聚类分析预测的假阳性基因在功能关联方面随机散布的假设成立,多重测试校正就考虑了注释的数量。

讨论

全基因组序列的可用性和不断增长的系统注释(如基因本体)为超越单基因水平的更面向功能的数据挖掘提供了手段。在本文中,我们提出了一种方法,该方法允许推断受转录因子组合相互作用调节的生物功能生物信息学与其他广泛使用的技术相反,我们的方法并不打算预测哪些因素控制相似表达谱的基因。相反,我们的搜索只需要一组表示转录因子的位置频率矩阵来预测其生物功能生物信息学首先,我们使用Cluster-Buster预测一组转录因子的潜在靶基因列表。然后,对基因本体提供的所有生物过程应用GOSSIP中实现的生物过程关联性的严格统计测试。因此,该搜索不受任何与这些因素相关的先验知识的影响,并提供了检测新的监管关联的机会。

本文中提出的肌肉相关转录因子的研究实例说明了该方法的实用性。正如预期的那样,肌肉转录因子的位点簇显著富集了骨骼肌特异性的术语。我们的方法表明,Mef-2在B细胞激活的背景下起着主要作用,这与文献一致。值得注意的是,在这些研究中不需要调整参数。

我们的方法弥补了单个启动子详细研究和全基因组方法之间的差距。发现控制RANTES基因的转录因子的组合作用用于预测LPS刺激后的调节功能。预测的功能与LPS刺激小鼠单核细胞后差异表达基因的图谱显示出显著的一致性。

此外,该方法还提供了一个支持所报告的富集过程证据的基因列表。这个基因列表可以理解为受研究因子和至少用一个过度表达术语注释的基因调控的基因的横截面。由于横截面的过滤特性,与潜在调控基因的主要列表相比,最终基因列表的错误预测更少,正如我们用微阵列数据验证的那样。

通过对由置换矩阵组成的随机数据集的分析,我们估计约5%与转录因子靶点相关的术语是偶然预测。该分析还表明,当位置频率矩阵的GC含量较高时,该方法不太具体,因为有几个与GC丰富的上游区域相关的项。如果是这样,那么必须仔细解释结果,排列分析可以帮助估计其重要性。由于缺乏真正的阳性数据集,对敏感性的估计存在问题。通过研究单个哺乳动物转录因子的相同结合位点簇,我们估计,在超过25%的情况下,我们的方法成功地将生物过程与转录因子结合位点簇相关联。

一些复杂的算法已经被开发出来,用于预测高等真核生物中的调节元件。尽管他们使用了诸如表达谱和系统发育足迹等附加信息,但错误预测的数量仍然很高。我们的论文不是专门预测单个基因的调控,而是旨在整合全基因组信息的不同来源。它表明,随着Cluster-Buster等高级预测程序和由基因本体表示的专家知识的出现,当应用严格的统计数据时,可以使用工具推断监管复杂性。这种全基因组转录调控方法可以预测由转录因子组合作用调节的功能。此外,它可以过滤潜在的目标基因列表,以减少错误发现的数量。

补充材料

补充材料可在NAR Online上获得。

补充材料

【补充资料】

鸣谢

作者感谢参与GOSSIP开发的Dieter Beule,以及Martin Frith和Zhiping翁为我们提供了集群集群计划。我们感谢Didier Gonze和Susanna Akehurst仔细阅读手稿,感谢Christine Sers对生物影响的讨论。N.B.感谢DFG(SFB 618)和BMBF的Sz.M.K.的支持。我们非常感谢细胞信号联盟提供的微阵列数据,并感谢Sangdun Choi和Robert Hsueh的小组提供这些数据。本文的开放存取出版费用由Deutsche Forschungsgemeinschaft(DFG)提供,Sonderforschungsbereich 618。

参考文献

1Cawley S.、Bekiranov S.、Ng H.H.、Kapranov P.、Sekinger E.A.、Kampa D.、Piccolboni A.、Sementchenko V.、Cheng J.、Williams A.J.等人。转录因子结合位点沿人类染色体21和22的无偏映射表明非编码RNA的广泛调控。单元格。2004;116:499–509.[公共医学][谷歌学者]
2Eukilchen G.、Royce T.E.、Berton P.、Marton R.、Rinn J.L.、Nelson F.K.、Sayward F.、Luscombe N.M.、Miller P.、Gerstein M.、Weissman S.、Snyder M.CREB与人类22号染色体上的多个位点结合。分子细胞生物学。2004;24:3804–3814. [PMC免费文章][公共医学][谷歌学者]
三。Wasserman W.W.,Sandelin A.应用生物信息学鉴定调控元件。《自然·遗传学评论》。2004;5:276–287.[公共医学][谷歌学者]
4Pilpel Y.,Sudarsanam P.,Church G.M.通过启动子元件的组合分析识别调控网络。自然遗传学。2001;29:153–159.[公共医学][谷歌学者]
5Kielbasa S.M.、Blüthgen N.、Sers C.、Schäfer R.、Herzel H.预测顺式-共调控基因的调控元件。基因组信息学。2004;15:117–124.[公共医学][谷歌学者]
6Wasserman W.W.、Palumbo M.、Thompson W.、Fickett J.W.、Lawrence C.E.人鼠基因组比较以定位调控位点。自然遗传学。2000;26:225–228.[公共医学][谷歌学者]
7Dieterich C.、Wang H.、Rateitschak K.、Luz H.、Vingron M.CORG:比较调控基因组学数据库。核酸研究。2003;31:55–57. [PMC免费文章][公共医学][谷歌学者]
8Frith M.C.,Li M.C.,Weng Z.簇巴斯特:在DNA序列中发现密集的基序簇。核酸研究。2003;31:3666–3668. [PMC免费文章][公共医学][谷歌学者]
9Ren B.、Cam H.、Takahashi Y.、Volkert T.、Terragni J.、Young R.A.、Dynlacht B.D.E2F将细胞周期进展与DNA修复、复制和G2/M个检查点。基因发育。2002;16:245–256. [PMC免费文章][公共医学][谷歌学者]
10Marton R.、Eukilchen G.、Berton P.、Hartman S.、Royce T.E.、Luscombe N.M.、Rinn J.L.、Nelson F.K.、Miller P.、Gerstein M.、Weissman S.、Snyder M.人类22号染色体上NF-κB结合位点的分布。程序。美国国家科学院。科学。美国。2003;100:12247–12252. [PMC免费文章][公共医学][谷歌学者]
11Ashburner M.、Ball C.A.、Blake J.A.、Botstein D.、Butler H.、Cherry J.M.、Davis A.P.、Dolinski K.、Dwight S.S.、Eppig J.T.等人。《基因本体:生物学统一的工具》。基因本体联盟。自然遗传学。2000;25:25–29. [PMC免费文章][公共医学][谷歌学者]
12Blüthgen N.、Kielbasa S.M.、Cajavec B.、Herzel H.HOMGL——比较不同物种的遗传列表以及不同的登录号。生物信息学。2004;20:125–126.[公共医学][谷歌学者]
13Kielbasa S.M.,Blüthgen N.,Herzel H.转录因子调控功能的全基因组分析。作者:Giegerich R.,Stoye J.,编辑。2004年德国生物信息学会议。第P-53卷。波恩:Gesellschaft für Informatik;2004年,第105–113页。[谷歌学者]
14Wasserman W.W.、Fickett J.W.确定赋予肌肉特异性基因表达的调控区域。分子生物学杂志。1998;278:167–181.[公共医学][谷歌学者]
15Fessele S.、Boehlk S.、Mojaat A.、Miyamoto N.G.、Werner T.、Nelson E.L.、Schlondorff D.、Nelsson P.J.Molecular和生物信息学在单核细胞中介导LPS诱导的RANTES/CCL5表达的启动子模块和C/EBP元件的特征。FASEB J。2001;15:577–579.[公共医学][谷歌学者]
16Birney E.、Andrews D.、Bevan P.、Caccamo M.、Cameron G.、Chen Y.、Clarke L.、Coates G.、Cox T.、Cuff J.等人,2004年合奏。核酸研究。2004;32:D468–D470。 [PMC免费文章][公共医学][谷歌学者]
17Dieterich C.、Cusack B.、Wang H.、Rateitschak K.、Krause A.、Vingron M.基于人-鼠基因组比较注释调控DNA。生物信息学。2002;18:S84–S90。[公共医学][谷歌学者]
18Fessele S.、Maier H.、Zischek C.、Nelson P.J.、Werner T.监管背景是基因功能的关键部分。趋势Genet。2002;18:60–63.[公共医学][谷歌学者]
19Heinemeyer T.、Wingender E.、Reuter I.、Hermjakob H.、Kel A.E.、Kel O.V.、Ignatieva E.V.、Ananko E.A.、Podkolodnaya O.A.、Kolpakov F.A.、Podcolodny N.L.、Kolchanov N.A.转录调控数据库:TRANSFAC、TRRD和COMPEL。核酸研究。1998;26:362–367. [PMC免费文章][公共医学][谷歌学者]
20Swanson B.J.、Jack H.M.和Lyons G.E.B和T细胞中肌细胞增强因子2(MEF2)表达的特征:MEF2C是淋巴细胞中的一种B细胞限制性转录因子。分子免疫学。1998;35:445–458.[公共医学][谷歌学者]
21Werner T.、Fessele S.、Maier H.、Nelson P.启动子组织的计算机建模作为研究转录协同调控的工具。FASEB J。2003;17:1228–1237.[公共医学][谷歌学者]
22Gekakis N.、Staknis D.、Nguyen H.、Davis F.、Wilsbacher L.、King D.、Takahashi J.、Weitz C.时钟蛋白在哺乳动物昼夜节律机制中的作用。科学。1998;280:1564–1569.[公共医学][谷歌学者]
23Sandelin A.、Alkema W.、Engstrom P.、Wasserman W.W.、Lenhard B.JASPAR:真核转录因子结合图谱的开放存取数据库。核酸研究。2004;32:D91–D94。 [PMC免费文章][公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社