跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2010年7月1日;38(Web服务器问题):W299–W307。
2010年6月11日在线发布。 doi(操作界面):10.1093/nar/gkq531
预防性维修识别码:项目经理2896116
PMID:20542910

RegPredict:基于比较基因组学方法的原核生物调控子推断集成系统

摘要

RegPredict web服务器旨在提供比较基因组学工具,用于使用比较基因组学方法重建和分析微生物调控子。该服务器允许用户在一组原核基因组中快速生成调控子和调控基序的参考集。共同调控的同源操纵子簇的新概念允许用户分配对大调控子的分析,并独立地对多个簇进行比较分析。RegPredict中当前实现的两个主要工作流是:(i)已知调控基序的调控子重构和(ii)从头算使用几种场景来产生起始基因集的新调节子的推断。RegPredict提供了一个全面的人工管理的调控基序位置权重矩阵集合。它基于MicrobesOnline的基因组序列、正交和操纵子预测。RegPredict的交互式web界面集成并显示了来自多个web资源的有关候选调控子成员的各种基因组和功能信息。RegPredict可在免费访问http://regpredict.lbl.gov.

简介

转录调控网络的准确重建和调控元件的注释是大规模基因组测序时代微生物基因组学的重要方面之一。尽管全基因组基因表达研究的数量越来越多,但我们将这些研究结果转换为准确的调控注释(例如“基因A由调控因子B转录调控”),以及将这些注释从模型生物体投影到相关基因组的能力极为有限。同样,尽管有丰富的基因注释资源和工具,但除了少数模式物种外,很少有工具支持监管注释。在我们的愿景中,基因组学驱动的在一个人口稠密的分类群中调控相互作用的重建应该包括两个主要步骤:(i)从分类群中准确重建一组代表性基因组中的调控子参考集,以及(ii)将推断的调节子自动繁殖到该组中所有密切相关的基因组。

基因和操纵子直接由同一转录因子(TF)或RNA结构(如代谢产物敏感的核糖开关)共同调节,被认为是调控子的一部分。基因表达的激活或抑制是通过TF与位于基因启动子区的调控位点(或TF结合位点,TFBS)的序列特异性结合实现的。由于细菌TF在DNA-结合状态下主要是二聚构象,因此TFBS通常具有内在对称性,例如回文性。单个TFBS的大小通常在~12到30 nt之间变化,最常见的长度为16到20 nt。特定TF共同调节多个基因的结合位点的显著变化对鉴定符合同一基因组中一致模体的所有TFBS提出了挑战。核苷酸频率位置权重矩阵(PWM)被许多计算算法用作微生物基因组中TFBS识别的更灵敏和更精确的方法(1).

比较基因组方法被广泛用于基因组规模的推断顺式-作用调节元件(例如TFBS、启动子和RNA调节位点)和许多细菌群中转录调控网络的重建(2). 一致性检查和系统发育足迹技术基于这样的假设,即调控子在包含同源TF的基因组之间有保守的趋势(3–7). 同源基因上游存在类似的候选TFBS表明它是一个真正的调控位点,而基因组中随机分布的候选TFBSs被视为假阳性。同时分析来自同一分类群的多个基因组,即使识别规则较弱,也可以对TFBS做出可靠预测。在一般方法中,通过比较基因组学验证TFBS后,构建改进的PWM并用于扫描基因组中是否存在额外的TFBS基序实例,从而产生超出初始训练集的调控子扩展。这导致了另一个循环(或多个循环)的迭代优化,旨在最大限度地提高重建调控子的覆盖率和一致性。

在我们之前的工作中,我们提供了多个例子,说明比较基因组方法应用于大量不同TF和核糖开关驱动的调节子的威力,这些调节子是为广泛的不同细菌重建的(2). 特别是,这种方法被应用于:(i)将以前已知的调节子从模式生物传播到许多其他生物;(ii)从头算预测并重建感兴趣的代谢途径或特定TF家族的新调节子;以及(iii)在一组密切相关的物种中广泛重建多个调节子(8–13). 这些以及其他先前的研究帮助我们确定了调控子基因组重建的主要工作流程,并开发了RegPrecise数据库,用于收集和可视化累积的调控重建(14).

在本文中,我们介绍了RegPredict web服务器,该服务器旨在为科学界带来我们的丰富经验,并通过提供一组高度集成的计算模块来半自动和准确地分析调节子,从而简化来自不同分类群的原核基因组中的调节子推断过程。RegPredict旨在实现在不同微生物群中快速积累调节子参考集的目标。

共调节正交开放子簇

在调节的比较基因组分析的典型场景中,在同源基因的上游区域识别候选TFBS,然后执行一致性检查程序(3–7). 两个可能阻碍该程序自动实施的潜在挑战性问题是:(i)密切相关基因组(假阳性源)的高保守性,以及(ii)操纵子重排频繁和在远距离相关基因组中出现额外的TFBS(假阴性)。为了解决这些问题,并促进对一组密切相关基因组中假定调控子成员的比较评估,我们开发了一种自动程序,将整个调控子拆分为一组候选亚区,这些亚区被定义为共同调控的同源操作子(CRONs)簇。对于每个分析的调节子,构建的CRON集合基于调节相互作用的保守性水平进行优先排序,从而可以将重点放在最突出的调节子成员上。在下一步中,使用高级web界面(见下文)对每个CRON进行功能和基因组背景分析,以便于决定CRON是否包含在最终调控子模型中。

CRON施工程序概述如下图1首先,扫描所有假定操作子的上游区域以寻找候选TFBS。其次,所有具有候选TFBS的同源操纵子以簇的形式连接在一起,从而可以评估候选调控相互作用的保守性水平。如果两个操纵子至少共享一个同源基因,则认为它们是同源的。最后,通过添加缺少候选TFBS的直系操纵子来扩展初始簇,以构建候选CRON。然后,可以将每个构建的CRON作为独立单元分别进行分析。将给定TFBS基序的所有接受的CRON组合在一起,得到一组目标基因组的重构TF调节子。基于CRON的调控子分裂为亚调控子对于分析全球TF的大调控子特别重要,例如变形杆菌中的CRP和厚壁菌中的CcpA。

保存图片、插图等的外部文件。对象名称为gkq531f1.jpg

构建共同调节的同源操纵子集群(CRON)的主要步骤:(A类)搜索假定的TF结合位点(B类)打造CRON核心(C类)核心延伸形成最终的CRON。三个基因组由直线表示。假定的算符用矩形表示。基因用彩色箭头表示。同源基因用相同的颜色表示。以浅灰色标记的基因在其他两个基因组中没有同源序列。红色圆圈表示假定的TFBS。CRON的核心是由一组操纵子构成的,这些操纵子包含在假定的TFBS之前的同源基因(以粉红色背景突出显示)。最后一个CRON通过包含没有假定TFBS的同源基因而扩展(以浅蓝色背景突出显示)。

RegPredict中CRON的构建过程基于MicrobesOnline数据库中可用的基因组数据,包括:(i)基于蛋白质结构域系统发育树分析的高质量同源基因和(ii)预测的操纵子(15,16).

规则推理工作流程

RegPredict web服务器旨在为一组分类相关的原核基因组中的完整调控子推断管道提供一套集成工具。服务器实现了两个成熟的工作流,广泛用于调控的比较基因组分析:(i)利用可用的PWM对已知调控基序进行调控子重构,以及(ii)从头开始先前未知调控基序的调控子推断(图2).

保存图片、插图等的外部文件。对象名为gkq531f2.jpg

RegPredict web服务器中实现的regulon推理工作流图。()已知调控基序轮廓的调控子重构()从头算调控基序未知时的调控子推断。

“基于已知PWM工作流的Regulon推断”利用我们收集的PWM来确定已知TFBS基序。所分析物种组中的所有基因组均通过特定PWM扫描,并确定候选TFBS。然后,CRON会自动计算,根据候选TFBS的基因组数量和站点得分进行排名,最后作为交互RegPredict web界面中手动管理的输出提供(见下文)。当脉宽调制训练集与目标基因组属于同一分类群的基因组时,基于脉宽调制的调节子推断很简单。在更一般的情况下,最初基于一组基因组中的一组已知TFBS构建的特定PWM对另一组基因组的适用性可以通过初步检查分析基因组中是否存在直系TF来确定。

当前版本的RegPredict从三个公开可用的web资源中提供了PWM的全面集合。RegPrecise数据库(http://regprecise.lbl.gov),最近由我们集团开发(14)捕获并可视化通过比较基因组方法在多种原核基因组中重建的预测TF调节子(350多个原核基因组的~400个TF同源群的~11000个TFBS)。这些数据中的大多数是由几个不同的细菌分类群(包括Shewanella科,链球菌科、葡萄球菌科、脱硫弧菌科Thermotogales公司)以及对LacI TF家族调节子的大规模预测。基于文字的数据库RegTransBase(http://regtransbase.lbl.gov) (17)使用受控词汇获取针对各种微生物发布的调控序列和相互作用的实验知识。RegTransBase数据库根据已发布的TFBS提供了约140个PWM的数据。RegulonDB数据库(http://regulondb.ccg.unam.mx) (18)包含TF调节子的模型,在大肠杆菌(~70 TF和PWM)。

RegPredict中可用于调控子重建的微生物基因组的当前列表包括MicrobesOnline数据库中主要细菌分类群的代表性物种。目前,RegPredict允许同时分析多达15个基因组。

从头开始“调节子推理工作流”用于在没有可用PWM时预测调节子。该过程从一个特定分类群的一个或多个相关基因组中的一组潜在共同调控基因开始。输入训练集可以基于许多来源组成,包括(i)构成功能通路的基因;(ii)与来自研究充分的物种的调节子同源的基因(例如。大肠杆菌枯草芽孢杆菌); (iii)来自含有同源TF基因的保守染色体位点或操纵子的基因;和(iv)通过微阵列实验确定的具有类似表达谱的基因(图2). 随后的重要步骤是识别来自训练集的基因的一组DNA上游区域内的候选TFBS基序,并构建相应的PWM谱。常用的方法是使用我们以前在SignalX软件中实现的类似MEME的迭代算法来查找不同类型的轮廓,例如不同长度的回文或直接重复(4,19)并大规模应用于微生物调节子推断(2,20).

按信息内容排序的候选图案配置文件列表作为RegPredict中“发现配置文件”程序的输出提供。正确图案的选择是从头开始调控子推理工作流程,通常可以通过将选定的候选基序应用于目标基因组并随后分析产生的调控子内容来获得。RegPredict提供了一个接口来加速候选图案的评估,如基于PWM的调控子重建工作流所述。一旦确定了最佳基序,将其应用于目标基因组可能会导致识别出新的候选调控子成员,这些成员可以迭代添加到初始训练集。PWM构造的迭代过程通过“基因车”简化,以收集在从头开始规则推理分析。

WEB界面

RegPredict web服务器可以通过位于的web界面公开访问http://regpredict.lbl.gov为了启动调控子推断会话,用户从一个或多个感兴趣的分类组中选择一组基因组。“选择基因组”对话框中的生物体现在按分类进行分组。所选择的基因组集在整个工作过程中保持不变,并用于所有调节子重建程序。然后向用户提供一个向导,从调节子推理的两种主要策略之一开始。

对于已知PWM的调节子推断

“运行配置文件”程序允许用户使用可选参数扫描具有选定PWM配置文件的基因组,并自动生成一组候选CRON(使用“配置文件”选项卡,图3A) ●●●●。可用于分析的PWM集合根据源数据库和分类法进行分类,其中每个模体轮廓通过其名称、长度、训练集大小、每个核苷酸位置的信息含量和一致性进行描述。使用PWM进行基因组扫描的可选参数是要搜索的上游区域间隔和TFBS分数的阈值,默认情况下,该阈值设置为给定PWM的训练集中所有站点的最小分数。”“排除重叠”参数允许排除所选上游区域间隔中的任何编码区域,从而缩小上游区域搜索区域。除了RegPredict中可用的PWM配置文件的收集外,用户还可以提交从文件上传的任何PWM配置文件,以及FASTA格式的任何预对齐TFBS集,作为新PWM的训练集(使用“序列”选项卡)。

保存图片、插图等的外部文件。对象名为gkq531f3.jpg

界面的两个部分专门用于规则推理的两种主要策略中的用户输入。(A类)“运行配置文件”允许用户启动已知PWM配置文件的调节器重建(B类)“Discover Profiles”启动在序列训练集中推断候选图案的程序。

位置核苷酸权重w个在PWM配置文件中计算为保存图片、插图等的外部文件。对象名称为gkq531i1.jpg 保存图片、插图等的外部文件。对象名称为gkq531i2.jpg,其中N个(b条,k个)是核苷酸的计数b条就位k个(4). 候选站点得分Z轴定义为各个位置核苷酸权重的总和Z轴(b条1 … b条L(左))=Sk个=1.升W公司(b条,k个),其中k个是站点的长度。每次用户选择特定PWM时,“运行配置文件”中的得分阈值都会自动更新。默认得分阈值被设置为用于构建PWM的训练集中的所有结合位点中的最小得分。

从头开始调节子推断

“Discover Profiles”允许推断FASTA格式提供的一组DNA片段中的候选基序,并从各种基因集自动生成上游基因区域的输入集(图3B) ●●●●。目前,有两种基因集来源可用于提取上游区域:(i)在“基因车”(见下文)中收集的基因,以及(ii)来自特定代谢途径或子系统的基因[通过SEED数据库的web服务上传,http://these.duchicago.edu/FIG/(21)]. 为了便于配置文件发现过程,用户可以选择一个或多个要同时搜索的DNA模体类型。对于每种模体类型,用户指定一组用于模体发现过程的参数,包括模体长度、回文位点位置的最小数量、轮廓中包含的训练集的大小以及回文位点之间GC对的最小数量。“发现个人资料”程序产生一组候选人个人资料,这些资料根据每个职位的信息内容进行优先排序。通过执行上一节所述的相同“运行配置文件”程序,所有构建的候选配置文件可立即用于比较基因组分析。

自动生成的CRON的优先级

剖面运行后构建的所有CRON如表“共调控同源操纵子簇”所示(图4,左)。对于每个CRON,该表提供了一个简要总结,包括:具有候选TFBS的基因组数量(“基因组”列)、CRON中操纵子、基因和位点的数量以及CRON中的最大TFBS分数(“最大分数”列)。“基因组”和“最大得分”列用于根据以下内容自动确定所有CRON的优先级:(i)目标基因组组中候选TFBS的保守性;以及(ii)候选TFBS与PWM简档的相似性。

保存图片、插图等的外部文件。对象名为gkq531f4.jpg

RegPredict web服务器的交互式工作区。示例显示了通过扫描9获得的主要输出希瓦氏菌属NagR转录因子的PWM基因组。共同调节的同源操纵子(CRON)的优先簇列在左侧面板表中。第一个选定CRON的基因组背景和基因功能摘要信息分别显示在中央和右侧面板中。所选NagR调节操纵子的详细基因组信息沙雷氏菌MR-1显示在底部面板中。

选择CRON子集进行详细分析的另一种方法是使用过滤器。“Filter Operon Clusters”菜单中当前可用的两个过滤器允许一个选择包含特定基因子集的CRON(使用“By genes”过滤器对话框,其中可以以行限定格式提交多个基因ID或位点标签),或指定基因组子集中的候选TFBS(通过“按位点”筛选对话框指定感兴趣的基因组)。此外,CRONs面板顶部提供了“Filter by Locus Tag”快速搜索选项。

选定CRON的详细分析

与特定CRON相关的所有信息显示在“基因组背景”、“摘要信息”和“基因/位点属性”面板中(图4).

交互式“基因组背景”面板可视化分析基因组集合中所选CRON的基因(彩色条)、位点(圆形)和操纵子(灰色背景条)。同源基因以相同的颜色显示。操纵子可能来自同一个基因座,也可能来自多个相距遥远的基因组基因座。此表示中的所有基因从5′到3′以相同方向显示,而基因组中每个基因的实际链在“基因属性”面板中显示。染色体上相邻的操纵子被一个短的空间隔开,而远处的操纵符则被长的空间隔着。主“过滤器”菜单中提供了用于分析CRON内容的三个附加过滤器Show Operons with Sites Only“仅通过共同监管的操作子限制CRON内容的表示。”“仅显示选定操纵子的同源基因”将基因着色限制为来自当前选定操纵符的基因及其在其他基因组中的同源基因,从而简化了CRON组成的分析。这两种滤波器对于分析大型复杂的CRON特别有价值。最后,“显示次要站点”将分数在阈值10%以内的其他弱TFBS可视化(次要站点)。尽管CRON施工程序中未考虑次要场地,但其分析可能有助于调整得分阈值并重复“运行概况”程序。

“基因属性”面板提供了选定操纵子中每个基因的基因组和功能属性的详细信息。基因功能注释和与SEED子系统的关联使用web服务从SEED数据库自动上传(21). 最后,该面板中的每个基因都有多个指向MicrobesOnline数据库中网页的链接(15)包括中心基因页面(“MO:gene”)、域页面(“MO:domain”)和基因系统发育树页面(“OM:tree”)。

“摘要信息”面板显示了有关所分析基因组组的附加信息、“Run Profile”程序的当前参数以及填充特定CRON的同源基因的功能注释概述。

使用“基因组背景”面板中的“导出”按钮,可以将一轮CRON分析的结果导出到文本文件。可导出的CRON内容可以通过标记用于从CRON中排除的基因/操纵子来缩小范围(使用“Alt”按钮)。导出文件包含每个分析基因组的基因详细描述(MicrobesOnline中的基因ID、位点标签、基因名称、MicrobesOnline中的正交ID和功能注释)和推测的TFBS(相对于以下基因起点的位点序列、得分和位置)(列出的基因组名称及其NCBI分类ID)。基因按假定的操纵子分组。

其他组件

为了在调控子重建过程中提供更大的灵活性,RegPredict提供了三个附加组件,即“基因组浏览器”、“基因车”和“站点车”。

“基因车”用于处理用户选择的基因集合。基因可以从“基因属性”面板或其他“基因搜索”或“SEED子系统”对话框添加到基因车。在“基因车”对话框中,用户可以删除/添加任何基因,并将基因集导出到文本文件或从文本文件导入基因搜索在分析的基因组组中实现简单的文本搜索。在“SEED子系统”中,用户可以通过web服务打开SEED数据库中可用的当前子系统的层次分类,从特定子系统中选择感兴趣的功能角色,并从SEED数据库中提取与所分析基因组集中所选子系统中所选角色对应的基因列表。一旦编译了一组基因,它就可以用作从头开始regulon推理“发现配置文件”工作流。

“基因组浏览器”允许在任何分析的基因组中的所有基因之间导航。通过单击“基因属性”面板中可用的“在浏览器中显示基因”链接打开基因组浏览器,可以分析选定的基因上下文和TFBS在基因组中的位置,或者通过基因id、名称或位点标签进行搜索。基因组浏览器中的任何基因都可以添加到“基因车”中。

“站点摘要”面板收集在所选CRON中标识的所有假定TFBS。“站点购物车”提供了一个工具,用于对在regulon分析会话期间选择的任何TFBS子集进行比较分析。TFBS及其侧翼区域的表示可用于估计基因上游区域的总体保守性。”Site cart提供将所有TFBS序列导出到文件的功能,并可用于“Run Profile”过程。

金黄色葡萄球菌HRCA规则重建的实例应用

RegPredict使用的典型场景是在模型生物体中识别具有已知基序的TF的TFBS并在一组基因组中重建调控子。这种情况可以通过热休克调节子HrcA的推断来证明,之前在链球菌例如,在一个新的分类群中葡萄球菌科(目前包括七个非冗余基因组)。

首先,潜在的HrcA调节子葡萄球菌科可以使用链球菌-基于RegPrecise-based的配置文件集合中提供的特定PWM和默认配置文件扫描参数(阈值=6.3)。共有三个高度保守的CRON葡萄球菌科将获得包括两个热休克反应操纵子,groES-groEL公司hrcA-grpE-dnaK-dnaJ-SA1407-SA1406-SA1405和假设基因SA1838标准,它与不同转录的TFBS共享相同的TFBS格罗斯基因。然后,可以通过重复“Run Profile”检查其他假定的HrcA调节器成员,并降低分数阈值。

其次,可以应用“发现配置文件”过程来构建葡萄球菌科-特定HrcA图案。使用“基因属性”面板中的“将基因添加到购物车”功能(七个基因组中的三个基因),可以很容易地收集上一步在所有葡萄球菌科基因组中最初发现的具有候选位点的基因训练集。在“发现简档”对话框中提取来自“基因车”的21个基因的上游区域,并使用由此产生的训练集来构建具有HrcA基序指定参数的简档(回文;长度=27,27,任意;最小回文位置=4;最小GC对=1;训练集大小=100%)。得到的最佳回文配置文件(信息含量=1.04)可以立即应用于自动计算HrcA调节子的CRON集葡萄球菌科(配置文件参数:得分阈值=7)。分数略低于阈值的网站可以使用“显示次要网站”选项轻松检查。例如,第三个CRON包括SA1838标准溶酪大球菌.

需要注意的是,在特定情况下,最终的调控子重建可以通过人工评估每个CRON来实现,同时考虑到单个评分和全基因组TFBS的整体保存,以及受调控基因的基因组背景和功能注释。

总结与展望

RegPredict是一个高度交互式的web服务器,专门设计用于快速准确地比较分析微生物调节子,并以半自动方式识别多个分类相关基因组中的TFBS。该服务器具有用户友好的界面和多种功能,包括:(i)用注释的DNA基序和对齐的结合位点集合扫描微生物基因组,(ii)为任何基因集收集上游DNA区域并识别新的TFBS基序,以及(iii)基因组组中候选TFBS基因组背景的比较分析。在少数可用于TFBS基因组分析的其他网络工具中,RSAT工具套件(22)允许序列检索、模式发现和模式匹配。RegPredict的主要特点包括:(i)在多个基因组中同时分析TFBS,以及(ii)使用CRON分析大型调控子的分布。RegPredict是一个非常强大的工具,用于快速积累不同微生物群中的调节子参考集。

我们计划在三个主要方向上进一步开发和扩展RegPredict web服务器。首先,我们将实现RegPredict服务器与RegPrecise数据库的紧密集成(14)包括使用个人登录功能将推断的调节子和PWM直接沉积到数据库中。这种双向整合将促进调节子参考集的积累,这些参考集将进一步用于向密切相关的基因组大规模自动传播调控注释。其次,我们将为从头开始调节子推断,包括:(i)使用微阵列实验保存在MicrobesOnline数据库中的具有相似表达谱的基因(15); (ii)来自保守基因簇和包含假定TF基因的操纵子的基因;(iii)与RegPrecise数据库中描述的其他谱系中先前推断的调控子同源的基因;和(iv)来自RegTransBase的实验已知的共调控基因集(17)、DBTBS(23)和CoryneRegNet(24)数据库。最后,我们计划添加一个模块,用于分析RFAM数据库中描述的RNA调节元件(25).

基金

美国能源部科学办公室生物与环境研究办公室基因组计划:GTL通过劳伦斯伯克利国家实验室和美国能源部签订的合同DE-AC02-05CH11231;国家科学基金(授予D.A.R.DBI-0850546);霍华德·休斯医学院(55005610转M.S.G.);俄罗斯基础研究基金会(08-04-01000至A.E.K.,09-04-92745至M.S.G.,10-04-01768至D.A.R.,09-04-92742至A.A.M.);俄罗斯科学院(D.A.R和M.S.G.的“分子和细胞生物学”项目);联邦教育局(P2581至E.D.S.);俄罗斯科学局(M.S.G.合同2.740.11.0101);以及俄罗斯总统对年轻科学家的资助(MK-422.2009.4 to D.A.R.)。开放获取费用的资金来源:美国能源部、科学办公室、生物与环境研究办公室、基因组计划。

利益冲突声明。未声明。

致谢

我们感谢MicrobesOnline和SEED团队为访问数据提供了便利,感谢Andrei Osterman进行了有益的讨论和鼓励,感谢Ekaterina Ermakova、Dmitry Ravcheev、Anna Gerasimova、Olga Tsoy对服务器进行了彻底测试并提出了有益的建议,感谢Alex Poliakov提供了技术援助,塔蒂亚娜·佩利(Tatiana Paley)协助开发网页界面,塔蒂亚纳·斯米尔诺娃(Tatiana-Smirnova)负责主页的网页设计。

参考文献

1D’Haeseleer P.DNA序列基序发现是如何工作的?自然生物技术。2006;24:959–961.[公共医学][谷歌学者]
2罗迪诺夫DA。细菌转录调控网络的比较基因组重建。化学。版次。2007;107:3467–3497. [PMC免费文章][公共医学][谷歌学者]
三。Alkema WB、Lenhard B、Wasserman WW。调节分析:细菌间保守调节网络的检测:应用于金黄色葡萄球菌。基因组研究。2004;14:1362–1373. [PMC免费文章][公共医学][谷歌学者]
4Mironov AA,Koonin EV,Roytberg MA,Gelfand MS。完全测序细菌基因组中转录调控模式的计算机分析。核酸研究。1999;27:2981–2989. [PMC免费文章][公共医学][谷歌学者]
5Tan K,Moreno-Hagelseib G,Collado-Vides J,Stormo GD.预测调节子新成员的比较基因组学方法。基因组研究。2001;11:566–584. [PMC免费文章][公共医学][谷歌学者]
6McCue L、Thompson W、Carmack C、Ryan MP、Liu JS、Derbyshire V、Lawrence CE。蛋白质细菌基因组中转录因子结合位点的系统发育足迹。核酸研究。2001;29:774–782. [PMC免费文章][公共医学][谷歌学者]
7Manson McGuire A,Church GM。通过比较基因组学预测调控子及其顺调控基序。核酸研究。2000;28:4523–4530. [PMC免费文章][公共医学][谷歌学者]
8Fredrickson JK、Romine MF、Beliaev AS、Auchtung JM、Driscoll ME、Gardner TS、Nealson KH、Osterman AL、Pinchuk G、Reed JL等。《Shewanella环境系统生物学研究》。自然修订版微生物。2008;6:592–603.[公共医学][谷歌学者]
9Kazakov AE、Rodionov DA、Alm E、Arkin AP、Dubchak I、Gelfand MS。蛋白质菌中脂肪酸调节和支链氨基酸利用的比较基因组学。《细菌学杂志》。2009;191:52–64. [PMC免费文章][公共医学][谷歌学者]
10Rodionov DA,Dubchak I,Arkin A,Alm E,Gelfand MS。金属还原德尔塔变形菌中调节和代谢途径的重建。基因组生物学。2004;5:R90。 [PMC免费文章][公共医学][谷歌学者]
11Rodionov DA,Dubchak IL,Arkin AP,Alm EJ,Gelfand MS。细菌中氮氧化物的异构化代谢:转录网络的比较重建。公共科学图书馆计算。生物。2005;1:e55。 [PMC免费文章][公共医学][谷歌学者]
12Rodionov DA,Gelfand MS。通过系统发育分析鉴定核糖核苷酸还原酶的细菌调节系统。趋势Genet。2005;21:385–389.[公共医学][谷歌学者]
13Rodionov DA,Gelfand MS,Todd JD,Curson AR,Johnston AW.α-杆菌中铁和锰响应转录网络的计算重建。公共科学图书馆计算。生物。2006;2:e163。 [PMC免费文章][公共医学][谷歌学者]
14Novichkov PS、Laikova ON、Novichcova ES、Gelfand MS、Arkin AP、Dubchak I、Rodionov DA。RegPrecise:原核生物转录调控相互作用的精选基因组推断数据库。核酸研究。2010;38:D111–D118。 [PMC免费文章][公共医学][谷歌学者]
15Dehal PS、Joachimiak MP、Price MN、Bates JT、Baumohl JK、Chivian D、Friedland GD、Huang KH、Keller K、Novichkov PS等。MicrobesOnline:比较基因组学和功能基因组学的集成门户。核酸研究。2010;38:D396–D400。 [PMC免费文章][公共医学][谷歌学者]
16Price MN、Huang KH、Alm EJ、Arkin AP。一种在所有测序原核生物中准确预测操纵子的新方法。核酸研究。2005;33:880–892. [PMC免费文章][公共医学][谷歌学者]
17Kazakov AE、Cipriano MJ、Novichkov PS、Minovitsky S、Vinogradov DV、Arkin A、Mironov AA、Gelfand MS、Dubchak I.RegTransBase–广泛原核基因组中调控序列和相互作用的数据库。核酸研究。2007;35:D407–D412。 [PMC免费文章][公共医学][谷歌学者]
18Gama-Castro S、Jimenez-Jacinto V、Peralta-Gil M、Santos-Zavaleta A、Penaloza-Spinola MI、Contreras-Moreira B、Segura-Salazar J、Muniz-Rascado L、Martinez-Flores I、Salgado H等。RegulonDB(6.0版):基因调控模型大肠杆菌K-12超越转录、活性(实验)注释启动子和Textpresso导航。核酸研究。2008;36:D120–D124。 [PMC免费文章][公共医学][谷歌学者]
19Gelfand MS,Koonin EV,Mironov AA。用比较基因组方法预测古生菌的转录调控位点。核酸研究。2000;28:695–705. [PMC免费文章][公共医学][谷歌学者]
20.Gelfand MS。微生物基因组中转录调控网络的进化。货币。操作。结构。生物。2006;16:420–429.[公共医学][谷歌学者]
21Overbeek R、Begley T、Butler RM、Choudhuri JV、Chung HY、Cohoon M、de Crecy Lagard V、Diaz N、Disz T、Edwards R等。基因组注释的子系统方法及其在注释1000个基因组项目中的应用。核酸研究。2005;33:5691–5702. [PMC免费文章][公共医学][谷歌学者]
22Thomas-Collier M、Sand O、Turatsinze JV、Janky R、Defrance M、Vervisch E、Brohee S、van Helden J.RSAT:调控序列分析工具。核酸研究。2008;36:W119–W127。 [PMC免费文章][公共医学][谷歌学者]
23Sierro N,Makita Y,de Hoon M,Nakai K.DBTBS:包含上游基因间保守性信息的枯草芽孢杆菌转录调控数据库。核酸研究。2008;36:D93–D96。 [PMC免费文章][公共医学][谷歌学者]
24Baumbach J.CoryneRegNet 4.0-棒状杆菌基因调控网络的参考数据库。BMC生物信息学。2007;8:429. [PMC免费文章][公共医学][谷歌学者]
25Gardner PP、Daub J、Tate JG、Nawrocki EP、Kolbe DL、Lindgreen S、Wilkinson AC、Finn RD、Griffiths-Jones S、Eddy SR等。Rfam:RNA家族数据库更新。核酸研究。2009;37:D136–D140。 [PMC免费文章][公共医学][谷歌学者]

来自的文章核酸研究由以下人员提供牛津大学出版社