摘要
背景
结果
结论
背景
材料和方法
的输入 伦巴第
-
1 共表达对: 一套 \(\mathcal{C}\subseteq\mathbb{G}\times\mathbb{G}\) 共表达基因对,根据其相关性或相互信息的值进行选择。 ARACNe的结果就是这样一个例子[ 2 ]、MRNET[ 4 ],或使用在不同环境条件下获得的表达谱评估的其他基于互信息的方法。 -
2 相似性对: 一套 \(\mathcal{A}\subseteq\mathbb{G}\times\mathbb{G}\) 基于TF/BS序列亲和力获得的基因对及其相关 第页 -值。 具体来说,一对基因( A类 , B类 )在中 \(\数学{A}\) if基因 A类 在基因启动子区与BS具有高亲和力的TF的编码 B类 例如, \(\mathcal{A}\) 可能是Prodoric数据库中匹配的结果[ 9 ]. 我们假设高 第页 -值已经从中丢弃 \(\mathcal{A}\) . -
三。 验证的对: (可选)一组 \(\mathcal{V}\subseteq\mathbb{G}\times\mathbb{G}\) 与独立的实验验证的调控相对应的基因对(如果可用的话)。
定义 先验的 图表 \(\mathcal{G}\) 和解释
定义
1 .
-
\(\mathcal{E}\) 是来自的定向路径 A类 到 B类 ; -
\(\mathcal{E}\) 是来自的定向路径 B类 到 A类 ; -
\(\mathcal{E}\) 是从基因开始的两条不同定向路径的结合 C类 分别到达 A类 和 B类 ,其中只有顶点 C类 常见的。
定义
2 .
成本定义
最优解释和子图
定义
三 .
定义
4 .
备选优化问题分析
结果和讨论
输入数据
-
■ \(\mathcal{C}\) : 共表达操纵子对: 通过分析 大肠杆菌 差异表达谱如下。 4297所有对之间具有互信息的矩阵 大肠杆菌 使用参数高斯密度估计器计算基因 地雷 [ 13 ]R统计包库[ 14 ]. 该矩阵有超过1800万个值,尽管其中大多数值要么微不足道,要么冗余,并被MRNET丢弃[ 4 ]战略。 在剩下的基因对中,我们只考虑了10万个具有最高互信息的基因, 即 大约占总数的5%。 选择这个数字是为了支持纳入主要的共同表达。 最后,如果每个操纵子都包含来自一对共表达基因的基因,则认为两个操纵子是共表达的。 在剔除多余和琐碎的病例后,我们获得了一组61506对共表达操纵子,涉及2492个不同的操纵子。 -
■ \(\数学{A}\) : 亲和网络及其p值 :产生了一组25604对具有高TF/BS亲和力的操纵子,如下所示。 通过BLAST同源性搜索(E值截止值为10 −10 )基因产物和Prodoric数据库中已知的TF实例之间[ 9 ] ( 网址:http://www.prodoric.de ). 然后,对于每个TF,每次MEME/FIMO定位基因上游区域(高达300 bp)的假定结合位点时,都会考虑BS[ 15 ]带有 第页 -值小于10 −5 如果第一个操纵子包含一个编码TF的基因,并且在第二个操纵符的上游区域具有假定的BS,则报告了一对操纵子。 这个 第页 -对的值定义为 第页 -所表示的关联值。 (最小值 第页 -如果第一个操作子中的多个TF与第二个操作子的启动子区域具有亲和力,则使用该值。)。 这组25604对包含2390个不同的操纵子。 -
■ \(\mathcal{V}\) : 已验证网络: 生成了一组1652对操纵子,它们代表独立的实验验证的转录调控。 根据Salgado等人的汇编,如果第一个操作子包含一个TF基因编码,该TF调节第二个操作子的表达,则报告每对操作子[ 8 , 16 ]可在获取 http://regulondb.ccg.unam.mx/ 这组1652对包含823个不同的操纵子。
-
■ ( \(\mathcal {希腊}_ {\mathcal{A}}\) ) 从头算 :此场景模拟了没有有效法规的情况; 因此,只有共同表达 \(\mathcal{C}\) 和亲缘关系 \(\mathcal{A}\) 用作输入。 这个 先验的 图表 \(\mathcal {希腊}_ {\mathcal{A}}\) 由该输入生成的包含25604条弧,对应于 \(\mathcal{A}\) 尽管有一套独立验证的法规 \(\mathcal{V}\) 在的输入中被丢弃 伦巴第 ,这组独立信息用于评估方法的偏差,以包括已确认的法规,因为 \(\mathcal{A}\) 也在 \(\mathcal{V}\) . -
■ ( \(\mathcal {希腊}_ {\mathcal{AV}}\) ) 扩展 :此场景考虑所有数据 \(\mathcal{C},\mathcal{A}\) 、和 \(\mathcal{V}\) 作为输入和使用 隆巴德 以通常的方式。 这个 先验的 图表 \(\mathcal {希腊}_ {\mathcal{AV}}\) 由该输入生成的包含26812个弧,对应于并集 \(\mathcal{A}\cup\mathcal{V}\) (交叉口有444对, 即 也通过实验验证了TF/BS亲和力)。 在这种情况下 \(\mathcal{V}\) 分配成本为1,对应于最大可能性。
的解释潜力 大肠杆菌
先验的 图表
伦巴第 结果偏向于验证的交互
的学位分布 伦巴第 输出与观察到的TRN类似
全球监管机构排名
伦巴第 应用于一组有意义的共同表达
不同输入数据结果的稳健性
成本参数分析
结论
支持数据的可用性
工具书类
Eisen MB,Spellman PT,Brown PO,Botstein D.全基因组表达模式的聚类分析和显示。 美国国家科学院院刊1998; 95(25):14863–8. Margolin AA、Nemenman I、Basso K、Wiggins C、Stolovitzky G、Favera RD等。Aracne:哺乳动物细胞环境中基因调控网络重建的算法。 BMC生物信息学006 7:S7。 2006; 7补充1:7。 Faith JJ、Hayete B、Thaden JT、Mogno I、Wierzbowski J、Cottarel G等。表达谱简编中大肠杆菌转录调控的大规模绘图和验证。 《公共科学图书馆·生物》。 2007; 5(1):8. Meyer PE,Kontos K,Lafitte F,Bontempi G.大型转录调控网络的信息论推断。 EURASIP生物信息系统生物学杂志。 2007:79879. 数字对象标识: 10.1155/2007/79879 . Olsen C,Meyer PE,Bontempi G.关于熵估计对基于互信息的转录调控网络推断的影响。 EURASIP生物信息系统生物学杂志。 2009:308959. 数字对象标识: 10.1155/2009/308959 . 罗迪奥诺夫DA。细菌转录调控网络的比较基因组重建。化学评论,2007年; 107(8):3467–97. Guhathakurta D.dna序列中转录调控元件的计算鉴定。 2006年《核酸研究》; 34(12):3585–98. Salgado H、Peralta-Gil M、Gama-Castro S、Santos-Zavaleta A、Muniz-Rascado L、Garcia-Sotelo JS等。Regulondb v8.0:组学数据集、进化保守性、监管短语、交叉验证金标准等。 2013年《核酸研究》; 41(D1):203–13。 Grote A、Klein J、Retter I、Haddad I、Behling S、Bunk B等。Prodoric(2009年版):原核生物基因调控分析的数据库和工具平台。 核酸研究2009; 37(数据库问题):61–5。 Acuña V、Aravena a、Maass a和Siegel a。简约假设监管网络建模:复杂性和启发式方法。 In:验证、模型检查和抽象解释。 计算机科学系列讲座笔记第8318卷。 柏林-海德堡:施普林格出版社:2014年。 第322-336页。 普鲁特KD。 Ncbi参考序列(refseq):基因组、转录物和蛋白质的精选非冗余序列数据库。 核酸研究2004; 33(数据库问题):501–4。 Faith JJ、Driscoll ME、Fusaro VA、Cosgrove EJ、Hayete B、Juhn FS等。许多微生物微阵列数据库:具有结构化实验元数据的统一标准化affmetrix简编。 核酸研究2008; 36(数据库问题):866–70。 Meyer PE,Lafitte F,Bontempi G.minet:一种利用互信息推断大型转录网络的r/生物导管包。 BMC生物信息学。 2008; 9:461. R核心团队。 R: 统计计算语言和环境。 奥地利维也纳:R统计计算基金会; 2012.R统计计算基金会。 国际标准图书编号(ISBN)3-900051-07-0。 Bailey TL、Boden M、Buske FA、Frith M、Grant CE、Clementi L等。模因套件:模因发现和搜索工具。 核酸研究2009; 37(Web服务器问题):202。 Gama Castro S、Salgado H、Peralta Gil M、Santos Zavaleta A、Muñiz Rascado L、Solano Lira H等人Regulondb 7.0版:整合在遗传感觉反应单元(gensor单元)内的大肠杆菌k-12的转录调控。 核酸研究2011; 39(数据库问题):98–105。 Sun J、Tuncay K、Haidar A、Ensman L、Stanley F、Trelinski M等。通过多种方法集成发现转录调控网络:对大肠杆菌k12的应用。 算法分子生物学。 2007; 2(1):2–2. Leclerc RD。最稀疏的生存:健壮的基因网络是简约的。 分子系统生物学。 2008; 4:213. Martínez-Nonio A,Collado-Vides J.《确定细菌转录调控网络中的全球调节器》。 2003; 6(5):482–9. Valente T,Foreman R.整合与辐射性:衡量个人在网络中的连通性和可达性。Soc Networks。 1998; 20(1):89–105.
致谢
作者信息
作者和附属机构
通讯作者
其他信息
竞争性利益
作者的贡献
其他文件
附加文件1
权利和权限