跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https公司

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2000年6月6日;97(12):6652-7.
doi:10.1073/pnas.110147297。

大肠杆菌中的操纵子:基因组分析和预测

附属公司

大肠杆菌中的操纵子:基因组分析和预测

H萨尔加多等人。 美国国家科学院程序. .

摘要

大肠杆菌操纵子组织的丰富知识,以及该细菌完整的染色体序列,使我们能够分析基因之间的距离以及同一操纵子中相邻基因的功能关系,而不是不同转录单位中的相邻基因。我们测量并证明了操纵子内基因的预期趋势,即基因间距离比转录单元边界的基因短得多。同一操纵子中基因之间短距离处的明显峰值与转录单元边界处基因的平坦频率分布形成对比。此外,同一操纵子中的基因往往具有相同的生理功能类别。这些分析的结果被用于实现一种方法,以预测转录单位中基因的基因组组织。该方法对位于操纵子或转录单元边界的相邻基因对的正确识别率最高可达88%,在用于预测大肠杆菌基因组的转录单元组织时,正确识别约75%的已知转录单元。基于频率距离分布,我们估计了大肠杆菌中总共630-700个操纵子。这一步骤为预测基因组序列已完成的其他细菌的操纵子组织提供了可能性。

PubMed免责声明

数字

图1
图1
RegulonDB中转录单位的大小分布,以包含的基因数量表示,以及M54版本中直接子的大小分布大肠杆菌基因组。
图2
图2
操纵子中相邻基因对与转录单位边界处相邻基因对的频率距离分布(t.u.)。这两种分布之间存在明显差异,操纵子中的基因的峰值非常接近距离0。最高峰值对应于−4和−1重叠。
图3
图3
用于估计整个操作子总数的数据大肠杆菌基因组。()间隔10 bp的距离分布。(b条)频率距离分布。(c(c))直接子中相邻基因的频率距离分布与操纵子和转录单位(t.u.)边界上相邻基因的平均频率距离分布。请注意c(c),这也证实了样本(操纵子和转录单位边界)代表群体(直接子,或在同一方向转录的所有相邻基因)的程度。根据这些数据推断,估计的操纵子总数从630到700。
图4
图4
频率距离分布是通过将10 bp间隔的频率相加得到的,以及一对基因在每个距离间隔处位于操纵子中的对数似然数。
图5
图5
在不同阈值下,通过单独使用距离对数似然库德(dllh)和距离和功能类对数似然库德(tllh)来区分操纵子中的已知基因对。()不同阈值下正确和错误阳性的分数。(b条)不同阈值下的灵敏度(检测到的操纵子右对/操纵子总对)、特异性(边界右对/边界总对)和准确性(灵敏度和特异性的平均值)。使用函数类时,正确的标识稍好一些。
图6
图6
已知和预测转录单元的大小分布。正如预期的那样,转录单元的数量随着它们在基因中的大小而以泊松分布方式减少。

类似文章

引用人

工具书类

    1. Overbeek R、Fonstein M、D'Souza M、Pusch G D、Maltsev N.美国国家科学院院刊1999;96:2896–2901.-项目管理咨询公司-公共医学
    1. Dandekar T,Snel B,Huynen M,Bork P.趋势生物化学科学。1998;23:324–328.-公共医学
    1. 劳伦斯·J·G、罗斯·J·R·遗传学。1996;143:1843–1860.-项目管理咨询公司-公共医学
    1. Lawrence J G.趋势微生物。1997;5:355–359.-公共医学
    1. Glansdorff N.J分子进化。1999;49:432–438.-公共医学

出版物类型

LinkOut-更多资源