大肠杆菌常见于人体胃肠道的正常菌群中(16)与人类的生活息息相关。这种细菌可以很容易地生长,其遗传学也很容易在实验室中进行操作,使其成为一个普通的工匠,也是研究得最好的原核生物模型之一。然而,大肠杆菌分离物可导致人类严重疾病,并与至少六种不同的疾病表现相关(29)这导致每年损失数十亿美元的工作时间以及医生和医院就诊(56). 腹泻大肠杆菌在美国最近的疫情中,菌株是众所周知的(http://www.cdc.gov/ecoli/); 然而,很大一部分大肠杆菌分离物在肠道外引起疾病,这些分离物被称为肠外致病性大肠杆菌(ExPEC)(54,56). ExPEC菌株在人类中引起一系列疾病,包括尿路感染和新生儿脑膜炎。腹泻致病性变体大肠杆菌它们的临床表现、受影响的年龄组以及相关的毒力因子也各不相同。已确定五种不同的腹泻分离物临床类型:肠聚集性大肠杆菌(EAEC),肠出血大肠杆菌肠致病性(EHEC)大肠杆菌(EPEC),肠侵袭性大肠杆菌(EIEC)和肠毒素大肠杆菌(ETEC)。已提出其他致病群;然而,这五个群体是不同的,可以得到整个社区的同意(29). EAEC被许多人认为是一种新出现的病原体,可以感染广泛的年龄组(18,23). EAEC毒力的分子基础尚不明确,这表明需要对致病型进行进一步的分子表征(18,23). 典型EAEC感染的特征是结肠内形成生物膜,随后分泌毒素和细胞溶解因子(18,23). 肠出血性大肠杆菌菌株通常与O157:H7血清型有关,因为该血清型是美国最近菠菜疫情的罪魁祸首(10). 有许多血清型与肠出血性大肠杆菌有关,但几乎所有的分离物都含有III型分泌系统(TTSS),参与细菌因子直接分泌到上皮细胞中,导致结肠结构破坏并导致血性腹泻(三). 此外,肠出血性大肠杆菌分离株会产生志贺样毒素,导致全身临床症状,如溶血性尿毒症综合征和继发性神经元和肾脏后遗症(30). EPEC分离物也使用TTSS破坏上皮层;然而,小肠的嗜性和志贺毒素基因的缺乏将这种病理类型与肠出血性大肠杆菌区分开来(5,29). 顾名思义,ETEC菌株分泌多种毒素,包括稳定毒素和不稳定毒素(49). ETEC感染的临床表现通常被称为旅行者腹泻,主要发生在发展中国家(49). 这种病原体的成员与小肠上皮层结合,分泌毒素,导致肠腔水平衡改变,导致水样腹泻(49). 而其他的都没有大肠杆菌病理变种经常侵袭上皮细胞,EIEC组的成员很容易进入结肠的肠上皮细胞并横向移动,从而避免了许多宿主固有免疫反应(12,44). 在临床和诊断上,EIEC与志贺氏菌物种,具有许多相同的毒力因子(12,44). 总的来说,大肠杆菌分离物及其引起的疾病是多种多样的,虽然已知每种不同的病原体都有许多毒力因子,但这些病原体的遗传内容以前还没有在基因组水平上进行过检测。
由于与微生物相关的人类和兽医疾病,使用全基因组测序研究的微生物物种明显偏向于病原体。此外,尽管全基因组分析具有固有的能力,但无法将功能可靠地分配给非特征化基因的预测产物,例如毒力因子,仍然是一个主要限制。基因组测序后的功能基因表征依赖于湿式实验室台架工作来验证生物信息学预测。基因组比较可以迅速缩小范围,至少缩小10倍(38),需要使用进一步经典的分子生物学技术研究的靶点或毒力因子的数量。对精心挑选的具有明确表型特征的分离株进行比较基因组分析,最大限度地利用全基因组测序的信息。为此,目前的研究旨在比较多个致病菌株和一个共生菌株的基因组含量大肠杆菌努力确定每个致病变种的独特毒力决定因素,以及该物种成员的共同特征。我们利用这些比较来预测全基因组(60)物种的大肠杆菌并在广泛的菌株中鉴定潜在的新毒力因子。
在这篇论文中,我们还描述了一个真实人类共生体的基因组比较大肠杆菌隔离,大肠杆菌HS公司(34),之前确定并公开大肠杆菌基因组序列(表). 以前对该物种的基因组测序工作主要集中在实验室适应的大肠杆菌K-12菌株(1,19,53)或数量有限的致病菌株(20,22,46,52,67). 使用胃肠道共殖体基因组作为参考基因组,应能更准确地说明哪些特征可能与定植相关,哪些特征可能是与疾病相关。此外,对同一病理变型的多个分离株进行比较,应允许在组内进行检查,以确定保守或收敛的毒力方法。该数据集为大肠杆菌作为病原体和物种。
表1。
病原体 | 应变 | 血清型 | 毒力因子一 | 基因组状态 | 连续梁数量 | 质粒 | GenBank登录号。 | 参考文献 |
---|
实验室改造 | K-12公司 | | | 完成 | 1 | 不 | U00096.2号 | 1 |
实验室改造 | W3110型 | | | 完成 | 1 | 不 | AP009048号 | 19,53 |
赞扬 | HS公司 | O9号机组 | | 完成 | 1 | 不 | CP000802型 | 本研究 |
ETEC公司 | E24377A型 | O139:H28 | 书信电报+装货单+; CFA CS1和CS3 | 完成 | 1 | 是的 | CP000800型 | 本研究 |
ETEC公司 | B7A型 | O148:水 | 书信电报+装货单+; CFA CS6 | 草稿 | 198 | 是的b条 | AAJT00000000美元 | 本研究 |
肠出血性大肠杆菌 | EDL933型 | O157:H7型 | LEE,志贺毒素 | 完成 | 1 | 是的c(c) | AE005174.2号 | 46 |
肠出血性大肠杆菌 | 酒井 | O157:H7型 | LEE,志贺毒素 | 完成 | 1 | 是的c(c) | BA000007.2个 | 20 |
ExPEC/UPEC公司 | CFT073型 | O6:K2:H1 | MRHA/S、MRHA/H、溶血素、需氧肌动蛋白、,帕帕菌毛(X2) | 完成 | 1 | 不 | AE014075.1 | 67 |
ExPEC/UPEC公司 | 2011财年 | O6:H31 | MRHA/S、MRHA/H、溶血素、需氧肌动蛋白、,帕帕菌毛和PapG III等位基因 | 草稿 | 88 | 不 | 阿拉伯联合酋长国 | 本研究 |
ExPEC/UPEC公司 | UTI89标准 | | 膀胱炎分离;帕帕菌毛、PapG III等位基因、铁调节基因 | 完成 | 1 | 是的c(c) | CP000243.1号 | 6 |
ExPEC/UPEC公司 | 536 | O6:K15:H31 | MRHA;溶血素、需氧肌动蛋白、,帕帕菌毛 | 完成 | 1 | 不 | CP000247.1号 | 22 |
欧洲电力公司 | E22型 | O103:氢气 | 兔病原,EAF质粒,LEE | 草稿 | 109 | 未知 | AAJV00000000 | 本研究 |
欧洲电力公司 | E110019号 | O111:H9型 | 不存在非典型EPEC、LEE、EAF质粒 | 草稿 | 115 | 未知 | AAJW00000000美元 | 本研究 |
欧洲电力公司 | B171号 | O111:北欧 | EAF质粒 | 草稿 | 159 | 未知b条 | AAJX00000000 | 本研究 |
欧洲经济共同体 | 厄瓜多尔042 | O44:H18型 | 肠毒素(Pet和EAST),pAAF质粒 | 不完整 | 7 | 是的 | 不适用d日 | 桑格 |
欧洲经济共同体 | 101-1 | 不可分型:H10 | 耐热肠毒素产生,缺乏pAAF质粒 | 草稿 | 70 | 是的b条 | AAMK00000000美元 | 本研究 |
ExPEC/禽类 | 亚太经合组织01 | O1公司 | 禽疾病分离物,pAPEC01 | 完成 | 1 | 是的 | CP000468.1 | 27 |
材料和方法
隔离选择。
表中总结了本研究中测序菌株的特征以及用于比较的公开基因组。
(i) 共同隔离。
这个大肠杆菌用于测序的HS培养物是从马里兰大学医学院疫苗开发中心获得的,是该分离物历史早期的冷冻库存。该分离物是从一名健康无病的人身上获得的,并已证明在没有任何明显临床症状的情况下定植于人类胃肠道(37)。
(ii)ETEC分离物。
ETEC分离物E24377A和B7A已被证实为人类病原体(36,59),并且股票是从沃尔特·里德陆军研究所(马里兰州银泉)的一家主GMP银行制备的。这两种菌株都产生不稳定毒素和稳定毒素。E24377A是O139:H28血清型菌株,产生CS1和CS3定植因子抗原(CFA)(4)而菌株B7A是O148:H28血清型,只产生CS6 CFA。
(iii)ExPEC隔离。
ExPEC分离物F11是一种泌尿系致病性分离物,取自一名20岁的膀胱炎患者(仅累及膀胱)[57]). 该菌株定植小鼠的能力已经过实验证明,许多毒力因子已经过功能表征(26). 该菌株是血清型O6:H31菌株,编码帕帕菌毛,含有papG公司III等位基因,两种不同的甘露糖抵抗血凝素(MRHA/S和MRHA/H)和溶血素,已被证明能产生需氧肌动蛋白(38)。
(v) EAEC隔离。
大肠杆菌101-1是一种非典型EAEC分离物,是20世纪90年代末日本大规模疫情的罪魁祸首(8,24). 根据DNA杂交测定,该菌株含有少量典型的EAEC毒力因子(8); 然而,该分离物的性质表明其毒力水平高于其他EAEC分离物。
基因组DNA基因组制备。
采取了预防措施,通过增加传代次数和实验室生长导致的毒力减弱,将基因组突变的可能性降至最低。从每个样本中获取基因组DNA大肠杆菌使用Ge和Taylor方法进行隔离(15),进行了以下修改。大肠杆菌分离物在Luria肉汤中培养16h,细胞生物量用于基因组DNA分离。用分光光度计和纳米滴法定量基因组DNA;~30至40μg用于文库构建和封闭反应。
的排序大肠杆菌基因组。
如前所述进行文库构建、随机鸟枪测序和基因组组装(51). 为每个基因组项目测序一个大插入随机质粒测序文库(10至12kb)和一个小插入随机质粒序列文库(4至5kb);测序成功率大于85%,平均高质量读取长度大于800个核苷酸。完成的基因组序列包含从大插入库和小插入库中读取的数据,这导致闭合基因组的平均每个核苷酸的序列覆盖率大于10倍,而草图基因组的平均覆盖率大于7.5倍。对于完整的基因组项目,使用编辑、行走库克隆和链接组件来关闭剩余的未排序区域。闪光基因查找器(55)用于识别潜在的编码区域,并按照前面的描述执行角色类别的注释和分配(61). 所有项目的GenBank登录号如表所示。
BSR分析。
如Rasko等人之前所述,进行了BLAST评分比(BSR)分析(50). 简单地说,对于选定的大肠杆菌参考菌株,我们获得了与自身比对的原始BLASTP评分(REF_score)和彼此最相似的蛋白质(QUE_score)大肠杆菌表中列出的基因组。将每个查询基因组蛋白获得的QUE_SCORE除以REF_SCORE,将分数归一化。归一化比率≤0.4的肽被认为是非同源的。标准化BSR为0.4类似于两种蛋白质在其整个长度上约30%相同(50). 标准化分数被用作保守(BSR,≥0.8)、离散(0.4<BSR<0.8)或唯一性(BSR≤0.4)的指标(50)。
泛基因组计算。
编制了包含BSR完整数据集的表格,然后按照前面的描述确定了唯一和保守的基因集(60); 但是,不使用BLASTP(P)值,则使用BSR评分,在蛋白质长度范围内包含的严格阈值为~>80%。我们认为,本研究中应用的严格阈值更准确地预测了这组病原体的相似性和差异性。每个基因组的BSR数据的完整表格可以从相应的作者处获得。
结果和讨论
大肠杆菌HS:什么是称谓?
大肠杆菌HS最初是从一位健康的实验室科学家的粪便中分离出来的,并被用作非家畜大肠杆菌一些人类殖民化研究中的分离物(34,35). 在所有情况下,大肠杆菌HS已被证明能稳定地定植于人类胃肠道,但在剂量大于10倍时不会引起任何可检测到的不良反应10CFU(循环流化床)(34). 使用的实用性大肠杆菌HS作为参考基因组和分离物是因为它提供了大多数实验室适应的分离物不再具有的定殖潜在背景。此外,该分离物的加入提供了检查致病性进化的机会大肠杆菌通过将其序列与从各种临床表现中分离出来的病原体序列进行比较,在基因组水平上进行研究。我们相信HS基因组序列将成为大肠杆菌。
只有相对较少的基因(94个基因)仅在HS基因组中发现,而在其他基因组中没有发现大肠杆菌基因组(表). 其中64个基因没有功能注释,注释为假设。具有功能注释的独特基因要么与血清组O9脂多糖(其他基因组中未出现的血清型)的产生有关,要么与原噬菌体残余物有关。与实验室适应的分离株相比,共生基因组不包含或缺少任何一个我们可以最终归因于定殖表型的特定区域(图。; 参见补充材料中的图S1)。这个大肠杆菌HS基因组与其他序列高度同步大肠杆菌基因组(图。). 虽然它拥有数量相当少的独特基因,但它确实包含与每一个比较致病菌株共享的特征。对基因组的详细比较检查表明了共生物种的镶嵌基因组结构。韦尔奇等人首先描述了马赛克大肠杆菌基于三个分离株比较的基因组结构(67). 在本研究中纳入14个额外菌株进一步支持了这一结论。使用大肠杆菌HS作为参考,可以快速识别特定分离物或病理变种与HS共享的基因簇(参见补充材料中的图S2)。在整个基因组比较中发现了这种镶嵌现象的多个例子。
共生分离物的基因含量和同源性大肠杆菌HS公司。(A) 基因保护使用大肠杆菌HS作为参考菌株。从外部开始,第一个圆圈显示正向的基因。第二个圆圈显示基因相对于起源方向相反。第三个圆圈显示卡方值,表示局部G+C含量的差异。第四个圆圈显示了所有对大肠杆菌HS公司。第5到20圈显示了所有其他区域的基因保守性大肠杆菌基因组比较顺序如下:MG1655、W3110、E24377A、B7A、EDL933、Sakai、CFT073、F11、UTI89、536、E22、E110019、B171、Ec042、101-1和APEC01(表). 颜色表示基因存在(红色)、发散(绿色)或缺失(蓝色)。另外三个区域是唯一的大肠杆菌HS显示:一个噬菌体区域(~0.3 Mb)不与任何其他测序菌株共享,血清组O9-特异性区域(~2.1 Mb),以及一个仅与共享的额外簇志贺氏菌物种(~2.6 Mb)。(B) 基因合成酶(保守基因顺序)大肠杆菌HS和大肠杆菌K-12。颜色表示区域之间的相似程度,如右下角的比例所示。箭头表示这些基因组的三个多样性区域。上下箭头表示独特的噬菌体和O9血清群。总的来说,这两个基因组之间存在大量的同步性。大多数其他完整基因组也观察到类似的模式;例外的是EHEC菌株EDL933基因组,它包含一个大的反转。
表2。
大肠杆菌拉紧 | 病原体一 | 基因数量 | 保守基因数量b条 | 独特基因数量c(c) | 群体特异性基因数量d日 |
---|
K-12公司 | 赞扬 | 4,238 | 2,312 | 21 | 11 |
第3110页 | 赞扬 | 4,384 | 2,324 | 31 | 11 |
HS公司 | 赞扬 | 4,433 | 2,321 | 94 | 11 |
E24377A型 | ETEC公司 | 5,111 | 2,318 | 246 | 5 |
B7A型 | ETEC公司 | 5,357 | 2,446 | 256 | 4 |
EDL933型 | 肠出血性大肠杆菌 | 4,863 | 2327年 | 27 | 122 |
酒井 | 肠出血性大肠杆菌 | 5,497 | 2,337 | 208 | 126 |
CFT073型 | ExPEC/UPEC公司 | 5,589 | 2,341 | 308 | 56 |
2011财年 | ExPEC/UPEC公司 | 5,198 | 2,412 | 203 | 46 |
UTI89标准 | ExPEC/UPEC公司 | 5,176 | 2,288 | 109 | 45 |
536 | ExPEC/UPEC公司 | 4,734 | 2,347 | 134 | 46 |
亚太经合组织01 | ExPEC/Avian公司 | 4,561 | 2,295 | 158 | 三d日 |
E22型 | 欧洲电力公司 | 5,575 | 2,343 | 274 | 5 |
E110019号 | 欧洲电力公司 | 5,586 | 2,397 | 219 | 4 |
B171号 | 欧洲电力公司 | 5,330 | 2,382 | 234 | 6 |
厄瓜多尔042 | 欧洲经济共同体 | 4,899 | 2,305 | 308 | 三 |
101-1 | 欧洲经济共同体 | 4,812 | 2356年 | 155 | 4 |
我们检测了HS和一种或多种被认为与定植或毒力有关的病原体所共有的一些特征。菌毛和菌毛是细菌粘附生物和非生物表面的两种机制。被注释为编码菌毛或菌毛成分的基因的比较大肠杆菌HS与其他病原体的基因比较表明,这些基因在基因组中是保守的,并且这些基因中没有一个是HS独有的(图。). 相反,当检查分泌系统时,结果显示大肠杆菌HS包含一般分泌途径的两个不同副本,也称为II型分泌系统(43). 虽然ETEC分离株和一个EPEC分离株(E110019)中都没有这两个拷贝,但EHEC和其余EPEC分离物中保留了一个版本,而ExPEC分离物包含这两个副本。在大肠杆菌HS,这种II型分泌系统的两侧没有任何活动元素,这进一步支持了这样的可能性,即在某些菌株中存在这些途径代表着生态位专门化,而不是随机水平转移事件。此外,无功能TTSS缺少功能TTSS的所有组件,即ETT2,存在于大肠杆菌HS(图。)(39). 这个簇在大肠杆菌HS、EHEC和EPEC分离株,但没有其他病理类型。ETT2已在EPEC菌株和一些非O157志贺毒素产生菌中发现大肠杆菌菌株(39). 最初认为ETT2是特定分离物的致病性标记,该位点可用于鉴定人类和动物流行株的致病性分离物(39); 然而,ETT2的存在大肠杆菌HS提示它不是发病的标志。这些只是马赛克性质的几个例子大肠杆菌HS基因组。
共性特征通常与一个或多个病原体共享。使用大肠杆菌作为参考,我们根据已知特征的注释或相似性,确定了可能与人类胃肠道定植相关的区域。这些区域分为四大类:菌毛或菌毛相关基因、菌毛、一般分泌物和III型分泌物。分离物以垂直线排列,每个水平组基于单个基因或肽。颜色表示相似程度;红色表示最相似(~100%相同),绿色表示很少或没有相似性,黑色表示查询序列长度上的~50%一致性。很明显,一些致病群体的特征或多或少与大肠杆菌HS公司。值得注意的是,两个不同系统的一般分泌系统基因在两个ETEC菌株中均缺失;然而,它们存在于四个UPEC菌株中的三个菌株中。其中一种分泌系统在EHEC、EAEC和EPEC分离株中的存在是可变的,而在实验室适应株中存在相反的表型,这表明该系统可能在定植中发挥作用。
镶嵌结构表明,共生菌株确实具有致病潜力,也可能作为毒力因子的遗传库。这些因素包括许多以前被认为是病原体特有的因素,表明它们(i)不是严格的致病特征,(ii)被共生物种用于定殖,或(iii)通过共生物种“转运”到另一致病分离物。Pupo等人认为大肠杆菌谱系可能已经进化了多次(48)也有可能大肠杆菌菌株可以作为基因库,从多种来源获取DNA,也可以作为DNA供体。获得适当的致病特征可能导致致病能力转移到共生分离物;相反,病原体可以通过DNA的丢失或捐赠恢复到共生状态。
ETEC公司。
本研究首次描述了ETEC分离物的完整基因组序列。E24377A分离物的基因组测序完成,并对足够多的B7A分离物基因组测序以获得高覆盖率草图。这两个分离物都是经验证的人类病原体(卡尔·布林克利,沃尔特里德陆军研究所,个人通讯),并含有ETEC分离物特有的稳定和不稳定毒素(65). E24377A基因组的一个特征是,该分离物的染色体比其他致病性菌株的染色体小大肠杆菌迄今为止检测到的菌株(~4.9 Mb,而EHEC和ExPEC菌株大于5 Mb)。较小的基因组可能是ETEC的一个特征,并且可能是高百分比的已识别插入(IS)元件和可移动特征的结果。插入频率和重复的移动特征使得这个基因组很难完成。这些元素在相关质粒中的存在也可能提供一种机制,通过这种机制,质粒可以整合到染色体中或从染色体中切除。易识别且在E24377A基因组中存在多个拷贝的IS元件包括IS1至IS4,印度605,印度66,印度91,印度605,印度621,印度629,印度630和IS911(网址:http://www-is.biotoul.fr/). 大约4%的基因组由这些活动元素组成。B7A基因组似乎不像E24377A基因组那样包含那么多的活动元素;然而,重复元素的高频率破坏了组装,导致B7A基因组在任何基因组序列草案中具有最多的连续序列(表)。
ETEC的染色体包含一个独特的基因簇,EcE24377A_2278到EcE24377 a_2297,负责丙二醇的利用。在厌氧条件下,可以通过岩藻糖的催化作用获得丙二醇,从而产生ATP、电子库和转移到中枢代谢的多种化合物(2,64). 丙二醇作为唯一碳源的应用肠炎沙门氏菌伤寒血清型通过钴胺依赖性丙二醇脱水酶途径与钴胺辅因子的产生有关(2,25); 然而,这是一种罕见的表型大肠杆菌(17). 值得注意的是,在E24377A中,钴胺素生物合成途径基因与丙二醇利用基因簇相邻,途径重建表明存在一条完全功能的途径。虽然丙二醇利用基因仅限于E23477A,但钴胺素生物合成则不限于此。劳伦斯和罗斯提出,丙二醇的利用途径在大肠杆菌和沙门氏菌这种途径重新引入这些生物体是最近发生的水平基因转移事件导致代谢改变的结果(33). 该基因簇在毒力中所起的作用(如果有的话)尚不清楚;岩藻糖可能是从上皮细胞表面获得并被催化的。
E24377A基因组的一个有趣的方面是存在多个质粒。在B7A基因组序列中没有发现完全闭合的质粒。我们可以鉴定出一些质粒连合序列,但高水平的重复序列阻碍了快速闭合。唯一一个序列已被报道的大型ETEC质粒被命名为pCOO(13). 由于其他质粒和染色体中存在IS元件和重复元件,E24377A质粒的准确闭合很困难。E24377A的三个最小质粒不包含任何IS元素,而三个最大质粒包含至少五个IS元素和一些这些质粒的多个相同副本(表). 我们完成了E24377A的六个质粒的分析,其大小从5033到79237 bp不等,共有269669 bp的染色体外DNA(表). E24377A质粒的G+C含量为47.3%~51.6%;相反,染色体的G+C含量为50%。有趣的是,该分离物中最大的质粒的G+C含量最低(表)而G+C含量最高的是小质粒pE24377A_6。如果pE24377A_5被忽略为异常或中性质粒,因为它没有可识别的表型,可以被认为是隐蔽的,则G+C含量与质粒大小呈负相关。此外,唯一的其他已测序ETEC质粒pCOO(~98 kb)表现出类似的趋势,G+C含量更低,为46.74%(13). 大小与G+C含量的负相关可能是以更多富含AT的IS或重复元素的形式引入外源DNA的结果。
表3。
质粒 | 大小(核苷酸) | G+C含量(%) | IS元素一 | 毒力因子 |
---|
第24377A_5页 | 5,033 | 49.63 | 核电厂 | 无,隐秘,pColE1复制子 |
第24377A_6页 | 6,199 | 52.57 | 核电厂 | 链霉素和磺胺类药物耐药性 |
第24377A_35页 | 34,367 | 51.62 | 核电厂 | 传输能力 |
第24377A_70页 | 70,609 | 50.21 | 是1(1*),IS2(1) ,印度66(2) ,是629(1*) | CS菌毛 |
第24377A_74页 | 74,224 | 49.85 | 是1(1) ,印度2(2*),IS66(4) ,印度91(1*)IS629(2*) | EatA自动运输机 |
第24377A_79页 | 79,237 | 47.27 | 是1(2*),IS2(2*),IS66(1*),IS91(4*)IS629(1*) | 肠毒素A,CS3菌毛 |
首席运营官 | 98,396 | 46.74 | ND(无损检测)b条 | CS1菌毛,EatA丝氨酸蛋白酶 |
E24377A、pE24377A_5和pE24377 A_6小质粒的基因含量与先前鉴定的质粒的基因内容相似,其在发病机制中的作用值得怀疑。质粒pE24377A_35与其他已知质粒不相似,但与pE24377 a_73和其他基于ColIb-P9的质粒共享的~5-kb区域除外(GenBank登录号{“类型”:“entrez-notide”,“属性”:{“文本”:“AB021078”,“term_id”:“4512437”}}AB021078年). 质粒转移系统的假定成分存在于pE24377A_35(EcE24377A _C0001至EcE24377 a_C0005和EcE243177A _C0028)上,但不存在完整的转移系统。质粒转移基因存在于所有大的E24377A质粒上,表明所有这些质粒可能需要形成功能转移装置。或者,这些质粒可能构成一个更大的共整合质粒,进行重排,我们在测序项目中观察到的形式代表了质粒在流动中的快照。在pCOO的表征过程中,提出了ETEC中大的协整质粒的概念(13)需要使用E24377A进行进一步的功能检查。
E24377A质粒均含有已知对ETEC发病至关重要的毒力因子(65). 质粒pE24377A_70编码CFA CS1所需的伞伞亚基,与CooD前体蛋白相比只有一个氨基酸变化(13). pE24377A_74编码EatA自动转运蛋白(45). EatA是V型自动转运体分泌系统家族的成员,单个肽包含其穿过革兰氏阴性菌内外膜所需的所有功能信息(21). 在这种情况下,EatA是一种丝氨酸蛋白酶,在ETEC的毒力中起着重要作用。杂交还表明,一组ETEC分离物含有EatA基因的质粒拷贝(45). 最终的大质粒pE24377A_79编码CFAs的另一个亚基CS3以及不耐热肠毒素A(EcE24377A_F00020)。这种毒素直接导致腹泻,因为它改变了肠上皮内的离子平衡,导致水进入肠腔,导致腹泻。虽然pCOO质粒在单个质粒上含有这些毒力因子,但在E24377A中,这些因子在不同的质粒上。
对E24377A的染色体和质粒的检查显示,与其他基因组相比,该基因组正在通过基因重排和丢失而发生快速变化大肠杆菌本研究中的菌株。对ETEC基因组草图和完整序列的比较表明,未被IS元件淹没的区域是稳定的,并且与其他区域表现出保守的同源性大肠杆菌菌株;然而,必须承认,ETEC似乎是遗传流动中的一个致病变种。
EHEC和EPEC。
肠出血性大肠杆菌(EHEC)和肠出血型大肠杆菌(EPEC)均可引起胃肠道病变的附着和消失;前者对结肠有向性,而后者位于小肠(29). 在这两种病理类型中,毒力主要由LEE中的基因驱动(40). LEE由~41个基因组成,分布在五个不同的转录单位,即LEE1到LEE5(参见补充材料中的图S4)。在这两种病理类型中,该位点的基因内容几乎相同,并且大多数多样性位于LEE5,特别是编码Tir(易位内膜受体)和内膜蛋白的基因,它们起着受体-受体对的作用。LEE1至LEE4包含参与合成TTSS的结构和调节基因,TTSS将Tir分泌到真核细胞中。然后,Tir插入真核细胞膜,充当内膜素的受体,内膜素随后介导“亲密连接”(31). 由于该位点在这些病理变种中高度保守,我们预计并发现所有EHEC和EPEC分离物都含有LEE基因(参见补充材料中的图S4)。
在所分析的每个肠出血性大肠杆菌分离株中发现的独特基因的数量主要反映了所采用的注释策略的差异(20,46). 例如,Sakai基因组包含的独特基因大约是EDL933基因组的10倍(表); 然而,许多基因都很小(<100个核苷酸),并且在EDL933基因组注释中不存在,这表明差异不是生物学上的,而是所使用的基因查找算法的结果。相比之下,本研究中两个EHEC菌株共享的基因与数量最多的共享基因表现出最大程度的基因组相似性,这表明存在共同的进化历史(表)(58,71). 有趣的是,约43%的基因是原噬菌体或噬菌体相关基因(见补充材料中的表S1)。如此高比例的噬菌体基因的存在证实了噬菌体在这种病原体的进化中所起的重要作用(32,47)。
EHEC和EPEC使用的TTSS已被证明能分泌一些LEE中未编码的效应物(70). Tobe等人最近的一项研究(62)鉴定了许多分泌型肠出血性大肠杆菌效应子,其中许多非LEE编码的分泌型效应子与噬菌体和原噬菌体有关。在没有其他功能注释的情况下,对肠出血性大肠杆菌分离物中保守噬菌体基因的鉴定(见补充材料中的表S1)可能表明这些基因仍存在于肠出血型大肠杆菌中,在某些情况下编码致病所需的分泌效应器。因为EHEC、EPEC和柠檬酸杆菌(一种导致小鼠损伤附着和消失的模型生物)具有类似的TTSS,我们想确定在肠出血性大肠杆菌中识别的分泌效应器是否被保存(9,62). 我们的分析表明,EHEC、EPEC和C.啮齿动物在分泌效应物的保存方面,分离物并没有表现出一致的特征(图。). 因此,尚不清楚每个分离物是否包含不同的效应子,以及这可能如何影响发病机制。ExPEC分离物不包含任何分泌效应物(未显示),而在共生和实验室适应的分离物中保留了一小群但不同的效应物。在共生和实验室适应的菌株中,这些效应器可能代表保存在噬菌体和噬菌体残余物中的分泌效应器的远距离同源物。这两个EAEC分离物的分泌效应物表现出不同的特征(图。)这可能反映了这些分离物中是否存在功能性TTSS,Harrington等人(18). 在维持TTSS的分离株中,分泌的效应子似乎有一定的保守性,但这些分泌的效应子在不能分泌的菌株中没有得到维持。其他致病性疾病中存在大量分泌效应物大肠杆菌含有功能性TTSS的菌株(即EPEC菌株),而缺乏TTSS(尿致病性)的菌株大肠杆菌[UPEC]、共生菌株和实验室适应菌株)不包含如此多的类似肽,这表明当肽不分泌时,编码这些肽的基因不会保留在基因组中。有趣的是,虽然EAEC菌株被认为含有活性TTSS,但它们似乎并不含有相同的分泌效应物。
Tobe等人鉴定的分泌效应分子(62)在其他中确定大肠杆菌基因组。BLAST特性显示为使用功能和生物信息学鉴定的EHEC分离物分泌效应分子构建的热图大肠杆菌酒井。红色表示相似程度较高,绿色表示相似程度较低。
没有完整的封闭EPEC基因组;然而,E2348/69的序列应该在不久的将来发布(http://www.sanger.ac.uk/Projects网站). 本研究中的序列分析表明,与当前数据集相比,EPEC分离物的基因组草图包含200多个独特基因(表). 与肠出血性大肠杆菌相比,在EPEC分离物中鉴定出的致病变种特异性基因相对较少(表)这表明EPEC菌株虽然具有相似的临床定义,但具有不同的分子机制。许多致病相关基因(即LEE区域)与EHEC共享;然而,无论是从进化的角度还是从临床鉴定的角度来看,肠出血性大肠杆菌的病理类型似乎更年轻(68)。
对两种病理类型中每一种的独特基因的分析表明,虽然两组的发病机制相似,但其进化路径可能不相似(表). 肠出血性大肠杆菌分离株似乎是沿着类似的进化路径进化的,这表明在解释注释策略时,每个基因组中存在最多的群体特异性基因和相对较少的独特基因。相反,EPEC可能利用多种分子机制来实现类似的致病结果,因为组特异性基因的数量在基因组中是最低的,而独特基因的数量相对较高。或者,肠出血性大肠杆菌分离株可能是由非常严格的标准定义的,而肠出血型大肠杆菌标准是包罗万象的,因此所观察到的多样性是这类病原体分散分类的结果。
欧洲经济共同体。
EAEC基因组的比较显示出与EPEC观察到的模式相似的模式;每个基因组中都有大量独特的基因,而很少有保守的致病性特异基因(表). 这是意料之中的,因为Ec042是EAEC型菌株,会导致大多数志愿者患病(41)而分离物101-1标记为“非典型”,因为它不具有用于EAEC分离物类型的pAA质粒或聚集粘附菌毛(24). 许多毒素与EAEC的发病机制有关,但大多数毒素与其他致病性毒素具有同源性大肠杆菌菌株(18). 我们鉴定了101-1基因组序列的25-kb区域,该区域不存在于Ec042中,但包含一个类似于Tobe等人在B171的EAF质粒中鉴定的束状毛样位点(63)(参见补充材料中的图S5)。在各种培养基条件下生长的全细胞裂解物的Western blot,并用抗成束菌毛抗体进行检测,没有检测到抗原相似的菌毛(D.A.Rasko,未发表的数据)。考虑到EPEC和EAEC基因簇之间的低水平保守性以及菌毛亚基之间缺乏任何相似性,这并不奇怪。在没有聚集粘附菌毛的情况下,新菌毛可能充当初始粘附素;然而,这个假设应该进行功能性检验。新菌毛附近的一个区域包含AatBA基因簇(参见补充材料中的图S5),该基因簇编码负责分泌分散蛋白的基因产物,分散蛋白是感染期间EAEC跨上皮层转运所需的小肽(42). 虽然有许多有趣的线索和大量独特的基因可以进行功能表征,但从基因组数据来看,101-1菌株为什么会导致疫情爆发还不是很明显。
大肠杆菌保守的核心基因组。
与17个基因组进行的比较基因组分析提供了物种内遗传多样性的一瞥大肠杆菌.检查17个基因中每个基因的数量大肠杆菌基因组分析表明,分离株的基因组大小为5020±446个基因(平均值±标准差)。使用BSR分析(50),我们计算出“保守核心”基因组大小(在所有17个菌株中高度保守的基因)为2344±43个基因(平均值±标准差)(表). 指数衰减模型如图所示。与17个基因组相比,保守核心基因的数量接近渐近线。该模型基于每个基因组比较排列中保守基因的中位数,并预测大肠杆菌大约有2200个基因(图。). 对这些基因的功能注释的检查表明,保守的核心基因主要编码核心代谢过程。先前使用22个具有不完整阵列数据集的分离株进行的基于比较基因组微阵列杂交的分析表明大肠杆菌基因组包括大约2800个基因(14). 此外,Chen等人使用生物信息学方法确定大肠杆菌是2865个基因(6). 这个数字来自一个由七个菌株的基因组内容组成的数据集,其中两个是福氏志贺氏菌隔离(6). 虽然先前研究中获得的核心基因组值与我们的当前模型密切相关,但通过当前分析确定了保守核心中基因数量最少的基因。还必须指出,在当前的研究中,也使用了最严格的纳入门槛。
保守的核心、唯一和全基因组计算大肠杆菌(A)每个点表示基因组中保守的基因数量。红线显示了在比较越来越多的基因组时,基于保守基因中值的指数衰减模型。(B) 基因组中独特基因的数量随着基因组数量的增加而减少。红线显示了当比较越来越多的基因组时,基于独特基因中值的指数衰减模型。(C) 该物种的泛基因组大肠杆菌外推曲线继续增加,因此大肠杆菌有一个开放的泛基因组。
独特的基因鉴定。
全基因组分析还确定了真正独特的基因(TUG),即仅存在于参考基因组中而不存在于任何其他基因组中的基因(表). 根据用作参考的基因组,TUG的数量从实验室适应菌株的~20个到300多个不等。在我们的大肠杆菌基因组数据集为176±95。与平均值的较大偏差表明大肠杆菌以及并非所有菌株都有类似的临床表现。我们还将指数衰减模型应用于使用中值识别独特基因(图。). 该模型的应用导致每个新基因组测序值为~300 TUG,更准确地表示了数据集。指数衰减模型中位数的使用最大限度地减少了比较同源菌株基因组的影响。正如所料,大多数TUG没有功能注释,因此它们可能代表新的生物合成或致病特征。
两个分离物CFT073和Ec042含有最多数量的独特基因(308 TUG)(表). 这一发现是意料之中的,因为人们早就知道UPEC(ExPEC)菌株具有更大的遗传多样性,主要是由于多重致病性和/或基因组岛(11,38,67). EAEC被认定为一个具有显著多样性的群体是出乎意料的。我们对EAEC集团内遗传多样性的了解有限。已知大多数典型的EAEC菌株含有一个大毒力质粒(18,23). 然而,本研究中每个EAEC分离物中的大量TUG(Ec042分离物中308个TUG,101-1分离物中155个TUG)表明染色体差异也可能在发病机制中起作用。EAEC中独特基因的鉴定可能为进一步研究这类新兴病原体的发病机制提供靶点。每个分离物中确定的独特基因可能并不总是代表该组的毒力因子,因为这些基因可能与具有类似临床来源的分离物共享。
病原体共享基因内容。
17的当前数据集大肠杆菌基因组包含来自每个大肠杆菌已识别的病理变种,为识别病理变种特异性基因提供了独特的机会(表). 令人惊讶的是,与我们预期的相比,致病变种特异性基因(在致病变种分离物中保存的基因,在任何其他分离物中都没有发现)更少。只有肠出血性大肠杆菌基因组包含相当大比例的病理变种特异性基因,超过120个基因(见补充材料中的表S1)。在肠出血性大肠杆菌特有的基因中,43%与原噬菌体和噬菌体元件相关,这证实了噬菌体在该致病株的进化中发挥了重要作用(58,69,71). 噬菌体区域可能携带编码as-yet-unidentified毒素或毒力因子的基因。相反,在属于家养或实验室适应型ETEC、EPEC和EAEC组的分离物中,可以鉴定出11个或更少的病理变种特异性基因。这表明,虽然这些分离物被归类为致病变种的成员,但这些组内存在显著的遗传异质性,这很可能反映了这些分离物是如何导致疾病的。
ExPEC基因组具有显著的相似性,表明在胃肠道外大肠杆菌利用常见的分子机制。这一观察的一个例外是鸟类大肠杆菌该分离物与其他ExPEC分离物共享三个基因(27,28). 这表明禽致病性大肠杆菌该毒株具有独特的鸟类定殖和感染基因库,而人类感染不需要这种基因库。总的来说,这些比较表明大肠杆菌除了肠出血性大肠杆菌和(在较小程度上)ExPEC,或大肠杆菌作为一种病原体,是一个“多面手”,具有使人类殖民化和感染人类的遗传潜力。相反,基因组数据集具有离群值,如EAEC分离物101-1和EPEC分离物E110019,两者均被视为“非典型”。因此,使用非典型分离物和典型分离物鉴定病理变种特异性基因可能代表有偏见的比较。需要在分子水平上对更典型和非典型的菌株进行检测,以准确确定病理变型命名的基因组边界。
的泛基因组大肠杆菌。
与之前的全基因组研究相比,该研究检查了密切相关的临床组链球菌在每个基因组中发现了数量有限的新的独特基因(60),当我们检测一组临床无关的菌株时,我们观察到独特基因的数量范围更广。这个大肠杆菌本研究中包含的分离株代表了构成该物种的多种病原体的广泛样本,并不是一组狭义的临床分离株。我们使用了类似于Tettelin等人的方法来测定pangenome(60). 数据的趋势是随着每个新测序的基因组不断添加新基因(图。)因此大肠杆菌被认为是开放的。开放物种全基因组表明,该物种仍在通过基因获取和多样化进行进化。我们的计算表明大肠杆菌泛基因组有一个由13000多个基因组成的基因库。这个数字对物种的多样性和发病机制有着巨大的影响大肠杆菌以及它在人类宿主中定植和致病的能力。
在这项研究中,我们分析了17个大肠杆菌分离物,包括8个新的分离物,除了一个真正的共生体外,它们代表了三个以前没有测序的致病变种,大肠杆菌HS公司。本研究通过比较基因组学确定了新的基因组特征和潜在的新致病机制。大约一半的基因组含量大肠杆菌分离物代表“核心保守”基因组。物种的开放全基因组大肠杆菌表明继续测序应能鉴定出每个基因组约300个新基因。公理的完整序列,大肠杆菌HS,揭示了病原体和共生体之间的显著基因组嵌合体,因为先前被认为与病原体相关或仅限于病原体的特征在共生体基因组中被识别。这对致病性的进化具有重要意义大肠杆菌由于共生菌群的成员可能充当遗传汇,“前体”病原体物种与共生菌的相互作用可能允许通过水平基因转移培养出完全致病的菌株。这个大肠杆菌HS基因组代表了病原体比较的新参考序列,该基因组的数据将是未来几年功能性工作的基础。