摘要

第一个完整的真核生物基因组序列是酵母基因组序列酿酒酵母、和酵母菌属基因组数据库(SGD;http://www.yeastgenome.org/)是原始模型生物数据库。SGD仍然是权威的社区资源酿酒酵母参考基因组序列及其注释,并继续提供与酿酒酵母基因及其产物。已经对一组不同的酵母菌株进行了测序,以探索商业和实验室应用,并提供了这些菌株的简要历史。这些新基因组的发表推动了新工具的创建,SGD将注释这些序列并提供比较分析,将变化与菌株表型和蛋白质功能的变化联系起来。我们正在SGD进入一个新时代,因为我们整合了这些新序列,并将其提供给科学界,所有这些都是为了继续我们教育研究人员和促进发现的使命。

数据库URL:http://www.yeastgenome.org/

酵母基因组学简史

多种多样的酿酒酵母基因组已经测序,包括各种商业和实验室菌株以及野生菌株,其中许多已从酵母菌属基因组数据库(SGD)。在这里,我们介绍了这些芽殖酵母菌株的分离和使用,它们目前被纳入SGD,以及我们在注释和分析中对未来发展的计划。

第一个完整的真核生物基因组序列是酵母基因组序列S公司.酿酒S288C菌株,通过全球测序联盟的努力完成(1). S288C具有复杂的系谱,但主要来源于EM93菌株(约占其基因组的88%),该菌株于1938年从加利福尼亚州中部的一株腐烂无花果中分离出来(2). S288C基因组的剩余12%来自五种不同的祖先:两种天然分离株(1939年从加利福尼亚州中部的一棵腐烂的无花果中分离的EM126,以及1942年从哥斯达黎加腐烂的香蕉中分离的NRRL YB-210)和三种商业烘焙菌株(酵母泡沫、FLD和LK)。S288C是一种广泛使用的实验室菌株,由莫蒂默公司设计用于生化研究,特别选择为非絮凝型,营养要求最低(2). 自S288C基因组发表以来的几年里,已经发表了几十个酵母基因组序列,为我们理解染色体进化和真核生物基因组的巨大可塑性奠定了基础。

在该财团完成S288C之后十年,第一批新基因组问世。2005年,来自加州葡萄园的野生分离物Bb32(3)的单倍体衍生物RM11-1a问世。YJM789发表于2007年,是一种机会性病原体的单倍体形式,来源于1989年从免疫功能低下患者肺部分离的酵母(,4). YJM789因其不同的表型,包括絮凝性、耐热性和致命毒性,在感染研究和数量遗传学方面很有用(4). 随着第二和第三本书的出版酿酒酵母基因组学,比较酵母基因组学诞生了。研究人员开始在基因组尺度上研究遗传变异的功能意义。世界环境学会等。(4)在YJM789和S288C之间显示了近6万个单核苷酸多态性(SNPs)和约6000个插入/缺失(indels),沿着染色体和特定基因的多态性密度具有异质性。序列改变导致生活方式改变的一个特别引人注目的例子,在本例中是致病性5菲律宾第纳尔编码参与多效性药物反应的ABC转运体。世界环境学会等。(4)还发表了首个酵母染色体-染色体序列比较,确定了第十四号染色体上的一个大反转,该反转跨越一个长度仅>30kb的区域,两侧为转座元件和tRNA。类似地,RM11-1a和S288C之间的反转存在于染色体III上,也受长末端重复序列和tRNA基因的限制。这两个新的基因组还首次与Gu进行了全基因组进化速率的比较等。(5)与YJM789和Ronald相比,S288C的蛋白质进化速度增加等。(6)在成对比较中,RM11-1a相对于其他两个菌株的进化速度更快。

2008年,又公布了三个基因组,将测序酵母基因组的数量从三个增加到六个,翻了一番。这是值得注意的,因为社区已经等了9年才完成第二个酵母基因组,而第三个酵母基因组又等了2年。然后在仅仅12个月的时间里,接下来的三个新基因组出现了。M22是在意大利的一个葡萄园采集的,而YPS163是1999年从宾夕法尼亚州南部一个天然林地的橡树下的土壤中采集的(7,8). 毫无疑问,YPS163具有抗冻性,这是一种与水通道蛋白表达增加相关的表型AQY2类(9). AWRI1631是澳大利亚葡萄酒酵母,是一种强大的发酵罐和工业葡萄酒菌株N96的单倍体衍生物(10). 研究人员开始一次比较三个不同的基因组,出现了类似的发现。多尼格尔等。(7)在M22、YPS163和S288C的组合基因组比对中报告了超过88000个多态性。在这些多态性中,许多是菌株特异性的,具有明显的非随机基因组分布,93%是SNPs,其余是indel。多尼格尔等。(7)也证实了葡萄园分离物M22相对于S288C的第VIII和XVI染色体之间的互惠易位。这种特异的相互易位是葡萄酒菌株中常见的一种易位,并能提高抗亚硫酸盐能力(11)这是一个有趣的结果,考虑到葡萄园通常会喷洒元素硫作为杀菌剂。博内曼等。(10)将AWRI1631与YJM789和S288C进行比较时,发现了差异的马赛克模式,因此,虽然基因组的大部分区域都存在大量的保守性,但许多区域表现出高度的粒间变异。此外,博内曼等。(10)此外,还报道了第VI和X染色体之间的互惠易位,这一次是在YJM789中,与S288C和AWRI1631相比,还有一个大的反转。

到2009年底,整个酵母基因组的序列陆续公布。JAY291是巴西生物乙醇菌株PE-2的非絮凝单倍体衍生物;它能产生大量乙醇和细胞质量,并能耐受热应激和氧化应激(12). 阿圭索等。(12)确定JAY291与S288C、RM11-1a和YJM789高度分化,并在几个已知耐热性和发酵性能相关的基因中包含特征良好的等位基因。EC1118是一种二倍体商业酵母,按产量计算,它可能是世界上使用最广泛的酿酒菌株。在北半球,它也被称为Premier Cuvee或Prise de Mousse;它是一种可靠的发酵罐,可以酿造清洁但有点乏味的葡萄酒。诺沃等。(13)发现EC1118与S288C和YJM789相比,与RM11-1a和AWRI1631的差异更大,并且还报告了EC1118基因组中位于第VI、XIV和XV染色体上的三个大小为17至65 kb的独特区域,包括34个与糖或氮的代谢和运输等关键发酵特性相关的基因。他们还鉴定了EC1118中缺失的S288C中的100多个基因。Sigma1278b基因组的发布值得注意,因为它是第二个被测序的广泛使用的实验室菌株,但也因为在该菌株背景下同时产生系统性缺失收集。道尔等。(14)据报道,Sigma1278b中有75个基因在S288C中缺失,还有一组“条件要素”,它们是在一种背景下生存所需的基因,但在另一种背景中不需要,这决定性地证明了表型受背景特定修饰语的影响。

第二年,五个新的酿酒酵母基因组可用(15). 福斯特O和福斯特B是商业啤酒酵母。VIN13是一种耐寒的南非葡萄酒品种,是一种适合酿造芳香白葡萄酒的强发酵剂。AWRI796是另一种南非葡萄酒品种,但在较温暖的温度下发酵更成功,更适合生产红色葡萄酒。CLIB215于1994年从新西兰北岛塔拉纳基的一家面包店分离出来。博内曼等。(15)在不同的工业菌株中鉴定出不同的大染色体拷贝数变异(CNV)。一些基因组似乎具有全染色体扩增:AWRI796中的I号染色体,Foster’s O中的III号染色体,以及Foster’s B中的II、V和XV号染色体。还发现了一些数百千碱基长的部分染色体CNV扩增,以及一些拷贝数的减少。博内曼等。(15)还报道了每个菌株中有几十个新的开放阅读框(ORF),其中一些在菌株之间共享,在这组不存在于S288C参考基因组中的非退化开放阅读框中总共有218个(表1).

表1

各种酿酒酵母基因组包含S288C参考基因组中不存在的ORF

应变不在S288C中的ORF参考
AWRI796系列7415
欧洲标准化委员会。PK113-7D型8316
2018年12月7715
福斯特B3615
福斯特O4815
291年1月1612
京凯7号4817
质量保证2311015
11-1a令吉3815
西格玛1278b7514
VIN13号公路4515
VL3型5415
YJM789型3415
应变S288C中没有ORF参考
AWRI796系列7415
欧洲标准化委员会。PK113-7D型8316
EC1118标准7715
福斯特B3615
福斯特O4815
291年1月1612
京凯7号4817
质量保证2311015
11-1a令吉3815
西格玛1278b7514
VIN13号公路4515
VL3(VL3)5415
YJM789型3415
表1

各种酿酒酵母基因组包含S288C参考基因组中不存在的ORF

应变S288C中没有ORF参考
AWRI796系列7415
欧洲标准化委员会。PK113-7D型8316
EC1118标准7715
福斯特B3615
福斯特O4815
JAY2911612
京凯7号4817
质量保证2311015
11-1a令吉3815
西格玛1278b7514
VIN13号公路4515
VL3(VL3)5415
YJM789型3415
应变S288C中没有ORF参考
AWRI796系列7415
欧洲标准化委员会。PK113-7D型8316
EC1118标准7715
福斯特B3615
福斯特O4815
291年1月1612
京凯7号4817
质量保证2311015
11-1a令吉3815
西格玛1278b7514
VIN13号公路4515
VL3(VL3)5415
YJM789型3415

2011年是产量最高的一年,可用基因组数量从14个增加到29个,翻了一番。CBS7960是从巴西圣保罗的一家蔗糖乙醇工厂分离出来的。PW5来自2002年尼日利亚拉菲亚棕榈树的发酵液。CLIB324是1996年从胡志明市采集的越南面包师菌株。CLIB382来自1952年前爱尔兰酿造的啤酒。EC9-8是一种单倍体抗镉酵母衍生物,从以色列纳哈勒奥伦河下游进化峡谷谷底分离得到(18). T7是从密苏里州巴勒州立公园的橡树分泌物中分离出来的。T73具有低氮需求、高酒精耐受性和低挥发性酸度生成,非常适合发酵生长在炎热气候中的强健结构性红酒。1974年前的某个时候,UC5来自日本Kurashi的Sene sake。VL3是在法国波尔多分离出来的,最适合生产高硫醇含量的优质芳香白葡萄酒(柑橘和热带水果特性)。博内曼等。(15)报道了VL3中第VIII号染色体的全染色体扩增,以及S288C中缺失的VL3中>50个ORF(表1). Kyokai No.7(K7)是使用最广泛的清酒酵母,于1946年首次从日本长野县的一家清酒酿造厂分离出来(17). 阿高等。(17)据报道,K7在第V和XIV染色体上有两个大的反转,两侧都有转座元件和反向重复序列,在第I和VII染色体上有2个CNV减少,与S288C相比,其他研究人员在其他菌株中发现了类似的镶嵌模式和非随机变异分布。他们还确定了K7中S288C缺失的48个ORF,以及S288C中K7缺失的49个ORF(表1). 2011年还出现了QA23的基因组,这是一种来自维尼奥维德地区的耐寒葡萄牙葡萄酒菌株。QA23营养素和氧气需求量低,β-葡萄糖苷酶活性高,这一组合造就了美丽的白苏维翁。1973年前的某个时候,Y10是从菲律宾的椰子中分离出来的。YJM269于1954年产自奥地利的红布劳尔-波图吉瑟葡萄。FL100是第三个进行测序的实验室菌株,随后很快就跟随W303。拉塞尔等。(19)据报道,W303衍生物K6001是研究衰老的关键模型生物,与S288C的基因组共享率超过85%,核苷酸位置差异超过8000个,导致799个蛋白质的序列发生变化。这些差异在整个基因组中都是非随机分布的,两个菌株的第十六号染色体几乎完全相同,第十一号染色体差异最大。拉塞尔等。(19)还注意到,W303中的一些非S288C区域也存在于Sigma1278b中,其与S288C的序列差异率是W303的六倍,与S288C相同,但不到其基因组的一半。

2012年,又有四个菌株的基因组序列可用,到目前为止,已经公布了几十个基因组,这些基因组来自于具有各种不同工作和生活方式的酵母菌(图1;表2). BY4741和BY4742是用于系统缺失收集的S288C衍生菌株,这些菌株与S288C之间的变异很小(山口T.Yamaguchi和F.Roth,个人通信)。ZTW1是2007年从中国用于工业生物乙醇生产的玉米泥中分离出来的。欧洲标准化委员会。PK113-7D是由亲本菌株ENY衍生而来的实验室菌株。WA-1A和MC996A,广泛用于系统生物学研究。内坎普等。(16)在CEN中发现六个重复区域。PK113-7D相对于S288C,两个位于染色体II上,一个位于染色体III、VII、VIII和XV上,包括麦芽糖代谢基因的富集。也存在于CEN中。Nijkamp及其同事发现PK113-7D是生物素原营养体,是生物素生物合成所需的基因。他们还鉴定出两个菌株之间有超过20000个SNP,其中三分之二位于ORF内。其中近5000个导致1400个以上蛋白质的序列发生改变。内坎普等。(16)还报道了2800个以上平均每个3bp的小indels,其中400多个位于编码区。另外83个基因被鉴定为S288C中不存在,包括在YJM269中也发现的ENA6钠泵,以及在YJM299和PW5中都存在的其他基因。内坎普等。(16)还对上述菌株的全基因组距离进行了系统发育分析(图1;表2).

根据Nijkamp等人(16)计算的全基因组距离的算术平均值(UPGMA)聚类,基于未加权对群方法描述酿酒酵母菌株之间的关系的系统发育图。根据Nijkamp等人(16)重新绘制。
图1

描述相互关系的谱系图酿酒酵母基于Nijkamp计算的全基因组距离算术平均(UPGMA)聚类的未加权对群方法的菌株等。(16). 从Nijkamp重新绘制等。(16).

表2

在S288C基因组发表以来的几年里,已经发表了几十个酵母基因组序列

应变年份原产地NCBI生物项目康蒂格N50脚手架N50
第288页1996实验室菌株项目编号128不适用b不适用
11-1a令吉2005加利福尼亚葡萄园分离株的单倍体衍生物项目编号13674263 288795 018
YJM789型2007条件致病菌单倍体衍生物项目编号13304429 709不适用
M22型2008意大利葡萄园隔离1988年4月2207不适用
YPS163型2008宾夕法尼亚林地隔离区PRJNA28813型2901不适用
AWRI1631年2008南非商品葡萄酒菌株N96的单倍体衍生物项目编号305537704不适用
291年1月2009巴西工业生物乙醇菌株PE-2的单倍体衍生物PRJNA32809型64 336不适用
EC1118标准2009商业葡萄酒菌株PRJEA37863型776 014不适用
西格玛1278b2009实验室菌株PRJNA39317型365 700不适用
福斯特O2010商业ale菌株项目编号:48567195 316不适用
福斯特B2010商业啤酒菌株PRJNA48569型204 208626 897
葡萄酒132010南非白葡萄酒品种项目编号:48563308 189700 638
AWRI796系列2010南非红葡萄酒品种项目编号:48559403 341565 854
点击2152010新西兰面包店隔离项目编号:PRJNA6014316 81347 217
哥伦比亚广播公司79602011巴西生物乙醇工厂分离物PRJNA60391项目18 76165 099
CLIB324系列2011越南面包店隔离PRJNA60415型426024 472
CLIB382系列2011爱尔兰啤酒分离物项目编号:PRJNA601458402711
EC9-8标准2011以色列峡谷隔离物的单倍体衍生物PRJNA73985型15 539541 605
FL100(飞行高度100)2011实验室菌株项目编号:PRJNA60147424426 506
京凯7号2011日本清酒酵母项目编号45827120 978902 266
质量保证232011葡萄牙Vinho Verde白葡萄酒项目编号:48561182 942182 942
第5页2011尼日利亚拉菲亚棕榈酒分离物PRJNA60181型14 234393 105
第7天2011密苏里橡树分泌物分离物PRJNA60387型147 205476 142
T73型2011西班牙红葡萄酒品种PRJNA60195型294536 287
UC5公司2011日本清酒酵母PRJNA60197型17 142356 094
VL3(VL3)2011法国白葡萄酒品种PRJNA48565型293 399656 188
W303型2011实验室菌株项目编号:167645149 943367 966
第10页2011菲律宾椰子分离物项目编号:PRJNA60201273022 204
YJM269型2011奥地利布劳尔波尔图杰瑟葡萄酒葡萄PRJNA60389型23 45258 353
BY4741公司2012S288C衍生实验室菌株不适用不适用不适用
BY4742公司2012S288C衍生实验室菌株不适用不适用不适用
欧洲标准化委员会。PK 113-7D2012实验室菌株PRJNA52955型48 196918 791
ZTW1号机组2012中国玉米醪生物乙醇分离物项目编号174065556 921不适用
应变年份原产地NCBI生物项目康蒂格N50脚手架N50
S288C型1996实验室菌株项目编号128不适用b不适用
11-1a令吉2005加利福尼亚葡萄园分离物的单倍体衍生物项目编号13674263 288795 018
YJM789公司2007条件致病菌单倍体衍生物项目编号13304429 709不适用
M22型2008意大利葡萄园隔离株PRJNA28815型2207不适用
YPS163型2008宾夕法尼亚林地隔离区PRJNA28813型2901不适用
AWRI1631年2008南非商品葡萄酒菌株N96的单倍体衍生物项目编号305537704不适用
JAY2912009巴西工业生物乙醇菌株PE-2的单倍体衍生物PRJNA32809型64 336不适用
EC1118标准2009商业葡萄酒菌株PRJEA37863型776 014不适用
西格玛1278b2009实验室菌株PRJNA39317型365 700不适用
福斯特O2010商业ale菌株项目编号:48567195 316不适用
福斯特B2010商业ale菌株PRJNA48569型204 208626 897
VIN13号公路2010南非白葡萄酒品种项目编号:48563308 189700 638
AWRI796系列2010南非红葡萄酒品种项目编号:48559403 341565 854
点击2152010新西兰面包店隔离项目编号:PRJNA6014316 81347 217
哥伦比亚广播公司79602011巴西生物乙醇工厂分离物邮编:039118 76165 099
CLIB324系列2011越南面包店隔离PRJNA60415型426024 472
CLIB382系列2011爱尔兰啤酒分离物项目编号:PRJNA601458402711
EC9-8标准2011以色列峡谷隔离物的单倍体衍生物PRJNA73985型15 539541 605
FL100(飞行高度100)2011实验室菌株项目编号:PRJNA60147424426 506
京凯7号2011日本清酒酵母项目编号45827120 978902 266
卡232011葡萄牙Vinho Verde白葡萄酒项目编号:48561182 942182 942
密码52011尼日利亚拉菲亚棕榈酒分离物PRJNA60181型14 234393 105
第7天2011密苏里橡树分泌物分离物PRJNA60387型147 205476 142
T73型2011西班牙红葡萄酒品种PRJNA60195型294536 287
UC5公司2011日本清酒酵母PRJNA60197型17 142356 094
VL3(VL3)2011法国白葡萄酒品种PRJNA48565型293 399656 188
W303型2011实验室菌株项目编号:167645149 943367 966
10日元2011菲律宾椰子分离物项目编号:PRJNA60201273022 204
YJM269型2011奥地利布劳尔波尔图杰瑟葡萄酒葡萄PRJNA60389型23 45258 353
BY4741公司2012S288C衍生实验室菌株不适用不适用不适用
BY4742公司2012S288C衍生实验室菌株不适用不适用不适用
欧洲标准化委员会。PK 113-7D2012实验室菌株第52955页48 196918 791
ZTW1号机组2012中国玉米醪生物乙醇分离物项目编号174065556 921不适用

Contig和scaffold N50长度是常见的基因组统计数据,表示单个连续序列(Contig或scaffolds)集合中的最小长度,其中包含组装中所有碱基的一半。

bN/A=不可用。

表2

在S288C基因组发表以来的几年里,已经发表了几十个酵母基因组序列

应变年份原产地NCBI生物项目康蒂格N50脚手架N50
S288C型1996实验室菌株项目编号128不适用b不适用
11-1a令吉2005加利福尼亚葡萄园分离物的单倍体衍生物项目编号13674263 288795 018
YJM789型2007条件致病菌单倍体衍生物项目编号13304429 709不适用
M22型2008意大利葡萄园隔离1988年4月2207不适用
YPS163型2008宾夕法尼亚林地隔离区PRJNA28813型2901不适用
AWRI1631年2008南非商品葡萄酒菌株N96的单倍体衍生物项目编号305537704不适用
291年1月2009巴西工业生物乙醇菌株PE-2的单倍体衍生物PRJNA32809型64 336不适用
EC1118标准2009商用葡萄酒品种PRJEA37863型776 014不适用
西格玛1278b2009实验室菌株PRJNA39317型365 700不适用
福斯特O2010商业ale菌株项目编号:48567195 316不适用
福斯特B2010商业ale菌株PRJNA48569型204 208626 897
VIN13号公路2010南非白葡萄酒品种项目编号:48563308 189700 638
AWRI796系列2010南非红葡萄酒品种项目编号:48559403 341565 854
点击2152010新西兰面包店隔离项目编号:PRJNA6014316 81347 217
哥伦比亚广播公司79602011巴西生物乙醇工厂分离物PRJNA60391项目18 76165 099
CLIB324系列2011越南面包店隔离2004年4月15日426024 472
CLIB382系列2011爱尔兰啤酒分离物项目编号:PRJNA601458402711
EC9-8标准2011以色列峡谷隔离物的单倍体衍生物PRJNA73985型15 539541 605
FL100(飞行高度100)2011实验室菌株项目编号:PRJNA60147424426 506
京凯7号2011日本清酒酵母项目编号45827120 978902 266
质量保证232011葡萄牙Vinho Verde白葡萄酒项目编号:48561182 942182 942
第5页2011尼日利亚拉菲亚棕榈酒分离物PRJNA60181项目14 234393 105
第7天2011密苏里橡树分泌物分离物PRJNA60387型147 205476 142
T73型2011西班牙红葡萄酒品种PRJNA60195型294536 287
UC5公司2011日本清酒酵母PRJNA60197型17 142356 094
VL3(VL3)2011法国白葡萄酒品种PRJNA48565型293 399656 188
W303型2011实验室菌株项目编号:167645149 943367 966
10日元2011菲律宾椰子分离物项目编号:PRJNA60201273022 204
YJM269型2011奥地利布劳尔波尔图杰瑟葡萄酒葡萄PRJNA60389型23 45258 353
BY4741公司2012S288C衍生实验室菌株不适用不适用不适用
BY4742公司2012S288C衍生实验室菌株不适用不适用不适用
欧洲标准化委员会。PK 113-7D2012实验室菌株PRJNA52955型48 196918 791
ZTW1号机组2012中国玉米醪生物乙醇分离物174065年4月556 921不适用
应变年份原产地NCBI生物项目康蒂格N50脚手架N50
S288C型1996实验室菌株项目编号128不适用b不适用
11-1a令吉2005加利福尼亚葡萄园分离物的单倍体衍生物项目编号13674263 288795 018
YJM789型2007条件致病菌单倍体衍生物项目编号13304429 709不适用
M22型2008意大利葡萄园隔离PRJNA28815型2207不适用
YPS163型2008宾夕法尼亚林地隔离区PRJNA28813型2901不适用
AWRI1631年2008南非商品葡萄酒菌株N96的单倍体衍生物项目编号305537704不适用
JAY2912009巴西工业生物乙醇菌株PE-2的单倍体衍生物PRJNA32809型64 336不适用
2018年12月2009商业葡萄酒菌株PRJEA37863型776 014不适用
西格玛1278b2009实验室菌株PRJNA39317型365 700不适用
福斯特O2010商业啤酒菌株项目编号:48567195 316不适用
福斯特B2010商业ale菌株PRJNA48569型204 208626 897
VIN13号公路2010南非白葡萄酒品种项目编号:48563308 189700 638
AWRI796系列2010南非红葡萄酒品种项目编号:48559403 341565 854
点击2152010新西兰面包店隔离项目编号:PRJNA6014316 81347 217
哥伦比亚广播公司79602011巴西生物乙醇工厂分离物邮编:039118 76165 099
CLIB324系列2011越南面包店隔离PRJNA60415型426024 472
CLIB382系列2011爱尔兰啤酒分离物项目编号:PRJNA601458402711
EC9-8标准2011以色列峡谷隔离物的单倍体衍生物邮编7398515 539541 605
FL100(飞行高度100)2011实验室菌株项目编号:PRJNA60147424426 506
京凯7号2011日本清酒酵母项目编号45827120 978902 266
质量保证232011葡萄牙Vinho Verde白葡萄酒项目编号:48561182 942182 942
密码52011尼日利亚拉菲亚棕榈酒分离物PRJNA60181型14 234393 105
第7天2011密苏里橡树分泌物分离物PRJNA60387型147 205476 142
T73型2011西班牙红葡萄酒品种PRJNA60195型294536 287
UC5公司2011日本清酒酵母PRJNA60197型17 142356 094
VL3(VL3)2011法国白葡萄酒品种1985年4月293 399656 188
W303型2011实验室菌株项目编号:167645149 943367 966
10日元2011菲律宾椰子分离物项目编号:PRJNA60201273022 204
YJM269型2011奥地利布劳尔波尔图杰瑟葡萄酒葡萄PRJNA60389型23 45258 353
BY4741公司2012S288C衍生实验室菌株不适用不适用不适用
BY4742公司2012S288C衍生实验室菌株不适用不适用不适用
欧洲标准化委员会。PK 113-7D2012实验室菌株第52955页48 196918 791
ZTW1号机组2012中国玉米浆生物乙醇分离物项目编号174065556 921不适用

Contig和scaffold N50长度是常见的基因组统计数据,表示单个连续序列(Contig或scaffolds)集合中的最小长度,其中包含组装中所有碱基的一半。

bN/A=不可用。

到目前为止,下一代测序方法已经成为主流,现在正在对整个基因组进行分析全体回答具体问题。温格等。(20)利用高通量测序结合分离物分析研究木糖发酵能力在600多株菌株中的分布酿酒酵母发现这种“木糖阳性”表型存在于约5%的受试菌株中,聚集在葡萄酒酵母中。他们进一步确定了一种新型木糖醇脱氢酶基因的存在XDH1型在Simi White株中,与Novo在第十五染色体上相同的65-kb亚端粒插入物等。(13)此前曾在葡萄酒行业确定主力产品EC1118。请注意,虽然Simi White和EC1118共享相同的大插入,但EC1118中的木糖利用位点本身是假基因的(13). 利布金德等。(21)将比较基因组学与200多个自然分离物的种群生态学相结合,解决分类和系统学问题,最终确定酿酒酵母和新型耐低温物种S公司真巴彦酵母作为…的祖先S公司巴斯德酵母,揭示了啤酒酵母的进化和驯化。与此同时,阮等。(22)我们还利用比较基因组学研究了啤酒的杂交历史酵母菌属,发现马赛克基因组和S公司巴亚努斯酵母,S公司紫外accharomyces uvarum酿酒酵母.命名为尤巴亚努斯链球菌Libkind和同事(21)由Ngyuyen确认等。(22)并打电话给S公司拉盖酵母博内曼等。(23)研究了广泛用于低温发酵生产优质白苏维翁和赛美蓉的葡萄酒酵母VIN7,并证实其基因组是一个复杂的异源三倍体酿酒酵母和耐低温S公司库德里亚夫佐维酵母.VIN7很可能是通过二倍体之间的交配产生的酿酒酵母和单倍体库德里亚夫采七,并显示了两个祖细胞的等位基因之间发生易位和重组事件的证据。欧尼等。(24)对阿尔萨斯工业葡萄酒酵母Eg8进行了基因组分析,该酵母能够耐受低温和高酒精浓度,是赛美蓉和麝香葡萄酒发酵的理想选择。欧尼等等. (24)发现Eg8也是二倍体之间的嵌合异源三倍体杂种酿酒酵母和单倍体S.kudriavzevii公司,并进一步鉴定了与Doniger相同的第VIII和XVI染色体之间的易位等。(8)据报道,葡萄园分离物M22导致抗亚硫酸盐能力增强,这在葡萄酒酵母菌株中很常见。佩里斯等。(25)研究了各种酿酒酵母×S.kudriavzevii公司从葡萄酒和啤酒发酵中分离出的天然混合物,包括VIN7。他们在不同的酵母中发现了不同的染色体补体和重排,尽管它们都有一套共同的S.kudriavzevii公司基因和缺乏一套共同的酿酒酵母基因。基因组序列丰富的内容可以作为比较的背景,这改变了我们研究基因组的方式。

新的方向

虽然下一代测序技术已经席卷了酵母遗传学界,但SGD一直在为这一转变做好准备,以进入酵母基因组学的新现代时代。2011年2月,SGD基于这些现代测序技术实施了一个质量更高的更新参考序列,此后,我们预计S288C的序列更新很少(恩格尔等。,准备中)。我们将继续为酿酒酵母以及来自这些其他测序菌株的变异序列,并正日益朝着序列变异和等位基因差异的表示方向发展。我们已经将新的酿酒酵母上述基因组将纳入SGD,并将继续扩大研究人员可获得的实验室和工业菌株以及野生菌株数量的增长信息量。正在开发新的工具,将提供对该等位基因和变异信息汇编的访问,并允许将新确定的序列与参考菌株以及几种广泛使用和普遍研究的序列进行比较酿酒酵母菌株。现有的工具包括每个ORF的预计算蛋白质和编码DNA比对(ClustalW),以及ORF特异树状图,这些树状图描述了ORF序列在其被鉴定的一组菌株中的相似程度(图2). 从每个基因座摘要页面,可以通过序列信息部分的一对下拉菜单访问蛋白质和DNA序列,而可以通过分析序列部分的链接或通过大多数SGD网页顶部序列菜单中的“菌株和物种”项访问比对。蛋白质或DNA序列也可以从比对页面批量下载,或从每个基因座摘要中逐个下载。我们还将各种菌株的基因组并入基本局部比对搜索工具(BLAST)数据集,用于搜索基因组和编码DNA以及蛋白质序列。BLAST可用于寻找裂变/聚变事件的证据,其中ORF(如YNR066C)在某些菌株中分裂,但在其他菌株中没有分裂(图3). 可通过大多数SGD页面顶部的序列菜单访问BLAST工具。所有菌株的DNA和蛋白质序列都可以下载,这样研究人员就可以进行自己的分析(http://downloads.yeastgenome.org). 此外,我们继续将序列变异信息与功能效应和表型变异联系起来。几年来,SGD一直在管理不同菌株背景下的表型,因为不同菌株和物种之间共享的基因可以产生不同的表型,揭示遗传变异,并可能揭示新的疾病模型(26).

氨基酸和编码DNA序列的预计算ClustalW比对以及ORF特异性树状图可用于每个ORFhttp://www.yeastgenome.org/cgibin/FUNGI/alignment.pl。
图2

氨基酸和编码DNA序列的预计算ClustalW比对以及ORF特异树状图可用于每个ORFhttp://www.yeastgenome.org/cgibin/FUNGI/alignment.pl.

各种酿酒酵母菌株的基因组已纳入SGD的BLAST数据集,可用于搜索基因组和编码DNA,以及位于http://www.yeastgenome.org/cgi-bin/blast-sgd.pl。
图3

各种基因组酿酒酵母菌株已被纳入SGD的BLAST数据集,可用于搜索基因组和编码DNA,以及位于http://www.yeastgenome.org/cgi-bin/blastsgd.pl.

新技术和新方法正在推动酿酒酵母仅基于单个引用序列的注释超出了系统的限制。下一代测序方法将确定数百种(如果不是数千种)不同基因的基因组序列酿酒酵母未来几年的工业菌株、实验室菌株和天然菌株。比较基因组学可以更清楚地描述物种基因组的全部组成部分,并可以识别序列特征,如结合基序、调控区和非编码RNA。如上所述,这些新的基因组不仅在特定的核苷酸上有所不同,而且在它们携带的基因的补体及其染色体的结构上也有所不同,因为基因组元素可以随着种群适应不同的环境而被洗牌、扩增、丢失或获得。为了更全面地了解酵母的基因库,SGD正在编译虚拟的酿酒酵母基因组,或泛基因组,包含在不同序列中发现的所有基因酿酒酵母菌株。

泛基因组更准确地描述了一个物种的遗传内容,并且可以比任何单个组成基因组大得多。每个基因都可以分为三类。核心基因是存在于每个基因组中的基因,包括蛋白质(如肌动蛋白)或聚合酶、组蛋白和核糖体成分的保守基本基因,这些蛋白质是一些最基本的细胞过程(如复制和翻译)所必需的。常见基因是指在某些基因组中发现的基因,但在其他基因组中没有发现;它们通常参与适应特定环境或应用,例如特定糖的代谢或特定碳源的发酵。在细菌基因组学中,这种中间类有各种名称:“特征”、“可有可无”、“外围”、“可变”或“灵活”基因(27–30). 它们往往比保守的基本基因进化得更快,但比单个基因组本身进化得更慢。这个酿酒酵母泛基因组包含数百个常见基因,这些基因在一些菌株中发现,但在其他菌株中没有发现。示例包括MAL(麦芽糖发酵)多基因座家族,每个基因座编码麦芽糖通透酶、麦芽糖酶和反式-MAL激活剂(31). 如前所述,尼坎普等。(16)发现了CEN菌株的基因组。PK113-7D在MAL基因中富集。稀有基因是指那些仅存在于少数基因组中的基因,甚至可能是单个菌株所特有的,并且通常具有未知功能。罕见的基因往往进化迅速,尤其是可变的,表现出高的基因出生率和死亡率。在细菌基因组学中,这些基因有时被称为“辅助”基因(27). 最近报道的一种罕见基因酿酒酵母是小说吗XDH1型前面提到的木糖利用基因(20). 其他示例包括PRM8型项目需求管理9,两者都编码DUP240家族非必需信息素调节的跨膜蛋白(32). 这三个集合共同构成了我们想要描述的泛基因组,并将在未来为新确定的芽殖酵母基因组注释和功能分析以及内部观察到的变异的比较提供有价值的资源酿酒酵母。

越来越多的测序基因组的可用性提出了所有基因组数据库都必须解决的越来越多的明确和当前挑战:任何特定的方法如何扩展到处理数百个基因组?组织和展示SNPs、较大多态性和基因组重排的最佳方式是什么?在泛基因组的背景下,染色体坐标和图谱信息应该如何处理?在SGD,我们正在扩大我们的范围,以提供所有主要芽孢酵母菌株的注释和比较分析,并正朝着提供多个参考基因组的方向迈进。我们并没有放弃一个标准的序列,而是在保持实用性的同时,确定从引用中可以走多远。能够“改变参考”,选择对特定研究领域最合适且信息最丰富的基因组,这是很有帮助的。SGD积极寻找并获得了一组具有丰富使用历史和实验结果的菌株的基因组序列,这些结果将作为参考基因组。这些菌株包括W303、Sigma1278b、SK1、SEY6210、CEN。PK、JK9-3d和FL100是我们获得最多表型数据的基因组,我们的目标是获得特定功能信息。高质量的基因组序列与详细的表型和功能注释相结合,将允许解剖表型变异的基因组基础。

对酵母细胞中单个基因产物的复合物和相互作用进行细致的研究,可以在酵母基因组学中做很多事情。没有其他模式生物能为理解生物学的基本机制提供如此肥沃的环境。研究真核细胞生物化学和细胞生物学的这门“小科学”仍有必要(33). SGD将小规模研究提供的实验定义知识连接到基因组结果注释期间的应用。酵母基因组学的力量直接依赖于酵母遗传学和生物化学。SGD长期以来为酵母研究人员和更广泛的遗传学界提供服务。随着我们共同走过比较酵母基因组学的新时代,SGD保持了其对质量的高度专注,并仍然是新菌株的主要注释资源酿酒酵母。我们继续致力于教育学生、培养实验研究人员和促进科学发现。

基金

SGD由美国国家人类基因组研究所(NHGRI)、美国国立卫生研究院[5U41HG001315-18]资助。内容完全由作者负责,不一定代表国家人类基因组研究所或国家卫生研究院的官方观点。

利益冲突。未申报。

致谢

作者感谢Craig Amundsen、Shuai Weng和Benjamin C.Hitz纳入和分析菌株基因组;Markus Ralser早期获取W303基因组序列;山口拓夫和弗雷德里克·P·(Fritz)·罗斯(Takafumi Yamaguchi),早期获取BY4741和BY4742基因组序列;盖尔·宾克利和伊迪丝·D·王阅读手稿;以及新加坡发展局的工作人员,没有他们的努力和奉献精神,新加坡发展局项目就不可能实现。

工具书类

1
戈菲奥
A类
巴雷尔
BG公司
布西
H(H)
有6000个基因的生活
科学类
1996
,卷。 
274
(第
546
-
567
)
2
莫蒂默
韩国
约翰斯顿
年少者
酵母遗传资源中心主要菌株的系谱
遗传学
1986
,卷。 
113
(第
35
-
43
)
陶菲克
帕帕西安
希杰
狄克逊
是的
酿酒酵母获得性免疫缺陷综合征患者的肺炎
临床杂志。微生物。
1989
,卷。 
27
(第
1689
-
1691
)
4
世界环境学会
W公司
麦库斯克
金华
海曼
RW公司
基因组测序和比较分析酿酒酵母菌株YJM789
程序。美国国家科学院。科学。美国
2007
,卷。 
104
(第
12825
-
12830
)
5
Z轴
大卫
L(左)
佩特罗夫
D类
实验室菌株的进化速率提高酿酒酵母
程序。美国国家科学院。科学。美国
2005
,卷。 
102
(第
1092
-
1097
)
6
罗纳德
J型
H(H)
布雷姆
R(右)
实验室和野生酵母的全基因组进化率
遗传学
2006
,卷。 
174
(第
541
-
544
)
7
多尼格尔
软件
基姆
HS公司
斯温
D类
酵母中性和有害多态性目录
公共科学图书馆-遗传学。
2008
,卷。 
4
第页。 
e1000183号
 
8
斯奈戈夫斯基
PD公司
东布罗夫斯基
PG公司
芬格曼
E类
酿酒酵母反常酵母菌共存于北美的天然林地中,显示出与欧洲同类不同程度的生殖隔离
FEMS酵母研究。
2002
,卷。 
1
(第
299
-
306
)
9
费伊
JC公司
麦卡洛
HL公司
斯奈戈夫斯基
PD公司
基因表达的群体遗传变异与酿酒酵母
基因组生物学。
2004
,卷。 
5
第页。 
26兰特
 
10
博内曼
应收账
福根
AH(AH)
比勒陀利亚
比较基因组分析酵母菌属葡萄酒菌株
FEMS酵母研究。
2008
,卷。 
8
(第
1185
-
1195
)
11
佩雷斯-奥尔廷
JE公司
Querol公司
A类
普格
S公司
酵母菌株适应性进化中染色体重排的分子特征
基因组研究。
2002
,卷。 
12
(第
1533
-
1539
)
12
阿圭索
JL公司
Carrozzole公司
MF公司
米茨科夫斯基
PA公司
a的基因组结构酿酒酵母广泛应用于生物乙醇生产的菌株
基因组研究。
2009
,卷。 
19
(第
2258
-
2270
)
13
诺沃
M(M)
比热
F类
贝恩
E类
葡萄酒酵母基因组序列揭示的真核-真核基因转移事件酿酒酵母EC1118标准
程序。美国国家科学院。科学。美国
2009
,卷。 
106
(第
16333
-
16338
)
14
道尔
研发
赖安
O(运行)
詹森
A类
基因型到表型:一个复杂的问题
科学类
2010
,卷。 
328
第页。 
469
 
15
博内曼
应收账
德桑尼
文学士
财富
D类
全基因组比较揭示了新的遗传元素,这些元素表征了酿酒酵母
公共科学图书馆-遗传学。
2011
,卷。 
7
第页。 
e1001287号
 
16
内坎普
JF公司
范登·布鲁克
M(M)
Datema公司
E类
从头开始实验室菌株基因组的测序、组装和分析酿酒酵母欧洲标准化委员会。PK113-7D,现代工业生物技术的典范
微量。单元格事实。
2012
,卷。 
11
第页。 
36
 
17
阿高
T型
雅西罗
细山
A类
清酒酵母全基因组测序酿酒酵母京凯7号
DNA研究。
2011
,卷。 
18
(第
423
-
434
)
18
SL公司
JY公司
折衷推动了酵母自然种群中金属抗性降低的进化
公共科学图书馆-遗传学。
2011
,卷。 
7
第页。 
e1002034号
 
19
拉塞尔
M(M)
库尔
H(H)
拉塞尔
M(M)
这个酿酒酵母W303-K6001跨平台基因组序列:一只实验室杂种狗的祖先和生理学研究
打开Biol。
2012
,卷。 
2
第页。 
120093
 
20
温格
JW公司
施瓦茨
K(K)
夏洛克
G公司
高通量测序的本体分离子分析揭示了酿酒酵母中一个新的木糖利用基因
公共科学图书馆-遗传学。
2010
,卷。 
6
第页。 
e1000942
 
21
利布金德
D类
廷格尔
计算机断层扫描
瓦莱里奥
E类
啤酒酵母的微生物驯化及野生遗传资源的鉴定
程序。美国国家科学院。科学。美国
2011
,卷。 
108
(第
14539
-
14544
)
22
阮(Nguyen)
高压
勒格拉
JL公司
纽维基利斯
C类
基于马赛克基因组破译导致啤酒血统的杂交历史海湾酿酒酵母菌株NBRC1948和CBS380T型
公共科学图书馆一号
2011
,卷。 
6
第页。 
e25821号
 
23
婆罗洲人
应收账
德桑尼
文学士
财富
D类
葡萄酒酵母VIN7的基因组序列显示了一个异源三倍体杂交基因组酿酒酵母库氏酿酒酵母起源
FEMS酵母研究。
2012
,卷。 
12
(第
88
-
96
)
24
欧尼
C类
拉乌尔
P(P)
阿拉斯
A类
一群人的生态成功酿酒酵母/库德里亚夫泽维酵母北欧酿酒环境中的混血儿
申请。环境。微生物。
2012
,卷。 
78
(第
3256
-
3265
)
25
佩里斯
D类
洛佩斯
加利福尼亚州
贝洛克
C类
比较基因组学酿酒酵母x个库氏酿酒酵母从葡萄酒和啤酒中分离出的天然杂交菌株揭示了不同的起源
BMC基因组学
2012
,卷。 
13
第页。 
407
 
26
恩格尔
SR公司
巴拉克里希南语
R(右)
宾克利
G公司
酵母菌属基因组数据库提供突变表型数据
核酸研究。
2010
,卷。 
38
(第
D433号
-
D436号
)
27
宾利(Bentley)
S公司
物种泛基因组测序
国家版次。
2009
,卷。 
7
(第
258
-
259
)
28
康兰
S公司
米贾雷斯
洛杉矶
贝克尔
J型
表皮葡萄球菌泛基因组序列分析揭示皮肤共生和医院感染相关菌株的多样性
基因组生物学。
2012
,卷。 
13
第页。 
64兰特
 
29
W公司
Y(Y)
C类
全基因组分析提供了对基因组变异和进化的见解沙门氏菌甲型副伤寒
公共科学图书馆一号
2012
,卷。 
9
第页。 
第45346页
 
30
Psomopoulos鱼
FE公司
西亚尔库
不及物动词
帕帕尼古拉乌
N个
这个衣原体属重温泛基因组:结构稳定性和功能一致性
基因
2012
,卷。 
(第
291
-
319
)
31
食物
总碳氢化合物
索利蒂
P(P)
马尔默
J型
MAL基因座多基因家族的结构酵母菌属
分子遗传学。
1989
,卷。 
217
(第
60
-
69
)
32
海曼
毫克
沃尔特
P(P)
Prm1p是一种信息素调节的多跨膜蛋白,在酵母交配过程中促进质膜融合
《细胞生物学杂志》。
2000
,卷。 
151
(第
719
-
30
)
33
阿尔伯茨
B类
“小科学”的终结?
科学类
2012
,卷。 
337
  
1583

作者注释

引文详情:Engel,S.R.和Cherry,J.M.酵母基因组学的新现代:群体测序和多重基因的结果注释酿酒酵母酵母菌属基因组数据库。数据库(2013)卷2013:文章ID bat012;doi:10.1093/database/bat012

这是一篇根据知识共享署名非商业许可条款发布的开放存取文章(http://creativecommons.org/licenses/by-nc/3.0/)它允许在任何媒体上无限制地进行非商业性使用、分发和复制,前提是正确引用了原始作品。