B 早在20世纪70年代,有一天早上,你可能打开一盒麦片,从里面掉出来一张纸片。 这是一个密码轮,允许未成年密码学家从事他们的行业。 轮子有两个大小不等的圆盘,在中心相连,这样你就可以在共同的轴上转动它们。 字母环绕着外轮,内轮上有一个箭头标记。 如果您将箭头与字母对齐,则内轮中的窗口会显示不同的字母。 你可以用这些编码字母写一条信息,对外人(最重要的是对你的父母)来说,这些信息看起来就像是胡言乱语。 要理解这条信息,唯一的方法就是用另一个密码轮从另一个提供的礼盒中破译出来,当然,这是同一个品牌的礼盒。
每当我翻阅一本生物教科书,看到以下内容时,脑海中总会浮现出代码轮的图像:
它是一种代码轮。 但它不是用来加密信息的,比如, 在后院和我见面 微型宇航员 它是一个存在于我们自己体内的密码轮,存在于我们30万亿个细胞中的每一个细胞中 ,使他们能够将储存在我们DNA中的食谱转化为我们的材料。 你可以在地球上的每一个物种中发现同样的密码轮,其形式几乎完全相同。 当你认真对待它时,它就是生活的准则。
这种遗传密码不同于生物体的特定基因序列——这是一个更为熟悉的概念。 以大猩猩的基因组为例。 它存储在猿的DNA中,由一系列称为碱的化学单位组成,每一个都像书中的一个字母。 以大猩猩为例,这本书有30.4亿个字母长,包含21000个基因。
将大猩猩的基因翻译成相应的蛋白质 大猩猩体内的细胞构建并完成了几乎所有的事情,它们的细胞使用一套规则:遗传密码。 基因序列是一本书,但如果没有密码,它就像没有罗塞塔石碑的象形文字一样毫无意义。
科学家在20世纪60年代破解了遗传密码。 这是现代生物学的伟大成就之一,与DNA双螺旋结构的发现不相上下。 它使科学家能够用新基因改造生物体,为我们的生物技术时代开辟了道路。
五十年后,基因密码仍然迷住了科学家。 他们继续争论它是如何演变的,为什么没有很多不同的代码。 随着科学家们对遗传密码的历史有了更好的了解,他们正在为其创造未来。他们正在重新编码细胞,以构建自然界中从未见过的新型蛋白质,这可能是新型药物的基础。
例如,这项研究超越了我们在新闻阅读基因中经常看到的生物技术的进步,也超越了对它们编码的蛋白质进行微调。 它改变了DNA的生物学意义。 通过重新编码生命,科学家最终可能会设计出与过去40亿年地球上存在的任何生物根本不同的新型生物——一种在实验室中创造的外星生命。
神秘的混乱
1953年,当弗朗西斯·克里克和詹姆斯·沃森发表DNA结构时,他们一下子解决了许多关于生命的谜团。 前几代科学家对可能导致遗传的化学物质感到困惑。 DNA提供了一个非常简单的答案。 它由两根主干组成,沿着主干排列着一系列底座。 DNA只需要四个碱基(缩写为A、C、G和T)就可以产生所有生命的多样性。 一个碱基组合给你一只大猩猩。 另一个是向日葵。
但尽管取得了这一胜利,克里克和沃森仍然不知道细胞如何利用其DNA构建蛋白质。 使这个谜团特别令人困惑的是,蛋白质是基于与基因不同的化学物质。 虽然DNA是由碱基组成的,但蛋白质是由20种不同的称为氨基酸的类乐高化合物组成的,这些氨基酸结合在一起形成长而灵活的链。
当这位俄罗斯出生的科学家乔治·加莫(George Gamow)读到沃森(Watson)和克里克(Crick)的论文时,他立即意识到这是一个密码学问题。 DNA包含由四个字母组成的信息。 蛋白质也是序列,但它们是由20个字母组成的不同字母组成的。 不知怎的,这个四位数的系统可以存储制造我们体内所有蛋白质的信息——从肌肉到神经递质再到消化酶。 Gamow后来写道:“因此,关于四位数如何翻译成这样的‘单词’的问题出现了。”。
为了回答这个问题,Gamow像十年前英国密码学家破解纳粹德国的恩尼格玛密码机时一样接近这个问题。 加莫没有进行生物实验,而是依靠逻辑。 他提出——没有确凿的证据——蛋白质是在氨基酸落入DNA分子的孔洞中时形成的。 以下是伽莫对这一现象的描述(围绕DNA双螺旋的碱基以圆形显示。钻石是氨基酸的孔洞):
Gamow提出,在给定的碱基组合之间,只有一种类型的氨基酸可以匹配。 他计算出有20种不同的钻石,完全适合20种不同氨基酸。
加莫表示,这肯定不是巧合。
虽然加莫的回答非常简洁,但完全错了。 正确的答案最终被证明几乎是笨拙的巴洛克风格:细胞通过首先制造一种被称为信使RNA的基因的单链拷贝来制造蛋白质。一种称为核糖体的分子工厂抓住信使RNA并读取其序列,提取细胞周围的氨基酸来构建DNA指定的蛋白质。
核糖体一次读取三个碱基,以挑选出每一个新的氨基酸,而这些三联体中的每一个都被称为密码子。
这又是说明遗传密码的轮子。 它代表了遗传密码中的所有密码子,从中心开始向外移动。 例如,GUA编码缬氨酸。
关于遗传密码最令人惊讶的是,不止一个密码子可以编码相同的氨基酸。 GUA不仅编码缬氨酸; GUC、GUG和GUU也是 其他氨基酸由三个密码子编码,其他由两个密码子。 只有少数氨基酸由一个密码子编码。 这与Gamow梦寐以求的时尚、一对一的代码相去甚远。 真正的基因密码看起来像是一个惊人的混乱。
如果我有一个这样运作的礼盒密码轮,我会写信给通用食品要求退款。
一个规范所有人
为了破解遗传密码,科学家们开始研究肠道细菌 大肠杆菌 他们之所以选择这种特殊的微生物,是因为在他们之前的几代科学家都对它进行了研究,组装了一套庞大的工具来解剖它的生物化学。 一旦他们完成训练 大肠杆菌 他们开始研究其他物种。 在一个又一个案例中,科学家们发现了完全相同的古怪系统。
自从发现遗传密码以来,科学家们一直想知道我们是如何以这种普遍的、草率的安排而告终的。 一些研究人员认为,看似草率的行为实际上是粗暴的——自然选择倾向于遗传密码,因为它比早期版本更具弹性。 通过对一种氨基酸使用一个以上的密码子,一个生物体可以防御有害的突变。
当这位俄罗斯出生的科学家乔治·加莫(George Gamow)读到沃森(Watson)和克里克(Crick)的论文时,他立即意识到这是一个密码学问题。
例如,如果GUC突变为GUU,我们的细胞不会转换为不同的氨基酸,从而产生缺陷蛋白质。 无论哪种情况,它都会选择缬氨酸。 在一项研究中 ,研究人员创造了大量随机遗传密码,并测量了它们抵抗突变的能力。 真正的遗传密码在所有可能的密码中排名前0.000001%。
其他科学家不同意这种对遗传密码百分之一的字面观点,认为它可能没有什么特别之处。1968年,克里克提出,遗传密码是通过一个被他抒情地称为“冰冻事故”的过程产生的
克里克认为,最早的生命形式具有原始、松散的遗传密码。 细胞在破译密码子时会经常出错,从而获取不同的氨基酸。 因为它们的蛋白质小而简单,这些早期的生命形式可以用有缺陷的蛋白质来弥补。
随着时间的推移,微生物出现了更精确的编码。 细胞误读特定密码子的可能性降低。 他们还开始使用更多的氨基酸,从而构建更复杂、更有用的蛋白质。
克里克认为,最终,细胞变得如此复杂,修补其遗传密码变得非常危险:一次突变可能会使细胞产生数百种不同蛋白质的缺陷版本,导致灾难性的失败。 遗传密码的进化嘎然而止。
其他研究人员,如伊利诺伊大学的奈杰尔·戈登菲尔德(Nigel Goldenfeld),认为密码更像一种语言,使得不同物种可以使用相同的基因, 生物通用语 .微生物有时 从其他物种中提取基因 有时,基因被证明是一个巨大的恩惠。 例如,在我们体内,抗生物素细菌可以将其基因捐献给易受感染的物种,以抵御药物。 但是,借来的基因能够带来益处的唯一方式是,如果细胞能够解码它们。
戈登菲尔德认为,在数百万年的时间里,生命中的许多遗传密码相互吸引,使得DNA在全球范围内得以交易,直到只剩下一个密码。
代码猫和老鼠
在发现通用遗传密码几十年后,科学家发现它并不完全通用。 1992年,研究人员发现了遗传密码规则的一个例外。 这是一个例外,潜伏在我们自己的牢房里。
绝大多数人类DNA储存在细胞内的一个称为细胞核的囊中,但有一些DNA碎片潜伏在称为线粒体的小型生油结构中。线粒体就像我们细胞内的微型细胞,用自己的核糖体解码自己的基因。 (它们很可能是从自己的微型细胞开始的,事实上,它们的祖先可能是20多亿年前侵入我们细胞的自由生活细菌。)
在研究线粒体时,科学家偶然发现了一个惊人的发现:他们的密码与细胞核中的DNA密码并不完全匹配。 例如,正常情况下,UGA给核糖体发出停止制造蛋白质并释放蛋白质的命令。在人类线粒体中,UGA不再是“终止密码子”:在这里,它编码氨基酸色氨酸。
克里克提出,遗传密码是通过一个他抒情地称之为“冰冻事故”的过程产生的
自第一次发现以来,研究人员已经发现了34个替代遗传密码。 每一个病例都是祖先密码进化修改的结果。 布朗大学细胞生物学家肯·米勒, 把这些变化比作方言 “美国、加拿大和英国英语方言在拼写和词义上的差异反映了一个共同的起源。DNA通用语言也是如此。”
在几乎所有已知的替代遗传密码中,一个密码子被从标准的20个氨基酸中的一个重新分配到另一个。 但是,一些物种已经扩展了密码,以包括其他生命形式没有使用的新氨基酸。 某些微生物已经将其中一个密码子转换为一种被称为硒代半胱氨酸的氨基酸。 其他人则添加了吡咯赖氨酸。 一些物种将这两种物种都加入到他们的剧目中。
这些基因方言给生物学家们制造了一个难题。 具有替代遗传密码的物种是彼此的远亲,它们居住在生命之树的远枝上。 这意味着进化一次又一次地改变了遗传密码。
2009年,当时在宾夕法尼亚州立大学(Penn State University)工作的进化生物学家爱德华·霍姆斯(Edward Holmes)和他的同事们发现了这些物种在共同点上的其他一些东西,这可能是一种推动替代遗传密码进化的力量。 当研究人员查看所有当时已知的具有替代遗传密码的物种时,没有证据表明病毒会感染其中任何一种。
霍姆斯和他的同事提出,逃避病毒是促使某些物种改变其遗传密码的原因。 虽然病毒对宿主具有极高的致命性,但它们也依赖宿主生存。 病毒通常只由包裹在蛋白质外壳中的基因组成,没有核糖体或制造蛋白质或基因所需的其他成分。 为了复制,它们侵入细胞并诱使其读出病毒的基因。
然而,为了成功感染宿主,病毒必须使用与其宿主相同的代码。 如果它们的代码不匹配,宿主细胞将产生有缺陷的病毒蛋白,新病毒将无法生存。
美国、加拿大和英国英语方言在拼写和词义上的差异反映了一个共同的起源。DNA的通用语言也是如此
当一种致命的新病毒疫情爆发时,这些病毒很可能会消灭大多数宿主。 具有替代遗传密码的突变宿主可能更容易存活,因为病毒无法利用它们。 他们生存下来,重建了人口。 从那时起,由于它们的替代遗传密码,宿主物种对所有病毒都具有免疫力。
然而,今年早些时候,布法罗大学的科学家们 发现了第一种用另一种遗传密码感染物种的病毒 它的宿主是一种酵母,在这种酵母中,CUG从编码一种氨基酸(亮氨酸)转变为另一种(丝氨酸)。
当研究人员仔细观察病毒的DNA时,他们发现CUG密码子几乎完全缺失。 一旦酵母菌改变了它的密码,病毒似乎就改变了自己的基因信息,这样它们就不会被混淆。 通过清除CUG,病毒消除了产生错误病毒的风险。 进化出另一种遗传密码是躲避病毒的好方法,但它可能无法保证免疫力。
一些病毒可能能够迎头赶上。
生活的新主代码生成器
50年后,20世纪60年代遗传密码的发现渗透到我们的日常生活中。 一旦科学家意识到人类和 大肠杆菌 他们使用相同的密码破译基因,想知道这种微生物是否能从人类DNA中制造蛋白质。 赫伯特·博伊尔(Herbert Boyer)和他的同事发现了如何从人类细胞中剪掉胰岛素基因并将其插入细菌中。 正如他们所希望的那样,微生物开始大量分泌胰岛素。 今天,数以百万计的糖尿病患者为自己注射由细菌产生的胰岛素。
科学家们越来越善于利用遗传密码来制造有价值的分子。 他们可以让山羊在牛奶中产生蜘蛛丝。 他们可以通过调整基因来制造新的蛋白质,例如专门设计用来攻击某些病原体的抗体。 所有这些成就都是可能的,因为生活的通用语言。
然而,遗传密码也限制了生物技术的创造力。 它只编码20个氨基酸。 自然界中还有数百种其他氨基酸(甚至有些 在星际空间看到 )从未融入生活。 更重要的是,科学家可以合成种类几乎无限的非天然氨基酸。 如果科学家能够对基因编码进行重新编程,使其包含这些其他氨基酸,那么这将为如何控制生命开辟一个可能的宇宙。
事实上,大自然已经改变了遗传密码,这让研究人员有信心尝试进一步改变它。 他们在21世纪初进行了首次尝试。 在2002年的一项研究中,斯克里普斯研究所的化学家彼得·舒尔茨和他的同事们创造了对光敏感的蛋白质。
科学家们越来越善于利用遗传密码来制造有价值的分子。 他们可以让山羊在牛奶中生产蜘蛛丝。
舒尔茨和他的同事通过加入一种普通氨基酸(苯丙氨酸)和一种称为二苯甲酮的光敏化合物来实现这一壮举。 一道紫外线的闪光给二苯甲酮提供了一股能量,使它们能与附近的蛋白质结合。
接下来,他们改变了细胞中的分子,从而代替将UGA读取为终止密码子,而是编码新的二苯甲酮结合氨基酸。 舒尔茨和他的同事随后将这些基因添加到 大肠杆菌 他们让细菌制造蛋白质,然后收获蛋白质。 当研究人员用紫外线照射蛋白质时,由于二苯甲酮形成的键,其中一些蛋白质结合在一起。 这种细菌产生了以前从未有过的分子。
舒尔茨继续在这些实验的基础上帮助创立了一家名为Ambryx的公司,2012年,他们 签订了3.03亿美元的协议 与制药巨头默克(Merck)合作,探索通过改变基因密码制造药物的新方法。
在一个典型的项目中,他们正试图开发抗癌分子,这种分子就像导弹一样可以对抗肿瘤。 研究人员希望改进现有的一类由蛋白质制成的药物,即单克隆抗体。 这些抗体可以被设计成只攻击已经癌变的细胞。 标准单克隆抗体粘附在癌细胞上,使其对免疫细胞更加明显,然后免疫细胞可以杀死它们。
Ambryx的研究人员正在研究如何使这些抗体自己完成这项肮脏的工作。他们正在制造携带毒素的非天然氨基酸,以及可以将这些携带毒素的氨基酸构建到抗体中的工程微生物。 他们希望,一旦这些非天然抗体附着到癌细胞上,它们的毒素就会立即杀死癌细胞。
就目前而言,扩展遗传密码只是一项有前途的技术,而不是一种拯救。 默克没有装满 大肠杆菌 大量生产抗癌药物。 没有人知道细菌如何有效地制造这些非天然蛋白质。
对基因密码进行更彻底的改变可能最终会取得更大的成功。 耶鲁大学的生物化学家Farren Isaacs和他的同事正在进行一个如此雄心勃勃的项目。 他们想改变几十个密码子,而不是一个新密码子。 如果他们成功了,他们可能会创造出能够构建全新蛋白质的有机体。 他们重新编码的微生物将不同于今天活着的任何生物,也可能不同于地球上曾经存在的任何生物。
艾萨克斯想利用遗传密码的巨大冗余。 他不想使用四种不同的氨基酸精氨酸密码子,而是想重写生物体的DNA,使其只使用一种。 这一修订将释放出三个密码子,他可以利用这些密码子来编码非天然氨基酸。 标准遗传密码中有44个冗余密码子,这一策略可能会带来巨大的新的生物学可能性。
在本月早些时候发表的一项研究中 科学类 ,Isaacs和他的同事在这条道路上迈出了第一步。 他们使用新的基因编辑工具搜索 大肠杆菌 包含UAG序列的终止密码子基因组:结果有314个。 Isaacs和他的同事用序列UAA(另一个终止密码子)手术替换了314个UAG。 这种细菌在没有多余版本的情况下表现得非常好。
这项实验标志着研究人员首次改变了生物体整个基因组中的密码子。 现在,UAG可以自由编码一种新的氨基酸,使科学家能够将TAG密码子添加到许多不同的基因中。 如果这种方法有效,他们也可以对其他冗余密码子进行同样的处理。
以这种方式改写遗传密码可能会让科学家做的不仅仅是创造新型分子。 如今,生物技术操作受到病毒的困扰,病毒杀死了科学家用来生产新分子的微生物。 Isaacs重新编码的微生物可能对病毒具有免疫力,病毒不再劫持它们的核糖体。
一种新的遗传密码也可能消除工程微生物逃离实验室造成破坏的风险。 科学家可能能够设计微生物,使其依靠非天然氨基酸生存。 如果他们逃离实验室,他们将只能找到天然氨基酸并死亡。 换言之,这些改变了的物种将成为我们代码的奴隶,从根本上脱离了地球上其他生物使用的自然代码。
今天关于转基因食品的争论,是因为我们突然开始以危险的方式篡改DNA。 事实上,自从我们开始驯化农作物和牲畜以来,数千年来我们一直在修补DNA。 多汁玉米棒子的基因与其硬脂酸前身的基因截然不同。 近几十年来,生物技术使我们能够以更高的技能将基因从一个物种转移到另一个物种,科学家甚至开始编辑DNA的单个碱基以微调基因。
但是,尽管带有人类胰岛素基因的微生物看起来很奇怪,但它仍然使用了数十亿年来生命赖以生存的古老密码。 我们现在可能正处于一个全新的时代的边缘,在这个时代,我们控制着生命的密码,而不是自然进化。
Carl Zimmer是 《纽约时报》 和12本书的作者,包括 病毒星球 .
获取Nautilus时事通讯
前沿科学,由最聪明的思想家揭示。