
生命的语言由20个字母——构成所有蛋白质基础的经典氨基酸——书写而成。这些蛋白质在细胞内执行几乎所有功能,但它们的化学词汇本质上受限于这套天然的构建模块。如果我们能扩展这个字母表,引入具有独特属性的新字母,从而创造出自然界从未构想过的、具有新功能的蛋白质,那会怎样?这个问题标志着合成生物学的一个关键前沿,致力于解决如何以编程方式增强生命基本操作系统。本文将探讨非经典氨基酸掺入这一突破性技术。第一章“原理与机制”将揭示重写翻译规则所需的精巧分子工程,解释正交性概念以及教会细胞新技能所需的工具。随后,“应用与跨学科联系”将展示这一扩展遗传密码的变革性影响,展示其在阐明细胞过程、构建更安全的转基因生物乃至理解生命起源等各方面的强大威力。
想象一下生命的语言。数十亿年来,它一直使用一个由区区20个字母——即经典氨基酸——组成的简洁字母表,书写着每一个生物的故事。这20个构建模块由核糖体遵循遗传蓝图的指令串联起来,创造出浩瀚而奇妙的蛋白质世界。蛋白质是细胞的机器、结构和信使。但如果这个字母表不是一条固定不变的自然法则呢?如果我们能添加具有新化学特性的新字母,并以此教会蛋白质做它们以前从未能做到的事情呢?这不仅仅是异想天开,而是科学领域最激动人心的前沿之一。但要添加一个新字母,我们首先必须理解支配原始语言的那些深刻而精妙的规则。
首先,我们必须精确定义我们所说的内容。当我们谈论标准20种氨基酸之外的氨基酸时,我们进入了一个存在一些微妙但重要区别的领域。你可能听说过胶原蛋白,你体内最丰富的蛋白质,其中含有高比例的一种名为4-羟脯氨酸的氨基酸。它不是“著名20种”之一,但它也不是一个经基因编码的新字母。相反,它是一种翻译后修饰 (PTM)。核糖体首先忠实地插入一个标准的脯氨酸,在蛋白质链合成之后,另一个酶会前来,将该脯氨酸化学转化为羟脯氨酸。这就像一位编辑在已经打好的字母上添加一个重音符号。
然而,自然界更进一步。在某些生物中,存在着一种真正的“第21种氨基酸”,名为硒代半胱氨酸。它在翻译过程中,响应一个特定的密码子被直接掺入蛋白质中。在结构上,硒代半胱氨酸是标准氨基酸半胱氨酸的类似物;它们几乎完全相同,只是半胱氨酸的硫原子被一个硒原子所取代。这不是翻译后修饰,而是一条程序化指令。遗传密码本身,在特殊情况下,会调用这第21个字母。
正是后一类真正激发了合成生物学家的兴趣:在翻译过程中直接以编程方式插入非经典氨基酸 (ncAA) 的能力。这意味着我们不只是在蛋白质建成后对其进行修饰,而是在根本上扩展了核糖体能够读取的遗传字母表。
那么,如何实现这样的壮举呢?细胞的翻译系统是效率和保真度的奇迹,经过亿万年的完善。它看起来像一个封闭系统。试图将一个新部件塞入这个错综复杂的机器听起来像是灾难的配方。但这种方法的美妙之处不在于重建整个机器,而在于巧妙地为其提供一些新的、定制的部件。
翻译的核心逻辑依赖于三个组成部分:一个mRNA密码子(遗传指令中的三字母“词”),一个转移RNA(tRNA)(读取这个词的“运货卡车”),以及一个氨酰-tRNA合成酶(aaRS)(将正确的氨基酸“包裹”装载到运货卡车上的“装货工”)。核糖体是这一切发生的工厂车间,但它很大程度上相信tRNA运货卡车是正确装载的。
为了掺入我们的新ncAA,我们需要创建一个新的、平行的系统,该系统不干扰细胞现有的操作。这需要三个关键的工程改造组件:
一个空闲密码子: 我们需要在mRNA中找到一个三字母词来重新利用。最方便的候选者是“终止”密码子,如UAG(也称为琥珀密码子)。在大多数情况下,UAG密码子告诉核糖体“故事到此结束;释放蛋白质”。为了我们的目的,我们可以把它看作是遗传密码中的一个空闲地址,一块我们可以建造新东西的地皮。我们可以编辑我们目标蛋白的基因,将UAG密码子精确地放置在我们希望ncAA进入的位置。
一个工程改造的tRNA: 我们需要一辆能识别这个空闲地址的新运货卡车。我们可以设计一个新的tRNA分子,其反密码子环的序列为5'-CUA-3'。这个反密码子与mRNA上的5'-UAG-3'密码子在化学上互补,使其能够结合到核糖体上的那个特定位置。这种特殊的tRNA通常被称为抑制tRNA。
一个工程改造的aaRS: 这是最关键的部分。我们需要一个全新的、高度特异的装货工。这个工程改造的酶必须完美地完成一项工作:它必须将我们期望的ncAA,且仅将我们的ncAA,连接到我们工程改造的抑制tRNA上,且仅连接到我们工程改造的tRNA上。
这一三元组——一个重利用的密码子、一个抑制tRNA和一个专用的合成酶——构成了遗传密码扩展的核心。
为了让这个新系统起作用,它绝不能与细胞的天然机器发生“串扰”。这个关键属性被称为正交性。把细胞的正常翻译系统想象成一个庞大而繁忙的公共电话网络,有20个对话(每个经典氨基酸一个)同时进行。我们工程改造的系统必须像一个私密的、加密的通信渠道。
这种正交性必须是绝对且双向的:
为什么这如此重要?让我们想象一下,如果这种正交性被打破了。假设我们工程改造的合成酶,除了用ncAA为我们的正交tRNA充能外,还意外地开始为天然的谷氨酰胺tRNA充能。核糖体不检查氨基酸;它只检查tRNA的反密码子是否与mRNA的密码子匹配。结果是什么?每当细胞试图将谷氨酰胺残基插入其成千上万种蛋白质中的任何一种时,它都会错误地掺入我们的ncAA。这种遍及整个蛋白质组的破坏将立即产生毒性,导致蛋白质错误折叠和细胞混乱。正交性不仅仅是一个优雅的设计原则;它是宿主细胞生存的严格要求。工程改造的aaRS对其ncAA及其配对tRNA的双重特异性是整个系统的关键。
有了这些原则,让我们来过一遍创造一个带有新型设计师氨基酸的蛋白质的配方。
步骤1:喂养细胞。 我们的ncAA是一个外来分子。细胞内部的代谢工厂不知道如何合成它。因此,第一步就是从外部供应ncAA,像一种特殊营养素一样将其添加到细胞的生长培养基中。没有这种原材料,整个过程就无从谈起。
步骤2:提供蓝图和工具。 我们将新的遗传信息引入细胞,通常是通过一个称为质粒的小环状DNA。这个质粒携带我们两个关键工具的基因:正交aaRS和正交抑制tRNA。它还携带我们目标蛋白的基因,该基因已被修饰,在ncAA插入的精确位置包含一个UAG密码子。
步骤3:十字路口的核糖体。 细胞的机器转录并翻译我们的新基因,产生正交工具。现在,当核糖体开始翻译我们目标蛋白的mRNA时,它会一直移动,直到遇到UAG密码子。在这里,它面临一个选择。细胞的天然释放因子蛋白识别UAG并想要终止翻译。但我们新合成的、携带ncAA的抑制tRNA也存在,并准备好结合。
这完美地说明了系统的互联性。如果我们执行了步骤2却忘记了步骤1(向培养基中添加ncAA),会发生什么?正交tRNA会被制造出来,但它的配对aaRS将没有货物可装载。抑制tRNA将保持空载状态。在UAG的十字路口,释放因子将面临无竞争的局面,每次都会获胜。结果是:翻译终止,我们只得到一个短的、无功能的蛋白质片段。
但是当所有组件都存在时,我们携带ncAA的tRNA会胜过释放因子,结合到UAG密码子,并将其新颖的氨基酸递送到生长中的蛋白质链上。核糖体毫不知情,形成肽键并继续前行,无缝地将一种新的化学功能编织进了蛋白质的结构中。
创造这些正交对是蛋白质工程的杰作,尤其是当期望的ncAA与经典氨基酸在结构上相似时。考虑这样一个任务:以一种天然使用L-酪氨酸(Tyr)的合成酶为起点,工程改造它以使用对乙酰-L-苯丙氨酸(pAcF)。这两个分子几乎相同;一个有羟基(-OH),另一个有乙酰基()。
工程挑战是双重的。首先是正向选择:你必须修改酶的活性位点,以更好地容纳pAcF的更大体积的乙酰基。但更困难的挑战是负向选择:你必须同时重新设计活性位点,以排斥原始底物——酪氨酸。这异常困难,因为酪氨酸在细胞中天然丰富,并且是原始活性位点的近乎完美匹配。科学家们必须像分子雕塑家一样,利用定向进化等技术,煞费苦心地对合成酶进行突变,筛选出那些对新氨基酸产生精致而高度特异的“品味”,同时失去对旧氨基酸亲和力的变体。最终的产物是一位真正的分子鉴赏家。
这项技术的力量并不仅限于一个新字母。通过使用不同的、相互正交的配对来靶向不同的终止密码子——例如,一对用于UAG(琥珀)密码子,第二对完全独立的用于UAA(赭石)密码子——我们可以在同一个蛋白质中掺入两种不同的非经典氨基酸。这种模块化为创造具有多个、精确定位的化学工具的蛋白质打开了大门,就像一把分子的瑞士军刀。我们不再仅仅是向生命的字母表中添加字母;我们开始书写全新类型的句子、诗歌和故事,解锁自然界从未想象过的功能和能力。
在上一章中,我们拆解了细胞精美的分子钟表机构,并学会了如何添加我们自己的齿轮和弹簧。我们发现,遗传密码尽管具有普遍性,但并非刻在石碑上的不变法则,而是一种动态、可编程的语言。我们已经学会了如何教给老细菌新把戏,具体来说,就是如何将一个新词——比如琥珀终止密码子UAG——不读作“结束”,而读作“在此处插入这个地球上任何生物都从未使用过的新奇、奇妙的氨基酸”。这一通过设计一对专属的“正交”tRNA及其充能酶()实现的分子工程壮举,不仅仅是一个巧妙的技巧。它就像在生命的钢琴上发现了一个新的、从未弹奏过的琴键。
自然而然地,接下来的问题是,我们现在能谱写出什么样的新乐章?用一个扩展的字母表,我们能讲述什么样的新故事?答案原来是一曲交响乐,充满了新的可能性,其影响范围从单个细胞最深层的内部运作,一直延伸到外太空的最遥远角落。真正的冒险由此开始。
在我们能够建造新的生物机器之前,我们必须首先理解现有机器是如何工作的。想象一下试图在黑暗中修理一块瑞士手表。这通常是细胞生物学家试图在一个活细胞内成千上万个拥挤、翻滚的蛋白质中追踪一个特定蛋白质时的感受。我们怎么可能在这场混乱的舞蹈中追踪我们唯一的“目标蛋白”(Protein of Interest, POI)呢?
答案是给它一个独特的标记,一个细胞中其他任何东西都不具备的标记。通过将一个带有特殊“可点击”化学基团——比如一个叠氮化物,一个微小的、弹簧加载的化学钩子——的非经典氨基酸(ncAA)掺入我们的POI中,我们创造了一个专属标签。然后,我们可以引入一个带有相应“点击”伴侣——一个张力炔烃——的荧光染料分子。通过一种极其高效且生物兼容的反应,染料只点击到我们的蛋白质上,使其变成一个微小的、发光的信标()。突然之间,在细胞的黑暗中,我们的蛋白质亮了起来。我们可以实时观察它去哪里,与谁交谈,以及它做什么。我们将一次黑暗中的搜寻变成了一次有导游的旅行。
但看见只是第一步,下一步是理解。例如,酶是自然界的催化大师,以惊人的速度和精确度完成化学奇迹。这种能力通常依赖于一个由微妙的非共价相互作用——氢键、静电作用以及神秘的芳香环“堆积”——组成的精细网络。我们如何才能在不破坏整个网络的情况下,测量其中一根脆弱丝线的强度呢?
在这里,ncAAs再次提供了一种无与伦比的精细工具。假设我们想测量溶菌酶这类酶活性位点中,单个色氨酸残基与糖分子堆积所贡献的能量,这是一个经典相互作用。旧方法可能是用一个小小的丙氨酸替换掉大体积的色氨酸,但这与其说是外科手术式的解剖,不如说是用大锤砸问题。整个结构可能会变形,使得结果难以清晰地解释。
现代方法则优雅得多。我们可以用一系列氟化色氨酸类似物来替换色氨酸。在芳香环上添加氟原子几乎不改变其大小,但系统地改变了其电子特性,从而“调节”了堆积相互作用的强度。通过创建一系列这些精细调节的酶变体并测量它们的结合亲和力,或许再结合对糖配体本身的修饰,我们可以构建一个热力学循环。这使我们能够以惊人的精确度计算出那单个堆积相互作用的能量贡献,甚至它如何与附近的氢键协同作用()。我们从业余的机械师,变成了仅通过聆听发动机细微的嗡嗡声变化就能诊断问题的专家。
有时,最令人兴奋的发现并非来自我们创造了什么,而是来自我们发现了什么。研究人员可能会从某个生物体中纯化出一种蛋白质,并通过核磁共振(NMR)和质谱的侦探工作发现,其中一个残基的化学性质和结构与20种经典氨基酸中的任何一种都不匹配。数据可能显示该残基共价地锁定在蛋白质骨架中,但其侧链比预期的更长或形状不同。这是一个翻译后修饰(PTM)的典型迹象——即在蛋白质合成之后对氨基酸进行的化学改变。高分辨率质谱随后可以通过测量它为蛋白质增加的微小额外质量,来确定修饰的确切身份()。通过这种方式,对ncAAs的研究不仅关乎我们能为生物学添加什么,还关乎发现自然界已在使用的、完整的、未被书写的词汇。
科学中常有这样的情况:我们发现自然界早已捷足先登。使用非经典氨基酸作为一种生物策略是一门古老的艺术。许多植物和微生物与其捕食者、竞争者和病原体之间进行着一场持续不断的、无形的化学战争,而ncAAs是其武器库的关键部分。
例如,黎豆(Mucuna pruriens)的种子里含有一种强效的防御性化合物:非经典氨基酸L-DOPA。对于一个毫无防备的食草动物来说,L-DOPA看起来与必需的蛋白质合成氨基酸酪氨酸极其相似。当食草动物吃下这些种子时,其细胞机器被愚弄了。负责为tRNA加载酪氨酸的酶无法完美地区分它和L-DOPA。结果,这个分子特洛伊木马在动物体内任何应该出现酪氨酸的地方被错误地掺入蛋白质中。后果是灾难性的:遍及整个蛋白质组的毒害导致蛋白质错误折叠、酶功能失常,并最终导致死亡()。
微生物也采用类似的策略,但通常是为了耐久性而不是直接的毒性。许多重要的抗生素和其他生物活性分子不是蛋白质,而是“非核糖体肽”,由称为NRPSs的巨大酶装配线合成。这些肽的一个显著特征是它们经常点缀着ncAAs,包括D-氨基酸——与所有核糖体生命所使用的L-氨基酸互为镜像。为什么要多此一举?主要原因是防御。通常会咀嚼和破坏这些肽的蛋白酶,其演化得能够精确识别标准L-氨基酸的特定形状和化学键。ncAA的存在,尤其是D-异构体的存在,对其造成了阻碍。蛋白酶无法结合或切割该肽,使其半衰期大大延长,成为一种更有效、更持久的武器或信号()。
这一自然法则——依赖于不寻常的组分——启发了ncAAs在合成生物学中最重要的应用之一:生物遏制。当我们改造生物体以执行强大任务,如生产药物或分解污染物时,我们肩负着深远的责任,以确保它们在意外泄漏到野外时无法存活或造成危害。
我们可以通过构建一个“遗传防火墙”来实现这一点。想象一下,我们改造一种细菌来生产一种有用但可能有害的酶。我们可以通过两种方式修改这种细菌:首先,我们将该酶功能绝对关键的一个氨基酸密码子更改为琥珀终止密码子UAG。其次,我们给这种细菌提供正交机器,让它将UAG解读为一种合成的、非经典的氨基酸,而这种氨基酸必须由我们在其生长培养基中提供。在发酵罐的受控环境中,细菌得到其合成的“维生素”并生产出功能性酶。但如果它逃逸到环境中——土壤或水中——这种合成氨基酸就无处可寻。UAG密码子此时被解读为“终止”,该酶永远无法以其完整的、有活性的形式被制造出来,生态威胁也就被消除了()。该生物体实际上对一种只有我们能提供的物质上瘾,从而创造了一个强大而优雅的安全开关。
遗传密码的扩展不仅在实验室的“湿”世界中带来了挑战和机遇,也回响在生物信息学的“干”数字世界中。几十年来,那些支持我们寻找蛋白质间进化关系的算法,如主力军BLAST程序,都是建立在一个20个字母的字母表和计分矩阵(如BLOSUM62)之上的,这些矩阵量化了一种氨基酸在数百万年进化中替换为另一种的概率。
当你想寻找你的含有第21、22或23种氨基酸的新蛋白质的同源物时,会发生什么?标准软件根本不知道该怎么办。要进行有意义的搜索,你必须教会旧算法新技巧。这需要扩展程序的内部字母表以识别新残基,更重要的是,通过添加新的一行和一列来扩展替换矩阵。这一新列必须填入有意义的分数,这些分数代表你的新氨基酸与所有其他氨基酸的物理化学相似性。最后,整个搜索的统计框架,即告诉你一个“命中”是真正显著还是仅仅是随机巧合的框架,都必须为这个新的评分系统从头重新计算()。即使是像AlphaFold这样最先进的结构预测深度学习模型,它们是在包含20个字母蛋白质的庞大数据库上训练的,如果在一个序列中遇到像代表硒代半胱氨酸的'U'这样的未知字符,也会卡住并报错,这凸显了让我们的计算工具与实验能力同步的挑战()。
这段始于一个单一工程细菌内部的旅程,最终引向了我们能提出的最深刻的问题之一:我们在宇宙中是孤独的吗?对非经典氨基酸的研究提供了一条意想不到且强有力的线索。几十年来,科学家一直在分析在碳质球粒陨石——我们太阳系形成时遗留下的原始物质——内部发现的有机物。这些陨石是时间胶囊,里面充满了氨基酸。
令人着迷的是,它们不仅含有20种生物氨基酸中的一部分,还含有超过100种不同类型,其中绝大多数在地球上是非经典的,例如-氨基异丁酸(AIB)和异缬氨酸。我们如何知道它们是真正的地外物质,而不仅仅是降落后从地球生命渗入岩石的污染呢?证据有三方面,且无可辩驳。首先,这些氨基酸显示出奇特的同位素特征——它们在氢()、氮()和碳()的重同位素中显著富集,这是在寒冷、受辐射冲击的星际分子云环境中发生化学反应的标志,而非舒适的地球环境。其次,与地球上只使用L-氨基酸的生命不同,陨石中的氨基酸以近乎完美的比例的L型和D型混合物(外消旋混合物)存在,这是非生物、非生命化学过程的标志。第三,像AIB这类氨基酸的存在本身就排除了地球来源,它在地球生物学中没有已知作用,但在益生元化学的模拟中很容易形成。当我们分析陨石内部并发现这三个特征,然后分析其外壳和周围土壤并发现完全相反的情况——地球的同位素比率、对L-氨基酸的强烈偏好,以及只有经典的20种氨基酸——这个论证就变得无懈可击了()。
来自太空的有机物是真实存在的。它们是宇宙化学的产物。这告诉我们,生命的构建模块并非地球独有的产物,而是在宇宙中广泛存在。它提出了一个诱人的可能性:生命,无论在哪里出现,可能都不受限于我们所使用的那套20个字母的字母表。非经典氨基酸的故事,始于生物工程师的一个巧妙工具,最终成为一扇窥探我们星球历史的窗户,也是我们寻找地外生命的路标。我们已经认识到,通过为我们自己的生物字母表添加字母,我们变得更有能力去阅读宇宙那古老且或许普适的语言。