
在科学史的大部分时间里,生物学是一门发现与分析的科学,致力于对复杂的生命机器进行艰苦的逆向工程。经过数十年对DNA的解码和对分子通路的描绘,我们对生命的组成部分获得了前所未有的理解。然而,这些知识也开辟了一个新的知识前沿,并带来了一个引人注目的知识鸿沟:如果我们理解了这些部件,我们能学会用它们来构建吗?这个问题标志着合成生物学的诞生。这门学科通过工程学的视角重塑了生命世界,不再仅仅将生物体视为待研究的对象,而是看作可以设计和构建的系统。
本文追溯了这一强大思想的概念演进和实际应用。第一章 “原理与机制” 将探讨允许科学家们用生物学进行构建的核心工程概念——如抽象化、标准化和模块化。它将深入研究生命固有复杂性所带来的挑战,以及从反馈回路到定向进化等用于创造鲁棒且复杂生物系统的巧妙设计策略。随后的章节 “应用与跨学科联系” 将展示这些原理如何被用于解决现实世界的问题,创造革命性的疗法、可持续的产业,甚至为解答“活着意味着什么”这一最根本的问题提供新工具。
几个世纪以来,生物学家扮演着博物学家兼探险家的角色,是最高级别的逆向工程师。面对一个活细胞惊人的复杂性、一个生机勃勃的生态系统,或我们体内蛋白质的精妙互动,其任务都是分析。要理解一块手表,你会把它一件件拆开,弄清楚每个弹簧和齿轮如何为整体功能做出贡献。从这个意义上说,经典遗传学和分子生物学就是对生命这块“手表”的精湛剖析。我们发现了基因,解码了DNA,并描绘了将阳光转化为糖或将信号转化为思想的通路。但一个新问题开始浮现,这个问题与其说属于探险家,不如说属于发明家:“既然我们知道了这些部件如何工作,我们能制造自己的手表吗?”
这个从纯粹分析到主动合成的概念转向,是合成生物学的核心。它将一个活的有机体重新定义为不仅是一个需要研究的进化奇迹,更是一个可以设计的可编程机器。这并不是说生命像机器一样简单,而是说我们可以开始将工程原理应用于它。
为了感受这一转变的分量,让我们回顾两个历史性的里程碑。在1970年代,科学家们首次完成了一项不朽的壮举:他们从一个生物体中切下一段DNA,并将其粘贴到另一个生物体中,创造了“重组DNA”。这是一项惊人的技术成就,相当于从一本法文小说中取出一句话,然后插入到一本德文小说中。但在2000年,一种不同类型的创造问世了:一个“基因拨动开关”。这不仅仅是一个移植的部件;它是一个微小的、设计好的线路,由两个相互抑制的基因构建在细菌内部。通过一次微小的化学推动,细胞可以从“开”状态翻转到“关”状态,并且它会记住自己的状态,就像一个电灯开关。这不仅仅是剪切和粘贴;这是用其自身的逻辑编写一种新的句子,一个活细胞内的微型计算机存储器。这个拨动开关并非在自然界中发现的;它是被设计、数学建模并构建出来以执行人类定义的功能。正是这种工程设计原理——模块化、建模和可预测行为——的应用,标志着合成生物学作为一个独特领域的真正黎明。
如果你想盖一栋房子,你不会从思考木材和钉子的原子结构开始。你会从墙壁、地板和窗户的层面思考。你在一个更高的抽象层次上工作。电气工程师也是如此;他们用晶体管、电阻器和电容器进行设计,而不是用原始的硅和铜。合成生物学旨在为生命世界创建类似的抽象层级。
最底层是元件 (Parts):基本的DNA片段,比如一个启动子(基因的“开”关)或一个终止子(“停止”标志)。然后你可以将这些元件组合成装置 (Devices)。例如,一个启动子、一个荧光蛋白基因和一个终止子共同构成一个使细胞发光的装置。将多个装置串联起来,你就得到了一个系统 (System)——也许是一个将糖转化为生物燃料的复杂代谢途径,或者是一个能检测疾病标志物并释放药物的传感器。
要使这成为可能,你需要标准化。你需要行为(大部分)可预测、经过充分表征的元件,并带有允许它们相互连接的标准“插头”。这一愿景催生了像标准生物元件库 (Registry of Standard Biological Parts) 这样的项目,这是一个不断增长的、包含数千个生物“乐高积木”的库,供设计者使用。这种工程方法,在技术飞速发展的推动下,已经改变了该领域。十年前,将一个包含15个基因的通路拼接在一起是一项艰苦卓绝、耗时多年的分子“缝合”工作。今天,科学家可以在计算机上设计整个15,000个碱基对的序列,将文件通过电子邮件发送给一家合成公司,几周后就能收到一管包含该精确定制DNA链的样品。生物学家已经从一个分子管道工提升为一名基因建筑师。
然而,在这里,我们整洁的工程类比开始出现裂痕。如果你从一个电路板上取下一个电阻器,然后插到另一个电路板上,它的电阻值将保持不变。这是一个真正标准的部件。然而,生物元件却没有这么听话。它们的功能与其环境深度纠缠在一起,这种现象被称为背景依赖性 (context dependence)。
想象一个实验室设计了一个启动子“P-alpha”,并在他们信赖的E. coli实验菌株中仔细测量了它的活性。他们发现它以0.85 PoPS(一个测量每秒聚合酶数 (Polymerases Per Second) 的单位,本质上是启动子的“强度”)的速率驱动基因表达。他们将这些信息——DNA序列和测得的活性——发送给一位同事,这位同事想在另一种细菌Pseudomonas putida中使用它来帮助清理工业废物。这位同事合成了完全相同的DNA序列并将其放入他们的细菌中。它的活性会是0.85 PoPS吗?几乎肯定不会。
问题在于启动子的DNA序列不是一个独立的指令;它是一个必须由宿主细胞自身的机器读取的指令。P. putida用于读取DNA的蛋白质机器与E. coli的不同。染色体的形状、存在的其他蛋白质、细胞内的化学环境——所有这些都构成了一个独特的背景,影响着该启动子的工作方式。0.85 PoPS这个值并不是DNA本身的属性,而是DNA与E. coli细胞相互作用所产生的涌现属性。这种背景依赖性是合成生物学的重大挑战之一。它提醒我们,我们不是在处理干净、隔离的组件,而是在处理十亿年混乱、相互关联的进化产物。
工程师如何用不可靠的部件构建可靠的系统?答案是设计更智能的系统。与其只使用简单的、开环的“永远开启”线路,你可以加入反馈,使系统能够自我调节。这标志着合成生物学的一个关键演进,从“以元件为中心”转向“以系统为中心”。
让我们想象一下,你希望一个细胞稳定地产生一定量的蛋白质。简单的方法(模型A)是使用一个永远开启的启动子,不断地生产蛋白质。稳态时的蛋白质含量为,其中是生产速率,是蛋白质被降解或稀释的速率。但细胞是一个充满噪音的地方!降解速率可能会波动,导致我们的蛋白质的水平上下起伏,这可能对我们的应用不利。这个系统是脆弱的。
现在考虑一个更优雅的设计(模型 B)。如果蛋白质能够关闭它自己的生产呢?这被称为负反馈回路。当的浓度过高时,它会结合到自己的启动子上,减慢生产速度。当的水平下降时,启动子又会变得活跃。由方程描述的系统具有内在的自我校正能力。如果突然增加(意味着蛋白质被清除得更快),的水平会开始下降。的下降会解除对启动子的抑制,从而加速生产以进行补偿。数学分析表明,这种反馈系统更加鲁棒——也就是说,它的输出对等参数的波动不那么敏感。这是一个美妙的原则:与其试图消除细胞的“噪音”,不如设计一个对噪音具有鲁棒性的系统。
理性设计的梦想是从零开始预测性地构建生物系统。但当我们的知识碰壁时会发生什么?假设我们的生物燃料通路需要一种特定的酶,但我们能找到的最好的酶既迟缓又低效。我们对蛋白质折叠和催化的理解可能不足以让我们理性地重新设计它以获得更高性能。我们该放弃吗?
绝不。一个务实的工程师会使用工具箱里的所有工具。这就是定向进化 (directed evolution) 发挥作用的地方。与其试图超越自然,我们可以利用它自己最伟大的发明:自然选择。我们可以取出我们迟缓酶的基因,使用方法创造出数百万或数十亿个它的随机突变版本,然后将它们付诸考验。我们设计一个巧妙的筛选或选择方法,只有含有更高效酶的细胞才能存活或茁壮成长。这是一种暴力搜索,但却非常强大。这揭示了一种美妙的协同作用:我们使用理性设计来构建我们系统的整体架构,然后利用定向进化的半随机力量来优化我们不完全理解的组件。
但合成生物学现在正将这一思想提升到一个更深刻的层次:为可进化性而设计 (design for evolvability)。想象一下,你想改造一种细菌来分解一种新的有毒污染物。与其自己设计完美的酶,甚至在试管中进行定向进化,你可以将这个生物体改造成为一个“发现引擎”。你可以理性地设计并构建一个细胞内部的复杂系统,该系统能做两件事:首先,它仅对候选酶的基因进行超突变;其次,它将生存与成功分解污染物联系起来。然后,你会将这个工程化的生物体置于一个以该污染物为唯一食物来源的环境中。你并没有设计出最终的解决方案,但你精确地设计了找到解决方案的过程。你构建了一台进化机器。这并非对工程学的退却;这或许是其最复杂的应用,即被理性设计的对象是进化过程本身。
虽然合成生物学的很大一部分专注于新药和绿色燃料等实际应用,但它的雄心触及了我们能提出的一些最深刻的问题。生命的基本原则是什么?一个系统被认为是“活的”所需的绝对最简组件集是什么?
为了回答这个问题,人们正在采取两种宏大策略。第一种是“自上而下”的方法,旨在创造一个最小细胞 (minimal cell)。科学家从一个简单的、现存的细菌开始,系统地逐一移除其基因,看看在舒适的实验室环境中哪些基因是生命真正必需的。其目标是将该生物体剥离至其最基本的底盘,揭示一个生命实体的核心指令集。
第二种策略是“自下而上”的方法,更接近人工生命 (Artificial Life) 领域。在这里,目标是从零开始,使用非生命的化学成分构建一个原细胞 (protocell)。研究人员可能会混合脂质形成一个简单的膜囊泡,然后尝试让像RNA这样的自复制分子在内部工作,或许再与一个能获取能量的简单新陈代谢相结合。这些创造物可能表现出我们与生命相关联的某些但不是全部属性(如新陈代谢和繁殖,但可能没有进化或稳态),从而模糊了生命与非生命之间的界限。
这两个追求,即从零开始构建生命和将其提炼至本质,代表了合成生物学家旅程的最终实现。它始于一个简单而大胆的想法——将生命视为可以构建的东西。它经历了创造一种元件语言的实践过程和应对复杂世界的挑战。最终,它将自己的工具转回到那个最根本的问题上,利用构建的行为不仅是为了创造新事物,更是为了最终理解创造了我们的那个东西。
在我们迄今的旅程中,我们已经探讨了驱动合成生物学的原理与机制——从仅仅阅读生命密码到主动编写生命密码的智识转变。但是,用脱氧核糖核酸(DNA)的语言来编写意味着什么?我们谱写这些新的生物学句子的目的何在?这个领域真正的美和力量并不在于其设计原则抽象的优雅,而在于它们在人类活动的整个光谱中令人惊叹的应用,从治愈我们的身体到质疑生命的定义本身。在这里,蓝图与现实世界相遇,合成生物学也在此展现其作为各学科伟大统一者的特质。
你看,科学史与其从业者所能使用的工具有着深刻的联系。在很长一段时间里,生物学是一门观察的科学。20世纪末高通量“组学”技术的发明,就像一下子得到了一座图书馆,里面藏着所有写过的书。我们可以阅读完整的基因组,清点每一个信使核糖核酸(mRNA)转录本,并对数千种蛋白质进行编目。这导致了一种“自上而下”的方法:我们审视海量的、相关性的数据集,并试图从观察到的模式中推断出故事——即底层的网络。这有点像试图通过分析词频来理解小说的情节。但是,如果在我们拥有阅读整个图书馆的工具之前很久,我们就得到了一支可以重写任何书中任何单词的魔法笔呢?这个反事实的情景帮助我们理解合成生物学所代表的哲学转变。如果强大的基因编辑工具先出现,我们的方法将会是“自下而上”且不懈追求因果关系的。我们会通过系统地一次改变一个“词”(一个基因)并观察“故事”(表型)的具体变化来理解系统。这就是合成生物学核心的工程思维:通过构建来理解,通过扰动来学习。
这种工程方法需要工程师的工具包。设计一个新的基因线路不是在餐巾纸上画草图就能完成的。这是一个复杂的过程,很像设计一架现代飞机或微芯片。研究人员现在坐在电脑前,使用专门的计算机辅助设计(CAD)软件来管理、编辑和注释大段的遗传密码。他们可以设计和组装整个合成染色体,删除不稳定的元件,为未来的实验插入数千个定制设计的遗传“着陆垫”,甚至嵌入独特的DNA“水印”来签署他们的作品。这个数字蓝图随后被发送到DNA合成设施,逐个分子地进行制造。这正是像合成酵母基因组计划(Sc2.0)这样宏大项目背后的工作流程,该项目旨在从零开始构建第一个合成的真核生物基因组。除了设计,我们还必须精炼我们的生物元件。我们可以利用“定向进化”等方法,在巧妙的微流控装置中进行,这些装置就像一种分子健身房。通过让蛋白质变体暴露在快速振荡的条件下——例如,快速开关一个配体——我们可以特异性地筛选出具有所需动力学行为的蛋白质,比如一个开启快但关闭非常非常慢的开关,这种特性被称为滞后性。
有了这些强大的设计和进化工具,第一个也是最个人化的前沿是人类健康。合成生物学最受赞誉的成功或许是在癌症治疗领域。在CAR-T细胞疗法中,我们学会了编程患者自身的免疫细胞。我们取出他们的T细胞(就像身体的警察部队),并为它们装备上一个合成的“嵌合抗原受体”(CAR)。这是一个模块化工程的杰作:它将一个设计用来识别癌细胞表面特定分子的外部传感器域,与告诉T细胞“攻击”的内部信号域结合起来。这些经过重新设计的细胞,现在本质上是“活体药物”,被输回患者体内,在那里它们会追捕并摧毁癌症。这不仅仅是添加一个基因;这是在一个活细胞中安装一个新的、可编程的感知-摧毁功能。
愿景甚至超越了对我们自身细胞的重新编程。想象一下吞下一颗“智能疗法”——一种经过改造的无害细菌,它生活在你的肠道中,充当一个微型的现场医生。科学家们已经设计出了这样的东西:一种配备了合成基因线路的益生菌。线路中的一个传感器模块检测到一种特定的分子,该分子是肠道炎症的信号。当传感器被触发时,它会激活一个执行器模块,该模块在问题源头处生产并分泌一种抗炎药物。这是一个完美的、自我调节的系统,只在需要的时间和地点提供药物,这与用药物淹没整个身体形成鲜明对比。展望更远的未来,合成生物学正在与发育生物学融合,以应对再生的巨大挑战。为什么蝾螈可以重新长出一条腿,而我们不能?秘密在于重新激活长期休眠的胚胎发育遗传程序。“合成再生”的宏伟目标是学习这些程序的语言——信号的精确序列、必要的基因激活、正确的力学环境——以诱导成熟组织进入再生状态。通过提供一个定时序列的输入——一个初始的伤口信号以产生有能力的细胞,随后是生长因子和模式形成素——我们或许有一天能触发新的、功能性组织的生长,这个目标将两栖动物肢体的生物学和植物叶片的全能性联系在一起。
当然,编程生命的应用不仅限于医学。合成生物学有望通过将细胞视为微观的、自我复制的工厂来彻底改变工业和农业。一个常见的挑战是,我们想要使用的生物体通常无法在我们要求的工业条件下生存。例如,许多擅长生产生物燃料的微生物也是专性厌氧菌——氧气对它们是致命的。利用合成生物学,我们可以理性地设计一个解决方案。通过计算细胞内有毒氧自由基的形成速率,我们可以确定保护细胞并使其在低氧生物反应器中存活所需的工程化“解毒”酶(如超氧化物歧化酶)的精确表达水平。我们本质上是在为这个生物体配备一个定制设计的防毒面具,以在恶劣环境中生存。
工程设计可以更加微妙和深刻,从数十亿年的进化中汲取教训。考虑一下将一个复杂的多基因代谢途径放入植物中以生产一种有价值化合物的挑战。在植物的细胞核中,基因表达的规则是真核式的:一个基因,一个蛋白质。表达四种蛋白质通常需要四个独立的基因,这效率低下。但植物有一个秘密:它们的叶绿体,这些细胞内微小的绿色太阳能板,是十亿多年前进入真核细胞内定居的古老细菌。它们仍然记得自己的根源。它们的遗传操作系统是原核式的,它们天然地以“操纵子”的形式表达成组的基因——即一个编码多种蛋白质的长mRNA。合成生物学家可以利用这段进化史。通过将我们的四基因途径作为一个合成操纵子放入叶绿体基因组,我们正在使用一个已经为这项确切任务预先布线的系统。这是一个惊人的例子,说明了理解生命的深层历史如何为现代工程提供蓝图。
或许合成生物学最令人称奇的应用不是制造产品,而是构建知识。它提供了一个革命性的工具来检验关于世界的基本假说。例如,进化生物学家在争论遗传网络的结构如何影响一个物种的进化能力,即其“可进化性”。是拥有一个控制许多途径的“混杂”主调节因子更好,还是拥有许多各自只控制一个途径的“专一”调节因子更好?有了合成生物学,我们不必猜测。我们可以构建这两种系统。我们可以创造两种细菌菌株,一种具有模块化的、混杂的架构,另一种具有专一的架构,然后让它们在一个在不同食物来源之间波动的环境中相互竞争。通过观察哪种设计策略在哪种条件下茁壮成长,我们可以实验性地检验关于进化设计中权衡取舍的深刻问题。
最后,合成生物学使我们能够探究最根本的问题:“生命是什么?”地球上所有的生命都使用一个由四个字母组成的遗传字母表:A、T、C和G。但这是唯一可能的字母表吗?通过设计可以并入DNA的新的、人工的碱基对,科学家们创造了半合成细菌,其遗传密码由六个字母写成。要做到这一点,他们不仅必须合成新的字母,还必须对细胞机器——DNA聚合酶——进行工程改造,使其能够读写这些字母。这一成就是工程范式的深刻展示。它超越了重新排列自然的部件,开始从第一性原理创造新的部件,为具有全新能力的生命形式打开了大门,并迫使我们重新思考我们所知的生物学是否是唯一可能的生物学。
从编程一个细胞来治愈癌症,到构建一个生物体来检验进化理论;从设计一个以细菌逻辑运行的植物,到构建一个带有六字母字母表的细菌——这些线索都是相互关联的。它们都是同一个核心思想的表达,这个思想被Richard Feynman的黑板上那句名言所概括:“我无法创造之物,亦无法理解之。”合成生物学是一种大胆且最终是谦逊的尝试,旨在通过学习构建生命来真正理解生命。