
几十年来,生物学在创建生命组成部分——基因、蛋白质和细胞的详细目录方面取得了卓越成就。然而,拥有这份“零件清单”并不等同于理解一个生命有机体如何运作、适应和进化。纯粹的还原论方法——即孤立地研究这些组分——难以解释那些仅由它们相互作用而产生的复杂现象。本文探讨了向系统生物学的历史性和思想性转变,该学科专注于通过研究部分之间的关系来理解整体。在第一部分“原理与机制”中,我们将深入探讨定义这一新视角的系列核心概念,从网络结构到深刻的涌现思想。随后,在“应用与跨学科联系”部分,我们将见证这些原理如何付诸实践,推动了工程学、医学以及我们对进化基本理解的革命。
想象一下,你拿到一个盒子,里面装着一块高端瑞士手表的每一个零件——每一个齿轮、弹簧、螺丝和宝石,所有零件都经过了细致的分类编目。你甚至拥有金属的完整化学分析报告和每个独立零件的完整蓝图。这是否意味着你理解了手表是如何报时的?当然不是。要理解这块手表,你必须理解这些零件如何连接、互动和协同运动。你需要理解这个系统。长期以来,生物学一直专注于为生命的零件创建一个精美的目录。系统生物学则代表了一次宏大的思想转变,转向理解所有这些零件如何协同工作。
让我们从一个神经科学的难题开始。一个科学家团队决定要理解一种动物是如何学习一种新的联想的。他们采用还原论的方法,专注于“零件”。他们分离出两种神经细胞,神经元A和神经元B,这两种细胞被认为对该学习过程至关重要。他们对这些细胞进行了详尽的表征:它们完整的基因表达谱,其细胞膜上离子通道的确切类型和数量,它们精确的电发放特性。他们了解了培养皿中单个神经元的一切可知信息。然而,他们完全无法解释整个回路是如何学习的。“学习”这一特性并不存在于孤立的零件中,它诞生于它们的相互作用。理解它的唯一方法是观察在一个活的、正在学习的大脑中,刺激神经元A如何影响神经元B。秘密不在于零件,而在于连接。
这个故事并非大脑所独有。思考一下分子生物学的“中心法则”,这个我们许多人在学校学到的优雅、线性的故事:DNA制造RNA,RNA制造蛋白质。一个基因就像一行代码,执行后产生一个单一的功能部件。但是,当我们仔细观察时,这幅整洁的图景便消融于一出充满活力、混乱和互动的戏剧中。一个单一的基因 并不仅仅产生一种蛋白质。它最初的RNA转录本可以通过不同的方式进行剪切和拼接(一个称为选择性剪接的过程),从而产生一整个家族相关但又不同的蛋白质。基因本身可能在某些组织中被完全关闭,这并非其DNA序列发生了改变,而是因为上面被加上了化学标记——这是一种称为表观遗传学的调控层面。此外,细胞还会产生其他分子,如非编码RNA,它们根本不制造蛋白质,但却像微小的傀儡师,抓住基因的RNA信使并将其标记以待销毁。而为了完成这个循环,由 产生的一种蛋白质可以回头影响调控它自身的那个非编码RNA的产生,从而形成一个反馈回路。
试图仅通过查看 的DNA序列来理解其功能,就像只读一个角色的台词就想理解其在戏剧中的作用一样。你错过了导演的笔记(表观遗传学)、备选结局(剪接)、与其他演员的互动(非编码RNA),以及角色自身对剧本的影响(反馈)。 的功能不是一个固定的属性;它是一个复杂的、相互连接的调控网络的动态输出。
这种从静态的零件清单到动态的关系网络的视角转变,在生物学中并非全新。事实上,在我们理解生命本身历史的方式上,也发生过一场非常相似的革命。几个世纪以来,我们遵循 Carl Linnaeus 的系统,将生物体分门别类地放入整齐、离散的盒子中:爬行纲(Class Reptilia)、鸟纲(Class Aves),等等。这是基于总体相似性和关键特征,或称组织“等级”。爬行动物有鳞片且是冷血的;鸟类有羽毛且是温血的。它们被放在各自独立、平等的盒子里。
然而,现代进化生物学使用一种称为支序分类学的系统发育方法,抛弃了这些盒子,转而构建了一棵家族树。这种方法坚持认为,分类必须反映真实的进化历史——谁是谁的后代。来自化石和遗传学的证据是压倒性的:鸟类是一类特定恐龙的直系后代。鸟类现存的最近亲属不是蜥蜴或龟,而是鳄鱼。因此,一个名为“爬行纲”(Reptilia)的正式类群,如果它包括鳄鱼但排除了鸟类,那就不是一个自然的类群。这就像画一幅包括了你的曾祖母和你祖母的堂兄,却唯独漏掉了你祖母本人的全家福。这种人为的、不完整的类群被称为并系群。对于一个现代生物学家来说,鸟是一种高度特化的、会飞的、有羽毛的爬行动物,正如人是一种高度特化的、大脑袋的、双足行走的猿类一样。
这与系统生物学的相似之处是深刻的。孤立地研究一个基因或蛋白质的还原论方法,就像创建一个并系分类一样。它从系统中切出一块,忽略了其真实的、历史的和功能上的关系,从而创造了一幅人为且不完整的图景。系统生物学家,就像支序分类学家一样,坚持认为关系才是真实的。相互作用的网络才是真正的研究对象。
当我们接受这种网络观时,我们就能开始理解所有科学中最美妙的现象之一:涌现。涌现特性是指由系统各组分的集体相互作用而产生,但不存在于组分本身的那些行为或特征。
思考一棵橡树。那棵树中的每一个细胞,从根尖到最高的叶片,都含有完全相同的遗传蓝图——相同的基因组。然而,如果你观察叶子,你会发现两种不同的类型。在阳光充足的上层树枝上是“阳生叶”,它们小而厚,富含光合作用的机制。在荫蔽的下层树枝上是“阴生叶”,它们宽而薄,旨在捕捉每一缕散射光。同样的遗传密码如何能产生两种不同的设计?
这并非由于突变或不同的基因组。这是树木潜在的基因调控网络响应其局部环境而产生的一种涌现特性。每个发育中的叶细胞内的网络会“倾听”它接收到的信号——光的强度和质量。这种与环境的对话将同一个网络引导到两个稳定的发育路径之一,最终形成阳生叶或阴生叶。叶片的最终形态并非以简单、线性的方式预先编程;它是从一组固定的基因与一个可变的环境之间的动态相互作用中涌现出来的。
那么,这些网络是什么样子的呢?它们只是随意缠绕的一团连接吗?远非如此。它们拥有独特而优美的结构,通常由简单、优雅的生长规则塑造而成。其中最重要的原则之一是优先连接,常被概括为“富者愈富”。
想象一下模拟一个蛋白质-蛋白质相互作用网络的演化过程。我们从一小群相互作用的蛋白质核心开始。随着新的蛋白质(通过基因复制和进化)加入网络,它们必须形成连接。优先连接规则指出,一个新蛋白质更可能与一个已经拥有许多连接的现有蛋白质相连接。这就像加入一个新的社交网络;你更有可能关注或结交一个已经很受欢迎的人。随着时间的推移,这个简单的规则会产生一个戏剧性的后果:它创造了集线器。这些是少数几个比平均蛋白质连接得多的蛋白质。在细胞中,这些集线器通常是主调节器,是细胞机器的关键。一个数学模型显示,一个最初只有几个连接的原始蛋白质,通过这种“富者愈富”的动态,在网络增长后最终可能拥有数百个连接,成为一个其移除可能对细胞是致命的至关重要的集线器。这个优雅的原则解释了有组织的、层级化的结构如何能从一个简单的、局部的生长规则中涌现出来。
生物网络的另一个关键结构特征是模块化。网络并非一个单一、庞大的实体。它被分解成半自主的团队或模块。想想一辆汽车:电气系统、冷却系统和传动系统都是模块。它们有特定的功能,并通过一组有限的、明确定义的接口相互作用,但你可以分析或修理冷却系统,而无需成为传动系统专家。生命也使用同样的设计原则。一组基因和蛋白质可能形成一个用于代谢特定糖类的模块,而另一组则形成一个用于修复DNA损伤的模块。这种模块化使系统具有鲁棒性——一个模块的故障不一定会级联并摧毁整个细胞——也使其具有可进化性,因为自然界可以混合、匹配和修改不同的模块来创造新功能。
随着对网络结构、反馈和模块化的理解日益加深,人们可能会被一个宏伟的梦想所诱惑:如果我们能绘制出单个细菌内部的每一个分子、每一个连接和每一次相互作用,会怎么样?我们能否创建一个完美的“数字细胞”,一个计算机模拟,在给定一组初始条件下,能够以绝对的确定性预测其整个生命历程?。
在这里,我们遇到了一个最终的、令人谦卑且极其深刻的原则:宇宙是在掷骰子。在单个细胞的尺度上,生命并非一台确定性的钟表机械。分子的数量很少,它们由于热能而相互碰撞和弹跳。一个反应的发生不是确定的,而是在两个分子恰好以正确方向碰撞时具有一定的概率。基因表达不是一个平滑、连续的过程;它常常以随机的爆发形式发生。这种生化过程中固有的、不可避免的随机性被称为随机性 (stochasticity)。
由于这种内在的噪声,即使我们拥有一份完美的“零件清单”和一张完美的网络图,我们也永远无法以绝对的确定性预测单个细胞的确切未来。确定性数字细胞的梦想,在原则上是不可能实现的。
那么,意义何在?如果完美的预测已无可能,系统生物学的目标是什么?目标不是成为一个微观世界的算命先生,而是成为一个理解设计的工程师。我们建立模型不是为了预测单一的结果,而是为了理解可能结果的分布。我们建立模型是为了揭示生命的设计原则:反馈回路如何创造稳定性?模块化如何赋予鲁棒性?网络结构如何让系统适应和进化?通过理解这些原则,我们就能开始理解健康的逻辑和疾病的起源。我们可以学会理性地设计新疗法,甚至为医药和生物技术工程化设计新颖的生物回路。系统生物学的最终目的不是预测单个细胞的未来,而是理解生命本身永恒、优雅且惊人聪明的逻辑。
在遍历了驱动系统生物学的核心原理和机制之后,我们现在抵达一个激动人心的目的地:真实世界。因为,如果一个美丽的理论不能照亮我们周围的世界,不能解决难题,不能构建前所未有的事物,那它又有何目的?系统生物学的历史发展不仅仅是一场智力上的操练;它是一个具有深远实践和哲学影响的故事。正是在生物学、工程学、物理学和计算机科学的十字路口,这种思维方式的真正力量得以彰显。我们从问“这个零件是做什么用的?”转变为问“我们能用这些零件构建什么?”甚至“我们能发明全新的零件吗?”
系统生物学引发的最具革命性的转变是视角的改变。几个世纪以来,生物学家就像一位博物学家,细致地分类和解剖他们偶然发现的丛林中宏伟的复杂性。然而,合成生物学家看待丛林,看到的不仅是一个有待理解的生态系统,更是一系列可用于建造的资源和原理。这就是“可编程机器”范式:认为生命的组成部分——基因、蛋白质、调控通路——可以被抽象化、标准化,并组合成执行新颖的、由人类定义的功能的回路。
这不仅仅是一个比喻。思考一下“异种生物学”(xenobiology) 的大胆目标,即创造与地球上任何生命在生物化学上都不同的生命形式。研究人员已经沿着这条路迈出了步伐,他们设计并构建了一种活细菌,其遗传密码从通用的四个字母(A、T、C、G)扩展到一个合成的六字母字母表。为了实现这一点,他们不仅必须合成能够相互配对但不能与天然碱基配对的新化学“字母”,还必须设计定制的聚合酶来读取和写入这种扩展的遗传语言。这一成就堪称合成生物学工程精神的典型范例。它不是经典意义上的发现,而是理性设计和建造的展示,构建了一个具有基本功能——遗传——的生物系统,它超越了我们所知的自然生命的界限。
每个工程师都需要一个工具箱。如果我们要建造生物机器,我们从哪里获得零件?合成生物学的历史揭示了两种互补的策略。
首先,我们可以成为回收大师,在自然界自身数十亿年积累的解决方案中寻找宝藏。没有比CRISPR-Cas9的发展更好的例子了。多年来,科学家们注意到细菌基因组中存在奇怪的重复序列。结果发现这些并非垃圾DNA,而是一个复杂的适应性免疫系统的核心,细菌用它来对抗病毒。它们将病毒DNA片段储存为“记忆”,并使用一个RNA引导分子来引导一个蛋白质“剪刀”(Cas9酶)在再次感染时找到并摧毁匹配的病毒DNA。天才的飞跃在于意识到这种自然防御机制可以被重新利用。通过简单地提供一个合成的引导RNA,我们现在可以引导这个分子剪刀以惊人的精度切割任何生物体中的任何DNA序列。曾经是微生物学中一个奇特脚注的东西,如今已成为历史上最强大的基因编辑工具,这证明了深入理解一个自然系统并将其为我所用的力量。
但是,如果自然界没有发明我们需要的零件怎么办?如果我们需要一种能在奇特溶剂中工作的酶,或者一种能催化生物学中未知反应的酶呢?在这里,我们必须自己成为进化的建筑师。这是第二种策略:“定向进化”。定向进化没有试图完美预测蛋白质结构如何导致其功能——这是一项极其困难的任务——而是采用了一种更务实、由工程驱动的方法。它在巨大规模上以加速的步伐模仿自然选择。科学家创造出数百万个基因的随机变体,表达由此产生的蛋白质,然后筛选那些在所需功能上表现出哪怕是轻微改进的蛋白质。“获胜者”被选中,再次突变,然后循环往复。通过这些构建和测试的快速迭代,我们可以打造出为远离其进化起源的任务而优化的新颖蛋白质和酶,为我们的生物设计提供定制组件,而无需完整的预测性蓝图。
一箱零件——即使是绝妙的零件——也不是一台机器。机器之所以能工作,是因为它的零件以特定的方式连接在一起。系统生物学的精髓在于其对这些连接的关注,对那些支配从新陈代谢到发育的一切事物的复杂网络的关注。源于数学和物理学的网络科学语言,为理解这种生物学架构提供了一个强大的框架。
例如,如果我们绘制出细胞内巨大的蛋白质-蛋白质相互作用网络,我们会发现它并非随机的。少数蛋白质,即“集线器”,与大量的伙伴相连,而大多数蛋白质只有少数几个连接。为什么会这样?像 Barabási-Albert 模型这样的生成模型提供了一个极其简单的解释。它们表明,如果一个网络通过添加新节点来增长,而这些新节点倾向于附着到已经连接良好的节点上(一种“富者愈富”的机制),那么我们在生物学中看到的以集线器为主导的结构就会自然出现。这个简单的优先连接原则有助于解释细胞社交网络的基本拓扑结构。
这些网络不是静态的;它们是动态的、不断演化的实体。想象一个蛋白质复合物——一个协同工作的小团队——需要适应新的条件。它会更换成员,招募新蛋白质并解雇旧蛋白质吗?还是同一个蛋白质团队保持不变,只是改变了它们相互作用的方式,就像一支篮球队改变战术一样?系统生物学提供了定量的工具来回答这个问题。通过追踪一个模块的成员组成及其内部相互作用模式随时间的变化,我们可以区分组分的变化和“布线”的变化,从而为我们提供一个更丰富、更动态的细胞适应图景。
或许,系统视角最美妙之处在于其统一的力量。通过提供一种共同的语言和一套共同的原则,它架起了曾经被视为独立的学科之间的桥梁。这一点在与进化和发育生物学(Evo-Devo)的交汇处表现得最为明显。
思考一下发育时序这个深刻的问题。胚胎如何确保一个事件在另一个事件发生后精确地发生五个小时?答案通常在于基因调控回路的逻辑。一种常见的称为“相干前馈环”的网络基序,充当了一种优雅而鲁棒的计时装置。在这个回路中,一个信号激活两个基因 和 。但是基因 也帮助激活基因 。如果通往 的直接路径上存在处理延迟,细胞可以有效地“等待”两个信号都到达后再继续进行。其显著的结果是,该回路一支臂上的生化延迟变化几乎可以一对一地完美转化为最终发育事件的改变。例如,延迟增加10分钟,会导致事件晚10分钟发生。这是一个美丽的例子,说明一个简单的网络结构如何为“异时性”(heterochrony)——即发育时间表的进化性改变——提供了一种机制。
这个新镜头也重新构建了经典的进化问题。以趋同进化为例,即两个不相关的物种独立地进化出相同的性状,比如鲨鱼和海豚的流线型身体。从历史上看,问题到此为止。但系统生物学让我们能够追问:它们是如何达到相同解决方案的?这两个物种是仅仅微调了它们共同继承的同一个祖先基因网络的布线?还是它们从头构建了完全不同的、非同源的回路,而这些回路恰好产生了相同的结果?利用计算方法比对这两个物种的基因调控网络,我们现在可以区分这两种情况,将进化研究从可见性状的层面提升到底层遗传软件的层面。
随着见解和应用的积累,一个领域必须走向成熟。对于一个工程学科来说,这意味着制定标准——让人们能够分享、复现和在他人工作基础上进行构建的通用语言。在我们的领域,这催生了诸如系统生物学标记语言 (SBML) 等标准的创建,这是一种用于交换生化网络动态模型的通用格式,以便它们可以在任何兼容的模拟器上运行。它也催生了合成生物学开放语言 (SBOL),它作为描述工程化基因构建体结构的“蓝图”——其部件、序列以及它们如何组装。这些标准是这场革命的无名英雄,为一门真正协作和累积的科学提供了必要的基础设施。
有了这些工具和原则,该领域现在可以面对所有挑战中最宏大的挑战,这些挑战从两个方向攻击“生命是什么?”这个问题。“自上而下”的方法试图创建一个最小细胞。从一个简单的现代细菌开始,科学家系统地逐个移除基因,试图发现在受控环境中生命所需的绝对最小的遗传部件集合。“自下而上”的方法则相反,旨在从零开始构建一个原细胞,在试管中混合脂质和核酸等非生命化学物质,看是否能涌现出一个自我复制的实体。最小细胞是漫长进化史的产物,被精简至其基本要素;而原细胞则是生命最初起源的一个假说模型。两者都是对我们理解的终极考验,推动我们不仅通过观察生命,更通过构建生命来定义它。
从哲学视角的转变到新生命形式的工程设计,从抽象的网络理论到胚胎生长的具体时序,系统生物学的应用与生命本身一样广阔。这是一个在多样性中寻求统一的领域,在数字与生物、过去与未来之间架起桥梁,并在此过程中不断重新定义可能性。