基本通量模式

玻尔百科

核心要点

一个基本通量模式 (EFM) 代表了一组最小的、不可分解的反应集合，它可以在代谢网络中以稳态运行。
代谢网络的每一种可能的稳态行为，在数学上都可以描述为其所有 EFM 的非负线性组合。
在代谢工程和合成生物学中，EFM 分析提供了一个包含所有潜在途径的完整清单，用于设计和优化细胞工厂，以生产有价值的化合物。
在系统生物学中，EFM 是一种预测工具，用于理解基因突变和调控约束带来的功能性后果。
EFM 分析的原理可以从单个细胞扩展到整个生态系统，解释了代谢冗余性、模块性和功能弹性等关键特性。

引言

单个细胞内的新陈代谢网络是一个极其复杂的系统，一张维持生命的、由化学反应构成的浩瀚而错综复杂的网络。面对这种复杂性，一个基本问题随之产生：我们如何能识别出生物体将底物转化为产物、能量和生物质所能使用的所有可能的功能性路径？仅仅绘制连接图谱是不够的；我们需要一种方法来破译该网络的完整功能库。本文将介绍基本通量模式 (EFM)，这是一个强大的数学概念，通过识别代谢功能的基本、不可分割的构建模块，为这一挑战提供了明确的答案。

本文将分两部分引导您了解这一强大的概念。首先，在“原理与机制”一章中，我们将深入探讨 EFM 背后的核心理论。我们将探索稳态和不可分解性的基本原理，通过简单的例子和数学形式，建立对 EFM 的直观而精确的理解。随后，“应用与跨学科联系”一章将展示这一抽象概念如何成为一种实用且具有变革性的工具。我们将看到 EFM 如何帮助代谢工程师设计微生物工厂，使系统生物学家能够预测细胞行为，甚至为整个生态系统的弹性提供见解。

原理与机制

想象一个活细胞，它不是一袋静态的化学物质，而是一个繁华的都市。其核心是一个庞大而复杂的道路网络——代谢途径。原材料（如底物）到达城门，沿着这些道路运输，在十字路口（由酶催化）被转化，最终成为成品、能量或新的细胞结构。但这并非混乱的交通高峰期。这座城市遵循一套严格的规则运行，确保交通（分子）顺畅、持续地流动，既防止了交通瘫痪，也避免了出现空城。作为生物学的城市规划师，我们如何绘制出这个网络中所有可用的基本路线？我们如何理解细胞完整的道路图集？这正是基本通量模式 (EFM) 这一优美概念的用武之地。

交通规则：完美平衡

我们细胞都市的首要规则是稳态条件。想象任何一个十字路口，在我们的比喻中它代表一种内部代谢物——一种化学中间体。为了让城市顺利运行，到达这个十字路口的总交通速率（分子）必须完全等于离开的总交通速率。如果到达的分子多于离开的，十字路口就会堵塞，导致有毒物质积累。如果离开的多于到达的，十字路口就会干涸，使所有后续路线停滞。细胞以其智慧维持着一种微妙的平衡，使这些内部代谢物的浓度保持恒定。

这个优雅的原理可以用一点数学知识出人意料地简单地捕捉到。我们可以用一个名为化学计量矩阵的图来描述整个道路网络，记作 $S$ 。这张图的每一行对应一个内部代谢物（一个十字路口），每一列对应一个反应（一个路段）。矩阵中的数字，即化学计量系数，告诉我们每条路如何影响每个十字路口：正数表示该路段产生此代谢物（交通流入），负数表示它消耗此代谢物（交通流出）。

让我们看一个简单的例子。底物 $S$ 进入细胞，被转化为中间体 $M$ ，然后 $M$ 可以被转化为产物 A 或产物 B。反应如下：

$v_1: S \rightarrow M$
$v_2: M \rightarrow \text{产物 A}$
$v_3: M \rightarrow \text{产物 B}$

唯一的内部“十字路口”是代谢物 $M$ 。反应 $v_1$ 产生它（系数为 $+1$ ），而反应 $v_2$ 和 $v_3$ 消耗它（每个系数均为 $-1$ ）。因此，我们化学计量矩阵中对应代谢物 $M$ 的那一行就是 $\begin{pmatrix} 1 & -1 & -1 \end{pmatrix}$ 。每个路段上的交通速率由一个通量向量 $\mathbf{v} = \begin{pmatrix} v_1 \\ v_2 \\ v_3 \end{pmatrix}$ 给出。稳态规则，即这种完美平衡的法则，可以用一个优美而紧凑的方程来表示：

$S \cdot \mathbf{v} = \mathbf{0}$

对于我们这个简单的分支网络，它变成：

$1 \cdot v_1 - 1 \cdot v_2 - 1 \cdot v_3 = 0$

任何满足此方程的交通流量 $(v_1, v_2, v_3)$ 集合（并且由于这些是单行道，流量均为非负值）都代表了该网络一个有效、可持续的运行状态。像 $\mathbf{v} = \begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix}$ 这样的通量向量是一个完全有效的状态：每产生 2 个 $M$ 分子，就有 1 个流向产物 A，1 个流向产物 B，从而使 $M$ 的水平保持恒定。通量向量告诉我们哪些反应是活跃的以及它们的相对速率；例如，在向量 $\begin{pmatrix} 2 \\ 0 \\ 2 \end{pmatrix}$ 中，第二个反应是不活跃的，因为它的通量为零。

发现基本路径

那么，我们可以找到任何有效的交通模式。但是，哪些是基本的路径，即细胞代谢策略的基本构建模块呢？再看看我们的分支网络。直观地说，这个网络可以做两件不同的基本事情：它可以制造产物 A，或者制造产物 B。

通往产物 A 的路径： 这涉及使用反应 $v_1$ 和 $v_2$ 。为了在 $v_3 = 0$ 的情况下维持稳态 ( $v_1 - v_2 - v_3 = 0$ )，我们必须有 $v_1 = v_2$ 。这条途径的最简整数表示是通量向量 $\mathbf{e}_1 = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix}$ 。这是一条最小的、自洽的路径：底物 $\rightarrow M \rightarrow$ 产物 A。
通往产物 B 的路径： 这涉及使用反应 $v_1$ 和 $v_3$ 。为了在 $v_2 = 0$ 的情况下维持稳态，我们必须有 $v_1 = v_3$ 。最简单的表示是 $\mathbf{e}_2 = \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix}$ 。这是另一条最小路径：底物 $\rightarrow M \rightarrow$ 产物 B。

这两个向量 $\mathbf{e}_1$ 和 $\mathbf{e}_2$ 就是我们的基本通量模式。那么，我们发现的另一个有效状态 $\begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix}$ 呢？注意到一件奇妙的事情：它就是我们两个基本模式的和！

$\begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix} = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} + \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} = \mathbf{e}_1 + \mathbf{e}_2$

这个状态不是基本的；它是一个复合状态，是细胞同时运行两条基本路径的情况。这就引出了使一个模式成为“基本”模式的核心特质：不可分解性。

一个 EFM 是一条有效的稳态路径，它不能被分解成更简单的、仍然有效的路径的组合。陈述这一点的最精确方式是通过支持集最小性条件。一个通量向量的“支持集”就是其中活跃反应（通量非零的反应）的集合。不可分解性条件指出，对于一个 EFM，不可能找到另一条有效的、非零的稳态路径，其活跃反应是该 EFM 活跃反应的*真子集*。

让我们来验证一下。 $\mathbf{e}_1 = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix}$ 的支持集是 $\{v_1, v_2\}$ 。我们能找到一条只使用 $\{v_1\}$ 或只使用 $\{v_2\}$ 的有效路径吗？不能。如果我们只使用 $v_1$ ，我们会产生 $M$ 而不消耗它。如果我们只使用 $v_2$ ，我们会消耗 $M$ 而不产生它。两者都不是稳态。因此， $\{v_1, v_2\}$ 是一个最小支持集，而 $\mathbf{e}_1$ 是一个 EFM。同样的逻辑也适用于 $\mathbf{e}_2$ 。

但是看看复合通量 $\mathbf{v} = \begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix}$ 。它的支持集是 $\{v_1, v_2, v_3\}$ 。我们已经知道一条有效路径 $\mathbf{e}_1$ ，其支持集 $\{v_1, v_2\}$ 是 $\{v_1, v_2, v_3\}$ 的真子集。因此，根据定义， $\mathbf{v}$ 不是一个 EFM。它是可分解的。另一个不同且最小路径的例子是，底物既可以通过中间体转化，也可以被直接消耗；这两个选项构成了两个独立的 EFM。

完整的图集：一个几何视角

这个原理非常强大。对于一个给定的网络，其所有 EFM 的集合为*每一种可能的稳态*提供了一个完备且有限的基。网络的任何可持续行为都可以被描述为一个简单的配方：一点 EFM 1，少许 EFM 2，依此类推。在数学上，任何可行的通量向量 $\mathbf{v}$ 都是基本通量模式向量 $\mathbf{e}_i$ 的非负线性组合：

$\mathbf{v} = c_1 \mathbf{e}_1 + c_2 \mathbf{e}_2 + \dots + c_k \mathbf{e}_k, \quad \text{其中 } c_i \ge 0$

这有一个优美的几何解释。所有可能的稳态通量向量的集合在一个高维空间中形成一个称为凸多面锥的形状。你可以把它想象成一个指向无限延伸的、有多个面的尖锥。那么基本通量模式是什么？它们是极射线——这个锥体的边。正如金字塔内的任何一点都可以通过沿着其边缘移动一定距离来描述一样，任何可能的代谢状态都可以描述为其基本边缘路径（即 EFM）的组合。为了找到所有可能的行为，我们不需要探索锥体内部的无限空间；我们只需要找到它有限数量的边。

环岛与可逆道路

代谢网络并不总是简单的分支路径。它们包含像循环这样迷人的结构。考虑一个简单的无效循环，其中蛋白质 $P$ 被一个酶磷酸化成 $P^*$ ，而 $P^*$ 立即被另一个酶去磷酸化变回 $P$ 。

$v_1: P \rightarrow P^*$
$v_2: P^* \rightarrow P$

在稳态下， $P^*$ 的产生速率必须等于其消耗速率，因此 $v_1 = v_2$ 。满足此条件的最简单路径是通量向量 $\begin{pmatrix} 1 \\ 1 \end{pmatrix}$ 。这是一个 EFM。它代表一个自洽的循环。虽然它看起来是“无效”的，因为它没有净产物生成，但这样的循环在生物学中至关重要，它们可以作为高度敏感的开关，对微小的信号做出剧烈反应。

这就引出了我们如何对这些网络建模的一个微妙但重要的细节，特别是关于可逆反应。标准的 EFM 分析将一个可逆反应视为一个单一的实体，其净通量可正可负。还有一个相关但不同的概念，叫做极端路径 (EPs)。EP 框架严格地将每个可逆反应拆分为两个独立的、不可逆的“正向”和“反向”反应。

这个看似微小的改变可以揭示 EFM 分析中“不可见”的路径。例如，在一个包含可逆步骤 $A \leftrightarrow B$ 的网络中，EP 方法可能会将一个无效循环 $A \rightarrow B \rightarrow A$ 识别为一条独立的路径。在 EFM 框架中，这个循环的净通量为零，因此它不会作为一个独立的、非零的模式出现。这并非一种方法“对”而另一种“错”的问题。相反，它们提供了不同的视角。EFM 给了我们一个所有能导致质量净转化的路径的简洁基底，而 EPs 则提供了对所有可能酶活性的更详细的枚举，即使是那些相互抵消的活性。

通过理解稳态和不可分解性的原理，我们解锁了一种系统性的方法，来绘制细胞新陈代谢的整个功能图景。EFM 不仅仅是抽象的向量；它们是生命用来维持自身、适应和繁荣的基本、独立的策略。它们是细胞这座城市的蓝图。

应用与跨学科联系

在上一章中，我们探索了细胞的内部世界，揭示了其基本的代谢途径——基本通量模式。我们学会了将它们视为构成生命化学语言的基本、不可分割的“句子”。这是一次迷人的纯粹理性练习，将一个复杂的反应网络提炼成一套清晰、完备的功能路径。

但科学不仅仅是破译自然法则；它关乎运用这些知识去理解、预测和创造。既然我们有了这本强大的代谢句子词典，我们能用它做什么呢？它能讲述什么样的故事？这才是旅程真正激动人心的地方。我们从被动地阅读细胞蓝图，转变为主动的建筑师和工程师。我们将看到，这个抽象的数学概念如何绽放为一个实用的工具箱，应用于工程、医学甚至生态学等不同领域，揭示了生命系统逻辑中惊人的一致性。

代谢工程师的工具箱

想象一个细胞，它不是一团神秘的生命物质，而是一个微型化工厂。它摄取葡萄糖等原材料，通过迷宫般的酶促流水线，将它们转化为数千种不同的产物——一些用于自身生长，另一些则可能对我们有用，比如生物燃料、药物或生物塑料。作为代谢工程师，我们的工作就是改造这个工厂，使其尽可能高效地生产某种特定的有价值化合物。

我们该如何开始呢？第一个挑战是找到一条可行的生产线。EFM 提供了完美的解决方案。通过构建细胞网络的计算模型，甚至可能加入一些来自其他生物体的新的、非天然的反应，我们可以让计算机列出连接我们廉价起始原料与我们期望的最终产物的每一条可能的路径。这些路径中的每一条都是一个 EFM。我们便得到了一个包含所有可能设计方案的完整菜单。

有了这份菜单，我们现在可以根据我们的工程目标选择最佳方案。例如，对生物体进行基因改造以激活一条新途径可能成本高昂且困难。如果我们的目标是最大限度地减少这种投入，我们可以简单地扫描 EFM 列表，选择实施起来所需反应最少的那一个。或者，我们的目标可能是追求最高纯度。那么我们可以筛选列表，找到那些只生产目标分子而不产生任何不必要副产物的 EFM，以确保一个清洁高效的过程。这种通用的设计策略——通过 EFM 分析枚举所有潜在路径，然后选择最优路径——是现代合成生物学的基石之一。

但是，当我们设计的工厂表现不佳时该怎么办？也许我们选择的途径是活跃的，但生产率却令人失望。我们怀疑存在一个瓶颈——某个缓慢的单一反应限制了整条流水线的速度。我们如何找到它？我们不能简单地打开细胞，观察分子的流动。这时，一场由 EFM 指导的、理论与实验之间的精彩对话就派上用场了。

细胞可能有多条可用的 EFM 来制造一种产品。我们不确定它“选择”了哪一条。但我们可以玩一个聪明的把戏。让我们对细胞做一个微小而有针对性的改变，例如，用药物轻微抑制一个特定的酶，比如酶 X。然后我们观察这对整体产品产量的影响。EFM 分析使我们能够预测每条可能路径的产量应该如何变化。如果细胞正在使用路径 A，抑制酶 X 可能会产生巨大影响。如果它正在使用不涉及酶 X 的路径 B，则可能完全没有影响。通过将真实的实验结果与我们基于 EFM 的预测进行比较，我们可以推断出细胞实际使用的路径，并由此精确定位我们需要修复的真正瓶颈反应。这是一个利用数学向生命有机体提出精确、可检验问题的绝佳例子。

系统生物学家的神谕

除了工程应用，EFM 还为我们理解生物学的基本运作提供了深刻的见解。它们就像一种神谕，让我们能够预测细胞将如何应对变化，并理解其令人困惑的复杂性。

最有力的应用之一是预测基因突变的后果。一个基因通常编码一种催化单一反应的酶。如果该基因被删除或损坏会发生什么？在我们的网络比喻中，这就像地图上的一条道路被永久关闭了。任何依赖于那条路的 EFM——任何代谢旅程——都不再可能。只需检查我们预先计算好的 EFM 列表中哪些包含了现在失活的反应，我们就能立即预测该生物体丧失了哪些功能能力。这对于理解遗传病和抗生素耐药性具有重大意义。

细胞的行为不仅由其基因决定，还受到一个复杂的调控网络的影响。这些调控网络可以对代谢通量施加特殊的约束。例如，某种机制可能强制执行一条严格的规则，即通过一个反应 $v_j$ 的通量必须始终是另一个反应 $v_k$ 的两倍，即 $v_j = 2v_k$ 。这样的规则如何重塑细胞的能力？同样，我们的 EFM 框架提供了答案。我们可以拿出我们完整的可能路径列表，简单地测试哪些路径遵守这个新的“交通法则”。任何稳态行为都必须是这些合规 EFM 的组合。我们可能会发现，新规则使整套路径失效，从而揭示了调控如何引导代谢流，并从相同的底层硬件上动态地塑造细胞的功能。

当然，像 E. coli 这样的生物体的全基因组尺度模型可能包含数百万甚至数十亿个 EFM。如此庞大的原始列表不是洞见，而只是数据。下一步是在其中寻找模式。在这里，EFM 分析可用于自动将这些无数的路径分为少数几个功能类别。我们可以教计算机检查每个 EFM 的净输入和输出，并给它贴上标签：“这条路径的主要目的是产生能量 (ATP)”，“这条路径为合成氨基酸而优化”，或者“这只是一个浪费能量却无净收益的无效循环”。这使我们能够将一个庞大、难以理解的路径列表提炼成一个关于细胞核心代谢策略的简单、人类可读的摘要。

这类分析中存在一种美妙的二元性。到目前为止，我们一直关注 EFM 作为实现功能的最小方式。但反过来问：禁用一个功能的最小方式是什么？这就引出了最小切割集 (MCSs) 的概念。一个 MCS 是一组最小的反应集合，如果将它们全部移除，将关闭一个目标代谢能力，比如生产一种必需营养素。要使这种“切割”奏效，它必须切断每一条产生该营养素的 EFM。这个概念非常强大。对于制药公司来说，一个 MCS 可能代表一组能够有效杀死病原体的药物靶点组合。对于生物工程师来说，它可能是关闭所有与期望产物竞争的途径所需的基因敲除策略。EFM 告诉你如何构建；MCS 告诉你如何破坏。它们是同一枚硬币的两面。

跨越尺度：从细胞到生态系统

EFM 分析的见解远远超出了单个细胞，为研究进化和生态学提供了一个定量的视角。当我们比较不同物种的代谢网络时，我们发现它们的结构带有其进化历史的印记。

考虑两种著名微生物的简化模型：肠道细菌 Escherichia coli 和面包酵母 Saccharomyces cerevisiae。通过计算它们生产某种发酵产物的 EFM，我们可能会发现 E. coli 网络拥有比酵母网络多得多的独立路径来完成这项任务。EFM 数量上的这种量化差异提供了代谢冗余性的度量。像 E. coli 这样必须在多变的肠道环境中生存的生物体，拥有多条备用路径是有利的。而像酵母这样的专家型生物，其新陈代谢可能更精简，但灵活性较低。EFM 分析使我们能够超越定性描述，为这种灵活性概念赋予一个数字，将网络结构直接与生物体的生态位联系起来。

这种冗余思想也揭示了新陈代谢的一个基本设计原则：模块性。当我们分析某个特定功能的所有 EFM 集合时，我们常常会发现一个“核心”模块的反应，它存在于每一个 EFM 中，代表了该途径不可或缺的部分。然后，我们会发现几个可替换的“卫星”反应或子模块，它们可以被换入换出以完成该功能。例如，核心路径可能需要一种分子 D 的供应，而网络可能包含两个不同的 EFM，它们使用两个完全不同的卫星路径来生产 D。这种模块化的、“核心加变体”的组织结构使网络具有鲁棒性，就像一个可以使用不同类型电池的系统。

也许最深刻的是，这些原理可以一直扩展到整个生态系统的层面。想想我们肠道中复杂的微生物群落。这个生态系统——以及我们自身的健康——取决于它执行关键功能的能力，比如从我们吃的纤维中生产短链脂肪酸。在一个群落层面的模型上使用 EFM 分析，我们可以发现整个生态系统实现这一功能的所有方式。我们可能会发现，一条途径完全由物种 A 完成，而另一条冗余的途径则涉及物种 B 和物种 C 的合作。

这种网络层面的冗余创造了功能稳定性。如果物种 A 的种群数量锐减，群落并不会失去生产关键脂肪酸的能力，因为其他物种可以使用它们的替代途径来接管。该功能对扰动具有缓冲作用。我们在单个细胞中看到的冗余原理，现在解释了一个由相互作用的生物体组成的复杂群落的恢复力。

从设计高效的细胞工厂到理解整个生态系统的稳定性，基本通量模式提供了一个统一的框架。它们远不止是数学上的奇趣之物；它们是一把钥匙，解锁了编码在错综复杂的生命网络中的逻辑、鲁棒性和目的。