细胞代谢建模：原理与应用

玻尔百科

定义

细胞代谢建模：原理与应用是系统生物学领域的一种计算方法，通过利用细胞反应网络和化学计量学来预测代谢活动。该方法的核心原理是利用通量平衡分析（FBA）并在稳态假设下优化生长或产率等生物学目标。这些模型广泛应用于代谢工程、病原体与癌症的药物靶点识别，并用于解释基因表达如何影响细胞的鲁棒性决策过程。

核心要点

流平衡分析 (FBA) 利用细胞的反应网络（化学计量），并假设系统处于稳态，通过优化如生长等生物学目标来预测代谢活动。
在代谢工程中，这些模型被用于计算最大理论产量，并为实现高价值化学品的生长耦合生产而理性设计菌株。
代谢模型通过精确定位病变或外来细胞所特有的必需反应，从而能够在病原体和癌细胞中识别药物靶点。
通过将代谢状态与基因表达联系起来，这些模型可以解释细胞在免疫应答和发育等过程中如何做出稳健的长期决策。

引言

活细胞就像一个极其复杂的化工厂，数千种化学反应同时发生以维持生命。完整地理解这个代谢网络是一项巨大的挑战。为了理解这种复杂性，科学家们建立了数学模型，将系统简化为其核心原理，为预测细胞行为提供了一个强有力的视角。本文旨在弥合观察代谢复杂性与理解其内在逻辑之间的知识鸿沟。它全面概述了我们如何能对细胞生命进行数学建模和工程改造。读者将首先学习细胞代谢建模背后的基本概念，然后了解这些模型如何彻底改变现代科学与技术。

这段旅程始于对代谢建模核心原理的探索。在第一章“原理与机制”中，我们将揭示如何将细胞概念化为一个微型城市，它受质量平衡和特定目标的规则支配。我们将剖析流平衡分析 (FBA) 的关键组成部分，包括化学计量矩阵、稳态假设以及目标函数在预测细胞行为中的关键作用。随后，“应用与跨学科联系”一章将展示这些理论框架如何在现实世界中得到应用。我们将看到代谢模型如何被用于将细胞改造为高效的工厂，为癌症等疾病开发靶向疗法，以及理解代谢与发育、进化等基本生命过程之间的动态相互作用。

原理与机制

要窥探细胞的内部运作，就如同目睹一场令人困惑的复杂奇观。数千种化学反应协同作用，形成一股活动的旋风，以某种方式维持、构建和复制生命本身。我们如何才能理解这一切？物理学家在面对一个极其复杂的系统时，其方法不是绝望，而是在混乱之下寻找潜在的原理，寻求一种更简单、更优雅的描述。在细胞代谢建模中，我们做的正是如此。我们不试图追踪每一个分子，而是构建一个细胞的“漫画”，一个能捕捉其逻辑和功能精髓的简化模型。

细胞：一座微型都市

想象一座繁华的都市。原材料——食物、水、燃料——通过港口和高速公路流入。在城市内部，一个由工厂、作坊和发电厂组成的庞大网络将这些材料转化为城市所需的一切：建筑、车辆、能源，甚至是建造新工厂的部件。货物沿着错综复杂的道路网络运输，在任何特定时刻，城市都处于一种动态平衡状态。对于任何内部产品，如砖块或钢梁，其生产速率平均必须等于其消耗速率。否则，城市要么因短缺而停滞，要么被自身的过剩产品所掩埋。其首要目标是什么？是成长、扩张、繁荣。

这是一个对活细胞非常贴切且有力的类比。细胞就是一座微型都市。它输入营养物质（原材料），并通过一个复杂的生化反应网络（工厂和作坊），将其转化为细胞组分和能量。对于一个处于富饶环境中的单细胞生物来说，其最终目标是生长并创造一个新城市——即细胞分裂。为了对此进行建模，我们采用了城市规划师可能使用的相同核心原则：我们绘制网络图，我们强制实现生产与消耗的平衡，我们定义资源限制，并且我们假定一个目标。

生命蓝图：化学计量与稳态

我们的首要任务是绘制一张城市产业地图。这张地图是该生物体中所有已知代谢反应的完整集合，源自数十年的生物化学研究，并通过其基因组进行注释。每个反应都像一个食谱：它需要某些成分（底物）并将其转化为产物。例如，著名的糖酵解途径，一条能量生产的中心高速公路，可以被看作一个单一的大型工厂区。为了在我们的全市模型中理解其功能，我们不需要详细描述内部的每一台机器。我们可以将其抽象为一个“黑箱”，通过它从细胞其余部分获取什么以及它提供什么来定义。其基本输入是葡萄糖、低能分子 $ADP$ 和电子载体 $NAD^{+}$ 。其输出是丙酮酸、高能分子 $ATP$ 和携带电子的载体 $NADH$ 。

我们可以将所有这些食谱——成千上万个——汇集成一个宏大的表格。在数学中，这个表格被称为化学计量矩阵，用符号 $S$ 表示。该矩阵的每一行对应一种特定的化学物质（代谢物），每一列对应一个反应。表中的数字，即化学计量系数，告诉我们在每个反应中有多少分子被产生（正数）或消耗（负数）。这个矩阵就是我们细胞的代谢蓝图。

有了这张蓝图，我们就可以应用最重要的简化假设：稳态假设。就像我们都市中的砖厂一样，对于任何在细胞内部产生和消耗的代谢物，其总生产速率必须完全等于其总消耗速率。没有净积累或耗尽。这一质量平衡原则为我们提供了一个出人意料地强大而简单的数学约束。如果我们将每个反应的速率或通量表示为一个向量 $v$ ，那么稳态条件可以优雅地表示为：

S v = 0

这个方程表明，当你将细胞整个代谢的蓝图（ $S$ ）乘以其所有反应的速率（ $v$ ）时，对于每种内部代谢物，结果都为零。这是流平衡分析 (FBA) 的核心支柱。

当然，细胞不是一个封闭系统。它在环境中运作，而环境施加了另一套规则，即约束。生活在无氧环境中的细胞无法使用氧气。为了模拟这一点，我们只需将氧气摄取反应的通量约束为零。营养物质也是如此；细胞消耗的葡萄糖不能超过其生长培养基中可用的量。这些约束通常是线性不等式，它们定义了细胞可能状态的边界。

目标问题：定义目标函数

我们有了地图（ $S$ ）和交通法规（ $S v = 0$ 及资源约束），但这只告诉我们哪些状态是可能的。它并没有告诉我们细胞实际上会做什么。一辆车可以有多种符合路线图和交通法规的驾驶方式，但司机有一个目的地。细胞的目的地是什么？

我们必须定义一个目标函数。对于微生物而言，一个非常成功的假设是，它进化的首要目标是：尽可能快地复制自身。为了将这种生物驱动力转化为数学，我们构建了一个特殊的反应，称为生物质反应。这不是一个真实的反应，而是一个“配方”，它以构建一个新细胞所需的确切比例，代表了所有必需的构件——氨基酸、核苷酸、脂质、ATP 等等。FBA 随后会搜索一种代谢通量模式，以最大化该生物质反应的速率，这等同于最大化细胞的生长速率。这是一种线性规划，一种在需求由线性关系表示的模型中寻找最佳结果的数学技术。

最大化生长是唯一的目标吗？也许不是。想一想一台精密调校的引擎。它不仅强大，而且高效。这引出了一个更精细的 FBA 版本，称为简约流平衡分析 (parsimonious FBA, pFBA)。该方法分两步进行：首先，它像标准 FBA 一样计算最大可能的生长速率。然后，它增加第二个目标：在保持该最佳生长的同时，找到实现它所需总代谢努力最小的通量分布，这里的总代谢努力量化为所有反应通量之和。其潜在的生物学假设是，细胞不仅追求速度，也讲求节俭。它们已经进化到使用资源效率最高的途径来实现其目标，从而最大限度地减少运行其代谢机器所需的蛋白质和能量投入。

创造的代价：代谢负荷与工程权衡

这种预测能力不仅仅是学术练习；它是代謝工程的基石。想象一下，我们想把我们的细胞都市变成一个专门生产有价值药物或生物燃料的工厂。我们可以通过向细胞中引入一条新的、合成的生产线（一条新的代谢途径）来实现这一点。

我们的模型可以在我们进入实验室之前就告诉我们这种干预的后果。当我们将一个关键的前体代谢物从其制造生物质组分的正常工作中转移到制造我们期望的产品时，必然会产生代价。这被称为代谢负荷。资源是有限的。如果我们拿走（比如说）35%的关键前体来制造我们的产品，模型会预测用于生长的通量相应减少35%。细胞生长变慢，因为它现在在为我们“兼职”工作。FBA 使我们能够量化这些权衡，帮助工程师设计能够在生产力与细胞健康之间取得平衡的途径，从而在制造产品和维持细胞工厂运转之间找到最佳平衡点。

超越蓝图：动力学与无形机制

尽管 FBA 模型功能强大，我们绝不能忘记它只是一个简化模型。它最大的优点——稳态假设——同时也是它最大的局限。它为我们提供了一个细胞以恒定速率运行的快照，但它没有告诉我们细胞是如何达到这种状态的，也没有说明它如何随时间变化。

为此，我们需要另一种模型：动力学模型。我们不再假设稳态，而是写下微分方程，根据产生和消耗每种化学物质的反应速率，来描述其浓度如何随时间变化。这种方法可以捕捉动态行为，例如工程化基因回路中的振荡，并允许合成生物学家在构建设计之前进行虚拟测试。挑战在于，这些模型需要知道每个反应的具体速率常数，而这些参数是出了名的难以测量，这也是为什么更简单的 FBA 方法仍然如此有价值的原因。

此外，我们的代谢蓝图是不完整的。它是一张化工厂的地图，但忽略了许多其他必要的城市服务。一个标准的 FBA 模型没有 DNA 修复团队、细胞分裂机制或调节细胞的信息处理系统的概念。这就是为什么一个标准模型可能无法预测一个 DNA 修复酶的基因对生命至关重要。该模型的目标仅仅是生产生物质所需的小分子成分；它对维持基因组完整性所需的复杂过程一无所知。在模型的眼中，一个 DNA 连接酶基因的致命敲除不会被注意到，因为其功能超出了所定义的代谢图谱范围。

这凸显了最后也是最关键的一点。细胞代谢模型是工具，而非真理。它们是强大的透镜，让我们能够聚焦于细胞生命的某个方面——质量和能量的流动。要看到全貌，要理解代谢如何与细胞周期、基因表达和信号传导相互作用，我们需要更全面的方法，比如新兴的全细胞建模领域。这些雄心勃勃的项目旨在模拟单个细胞中的一切，创造出终极的数字孪生体。但它们是站在像 FBA 这样的更简单模型的肩膀上的，正是这些模型首先教会了我们，即使在活细胞令人眼花缭乱的复杂性中，也能找到简单而优雅的原理，并且借助一点数学，我们就能开始理解生命本身的逻辑。

应用与跨学科联系

我们已经花了一些时间研究游戏的规则——即控制细胞内分子复杂舞蹈的核心原理和机制。我们看到了质量如何守恒，能量如何流动，以及酶如何决定生命的节奏。但是，了解象棋的规则是一回事，欣赏特级大师的精妙策略则完全是另一回事。现在，我们将进入第二个领域。我们将探索这些基本的细胞代谢模型如何不仅仅是抽象的记账练习，而是实际上用于工程、医学和理解生物学最深层问题的强大工具。我们正在从单个建筑的蓝图转向设计整个城市，诊断其系统性故障，甚至观察它们随时间演化。

细胞即工厂：设计生命流水线

本质上，细胞是一位化学大师，以惊人的效率运行着数千个反应。它实际上就是一个微型工厂。因此，工程师自然会问的第一个问题是：我们能接管这个工厂吗？我们能重新利用它的机器为我们制造东西吗，比如生物燃料、药物或新型材料？细胞代谢模型是这项事业的关键，我们称之为代谢工程或合成生物学。

最直接的问题是效率问题：如果我们给工厂一定量的原材料，比如葡萄糖，我们可能获得的目标产品（如一种有价值的氨基酸）的绝对最大量是多少？这不仅仅是猜测，它是一个可以计算的数字。通过为每个原子——特别是碳原子——写下平衡表，我们可以追踪从输入到输出的路径。我们还必须尊重细胞自身的需求；它不能将所有资源都转移到我们的产品上，因为它需要产生能量和构件来维持生命。这些生物学上的必需品构成了我们系统的约束。通过将这些约束应用于我们的原子平衡表，我们可以以惊人的精确度计算出理论最大产量，为工程师在实验室中提供一个可以追求的“满分”。

但是我们如何告诉细胞制造什么呢？这就是强大的计算框架——流平衡分析 (FBA) 发挥作用的地方。FBA 要求我们定义一个“目标函数”——一个细胞目标的数学表达式。如果我们希望细胞尽可能快地生长，我们就将目标设定为最大化生物质。但如果我们希望它生产一种分泌到细胞外的有价值的化学品，我们只需告诉模型：你的新目标是最大化输出该化学品的反应通量。FBA 算法随后会解决这个难题，在不违反任何潜在的物理和化学约束的情况下，找到遍布整个网络的一整套反应速率来实现这一目标。这就像告诉 GPS 你的目的地；算法会计算出最佳路线。

然而，代谢工程的真正天才之处在于使细胞的目标与我们的目标保持一致。细胞的主要“愿望”是生长和分裂。强迫它花费宝贵的资源来制造一种（从它的角度看）“无用”的化学品可能很困难。最巧妙的设计是那些使我们的产品对细胞自身的生长变得不可或缺的设计。这被称为生长耦合生产。利用代谢模型，我们可以通过计算重新设计细胞的线路图，例如移除一个天然途径并放大一个工程途径。结果是一个系统，在该系统中，细胞生产生物质所需的关键内部代谢物的唯一方法是同时运行制造我们期望的外部产品的反应。在这样的菌株中，生长最快的细胞必然是最好的生产者。这为定向进化创造了一个强大的系统，我们可以简单地筛选快速生长的细胞，并自动获得高产量生产作为额外的好处。

细胞即战场：对抗疾病与治愈身体

那些让我们能够利用生命进行构建的工具，也赋予了我们前所未有的力量来对抗腐蚀生命的疾病。当致病菌侵入我们的身体时，这是一场代谢之战。病原体必须从宿主环境中搜寻资源并构建自身的生物质以进行增殖。我们可以利用代谢模型找到它的“阿喀琉斯之踵”。通过为病原体和其人类宿主分别建立模型，我们可以进行并排比较。我们寻找那些对病原体生存既必需又独特的反应，独特性意味着该途径要么在人类中不存在，要么产生人类细胞不制造的分子。满足这两个标准的反应是理想的药物靶点。抑制它对病原体是致命的，但对宿主无害，就像在敌方坦克中找到一个我们自己车辆中没有的等效关键引擎部件一样。

有时，疾病并非外来入侵者，而是我们自身细胞内部的功能失常。癌症就是一个典型的例子。我们现在发现，一些癌症是由“致癌代谢物”驱动的——这些常见的代谢物由于基因缺陷而大量积累，并开始造成严重破坏。例如，在某种类型的肾癌中，克雷布斯循环酶富马酸水合酶 (Fumarate Hydratase) 的突变导致其底物富马酸盐 (fumarate) 累积。过量的富马酸盐随后作为竞争性抑制剂，作用于一类完全不同的、通常调节细胞对氧水平反应的酶。结果是，癌细胞被欺骗，以为自己处于低氧环境，从而激活一种“假性缺氧”状态，即使在氧气充足的情况下也促进肿瘤生长。在这里，一个简单的酶动力学模型可以精确量化富马酸盐浓度的特定升高如何削弱靶酶的活性，从而将基因突变与下游的致癌信号直接联系起来。

这种详细的理解为个性化医疗打开了大门。并非所有癌症都相同，正如并非所有患者都相同。患者 A 的肿瘤可能严重依赖一条代谢途径，而患者 B 的肿瘤则依赖另一条。一个显著的例子是合成致死的概念。想象一个肿瘤细胞，它在一条主要的能量生产途径（比如氧化磷酸化，OXPHOS）上已经存在缺陷。该细胞通过过度依赖另一条途径来补偿，比如糖酵解以及随后的丙酮酸到乳酸的发酵。对于这个特定的肿瘤，一种抑制产生乳酸的酶 LDH 的药物将是毁灭性的，因为它切断了细胞处理其燃料的最后一条主要途径。然而，在具有功能齐全的 OXPHOS 的健康细胞或不同肿瘤中，同样的药物几乎没有效果，因为细胞可以简单地将其丙酮酸重新导入未受阻的 OXPHOS 途径。针对特定患者的代谢模型使我们能够预测这些合成致死相互作用，根据其肿瘤独特的代谢指纹，识别哪些药物对哪些患者有效。

细胞：一个动态的集成系统

到目前为止，我们的旅程一直将细胞视为一个处于稳态的系统，一个时间快照。但生命是动态的。细胞的目标和环境在不断变化。考虑一个噬菌体——一种感染细菌的病毒。一旦感染，它就会发动一场政变。随着时间的推移，它劫持细胞的机器，迫使它停止制造新的细菌，转而开始制造新的病毒。这个过程可以使用动态流平衡分析 (dFBA) 进行建模，其中目标函数本身随时间变化。最初，目标是最大化细菌生物质，权重为 100%。随着感染的进行，生物质生产的权重下降，而病毒颗粒合成的权重增加。在一个关键时刻，最优代谢策略会发生突然、剧烈的转变——一种“相变”——整个代谢产出从制造细胞部件切换到制造病毒部件。建模使我们能够预测这种代谢转换的确切时间。

代谢与细胞决策的这种整合不仅限于病理状态；它是复杂生命的一个基本特征。看看我们自己的免疫系统就知道了。当 T 细胞被激活以对抗感染时，它会经历大规模的代谢重编程，切换到快速糖酵解的状态。这不仅提供了能量，还提供了增殖成效应细胞大军所需的特定分子构件（如脂质、氨基酸和核苷酸）。相反，当一个 T 细胞注定要成为长寿的记忆细胞时，它会采取不同的代谢姿态，更多地依赖高效的脂肪酸氧化。这些状态由像 mTORC1 和 AMPK 这样的主信号中枢调控，它们感知营养物质的可用性和细胞能量状态。通过在不同营养条件下对 ATP、NADPH 和碳的通量平衡进行建模，我们可以看到为什么丰富的葡萄糖会自然促进生物合成的效应细胞程序，而能量稀缺和脂肪酸氧化则与记忆细胞的静息、生存导向状态内在相关。

也许这一原理最完美的例证是在发育生物学中，代谢有助于使改变生命的决定永久化。在发育过程中，一个祖细胞可能被一个嘈杂、波动的外部信号推向一个特定的命运。细胞如何做出承诺，锁定决定使其不再动摇？自然界找到的一种优雅解决方案是将新命运的遗传程序与特定的代谢状态耦合起来。例如，一个指定“命运 B”的主基因 B 可能同时开启一个代谢开关，转向 OXPHOS。一个仅在高 OXPHOS 活性期间产生的关键代謝物，随后可以作为基因 B 本身的共激活剂。这就创造了一个强大的、细胞内在的正反馈回路。一旦最初的外部信号足够强，将基因 B 的表达推过某个阈值，代谢开关就被触发。由此产生的代谢物生产接着将基因 B 锁定在高表达状态，使该决定变得稳健，且独立于最初的嘈杂信号。代谢状态充当了一种细胞记忆形式，巩固了细胞的新身份。

终极前沿：模拟生命本身

我们已经看到代谢模型如何用于设计工厂、对抗疾病和理解复杂的决策。这条路通向何方？系统生物学的终极抱负是创建一个“全细胞模型”——一个对细胞如此完整的计算机模拟，以至于它包含了每个基因、每个蛋白质、每个代谢物以及它们之间的每次相互作用。这样的模型将不是一个静态图表，而是一个硬盘上的动态生命实体。

要用这样一个模型来模拟试管中的进化需要什么呢？想象一下，我们想观察一种细菌演化出对抗生素的抗性。我们的模拟必须包含几个关键要素。首先，变异的来源：一个在复制过程中向基因组引入随机突变的模块。第二，从基因型到表型的机理联系：模型必须能够“读取”一个突变的酶基因，并预测这将如何改变酶的功能，例如其对抗生素的亲和力。第三，从表型到适应度的联系：细胞的代谢状态，现在因药物对靶酶的影响而改变，必须决定其生长和分裂速率。最后，模型必须拥抱生命固有的随机性，包含基因表达和化学反应中的随机“噪声”，这创造了对生存和适应至关重要的非遗传多样性。通过将所有这些部分在一个模拟环境中组合起来，我们可以释放一个虚拟细胞群体，一代又一代地观察突变的出现、经受选择的考验，最终一个抗性谱系出现并占据主导。这不是科幻小说；这是该领域正在积极追求的宏大挑战，而代谢模型构成了其根基。从计算单一化学品的产量到模拟宏大的进化历程，代谢的数学为我们提供了一个日益锐利的透镜，用以观察、理解并最终改造生命这一现象。