细胞建模

玻尔百科

定义

细胞建模是一个通过抽象化手段将复杂的生物细胞简化为物理对象、逻辑电路或化学工厂的计算与数学研究领域。该学科利用代理模型和微分方程等多种建模工具，在不同生物尺度上分析细胞过程以及粘附和趋硬性等生物物理行为。细胞建模在医学中具有重要作用，常用于设计和优化化疗方案及疫苗接种时间等治疗策略。

核心要点

细胞建模的力量在于抽象，通过将细胞视为物理对象、逻辑电路或化工厂来简化生物学的复杂性。
从基于智能体的模型到微分方程，多样化的建模方法工具箱被用于研究不同生物尺度上的细胞过程。
在医学领域，细胞模型对于设计有效的治疗策略至关重要，例如优化化疗方案和安排疫苗接种时间。
生物物理模型通过应用表面张力和能量最小化等基本物理原理，解释了细胞粘附和硬度趋性等力学行为。

引言

活细胞是一个极其复杂的宇宙，一个由相互作用的组分构成的动态系统，长期以来一直挑战着科学的理解。我们如何才能揭示一个同时是化工厂、物理机器和信息处理器的系统的逻辑呢？挑战不在于缺乏数据，而在于解释数据的困难。本文探讨了强大的细胞建模领域，该领域并非通过捕捉每一个细节来应对这一挑战，而是通过战略性简化的艺术，即抽象。它提供了一个框架，用于将错综复杂的生物过程转化为可理解和可预测的计算模型。

这次探索之旅将分为两个主要部分。首先，在“原理与机制”中，我们将探讨细胞建模的基本理念。我们将深入研究观察细胞的不同“视角”——将其视为受热力学支配的物理对象、处理信息的逻辑网络和受约束的新陈代谢经济体——并检视现代生物学家工具箱中可用的各种计算工具。随后，在“应用与跨学科联系”中，我们将看到这些模型的实际应用，发现它们如何指导医学治疗、为生物工程设计提供信息，并揭示生物学与其他复杂系统之间深刻的联系。

原理与机制

要建立一个细胞模型，我们必须首先问一个看似简单的问题：细胞是什么？是一个微小的、柔软的化学物质袋？一台极其复杂的机器？一个自我复制的计算机程序？事实上，它兼具所有这些特征，甚至更多。建模的秘诀不在于捕捉这种复杂性的每一个细节。恰恰相反，模型的力量在于其深思熟虑的简化——其巧妙的抽象。我们选择一种能抓住我们希望理解的现象之本质的现实表征，一种对现实的漫画式描绘。

这一理念是构建首个“全细胞”计算模型这项宏伟工作的核心。领导该项目的科学家们没有选择复杂的人类细胞，而是选择了微不足道的生殖支原体 (Mycoplasma genitalium)。为什么？因为它过去是，现在也是已知最简单的自由生命形式之一。它拥有所有生物中最小的基因组之一，而且很方便的是，它没有坚硬的细胞壁，这简化了对其物理结构和生长的模拟。其目标不是要模拟生命的所有辉煌之处，而是首先攻克最简单的情况——这是科学策略的真正杰作。

让我们自己尝试一下。以常见的大肠杆菌 (Escherichia coli) 为例。我们可以从将其建模为一个简单的几何对象开始：一个具有特定长度和直径的圆柱体。在内部，其整个基因组，一个单一的环状染色体，被压缩在一个称为拟核的区域。它占据了多大空间？通过估算每个DNA碱基对的有效体积，并知道碱基对的总数，我们可以计算出拟核的体积。将其与细胞总体积进行比较，我们得出一个惊人而具体的数字：DNA及其相关机器约占整个细胞体积的12%。这个简单的粗略计算揭示了一个深刻的真理：细胞不是一个空洞的洞穴，而是一个极其拥挤的环境。这一认识立即为我们接下来的问题框定了方向：任何物质如何找到其正确的位置？信号如何穿过这个密集的分子丛林？

存在的物理学：作为物理对象的细胞

细胞并非存在于真空中。它对其周围环境进行推、拉和粘附。事实证明，我们可以通过将细胞视为一个受永恒物理定律（如液滴）支配的简单物理对象，来理解许多这些行为，而无需援引复杂的生物学知识。

想象一个细胞降落在一个表面上，就像一滴雨水落在窗玻璃上。细胞膜，如同液滴的表面，具有表面张力 $\gamma_{cm}$ ，它试图将细胞拉成一个完美的球体以最小化其表面积。同时，细胞与基底之间的粘附力将其向外拉，促使其铺展开。基底本身与周围的液体介质之间也存在张力。细胞必须找到一个平衡点，一个能使系统总能量最小化的形状。这种平衡导致细胞呈现球冠形状，由一个特定的接触角 $\theta_c$ 定义。

通过应用能量最小化原理，可以推导出一个优美、简洁而强大的关系式，即杨-杜普雷方程（Young-Dupré equation）。它将剥离细胞所需做的功——即粘附功 $W_{ad}$ ——与细胞自身的表面张力及其形成的最终接触角联系起来： $W_{ad} = \gamma_{cm}(1 + \cos\theta_c)$ 。这非常了不起。它告诉我们，仅通过测量一个粘附细胞的形状，我们就可以量化其附着力的物理强度。一个复杂的生物学行为——粘附——被同样支配着肥皂泡和露珠的物理学原理优雅地解释了。在这种观点下，细胞是一个努力达到热力学平衡的物体。

生命的逻辑：作为网络的细胞

但细胞不仅仅是一个物理液滴。它是一个活跃的、处理信息的系统。其核心是一个基因网络，这些基因通过一个复杂的逻辑网络相互调节彼此的活动。一个基因的产物可能会激活另一个基因，而后者又可能抑制第三个基因。为了对此进行建模，我们可以进行另一个深刻的抽象：我们可以将基因网络视为一个计算机电路。

在这种最简单的版本中，即布尔网络，每个基因都是一个开关，可以是“开”（1）或“关”（0）。支配网络的规则是简单的逻辑门：与、或、非。例如，一个规则可能规定，多能性基因 P 只有在两个分化基因 M 和 E 都为“关”时才保持“开”状态。

当我们让这样的网络运行时，会发现一些惊人的现象。从任何初始的开/关状态配置开始，系统最终都会陷入一种稳定模式。其中一种模式是不动点吸引子，这是一种一旦达到就永不改变的状态。在一个细胞分化模型中，我们可能会发现三个不动点：一个只有中胚层基因 M 为开，一个只有外胚层基因 E 为开，还有一个所有基因都为关。这些吸引子是模型对稳定、分化的细胞命运的表征。因此，分化过程被描绘为穿越一个由可能基因状态构成的景观的旅程，景观中的山谷代表着最终的、稳定的细胞类型。

但如果我们要建模的过程不是以静态结束，而是无限重复的呢？考虑细胞周期，即生长和分裂的节律性进程。在这里，系统会陷入一个循环吸引子。它不会稳定在单个状态，而是进入一个重复的状态序列。例如，一个简单的三基因细胞周期模型可能会经过一个包含五个不同状态的循环，然后返回起点重新开始： $(0,0,0) \to (1,0,0) \to (1,1,0) \to (0,1,1) \to (0,0,1) \to (0,0,0)$ 。因此，吸引子的概念是一个统一的原则，它优美地描述了分化的稳定终点和像细胞周期这样生命的动态振荡引擎。

细胞的经济学：约束与平衡

看待细胞的另一种方式是将其视为一个微型化工厂。它输入原材料（营养物质），通过复杂的装配线（代谢途径）进行加工，并输出成品（产物）和新的工厂部件（生物质）。这个代谢网络可能涉及数千个反应。试图通过测量每一个酶的动力学速率来对整个系统进行建模是一项艰巨的，甚至是不可能的任务。

在这里，建模者采用了一种不同且极其巧妙的抽象形式：基于约束的建模。我们不关心详细的动态过程，而是施加一个强大而单一的假设：稳态。在一个稳定生长的细胞中，内部代谢物的浓度是不变的。对于任何给定的代谢物，产生它的反应总速率必须与消耗它的反应总速率完全平衡。

这个简单的想法应用于整个网络时，会产生一个线性方程组，该方程组约束了可能的反应速率，即通量。这种称为通量平衡分析（FBA）的技术，使我们能够在不了解详细动力学的情况下预测细胞的代谢能力。例如，通过设定生物质的生产必须以特定速率（ $v_5$ ）进行，我们可以利用平衡方程求解出产物（ $v_4$ ）必须以何种确切速率被分泌，以维持内部平衡。该建模框架还强调了交换反应的关键作用，这些反应代表了分子的输入和输出，是细胞内部经济与外部世界之间的接口。

命运的景观：从快照到影像

状态空间、轨迹和吸引子这些抽象概念很优美，但我们能真正看到它们吗？在一项实验技术与计算建模的里程碑式融合中，答案是肯定的。像单细胞RNA测序（scRNA-seq）这样的现代技术，允许我们同时捕捉成千上万个单细胞的基因表达水平快照。如果我们从一个正在经历分化等过程的细胞群体中获取这个快照，我们将捕捉到处于各个阶段的细胞混合体：干细胞、中间细胞和成熟细胞。

问题在于这个快照是静态的；我们不知道哪个细胞在前，也不知道它走了哪条路径。这时模型就派上用场了。一种称为伪时间分析的计算方法根据基因表达谱的相似性对细胞进行排序。它将静态的快照拼接成一条连续的轨迹，就像将一堆散乱的个人照片按从婴儿到老年的顺序排列一样。

这条推断出的轨迹是一个模型——一个关于单个细胞随时间推移所采取的发育路径的假说。它将一个静态数据集转化为一个动态影像，揭示了驱动细胞从一个状态转变为另一个状态的基因表达变化序列。它使得细胞在高维“表观遗传景观”中穿行的抽象概念变得具体可见，而这一切都建立在对真实细胞的测量之上。

建模者的工具箱：选择正确的视角

我们已经看到细胞被建模为几何固体、液滴、逻辑电路、化工厂以及在抽象景观中移动的点。没有一个单一的“正确”模型。相反，现代生物学家拥有一个丰富的建模范式工具箱，而细胞建模的艺术在于为当前问题选择合适的工具——合适的视角。

考虑一个复杂的生物过程，比如炎症。这是一个涉及不同尺度上不同角色的多尺度戏剧。为了对其建模，我们需要一种混合方法，一个由不同模型协同工作的工具箱。

对于信号分子（细胞因子）在组织中的扩散，当涉及数万亿个分子时，我们可以将它们视为一个连续场，并使用偏微分方程（PDEs）（如热方程）来描述它们的传播。
对于向炎症部位爬行的免疫细胞（中性粒细胞），我们必须将它们视为个体。它们的运动是跳跃和随机的，它们做出个体“决策”，它们的集体聚集行为源于局部相互作用。在这里，基于智能体的模型（ABM）是完美的工具，它将每个细胞模拟为一个拥有自身规则的离散智能体。这就像将人群建模为流体密度与模拟人群中每个人的区别。
在每个细胞内部，对于仅有少数几个拷贝的转录因子，其与DNA的结合是一个根本性的随机事件。确定性速率在此毫无意义。这里我们必须使用基于化学主方程的随机模型来捕捉噪声和概率的关键作用。
对于信号通路中一个蛋白质可以被以数十种方式修饰（例如，在多个位点磷酸化）的情况，可能的分子状态数量会呈组合爆炸式增长。手动写出每一个反应是不可能的。基于规则的模型通过根据分子模式定义反应来解决这个问题，让计算机自动生成庞大的反应网络。

这些选择中的每一个都涉及认知上的权衡。PDE模型为我们提供了化学梯度的优美连续图像，但它平均掉了单个分子的身份和随机性。ABM捕捉了单个细胞至关重要的异质性，但计算量大且难以分析。随机模型忠实于分子世界的概率性质，但模拟速度可能很慢。细胞建模的精妙之处不在于找到一个主方程，而在于巧妙地选择和组合这些不同的视角，以创造一幅易于处理、可预测且最重要的是富有洞察力的生命复合图景。

应用与跨学科联系

在熟悉了细胞建模的原理和机制之后，我们现在来到了旅程中最激动人心的部分。这一切有什么用呢？一个科学思想的真正力量和美妙之处，并不在于其抽象的完美，而在于它与现实世界联系的那些令人惊讶和深刻的方式。一个好的模型是连接理论与实践的桥梁，是揭示隐藏模式的透镜，是用于建设和治疗的工具。现在，让我们探索细胞建模已成为不可或缺伴侣的广阔应用领域，它指导着我们在医学中的实践、在工程中的设计，以及我们对复杂性本身的理解。

作为患者的细胞：医学和药理学中的建模

细胞建模最直接、影响最深远的应用或许是在对抗人类疾病方面。在这里，模型从学术练习转变为拯救生命的工具，使我们能够在虚拟世界中模拟疾病并测试治疗方法，然后再应用于患者。

考虑癌症化疗的挑战。许多药物被设计成仅在细胞分裂周期的特定阶段攻击细胞。例如，一种药物可能靶向DNA合成（ $S$ ）期。在一个包含处于周期各个阶段的细胞混合体的肿瘤中，单次给药只会影响一小部分癌细胞，而其余的则会继续其致命的增殖。我们如何能做得更好？

一个将细胞周期视为具有确定持续时间的状态序列（ $G1$ 、 $S$ 、 $G2/M$ ）的简单模型，提供了一个绝佳的策略。我们可以使用第一种药物来同步肿瘤，将所有细胞阻滞在易受攻击的 $S$ 期的起跑线上。然后，一旦细胞聚集起来，我们就在阻滞解除的瞬间施用第二种细胞毒性药物。模型预测，这种“组合拳”可以极大地增强药物的效力，将一种普通的武器变成一种极其精准的武器。这不仅仅是理论上的收益；它已成为现代肿瘤学基石的联合化疗方案的基础。

同样的思维方式也延伸到医学的其他领域，比如免疫学。像利妥昔单抗（rituximab）这样的强效药物，用于治疗类风湿性关节炎等自身免疫性疾病，其作用机制是耗尽一种称为B细胞的特定免疫细胞。但这些B细胞正是我们的身体需要用来对疫苗产生有效反应的细胞。这就产生了一个临床困境：使用利妥昔单抗的患者何时可以安全有效地接种年度流感疫苗？一个描述治疗后B细胞经过数月逐渐恢复的直接动力学模型提供了答案。通过对B细胞群体的恢复进行建模，临床医生可以推荐一个最佳的疫苗接种窗口——或者在用药前很久，或者在用药后很久，当免疫系统有时间重建时。这个细胞群体动力学的简单应用直接为患者护理和公共卫生提供了信息。

更复杂的疾病模型可能会将这些群体动力学与细胞环境模型相结合。例如，为了理解实体瘤的生长，我们可以构建一个混合模型，其中离散的、随机的癌细胞为一个连续扩散的营养场而竞争。这些多尺度模型是“虚拟人”项目的核心，旨在创建生理学和疾病的全面模拟。

作为工程师的细胞：生物物理学与生物工程

细胞不仅仅是群体中的抽象实体；它们是物理机器。它们是软物质工程的奇迹，通过电、化学和机械力与环境相互作用。细胞建模让我们得以窥探这个细胞力学世界，并将其用于生物工程。

让我们从细胞的电学特性开始。一个细胞本质上是一个包裹在薄薄的油性膜中的微小盐水滴。这样一个物体如何响应外部的交变电场？一个简单的物理模型，将细胞质视为具有一定介电常数的导电介质，揭示了一种有趣的频率依赖行为。在低频下，移动离子有足够的时间冲到细胞外围，产生一个反向电场来屏蔽内部。在非常高的频率下，离子跟不上，外部电场会深入穿透。我们的模型可以计算出发生这种转变的精确交叉频率。这个原理不仅仅是一个奇特现象；它对于像电穿孔这样的生物工程技术至关重要，该技术利用高压脉冲在细胞膜上瞬时打开孔隙以递送药物或基因。

更引人注目的是细胞感知并响应其周围环境物理硬度的能力，这种现象被称为硬度趋性（durotaxis）。一个在表面上爬行的细胞可以“感觉”到下方的基底是像明胶一样软还是像塑料一样硬，并且它通常选择向更硬的区域迁移。这怎么可能呢？通过将细胞内部的细胞骨架建模为一种“活性物质”——一种能够产生自身内部应力的材料——我们可以找到答案。如果细胞的应力产生机制在较硬的表面上工作得更剧烈，那么基底硬度的梯度将产生一个净内部力，拉动细胞前进。一个基于活性液晶物理学的模型可以精确推导出细胞沿硬度梯度上升的速度。这个过程对于组织形成和伤口愈合至关重要，其失调在癌症转移和纤维化等疾病中起着关键作用。通过建模来理解它，是迈向控制它的第一步。

除了单细胞力学，建模还帮助我们量化整个组织的结构。当病理学家观察活检切片时，他们看到的是细胞的复杂排列。这些细胞是随机分布的，还是组织成簇或规则的模式？通过将细胞的位置视为空中的点，我们可以应用从生态学和天文学等领域借鉴来的空间统计学的强大工具，来定量地回答这个问题。像里普利K函数（Ripley's $K$ ）这样的函数可以揭示肉眼无法察觉的细胞类型之间微妙的聚集或排斥现象，为疾病提供强有力的诊断特征。

作为计算机的细胞：信息、复杂性与发育

也许对细胞最深刻的视角是将其视为一个信息处理系统。细胞执行一个编码在其DNA中的发育“程序”，处理来自环境的信号，并做出决定其命运的决策。在这里，细胞建模成为理解生物计算的工具。

一个基本的见解来自一类非常简单的模型，即元胞自动机。想象一条一维的细胞线，每个细胞可以处于两种状态之一（比如，有色素或无色素）。下一代每个细胞的状态由一个简单的、基于其自身状态及其近邻状态的局部规则决定。从单个起始细胞开始，即使是一个非常简单的规则也能生成令人惊叹的复杂模式，其中充满了错综复杂的结构和看起来完全随机的区域。这展示了自然界的一个深刻原理：巨大的复杂性不一定需要复杂的蓝图。它可以从简单局部规则的重复应用中自发涌现。

为了理解细胞内部运行的“软件”，我们可以对控制其行为的基因调控网络进行建模。一个常见的情景涉及一系列事件：一个外部信号触发一个近乎瞬时的磷酸化级联反应，这反过来又启动了一个缓慢得多的基因表达过程。当我们写出常微分方程（ODEs）来对此建模时，我们发现一个被称为刚性（stiffness）的数学特性。这源于快速化学反应和缓慢蛋白质合成之间巨大的时间尺度分离。这种刚性不仅仅是数值计算上的麻烦；它是生物电路的一个基本设计原则。它使细胞能够对即时变化高度敏感，同时在其长期决策中保持稳健的稳定性。

我们如何系统地逆向工程这个生物软件呢？这就是前沿实验技术与计算建模相遇的地方。在一种名为Perturb-seq的方法中，科学家可以使用CRISPR基因编辑技术创建一个庞大的细胞池，其中每个细胞都有一个不同的基因被禁用。通过使用单细胞RNA测序，他们可以读出成千上万个这些细胞的完整转录“状态”，并对每一个细胞识别出被扰动的基因。通过将这个庞大的数据集与像RNA速度（RNA velocity）这样的推断细胞发育方向的计算模型相结合，研究人员可以构建一个基因如何控制细胞命运的因果图。我们可以看到“破坏”代码的一部分（一个基因）如何改变发育轨迹，将细胞推向一种命运或阻止其走向另一种命运。这不仅可以通过破坏基因来实现，还可以通过可控地将其下调（CRISPRi）或上调（CRISPRa）来实现，这给了我们前所未有的能力来调试生命程序。

模式的统一：从细胞到代码

我们从为理解生物学而对细胞建模开始。我们最终认识到，我们开发的工具其影响范围远超于此。一个模型力量的最终证明是其普适性。

考虑一个富有创造性、令人脑洞大开的类比。让我们将用于模拟细胞谱系和分化的概念——状态转换、祖先的有向图、分支和合并的命运——并将其应用于一个完全不同的演化系统：一个像Git这样的软件仓库。在这里，每一次“提交”（commit）都类似于一个细胞。提交的历史形成了一个谱系树。当开发者创建一个“分支”（branch）来开发一个新功能时，就像一个细胞在分化。当该功能被“合并”（merge）回主代码库时，就像发育路径的汇合。

令人惊讶的是，这个类比是成立的。我们可以使用相同的图论指数来量化一个软件项目中的分支和合并，就像我们对一个发育中的胚胎所做的一样。我们甚至可以应用非平衡热力学的概念，计算代码库演化的“熵产生”，以此来衡量其不可逆的、创造性的进展。

这个类比的成立是一个深刻的陈述。它告诉我们，我们发现的数学结构——状态、转变和历史的逻辑——并非生物学所独有。它们是复杂系统在形成过程中的普遍模式。我们从一个具体问题开始，比如理解一个细胞，最终得以一窥支配着生长和演化的更深层次、统一的逻辑，无论是在一个有机体中，还是在一个软件中。这，终究是我们的模型帮助我们看到的科学内在之美。