
自然界处于持续不断的变化之中。种群数量增减,物种出现又消失,分子被创造又被摧毁。我们如何理解这种不息的变化?一个出乎意料但強大的答案,源于数学中最优雅的框架之一:生灭过程。该模型将动态系统简化为其核心组成部分——随时间出现(“出生”)或消失(“死亡”)的个体实体——为描述从排队等到宏大的演化历程等各种现象提供了一种通用语言。尽管它很简单,但它解决了量化和预测由随机事件支配的系统行为这一根本性挑战。
本文全面概述了生灭过程,连接了理论与应用。在第一章“原理与机制”中,我们将剖析模型的核心机制,探讨出生率和死亡率如何决定系统命运,以及状态依赖等变体如何解释复杂的生物调控。随后,在“应用与跨学科联系”一章中,我们将跨越不同科学领域,揭示该模型非凡的通用性,展示同样的基本规则如何描述细胞的内部运作、大流行病的传播以及生命本身的演化历史。
想象一个由最简单规则构成的世界:事物出现,然后消失。一个新物种从旧物种中分化出来。一个病人康复,从感染人数中移除。一个顾客到达收银台;另一个完成购物后离开。一个分子在细胞内合成;另一个被降解。这本质上就是生灭过程的故事:一个强大而优雅的数学框架,用于描述以离散计数方式变化的系统。
这个想法的真正魅力在于其惊人的简洁性和令人难以置信的应用范围。仅通过关注两个基本事件——出生和死亡——我们就能建立起关于演化、流行病学、遗传学乃至排队等候这一平凡行为的惊人逼真的模型。让我们从头开始,探索这一过程的原理。
“出生”以特定速率发生是什么意思?假设我们正在观察一个生物体的单个谱系,我们说它的物种形成(出生)速率为。这并不意味着它像节拍器一样每百万年就产生一个新物种。自然界并非如此可预测。相反,该速率代表一种倾向性,一种瞬时概率。在任何无限小的时间片段内,我们的谱系分裂成两个的概率是。同样的逻辑也适用于灭绝,即“死亡”,其发生速率为。我们的谱系在那个微小时间间隔内灭绝的概率是。
这个简单模型的一个关键特征是事件的无记忆性。谱系不会“变老”或更“应该”发生一次物种形成事件。在任何时刻,它的未来只取决于它当前的状态,而非其过去的历史。这是马尔可夫过程的标志,它意味着直到下一个事件(无论是出生还是死亡)的等待时间遵循指数分布。
现在,如果我们不是一个而是有个相同的谱系呢?在最简单或线性的生灭过程中,每个个体都是独立的行动者。如果一个谱系有的出生倾向,那么个谱系的总倾向就是。因此,整个种群经历出生的总速率为,经历死亡的总速率为。整个系统的变化速率与其当前规模成正比。这个看似简单的假设是我们可以模拟从细菌到姓氏等一切事物指数增长的基础。
生灭过程的抽象结构——个体、出生、死亡和速率——就像一种通用语言,自然界和社會中的许多不同系统都在使用。
思考一下宏观演化这幅宏伟的画卷。在这里,一个“谱系”或物种就是我们的个体。一次“出生”是一次物种形成事件,即一个新物种出现,其每个谱系的发生速率为。一次“死亡”是一次灭绝事件,速率为。生物学家使用这个框架来理解生命的多样化,探索为什么像甲虫这样的一些类群物种如此丰富,而另一些则数量减少。
现在,将你的注意力转移到一个完全不同的场景:银行或超市。在排队论中,等待服务的人就是我们的“个体”。“出生”是新顾客的到来,“死亡”是现有顾客完成服务。该领域最基本的模型是M/M/1队列,它不过是我们线性生灭过程的重新包装。两个“M”代表“马尔可夫性”,意味着到达间隔时间和服务时间都呈指数分布——这是恒定出生率和死亡率的直接结果。描述恐龙兴衰的同一套数学方法,也可以预测你等待一杯咖啡的时间。
同样的故事也发生在我们自己体内。在癌症生物学中,个体是一个肿瘤细胞。细胞分裂是一次“出生”,而程序性细胞死亡(凋亡)或免疫清除是一次“死亡”。如果出生率超过死亡率,肿瘤就会生长。这一视角对于理解肿瘤如何扩张,以及新的、更具侵略性的突变克隆如何在该增长群体中出现并存活至关重要。
对于任何由生灭过程支配的种群来说,其最终问题是它的长期命运:它会繁荣壮大,还是注定灭绝?答案取决于出生率和死亡率之间的微妙平衡。
关键量是净分化率,定义为。的符号将过程分为三种基本情况:
超临界 ():当出生超过死亡时,净增长率为正。种群预期呈指数增长,如。然而,这只是一个期望值。随机性,或者说纯粹的坏运气,起着关键作用,尤其是在种群规模很小的时候。即使具有很强的增长优势,单个谱系也可能因偶然在站稳脚跟之前就灭绝。一个新谱系最终存活下来并避免这种早期随机灭绝的概率恰好是。这是一个至关重要的见解:增长并非必然,只是可能。
亞临界 ():当死亡占上风时,为负。种群预期呈指数衰减。在这种情况下,灭绝不仅是可能的,而且是必然的。
临界 ():这是出生与死亡完全平衡的临界情况,。预期种群规模随时间保持不变。看起来种群似乎可以在这种平衡状态下无限期地持续下去,但随机波动的隐匿特性确保了它不能。一系列的死亡事件可能导致一个无法挽回的局面。在临界过程中,最终灭绝也是必然的,尽管可能需要非常长的时间。
到目前为止,我们的故事一直是关于恒定速率的。但是,当游戏规则根据系统状态发生变化时会怎样?这正是生灭过程真正展现其活力的地方,揭示了关于调控、噪声和生物设计的深刻真理。
在许多生物系统中,失控的增长是灾难性的。细胞和生物体已经演化出复杂的负反馈回路来维持稳定性,即稳态。想象一个基因产生一种蛋白质,而这种蛋白质反过来又帮助关闭其自身的生产。这就是负向自动调控。
我们可以用一个速率是状态依赖的生灭过程来模拟这一点。设为蛋白质分子的数量。“死亡”率可能是一个简单的线性降解,。但是,“出生”或生产速率现在依赖于:例如,它可能随着的增大而减小,。项代表反馈:蛋白质越多,生产变得越慢。
这种设计的结果是什么?让我们考虑系统中的“噪声”——分子数量围绕其平均水平的随机波动。一个有用的度量是法诺因子,。对于一个具有恒定出生率的简单生灭过程,其稳态分布是泊松分布,其特性是方差等于均值,所以。这是随机性的基线水平。
值得注意的是,对于负反馈系统,可以证明法诺因子为。由于反馈强度必须为正,这个值总是小于1。这被称为亚泊松噪声。负反馈就像一个恒温器,主动抑制随机波动,使分子数量比偶然情况下要稳定得多。这种噪声的减少是生物学家所称的渠道化的定量体现——即发育或生理状态对随机扰动的稳健缓冲。
如果出生率本身是一个波动的量呢?这在基因表达中是一种常见情景。基因的启动子,即启动其转录为mRNA的区域,可以在“开启”状态(生产活跃)和“关闭”状态(生产沉默)之间随机切换。
这可以建模为一个与隐藏状态(启动子状态)耦合的生灭过程。当启动子处于“开启”状态时(以速率发生),mRNA分子以高速率出生。当它处于“关闭”状态时(以速率发生),出生率为零。同时,mRNA分子以恒定速率死亡。
这个“电报模型”导致生产以脉冲方式发生。其结果与负反馈相反:它放大了噪声。可以证明,该系统中的法诺因子大于1,这是超泊松噪声的标志。mRNA分子的分布比简单的泊松过程要宽得多,也更不稳定。
有趣的是,这种效应取决于时间尺度。如果启动子切换()相对于mRNA降解率()非常快,生产率会平均化,系统表现得像一个简单的生灭过程,其中。但如果启动子切换很慢,脉冲就会很长且不频繁,导致非常高的噪声。
生灭过程不仅是模拟未来的工具;它也是我们解读过去的主要镜头,尤其是在演化生物学中。但在这里我们面临一个深刻的挑战:我们很少能观察到过程的实际发生。相反,我们看到的是它的结果——例如,一个现存物种的系统发育树——并且必须尝试推断创造它的规则。
事情在这里变得棘手。想象你构建了一个所有现存灵長类动物的家谱。它是由物种形成和灭绝的生灭过程产生的。你能否仅通过观察树的分支模式(其拓扑结构)来判断灭绝率是多少?令人惊讶的答案是不能。一个高灭绝率和高物种形成率的过程可以产生一个在统计上与一个纯出生(尤尔)过程(零灭绝)产生的树拓扑结构无法区分的树。灭绝优先修剪掉较古老的分支,但其对幸存树形状的影响是微妙的。
灭绝的特征不在于形状,而在于分支的时间。高灭絕率造成一種被稱為“現時拉動”的現象,即幸存树中的分支事件看起来更集中于近代,因为较古老的谱系有更多的时间灭绝。
这暗示了一个更深层次的问题。如果物种形成率和灭绝率本身随地质时间变化,即和,那么仅从现存物种的树中将它们解开就变得根本不可能。存在无限多对速率函数可以生成完全相同的观测树。这种不可识别性是一个 sobering 的教训:历史记录是不完整的,过去的一些方面可能因灭绝的面纱而永远向我们隐藏。
更进一步的現實主義,比如承认物种形成并非瞬时,而是一个“ protracted ”过程,增加了更多的层次。新物种的启动和其“完成”之间的时间延迟留下了其独特的印记:生命之树中明显缺乏非常近期的分支。我们模型中每一层复杂性都揭示了阅读生命之书时新的潜在模式——以及新的挑战。
从其基本定义到其深刻的哲学意涵,生滅過程不仅是一个模型。它是一种思维方式——一个镜头,通过它,出现和消失的简单行为可以解释我们周围复杂、动态、不断变化的世界。
我们花了一些时间来了解生灭过程的机制。我们已经看到,它简单的概率规则——即个体以一定速率出生,以另一速率死亡——可以用数学精确地描述。但这才是真正乐趣的开始。这套机制是为了什么?自然界在何处使用这种优雅的随机游戏?
惊人的答案是:几乎无处不在。生灭过程不仅仅是一个数学上的奇趣之物;它是编织在生命世界结构中的一个基本模式。通过改变我们对“个体”、“出生”和“死亡”的定义,我们可以使用这单一、统一的框架来理解尺度相差数十个数量级的现象——从单个分子的瞬时状态到数百万年演化的宏伟历程。让我们踏上穿越这些尺度的旅程,见证这个思想的力量与美。
让我们从小处着手,从运行细胞机器的分子层面开始。在免疫细胞内,称为受体的分子必须在检测到威胁时向细胞核发出信号。它们部分通过称为ITAMs的蛋白质基序来做到这一点。这些基序上的位点可以被激酶(一种酶)磷酸化(添加一个磷酸基团),也可以被磷酸酶(另一种酶)去磷酸化。
我们可以将一个位点的磷酸化视为一次“出生”,将其去磷酸化视为一次“死亡”。如果一个ITAM有两个位点,其状态可以是0、1或2个磷酸化位点。“出生”率取决于激酶活性和未被占据的位点数,而“死亡”率取决于磷酸酶活性和被占据的位点数。通过为这个简单的三态系统建立生灭方程,我们可以计算出在任何给定状态下找到ITAM的确切稳态概率。结果表明,这个分布是一个简单、熟悉的二项分布,完全由激酶与磷酸酶活性的比率决定。这揭示了一个深刻的生物信号传导原理:细胞只需调整两种相对立的酶活性之间的平衡,就可以精确控制其受体的平均磷酸化状态,从而控制其信号的强度。磷酸基团嘈杂、随机的来来往往最终稳定在一个可预测的平衡状态。
让我们稍微放大一下视角,从单个分子到细胞内的细胞器。考虑线粒体,细胞的能量工厂。一个细胞必须维持一个健康的线粒体群体。在其生命周期中,线粒体可以分裂(“出生”)或被移除(“死亡”)。我们可以用生灭过程来模拟这个群体。但这个故事还有一个续集:当细胞自身分裂时,它不会计算线粒体的数量并小心地将一半分给每个子细胞。它是随机分配的。
这对生命提出了一个关键问题:细胞如何确保其后代继承到足够数量的可存活线粒体?生灭模型提供了一个优美的答案[@problemid:2616019]。该模型不仅让我们能够计算细胞分裂时线粒体的预期数量,还能计算方差——即围绕该平均值的“离散程度”。细胞器种群增长和分配过程的随机性都引入了噪声。模型表明,为了使子细胞中的相对变异保持在某个可容忍的阈值以下,母细胞必须将其平均线粒体种群维持在一个计算出的最小值之上。换句话说,一个庞大的群体充当了对抗生命不可避免的随机性的缓冲,确保了代际遗传的稳定性。
同样的逻辑也适用于细胞群体本身。在动脉粥样硬化等疾病的不幸背景下,动脉壁内的平滑肌细胞可以增殖形成病变。每个细胞克隆都始于一个创始细胞,其命运由细胞分裂(“出生”)与程序性细胞死亡或凋亡(“死亡”)的速率决定。我们曾用于分子和细胞器的相同方程,现在可以预测这些细胞克隆随时间的预期大小和整个概率分布,为我们提供了量化疾病进展的工具。
当然,现实世界是复杂的。当医生抽取血样来计算淋巴细胞时,测量永远不会完全准确。真实的、潜在的细胞群体正根据其自身的生灭过程演化,但我们对其的观察被测量误差所破坏。在这里,生灭过程成为一个更复杂的统计工具——状态空间模型——的核心组成部分。这个框架让我们能够将真实群体的机械论生灭模型与噪声的统计模型结合起来,从而从我们不完美的数据中推断出隐藏细胞群体最可能的轨迹。这是机械论理论与实用数据分析的有力结合。同样,当神经科学家使用先进的显微镜观察神经元树突上突触的形成和消失时,他们正在观看一个生灭过程的实际发生。通过将模型拟合到他们的观察结果,他们可以提取突触形成和消除的 underlying 速率,将图像转化为关于大脑可塑性的定量见解。
现在,让我们进行一次真正惊人的尺度飞跃。我们告别细胞和分子的世界,将注意力转向演化的广阔时间尺度。我们简单的出生与死亡游戏还能适用吗?绝对可以。
考虑基因组中的基因。在演化过程中,基因可以通过复制(“出生”)和删除(“死亡”)而丢失。一个基因家族只是一个相关基因的群体。它的大小——即该基因的拷贝数——根据一个生灭过程演化,其中“个体”现在是基因组内的基因。这使我们能够获取不同物种的基因组,比较它们的基因家族,并推断塑造它们的基因复制和丢失的历史速率。
但为什么要止步于基因呢?让我们考虑演化中的终极个体:物种。当一个新物种从一个祖先物种中产生时,这是一次“出生”。当一个物种灭绝时,这是一次“死亡”。生命之树,及其分支和终止的谱系,是在地质时间尺度上上演的宏大生灭过程的化石记录。通过分析从现存物种DNA重建的系统发育树中的分支模式和时间,我们可以利用生灭过程的数学方法来做一些非凡的事情:我们可以估计物种形成()和灭绝()的潜在速率。我们可以成为生物多样性的会计师,计算一个生物类群的净分化率(),并深入了解为什么有些类群物種丰富而另一些则不然。
这个框架可以变得更加强大。演化中的一个核心问题是某些性状是否是促进多样化的“关键创新”。鸟类的飞行演化或植物的花朵演化是否导致了新物种的爆发?我们可以通过使用状态依赖的生灭模型来检验这一点。在这里,我们允许物种形成率和灭绝率和依赖于某个特征的状态(例如,飞行与不飞行)。通过比较两种状态下速率不同的模型与速率相同的模型的统计拟合度,我们可以严格地检验这个假说。这种方法也揭示了科学推断的微妙之处;需要复杂的“隐藏状态”模型来确保我们不会错误地将多样化转变归因于我们感兴趣的性状,而实际上它是由某个其他未观察到的因素引起的。
最后,我们可以将来自现存物种的证据与过去的直接、有形的证据——化石记录——统一起来。化石化生灭(FBD)过程是一个美丽的综合体,正是这样做的。它将物种的多样化建模为一个生灭过程,然后在每个现存谱系上,叠加第二个随机过程——一个泊松过程——来控制化石形成和发现的罕见事件。这就创建了一个单一、连贯的概率框架,同时解释了现存物种的系统发育树、已知化石的位置和年代,以及化石记录中的空白。这是一个令人惊叹的例子,说明分层的随机过程如何能将不同形式的证据编织成一个单一、统一的生命故事。
让我们从遥远的过去回到紧迫的现在。当一种新病毒出现并在人群中传播时,我们再次观察到一个生灭过程。一次病毒的“出生”是一个传播事件:一个感染者将病毒传染给另一个人。一次“死亡”是将一个感染个体从传播者池中移除,无论是通过康復,还是不幸地,通过他们自己的死亡。
在疫情爆发期间,科学家们不断地从不同患者身上收集和测序病毒基因组。这些序列构成了一棵系统发育树,它是传播链的高分辨率地图。这棵树的分支形状和时间包含了丰富的信息。通过将生灭-取样模型应用于这棵树,流行病学家可以提取疫情的关键参数。他们可以估计传播率()、康復率(),甚至是病例被取样和测序的速率()。从这些参数中,他们可以计算出至关重要的基本再生数,,它告诉我们疾病传播的速度。这就是系统动力学:利用演化理论实时了解流行病动态。抽象的生灭过程成为公共卫生武器库中的一个重要工具,帮助我们理解和抗击大流行病。
从分子到细胞,从基因到物种,从生命之初到大流行的展开——生滅过程是自然界反复讲述的故事。其数学上的优雅仅与其解释力相匹配。它的简洁让我们看到了千差万别现象中的统一性,揭示了复杂多样的生命织锦往往是由出生与死亡这两种非常简单、重复的线索编织而成的。