传染病数学建模

玻尔百科

定义

传染病数学建模是流行病学的一个分支领域，通过将人群简化为易感者、感染者和康复者等仓室，利用数学框架来理解疾病传播的基本动态。该建模方法利用基本再生数（R0）来判定疫情是会扩大还是消亡，并为评估疫苗接种和社会距离等公共卫生干预措施的效果提供定量依据。此类模型的应用不仅限于人类间的传播，还能够为研究人畜共患疾病、环境风险以及疫情对经济的影响提供关键见解。

核心要点

SIR 和 SEIR 等仓室模型将人群简化为不同分组（如易感者、感染者、康复者），以理解疾病传播的基本动态。
基本再生数 ( $R_0$ ) 是一个关键阈值，它决定了流行病是会增长 ( $R_0 > 1$ ) 还是会消亡 ( $R_0 < 1$ )，使其成为流行病学中一个非常重要的量。
模型提供了一个评估公共卫生干预措施（如疫苗接种或社交距离）的框架，通过量化这些措施对传播动态和群体免疫阈值的影响。
这些模型的应用超出了人际传播的范畴，为理解人畜共患病（同一健康）、环境风险以及流行病的经济影响提供了关键见解。

引言

理解传染病暴发的轨迹是公共卫生领域最关键的挑战之一。虽然流行病看似混乱和不可预测，但它们受到可以被描述和分析的潜在原则的支配。核心问题一直在于缺乏一种形式化语言来解码病原体、宿主及其环境之间复杂的相互作用。数学建模提供了这种语言，它提供了一个强大的框架，使我们能够超越直觉，走向定量预测和控制。

本文旨在介绍这一重要领域。首先，我们将探讨流行病建模的原理与机制，解构仓室模型（SIR、SEIR）和至关重要的基本再生数 $R_0$ 等基础概念。我们将看到这些简单的结构如何揭示疾病传播的基本逻辑。随后，在应用与跨学科联系一节中，我们将展示这些理论工具如何应用于解决现实世界的问题，从管理医院暴发、为经济政策提供信息，到推进相互关联的“同一健康”（One Health）视角。读完本文，您将不仅清楚地了解这些模型是如何构建的，还将明白为什么它们在广泛的科学和社会领域中都是不可或缺的。

原理与机制

要窥探一场流行病的未来，我们不需要水晶球。相反，我们需要一种描述感染机制的方法——一种能够捕捉病原体、宿主和环境之间复杂互动关系的语言。数学建模提供了这种语言。它的目的不在于找到精确的数字，而在于理解支配疾病传播的原理。就像拆开时钟观察齿轮如何啮合一样，我们可以构建简单、透明的“玩具宇宙”来揭示流行病的逻辑。

将世界装入盒子：仓室模型

想象一下，我们可以根据整个人群相对于某种疾病的状态，将其分入几个大盒子，即仓室。这就是仓室建模的基本思想。其中最简单、或许也是最著名的是 SIR 模型。该模型假设每个人都处于以下三种状态之一：易感（Susceptible, $S$ ）、感染（Infectious, $I$ ）或康复（Recovered, $R$ ）。

个体最初是易感者。如果不幸被感染，他们会进入感染者仓室。在这里，他们可以将疾病传染给他人。经过一段时间后，他们要么战胜病原体并康复，获得免疫力，要么死亡。无论哪种情况，他们都将从传播链中移除，进入康复者仓室。这个流程很简单： $S \to I \to R$ 。

但是，人们是如何从 $S$ 状态转移到 $I$ 状态的呢？这正是该机制的核心。新感染的速率取决于易感者与感染者之间的接触。如果我们想象每个人都像气体中的分子一样随机混合，那么这种接触的数量将与易感者数量 $S$ 和感染者数量 $I$ 的乘积成正比。

这便引出了许多流行病模型的基石——发病率 (incidence rate)，通常写作 $\frac{\beta S I}{N}$ 。让我们来分解一下。 $I/N$ 项代表当前具有传染性的人口比例。对于任何一个易感者来说，这是他们下一次随机接触到可能传染疾病给他的人的概率。如果我们将这个概率乘以 $S$ ，就得到了一个与整个人群中可能发生的传染性接触总数成比例的项。最后一部分 $\beta$ 是一个参数，它将所有其他关于传播的因素都整合到了一个数字中：人们接触的频率，以及 $S$ 与 $I$ 之间的一次接触实际导致感染的概率。这种“频率依赖”的公式非常强大，因为它捕捉到了一个直观的想法：易感者面临的风险取决于疾病的患病率，而不仅仅是患病者的绝对数量。

当然，现实世界要复杂得多。如果从疾病中康复并不能获得终身免疫力呢？想想普通感冒，你可以一次又一次地得。在这种情况下，'R' 仓室作为最终目的地就没有意义了。相反，个体在康复后会直接回到易感者仓室。这就得到了 SIS 模型，其流程是一个连续的循环： $S \to I \to S$ 。选择 SIR 模型还是 SIS 模型并非数学上的偏好，而是生物学上的选择，完全取决于我们的免疫系统对特定病原体的反应方式。

对于许多疾病来说，还存在另一个关键的延迟。当你接触到像 SARS-CoV-2 这样的病毒后，会有一段时间病毒在你体内复制，但你还不能传染给他人。为了捕捉这一点，我们可以增加一个新的仓室：暴露（Exposed, $E$ ）。这就创建了 SEIR 模型，其流程为 $S \to E \to I \to R$ 。在 $E$ 仓室中度过的时间是潜隐期 (latent period)。这与孵育期 (incubation period)（出现症状前的时间）有细微差别。对于像 COVID-19 这样的疾病，一个人可能在感到不适之前就具有传染性（症状前传播），因此其潜隐期比孵育期短。增加这个“等候室”仓室使得模型的时间动态更加真实。

神奇数字： $R_0$

如果将一个感染者引入一个完全易感的人群中，他平均会传染给多少人？这个数字就是著名的基本再生数，即 $R_0$ 。毫无疑问，它是流行病学中最重要的量之一。

其重要性在于它的阈值行为。如果 $R_0$ 大于 1，每个感染者平均会传染给超过一个人。疫情将会增长，初期可能呈指数级增长。如果 $R_0$ 小于 1，每个感染者平均传染的人数将少于一个。传播链会逐渐中断并最终消亡。数百万人的命运可能取决于 $R_0$ 是 0.9 还是 1.1。

但 $R_0$ 不仅仅是一个抽象的数字，它是一个关于疾病的综合故事。我们可以将其分解为基本组成部分。在最简单的形式下，对于单一传染阶段， $R_0$ 是三个关键因素的乘积：

$R_0 = \beta \times c \times D$

这里， $\beta$ 是每次接触的传播概率， $c$ 是接触率（一个人每天与多少人互动）， $D$ 是传染期持续时间。这个简单的方程极具启发性。它告诉我们有三种方法来对抗流行病：降低每次接触的传播概率（如戴口罩、洗手），降低接触率（如社交距离），或缩短传染期持续时间（如抗病毒治疗）。对于像梅毒这样的疾病，它有高度传染性的一期和二期阶段，随后是传染性较低的潜伏期，这个框架揭示了为什么早期治疗如此关键。缩短早期高 $\beta$ 阶段的持续时间 $D$ 相比于治疗后期传染性较低的阶段，能够更大幅度地降低 $R_0$ 。

$R_0$ 概念的美妙之处在于其适应性。对于像登革热或盘尾丝虫病（“河盲症”）这样的媒介传播疾病，传播链更为复杂，但逻辑是相同的。 $R_0$ 成为两个主要步骤的乘积：一个受感染的人会传染给多少只蚊子，以及其中一只受感染的蚊子会继续传染给多少人。每一步都是概率和速率的链条。要让人类传染给蚊子，我们需要知道蚊子的叮咬率、人均蚊子数量、每次叮咬的传播概率以及人类的传染期有多长。然后，蚊子要传染给人类，它必须首先度过外源性孵育期（EIP）——病毒在蚊子体内复制所需的时间——然后，在其剩余的生命中，它必须以一定的传播概率叮咬易感人群。

这些组成部分中的每一个——蚊子寿命、叮咬率、传播概率、EIP——都可以用数学方式写下来。当它们相乘时，就构成了媒介传播疾病的 $R_0$ 。这使我们能够看到，例如，温度变化如何影响流行病。对于蚊子这种变温动物来说，较高的温度会加速它们的新陈代谢和病毒复制，从而缩短 EIP。较短的 EIP 意味着蚊子存活至具有传染性的机会更高，这会增加 $R_0$ ，并使流行病更具爆发性。

从 $R_0$ 中，我们还可以推导出群体免疫阈值 ( $h$ )，由 $h = 1 - 1/R_0$ 给出。这告诉我们需要多大比例的人口获得免疫（例如通过疫苗接种），才能将有效再生数推低至 1 以下并阻止传播。如果一种疾病的 $R_0$ 为 3，那么 $h = 1 - 1/3 = 2/3$ ，意味着三分之二的人口必须具有免疫力。这是一个极其简单的公式，却代表着一个极其重要的公共卫生目标。那么，如果我们计算出 $R_0$ 已经小于 1，比如说 0.9，会怎么样呢？那么 $h = 1 - 1/0.9 \approx -0.11$ 。一个负的阈值是一个绝佳的结果；这意味着即使没有任何免疫力，该疾病也无法在人群中持续传播。不需要群体免疫，因为群体本身已经是安全的。

拥抱复杂性：超越基本仓室

简单的 SIR 模型及其变体虽然优雅，但它们依赖于一个强大却往往错误的假设：即每个人都是相同的，并且与其他人随机混合。真实世界远比这更有结构。

以霍乱为例。要准确地对其建模，我们需要承认两个不便的事实：许多感染者是无症状的但仍会排出细菌，并且细菌可以在环境宿主（如水源）中存活。简单的 SIR 框架在这里失效了。如果没有症状性病例（ $I=0$ ），模型会预测疾病消失。但实际上，无症状携带者可以持续向环境宿主中播撒病菌，后者随后可以感染新的人。为了捕捉这一点，我们必须添加新的仓室：代表无症状携带者的 'A' 仓室和代表水中病原体浓度的 'W' 仓室。然后我们将它们联系起来： $I$ 和 $A$ 个体都将细菌排入 $W$ 中，而易感人群通过接触 $W$ 而生病。这个更复杂的模型突然可以解释霍乱为何能在重大暴发之间持续存在，以及为什么降雨事件（通过将细菌冲入供水系统）可以引发新的疫情高峰。

我们还假设了人群是同质混合的。这显然是错误的。我们的互动受社交网络——家庭、朋友、同事——的支配。对于性传播感染，这种网络结构至关重要。一个拥有数百个性伴侣的个体（网络中的“中心节点”）在传播疾病方面的影响力，与处于单偶制关系中的人相比，不成比例地巨大。在这些情况下，人群的平均接触数是一个具有误导性的指标。接触数的方差更为重要。由于中心节点更容易被感染，也更容易传播感染，网络异质性会极大地增加现实世界中的 $R_0$ ，远超简单质量作用模型所预测的数值。

如果人口本身不是静态的呢？人是会移动的。考虑一个拥有定居社区和临时移民营的地区。这两个群体的接触率、生活条件和初始疾病患病率可能大相径庭。对整个地区使用一个简单的 SIR 模型是错误的，它会把关键差异平均掉。我们可以用集合种群模型（metapopulation model）来解决这个问题——本质上它是一个 SIR 模型的 SIR 模型。我们分别对每个群体进行建模，各有其 $S_A, I_A, R_A$ 和 $S_B, I_B, R_B$ ，然后添加描述人群在它们之间流动的项。这使我们能够捕捉相互关联的异质群体的总体动态。

为了获得更精细的细节，我们可以完全放弃“自上而下”的仓室方法，转而使用“自下而上”的基于智能体的模型（Agent-Based Model, ABM）。在这种模型中，我们将每个人模拟成一个拥有自身属性和行为的独特“智能体”。我们可以为他们设定家庭、工作场所、日常时间表和特定的社交网络。ABM 不使用针对整个人群的微分方程；相反，它模拟数百万次个体互动，而流行曲线则自下而上地涌现出来。ABM 计算成本高昂且需要大量数据，但它们允许我们以仓室模型永远无法达到的细节水平来探索各种情景——例如关闭特定学校或工作场所。

最后，一句忠告。模型是地图，不是领土。一个拥有数千个参数、在一个流感季节的数据上训练出来的模型，可能完美地“预测”了该季节的结果。这就是过拟合（overfitting）。但是，当用一个具有不同病毒株和不同人群免疫状况的新季节数据来测试它时，其性能可能会崩溃。这就是为什么使用外部、未见过的数据进行模型验证不是一种奢侈；它是一种科学上的必需。它迫使我们区分真实的、可移植的因果关系与虚假的关联。我们的目标不是构建最复杂的模型，而是构建能够捕捉系统本质真实性的最简单模型——一个不仅适用于特定地点和特定时间，而且能揭示普遍适用原则的模型。

应用与跨学科联系

在我们之前的讨论中，我们阐述了数学流行病学的基础原理，学习了如何用仓室、速率和再生数等精确的语言来描述疾病的传播。这可能看起来像是一场理论练习，一场在黑板上用符号玩的游戏。但这个框架真正的力量和美妙之处，并不在于其抽象的公式，而在于它能够联系并阐明一系列广泛得惊人的现实世界问题。它是一面透镜，一旦打磨好，就能让我们看到从医院暴发到国家经济产出等一切事物背后的隐藏机制。

现在，让我们踏上探索这些应用的旅程，看看这种数学语法如何让我们能够将来自不同领域的紧迫问题，转化为一种我们可以分析、理解并最终采取行动的形式。

公共卫生与临床医学的核心

当然，我们的模型最直接的用途是在它们诞生的领域：疾病管理。以医院病房为例，这是一个小型的、自成一体的世界。当像耐药菌这样的感染开始传播时，我们该如何思考？我们可以将病房建模为一个封闭系统，一个更大社会的缩影，病人从易感者转为感染者，再到康复者。通过写下几条简单的规则——例如新感染率取决于易感者和感染者的混合接触数量——我们就可以构建一套完整的方程来描述疫情暴发。这个简单的 SIR 模型使我们能够在真实、高风险的医院环境中实施感染控制措施之前，就先探索各种“假设”情景。

同样的思维方式可以从医院病房延伸到单个患者。想象一位接受了器官移植的病人，其免疫系统被抑制，容易感染像巨细胞病毒（CMV）这样的病毒。医生面临一个关键选择：是给所有高危患者进行预防性抗病毒药物治疗（预防性策略），还是密切监测他们，仅在检测到病毒时才进行治疗（先发制人策略）。哪种更好？数学给出了一个惊人清晰的答案。病毒如果不受控制，会呈指数级增长。我们可以用一个以“倍增时间” $\tau$ 为特征的简单公式来模拟这种增长。更快的倍增时间意味着更具侵略性的病毒复制。只有在检测到病毒到疾病发作之间的时间窗口长于监测测试的间隔时，先发制人策略才是安全的。对于一个病毒复制速度快的高危患者来说，这个时间窗口可能非常短——甚至比每周一次的检测周期还要短。在这种情况下，模型告诉我们，等待敌人出现是一场不值得的赌博；预防性策略是更优的选择。对于病毒复制较慢的低风险患者，时间窗口更宽，使得先发制人疗法的“观察等待”成为一种安全合理的选择。在这里，一个简单的指数模型为个性化医疗提供了严谨的、定量的基础。

历史上最重要的教训之一，以臭名昭著的“伤寒玛丽” Mallon 的案例为代表，就是并非每个能传播疾病的人都明显生病。一些被称为无症状携带者的个体，可以在多年内携带并传播病原体而自身不表现出任何症状。我们的模型可以很好地处理这种情况。我们可以为有症状和无症状的个体创建独立的“感染”仓室，每个仓室都有其自身的传播率和传染期。通过将总的基本再生数 $R_0$ 计算为各组贡献的加权和，我们可以发现惊人的事实。一个有症状的人可能在短时间内具有高度传染性，而像 Typhoid Mary 这样的无症状携带者可能传染性较弱，但传染期非常长。模型表明，这些长期的、隐藏的携带者对疾病传播的总贡献可能是巨大的，有时甚至是主导性的。这一见解揭示了为什么公共卫生工作必须超越仅仅关注病人，而要考虑整个人群，才能有效切断传播链。

此外，风险很少是均一的。在任何人群中，一些人比另一些人面临更高的暴露风险。对于像疟疾这样的媒介传播疾病尤其如此——有些人简直就是“蚊子磁铁”。如果一群人平均受到的蚊子叮咬次数是另一群人的三倍，我们的模型预测，在其他条件相同的情况下，他们的新感染率也将是三倍。这种异质性原则至关重要。它解释了为什么疾病常常集中在“热点地区”，以及为什么像分发蚊帐这样的控制措施必须针对风险最高的人群才能最有效。平均值可能具有欺骗性；模型迫使我们关注风险的分布。

“同一健康”视角：人类、动物与环境

生命与疾病之网远远超出了人与人之间的接触。许多病原体从动物种群中溢出，而环境本身也可以充当宿主。“同一健康”（One Health）概念认识到人类、动物和环境的健康是密不可分的。数学建模是描述这种相互联系的天然语言。

以人畜共患的内脏利什曼病为例，这是一种由沙蝇传播的毁灭性寄生虫病。在许多地区，家犬是主要的动物宿主。为了保护人类，我们应该专注于治疗病人，还是应该针对犬只？传播模型使我们能够追踪整个传播路径：从一只受感染的狗，到叮咬它的沙蝇，再到后来被这只沙蝇叮咬的人。模型显示，人类的感染率与具传染性的沙蝇的流行率成正比，而后者又取决于犬类宿主的规模和传染性。通过实施犬类筛查和治疗计划，我们可以减少感染源。该模型厘清了整个因果链，并突出了成功的关键因素：计划的覆盖范围、筛查测试的灵敏度、治疗的有效性，以及至关重要的，那些可能被忽略的无症状但具有传染性的犬只所扮演的角色。

这种逻辑也延伸到了环境中的病原体。我们如何评估食用被污染水源灌溉的农产品的风险？我们可以通过使用一个名为“定量微生物风险评估”（Quantitative Microbial Risk Assessment, QMRA）的框架，超越“低风险”或“高风险”等模糊的定性标签。这种方法将整个过程形式化为一系列概率步骤：从牲畜排出的特定浓度的病原体进入河流，其中一部分存活下来并用于灌溉，导致一颗生菜上带有一定的“剂量”，当被食用时，根据剂量-反应曲线，会带来特定的感染概率。QMRA 使用概率语言将动物排泄、环境运输到人类暴露的各个环节联系起来，使我们能够计算出每份食物的实际感染概率。这为监管机构设定标准和比较不同干预措施（如改善水处理与改变农业实践）的有效性提供了理性依据。

与经济学和政策建立联盟

我们模型带来的见解不仅仅是学术性的；它们对政策和经济学有着深远的影响。它们为公共卫生支出的合理性提供了依据，并帮助我们理解一个国家人口的健康与其财富之间的深层联系。

群体免疫概念是支持疫苗接种最有力的论据之一。当一个人接种疫苗时，他们获得了直接的保护。但他们也为整个社区提供了间接的好处：因为自己不会被感染，所以也不会将疾病传染给他人。这是一种正外部性。我们如何为这种好处定价？当卫生经济学家使用简单的静态模型来评估疫苗的成本效益时，他们往往只计算直接好处，并假设感染风险是固定的。但我们的动态模型表明这是错误的。随着越来越多的人接种疫苗，社区内的传播会下降，每个人（包括未接种者）的感染风险都会降低。静态模型忽略了这个关键的反馈循环，因此系统地低估了疫苗项目的真实价值。通过计算有效再生数 $R_e$ 如何随疫苗覆盖率下降，我们可以量化全面的、全人群范围的效益，并为投资提供更有力的经济论据。

健康与财富之间的联系甚至更为深刻。疾病不仅在治疗上花费金钱，它还削弱了整个经济的生产能力。我们可以通过将我们的流行病学理解直接整合到经典的经济模型中来将其形式化，例如 Cobb-Douglas 生产函数，该函数将一个国家的总产出 ( $Y$ ) 描述为资本 ( $K$ ) 和劳动力 ( $L$ ) 的函数。疾病通过减少有效劳动力来发挥作用；一部分工人 $d$ 因病无法工作。有效劳动投入变为 $L(1-d)$ 。当我们将此代入生产函数时，影响立竿见影：疾病成为整个经济的拖累。一项公共卫生干预措施，如媒介控制或预防性药物，通过减少 $d$ 来起作用。在模型中，这等同于有效劳动力供给的增加，直接促进了国家的总经济产出。疾病控制不仅是一项人道主义善举，它也是一种经济刺激形式。

更深层次的博弈：生物学、进化与历史

这些模型最美妙的应用，或许是那些为生物学本身、甚至为科学史提供新视角的应用。它们能够揭示隐藏在病原体本质深处的真理，并帮助我们理解我们科学前辈们的思想。

以寄生蠕虫Onchocerca volvulus为例，它是河盲症的病因。这种寄生虫是雌雄异体的——它有独立的雄性和雌性，需要交配才能繁殖后代。这个简单的生物学事实带来了惊人的流行病学后果。一个宿主要想成为新的感染源，他们必须同时感染至少一条雄性和一条雌性蠕虫。在社区感染水平非常低的情况下，平均蠕虫负荷 $\lambda$ 很低。任何单个人同时拥有两种性别蠕虫的概率变得极小——它不成比例于 $\lambda$ ，而是与 $\lambda^2$ 成比例。这种在低种群密度下人均繁殖率下降的现象，被称为阿利效应（Allee effect）。它创造了一个“断点”：如果我们能通过大规模药物分发将平均蠕虫负荷推到这个临界阈值以下，寄生虫种群就无法自我维持。其出生率低于死亡率，最终走向局部灭绝。这种寄生虫的性生活成了它的阿喀琉斯之踵，这是我们的模型揭示的、也是我们的控制策略可以利用的弱点。

最后，让我们将模型的镜头对准的不是一种疾病，而是一个思想。在 19 世纪，在病菌学说被完全接受之前，伟大的流行病学家 William Farr 提出了“流行病体质”（epidemic constitution）的概念——一种神秘的、随时间变化的、似乎使整个人群易患疾病的大气或环境条件，导致不同的流行病同步起落。他仅仅是错了吗？我们的模型表明，他触及到了某些深刻的东西。我们可以通过引入一个共同的、随时间变化的因子来形式化他的想法，该因子会乘以所有疾病的传播率。如果这个代表（或许是）季节性天气或社会行为变化的因子在夏季达到顶峰，那么它将倾向于导致霍乱和麻疹在夏季同步达到高峰。然而，这个模型与病菌学说完全兼容。如果人群中不存在麻疹病毒，其传播率乘以零，再多的“不良体质”也无法凭空制造出一个病例。该模型为 Farr 的直觉概念赋予了精确、严谨的含义，使其与现代知识相协调，表明这是对流行病本质的一个虽不完整但却卓越的洞见。

从诊所到全球经济，从蠕虫的性生活到科学思想史，传染病数学建模提供了一种范围惊人的统一语言。它证明了将一套简单的思想用清晰精确的方式表达出来，并追随其逻辑直至终点的力量。

传染病数学建模

引言

原理与机制

将世界装入盒子：仓室模型

神奇数字：R0R_0R0​

拥抱复杂性：超越基本仓室

应用与跨学科联系

公共卫生与临床医学的核心

“同一健康”视角：人类、动物与环境

与经济学和政策建立联盟

更深层次的博弈：生物学、进化与历史

传染病数学建模

引言

原理与机制

将世界装入盒子：仓室模型

神奇数字：R0R_0R0​

拥抱复杂性：超越基本仓室

应用与跨学科联系

公共卫生与临床医学的核心

“同一健康”视角：人类、动物与环境

与经济学和政策建立联盟

更深层次的博弈：生物学、进化与历史

神奇数字： $R_0$

神奇数字： $R_0$