try ai
科普
编辑
分享
反馈
  • 系统建模

系统建模

SciencePedia玻尔百科
核心要点
  • 复杂系统的行为源于其结构,该结构由存量(累积量)、流量(变化率)以及连接它们的反馈回路(增强型或平衡型)组成。
  • 建模方法可以采用“自上而下”的方式,使用系统动力学来分析聚合模式;也可以采用“自下而上”的方式,使用基于主体的建模来观察复杂行为如何从个体互动中涌现。
  • 模型服务于不同的目的,从描述性图谱和预测性“黑箱”模型,到能够进行强大“情景”分析的解释性“透明箱”机理性模型。

引言

在一个由错综复杂的网络和相互关联的挑战(从公共卫生危机到气候变化)所定义的世界里,简单的因果推理往往力不从心。系统建模提供了一种强大的语言和工具集来理解这种复杂性,使我们能够明白一个系统的结构如何随时间推移产生其行为。它弥合了我们直觉假设与我们在现实中观察到的、往往是反直觉的结果之间的鸿沟。本文旨在作为这一重要学科的指南。第一章“原理与机制”将解构任何系统的基本构成要素——从边界和反馈回路到模型构建的哲学。随后的“应用与跨学科联系”将展示这些原理如何应用于解决计算机科学、环境管理和公共政策等不同领域的实际问题,揭示系统思维的深远影响。

原理与机制

谈论一个“系统”本身就是一种大胆的声明。它意味着在沙滩上画一条线,将宇宙的一部分与其他一切分离开来,并宣称:“这部分,我想要理解。”任何系统建模者的第一步都不是写下一个方程,而是画出一个边界。这个边界,这个想象中的膜,定义了我们的​​控制体​​。内部是系统;外部是其环境。想象一位研究海湾的海岸海洋学家。系统可能是海湾地理范围内的水体,从海床到波光粼粼的表面。环境则是其他一切:注入淡水的河流,交换热量和气体的大气,以及在海湾口引起潮汐的浩瀚海洋。

一旦我们画好了边界,我们的注意力就转向了穿越边界的东西。系统与其环境之间的交换被称为​​通量​​——物质、能量或信息的通量。我们的海湾是一个​​开放系统​​,因为它与周围环境自由地交换这三者。而一瓶密封的葡萄酒则是一个近乎​​封闭系统​​:它可以与酒窖交换热量,但酒本身不会流向任何地方。一个什么都不交换的孤立系统,是一个有用的理论理想,就像完美的真空或无摩擦的表面;它是一个帮助我们思考的概念,但在现实世界中很难找到。建模的艺术始于这个至关重要的边界选择。边界画得太窄可能会忽略一个关键影响;边界画得太宽则可能创建一个过于笨重以至于无用的模型。

变化的节奏:存量、流量和反馈

定义了系统之后,我们向内观察。我们常常发现一些随时间累积或消耗的数量。我们称之为​​存量​​。存量是一种记忆,一段历史。浴缸里的水量是一个存量。流行病中感染的人数是一个存量。一段关系中的信任度是一个存量。

存量的变化并非凭空发生。它们被​​流量​​所改变——即填充或排空存量的变化率。浴缸里的水位(存量)因水龙头的流入而上升,因排水口的流出而下降。许多系统模型的核心是一组方程,其表述很简单:一个存量的变化率等于其总流入减去总流出。这就是累积原则,一个简单的记账规则,支配着从你的银行账户到大气中的碳的一切事物。

但真正有趣的地方在于,在大多数系统中,流量不是恒定的。流量的速率往往取决于存量本身的水平。这种依赖性创造了​​反馈回路​​,这是驱动所有复杂系统行为的无形引擎。

反馈回路有两种基本类型。第一种是​​增强回路​​,或称正反馈。在这些回路中,存量的变化引发了一系列事件,导致同方向上更大的变化。“越多,则更多。”想象一个滚下山的雪球,或者一个病毒式视频的传播。在一个新健康策略的模型中,采用该策略的诊所越多,产生的同伴压力或“口碑”效应就越大,从而加速了采用率,导致更多人采用。这是指数增长的引擎。

第二种类型是​​平衡回路​​,或称负反馈。这是稳定和调节的引擎。在这里,存量的变化会触发一个与原始变化相反的响应。“越多,则增长越慢。”这是一种寻求目标的行为。你的恒温器是一个经典的例子:当房间变得太热(热量存量上升)时,恒温器会关闭暖气(减少热量流入),使温度回到其设定点。在我们的健康策略模型中,随着采用者比例的增长,潜在新采用者的池子会缩小,自然减缓了传播速度。或者,如果采用速度超过了卫生人力的承载能力,职业倦怠可能会增加,对该项目的支持可能会减弱,从而为进一步的采用踩下刹车。

系统随着其相互作用的增强和平衡回路的节奏而舞动。初创公司的爆炸性增长,随之而来的是减缓其发展的成长的烦恼。一个物种的种群激增,随之而来的是限制其数量的资源稀缺。理解一个系统就是要识别其关键的存量、流量以及连接它们的反馈回路。正是这种结构产生了系统的行为——其方式常常是深度反直觉的。一项用心良苦的政策如果与一个看不见的平衡回路相悖,或者无意中加强了一个失控的增强回路,就可能失败甚至适得其反。这些“意外后果”并非随机;它们是一个系统反馈结构的逻辑结果。

见森林的两种方式:自上而下与自下而上

我们如何着手构建这些结构的模型?有两种宏大的哲学,两种看待世界的不同方式。

第一种方法,通常称为​​系统动力学​​,是“自上而下”的。它从宏观角度看待世界,对整个群体的存量和流量进行建模。我们不关心单个的人、动物或分子;我们关心的是它们的总数。我们看到的是森林,而不是个别的树木。这对于理解由反馈回路驱动的大尺度模式和长期动态非常强大。

但有时,树木也很重要。有时,个体的多样性和互动恰恰是我们需要理解的。这就引出了第二种哲学:“自下而上”的​​基于主体的建模(ABM)​​。在ABM中,我们不为整个群体编写方程。相反,我们创建一个由单个“主体”组成的虚拟世界。每个主体都可以是不同的——即异质性的——拥有自己的属性和简单的局部行为规则。一个病患主体可能对在诊所等待有特定的容忍度;一只鸟类主体可能有一条规则,即当捕食者过于靠近时飞走。

ABM的魔力在于​​涌现​​。从许多异质性主体的简单、局部互动中,可以涌现出复杂且出人意料的大尺度模式——这些模式并未被明确编程进主体的规则中。在一个疫苗接种运动的模型中,个体主体风险感知的差异及其局部社交网络,可能导致“斑块状爆发”,即疾病在一个社区持续闷烧,而另一个社区则完全安全。一个将所有人平均化的聚合模型会完全错过这种关键的地理纹理。基于主体的建模教会我们一个深刻的教训:整体通常不仅大于,而且迥异于其各部分之和。

建模者的调色板:目的的光谱

正如构建模型有不同的哲学一样,也存在不同类型的模型,每种都有其自身的用途。

在光谱的一端,我们有​​描述性模型​​。这些是地图。大脑的接线图或食物网图表都是描述性模型。它们告诉我们“那里有什么”以及各组件是如何连接的,但不一定告诉我们系统随时间如何行为。

其次,我们有​​经验性模型​​。这些通常被称为“黑箱”模型。它们通过将大量数据输入统计或机器学习算法来构建,这些算法会找出输入和输出之间的模式和相关性。它们可以是极其强大的预测器,但它们在运行时对底层机制的假设最少。它们能以惊人的准确性告诉你会发生什么,但不一定能告诉你为什么。而且因为它们不理解“为什么”,所以它们可能很脆弱;如果系统进入其训练数据之外的状态,它们的预测可能会彻底失败。

最后,我们有​​机理性模型​​。这些是“透明箱”模型。它们是根据我们对支配系统的底层物理、化学或社会机制的理解从头开始构建的。基于扩散和资源约束原理的健康策略反馈模型就是一个机理性模型。这些模型最难构建,因为它们需要深入的科学理解。但它们也是最强大的。因为它们代表了系统的因果机制,所以它们允许我们提出“如果……会怎样?”的问题——科学家称之为反事实。如果我们为卫生工作者增加一倍的培训预算会怎样?如果出现一种新的、更具传染性的病毒变种会怎样?

这引出了一种美妙的协同作用,一个由物理学家Richard Feynman著名阐述的发现循环:“我无法创造的,我就不理解。”在现代生物学中,系统生物学家分析生物体以构建机理性模型——这是​​分析​​。然后,合成生物学家利用这种理解来尝试设计和构建新的生物回路——这是​​综合​​。当合成回路未能按预期工作时——这种情况经常发生——它揭示了我们机理性模型中的一个缺陷,我们理解上的一个空白。创造的失败推动了更深入的分析,而这又反过来导向更好的创造。这个在拆解与重组之间循环的美妙过程,正是科学事业的核心。

时间与影响的特性

系统随时间展开,但并非总是以相同的方式。系统动力学模型的微分方程所产生的平滑、连续的曲线描述了一种变化。但许多系统是断断续续地演变的。银行的队伍、工厂的生产线或医院的急诊室都是​​离散事件系统​​。在这些模型中,系统状态在特定​​事件​​发生前是冻结的——一位顾客到达,一台机器完成其任务,一名患者出院。模拟时钟不是按固定间隔向前跳动;它从一个事件时间跳到下一个。建模的世界足够丰富,既能捕捉河流的连续流动,也能捕捉队列的断续节奏。

正如我们对时间的看法可以很细致一样,我们对因果关系的看法也可以如此。我们经常画出单向的箭头:A导致B。但在物理世界中,影响很少是单行道。想想电动机。我们可以说,施加电流(电气输入)会导致轴产生扭矩(机械输出)。但同样正确的是,试图转动轴(机械输入)会在电路中产生“反电动势”——一个电压(电气输出)。这种相互影响,即​​互易性​​,是耦合物理系统的基本属性。更先进的建模方法,称为​​非因果建模​​,旨在从一开始就尊重这种双向现实,提醒我们简单的因果链有时可能隐藏着更复杂、更美丽的相互联系。

建模者的谦逊:承认不确定性

没有一个模型是完美的水晶球。模型是一种简化,其力量与危险都蕴含于这种简化之中。一个诚实的建模者必须是不确定性的学生,而不确定性有两种基本类型。

第一种是​​偶然不确定性​​,源自拉丁语 alea,意为“骰子”。这是固有的、不可简化的随机性。它是宇宙本身的模糊性。即使有一个完美的公平硬币模型,我们也无法预测下一次抛掷的结果。这是即使我们完全了解游戏规则时仍然存在的不确定性。

第二种,且通常是更大的不确定性来源,是​​认知不确定性​​,源自希腊语 episteme,意为“知识”。这是源于我们自身无知的不确定性。原则上,它是可以减少的。如果我们收集更多数据或进行更多研究,我们就可以减少它。认知不确定性本身有两种主要形式。第一种是​​参数不确定性​​。我们可能有正确的模型结构,但我们不知道其中数字的确切值。我们可能用泊松过程来模拟急诊室的病人到达情况,但我们对平均到达率 λ\lambdaλ 只有一个基于有限数据的模糊估计。第二种,也是更深层次的形式,是​​模型不确定性​​。这是令人谦卑的认识,即我们甚至可能没有正确的模型结构。急诊室的单队列模型是否足够,还是我们需要一个更复杂的、为不太严重的病例设有单独快速通道的模型?这是关于我们模型蓝图本身的不确定性。

理解这些不同类型的不确定性不是失败的标志;它是科学成熟的标志。它让我们能够传达我们知识的局限,并对我们的模型能做什么和不能做什么保持诚实。

简约的优雅:简约法则

鉴于世界无尽的复杂性,我们的模型应该有多复杂?为了追求真实感,人们很容易添加越来越多的细节和参数。但这是一条危险的道路。一个有太多可调“旋钮”的模型可以被调整到完美拟合任何过去的数据,这种现象被称为过拟合。这样的模型并没有解释任何东西;它只是在记忆噪音。它很可能成为未来的糟糕向导。

这引领我们来到所有科学中最重要的指导原则之一:简约原则,或称​​奥卡姆剃刀​​。在建模的背景下,它不仅仅意味着“最简单的模型就是最好的”。那是天真的极简主义。更恰当、更复杂的表述是:在所有与我们的基本机理知识(如能量守恒)一致且预测能力大致相等的模型中,我们应该偏爱那个可调参数最少的模型。

这是对优雅的充足性的追求。我们想要一个尽可能简单,但不能更简单的模型。这一原则引导我们远离过度简化的贫瘠和过度复杂的丛林。它反映了一种深刻的信念,即自然界的底层法则不仅强大,而且优美而简洁。因此,系统建模的艺术不仅仅是捕捉复杂性。它在于发现常常位于其核心的深刻简约,并构建一个反映它的模型。这涉及在​​抽象层次​​中导航,选择恰当的细节水平——从最精细的基于主体的模拟到最高层的概念图——以回答手头的问题。它是一门手艺、一门科学、一门艺术,三者合而为一。

应用与跨学科联系

在经历了系统建模的原理与机制之旅后,您可能会感觉自己像是刚学会了一门新语言的语法规则。您理解了结构、句法和组件。但一门语言真正的乐趣不在于了解其规则,而在于用它来阅读诗歌、讲述故事、理解新思想。所以,让我们离开工坊,到世界各地走一走,看看用系统建模这门语言可以构建出哪些美丽而强大的东西。这不仅仅是一项学术练习;它是一个强大的透镜,用以理解现实错综复杂的舞蹈,从计算机芯片的逻辑门到我们星球广阔、旋转的系统。

建模可预测之物:矩阵中的必然未来

有些系统,至少在某个层面上,表现得像宏伟的钟表。想象一下动物种群、竞争品牌的市场份额,甚至雨后晴天的概率。系统今天的状态影响着它明天的状态,而这种关系通常可以被封装在一组转换规则中。如果这些规则是一致的,我们可以将它们打包成一个称为矩阵的数学对象。这个矩阵不仅仅是一个数字表格;它是系统的DNA。

想象一个有三种可能状态的简单系统。我们可以写出一个“随机矩阵”,告诉我们从任何状态转移到任何其他状态的一步概率。如果我们想知道两步后会发生什么,我们将矩阵与自身相乘。那么二十步呢?或一千步呢?我们只需将矩阵提升到那个幂次。这看起来像是一项乏味的计算,但其魔力在于一个更深层次的属性。系统的长期行为由矩阵的特征值决定——这是一组随着系统演化而保持不变的特殊数字。对于一个稳定的系统,其中一个特征值将恰好是111,代表它最终将稳定下来的、不变的平衡状态。其他所有小于111的特征值,代表着随时间消逝的瞬态行为,就像投入池塘的石头泛起的逐渐消失的涟漪。特征值越接近111,其对应的涟漪衰减得越慢。仅仅通过观察这些数字,我们就能看到系统的最终命运以及它接近命运的速度,而无需进行逐步模拟。这是一个美丽的例子,说明了一个模型的深层数学结构如何揭示编码在其规则中的长期命运。

构建坚不可摧之物:为更安全的世界建立形式化模型

虽然预测未来很迷人,但系统建模也赋予我们保证未来的力量。思考一下设计铁路信号系统的挑战。我们希望绝对、百分之百地确定,任何两列火车永远不会同时占据同一段轨道。我们如何实现这样的确定性?我们可以运行数天的模拟,测试数百万种情景。但我们总是会被一个 nagging 的问题困扰:“万一有一种奇特、未经测试的情况会导致灾难呢?”

形式化建模提供了一个更深刻的答案。与其测试一百万个例子,我们可以构建一个模型来证明所有可能情景的安全性。方法是将整个系统——轨道、信号、列车运行规则——转化为一组逻辑语句,其形式为所谓的合取范式。问题“会发生碰撞吗?”被转化为一个纯粹的数学问题:“是否存在任何对我们的变量赋予‘真’或‘假’的赋值,使得‘发生碰撞’的陈述为真?”这是计算机科学中一个著名的问题,称为布尔可满足性问题,或SAT。虽然它通常非常困难,但我们有出色的算法,称为SAT求解器,可以处理其巨大的实例。如果求解器找到了一个满足的赋值,它就为我们提供了一个碰撞如何发生的具体例子——一个我们必须修复的错误。如果它证明不存在这样的赋值,我们就得到了安全性的数学保证。这是一个巨大的飞跃,从“我们没有看到它失败”到“我们已经证明它不可能失败”。同样的形式化验证原则被用于设计您计算机中的微处理器,并确保飞机和医疗设备中软件的可靠性,从而构建一个不仅是工程设计的,而且是可证明安全的世界。

抽象的艺术:森林还是树木?

或许系统建模中最伟大的艺术在于选择正确的抽象层次。当我们审视一个复杂系统时,我们是应该对森林建模,还是对个别的树木建模?答案完全取决于我们提出的问题。两种主要范式主导着这一选择:系统动力学,它从上到下对森林进行建模;以及基于主体的建模,它从下到上,一棵树一棵树地生长出森林。

想象一家医院试图理解一个新的电子健康记录系统的影响。医院管理者注意到了两种问题。一方面,他们看到了大规模的聚合模式:药物订单的总积压量在增长,而且似乎存在一条“学习曲线”,因为员工的速度在慢慢变快。另一方面,他们听到了关于微观层面行为的故事:Dr. Rodriguez 总是忽略某一类警报,而护士 Chen 找到了一个聪明的变通方法,并且延误似乎集中在三楼的护士站。

为了理解聚合的积压和学习曲线,​​系统动力学 (SD)​​ 模型是完美的工具。SD以存量和流量的方式思考,就像一个水管工规划一个由水库和管道组成的系统。我们可以定义一个“未完成订单”的“存量”,其“流入”来自医生,其“流出”则是在订单被处理时产生。我们可以模拟一个“员工技能”的“存量”,随着人们的学习而慢慢填充,这反过来又打开了订单处理流出的“阀门”。SD在捕捉驱动这些大规模行为的反馈回路方面表现卓越。例如,不断增加的警报数量可能会造成“警报疲劳”,这会降低临床医生的响应能力,从而让问题漏掉,产生更多警报——这是一个经典的增强反馈回路。

但要理解为什么延误会集中在三楼,或者为什么 Dr. Rodriguez 的行为与护士 Chen 不同,我们需要一个不同的视角。​​基于主体的模型 (ABM)​​ 创建了一个由单个“主体”——代表每位医生、护士和病人的数字替身——组成的虚拟世界。每个主体都被赋予了自己的属性(经验、耐心、专业)和一套简单的行为规则。没有自上而下的积压方程。相反,我们只需按下“运行”键,观察系统行为如何从我们主体之间成千上万的局部互动中涌现出来。我们可能会看到走廊里出现交通堵塞,仅仅因为两辆推车试图在一个狭窄点通过,这是聚合模型永远无法看到的现象。当异质性和局部互动是解开谜题的关键时,ABM就是正确的工具。

这种选择不仅仅是品味问题;它通常由系统的基本属性决定。考虑为一个公司的招聘流程建模。对于一个招聘数千人的大型全球公司来说,大数定律抹平了个体差异。这个过程可以用平均率准确描述,使其成为SD模型的完美候选。但对于一个通过其社交网络招聘十几人的小型初创公司来说,每个个体的命运、他们被分配到的具体导师以及他们生产力提升的重尾特性都至关重要。在这个小数量和巨大个体差异的世界里,只有ABM能够捕捉到其本质动态。同样,在评估公共卫生政策时,像改变处方指南这样的自上而下的干预措施非常适合SD模型,而像通过社交网络传播的同伴主导的纳洛酮培训这样的自下而上的项目,则需要ABM才能被正确理解。

建模我们的世界:从分水岭到整个地球

帮助我们理解医院和公司的建模原则,同样也让我们能够应对自然世界的巨大复杂性。我们如何可能预测一个广阔分水岭的水流?我们无法为每一滴雨水写下方程。答案再次是选择一种巧妙的抽象。在​​分布式水文模型​​中,我们在景观上覆盖一个虚拟网格,将其划分为数千个更小的单元。每个单元本身就是一个简单的模型:它从天空和其上坡邻居那里接收水分,将一部分储存在土壤中,一部分蒸发掉,然后将其余部分送给其下坡邻居。

没有哪个单元非常智能,但当它们全部连接起来,遵循其简单的局部规则时,真实河流系统的复杂、分叉网络就涌现出来了。这是现代环境建模的基础。它使我们能够在大尺度上提出“如果……会怎样?”的问题:如果气候变化带来更强的降雨会怎样?如果森林被购物中心取代会怎样?我们可以看到后果在整个系统中涟漪般地扩散开来。

今天,我们正在用​​物理-数据混合模型​​将这一前沿推向更远。我们基于物理和化学定律的地球气候模型非常强大。我们可以用一个基于物理的算子(我们称之为 MMM)来表示大气和海洋的大尺度环流。但总有一些过程,比如单个云的形成,因为太小或太复杂而无法被我们的网格化方程完美捕捉。这些未解析的过程可能导致误差。这里有一个绝妙的想法:我们可以利用来自卫星和传感器的大量观测数据档案,来训练一个机器学习模型(我们称之为 fϕf_{\phi}fϕ​),让它学习我们的物理模型所犯错误的模式。最终的混合模型结合了两者的优点:系统的状态由我们信赖的物理模型(MMM)推进,但在每一步,我们都添加一个数据驱动的校正(fϕf_{\phi}fϕ​),以弥补我们遗漏的物理过程。我们正在教导我们的模型从错误中学习,在第一性原理理论和大数据之间创造出一种强大的协同作用,这正在彻底改变天气预报和气候科学。

指向复杂未来的罗盘

最终,建模的目标不仅仅是理解世界,而是帮助我们更明智地驾驭它。当面临关于可持续性和公共卫生的复杂选择时,系统思维提供了一个不可或-缺的罗盘。

考虑在生物基塑料和传统石油基塑料之间做出选择。一个简单的比较可能会产生误导。​​生命周期评估 (LCA)​​ 是一种严谨、标准化的系统建模形式,它迫使我们审视全局。它要求我们定义从“摇篮到坟墓”的系统边界——从原材料的提取(油井中的石油或田地里的玉米)到制造、运输、消费者使用以及最终的处置或回收。然后,我们盘点所有穿越该边界的物质和能量流,并评估一系列潜在的环境影响,从温室气体排放到水资源消耗和生态毒性。这种整体观防止我们制定的“解决方案”仅仅是将负担从一个环境问题转移到另一个问题上。

同样的系统思维对于制定合理的公共政策至关重要。当一个城市考虑像拥堵费这样的政策时,决策者会被各种质量不一的证据淹没。一种​​将健康融入所有政策 (HiAP)​​ 的方法使用系统视角来权衡这些证据。一个针对数百人的、完美控制的小型实验(随机对照试验,RCT)可能具有很高的*内部效度,但它对于当政策推广到一百万不同人群时会发生什么,告诉我们的信息很少。一个研究另一个已经实施该政策的城市的精心设计的“自然实验”,其因果关系可能稍欠确定性,但其外部效度*——其与现实世界政策问题的相关性——要大得多。系统模拟模型随后发挥着至关重要的作用,综合所有这些不同来源的证据,为该城市的特定背景量身打造一个预测,让决策者能够探索各种情景并预见意外后果,特别是对最脆弱人群的影响。

从逻辑的确定性到人类行为的随机舞蹈,从医院的管道系统到地球的未来,系统建模为我们提供了一个清晰思考复杂性的框架。它是一门培养对相互联系、对反馈回路的微妙力量、对简单规则能够产生错综复杂而美丽的涌现模式的深刻欣赏的学科。它没有给我们一个水晶球,但它确实为我们提供了我们最强大的工具之一,用以推理现在并为未来规划一条更明智的道路。