
在尝试理解世界的过程中,我们常常默认采用简单的线性因果链。虽然这个模型是一个有用的起点,但当这些链条自我回环形成反馈时,自然和工程系统的真正复杂性和适应性才得以显现。本文深入探讨动力学范式这一概念——即由系统内部结构与其环境之间复杂的相互作用而产生的、独特的、依赖于情境的行为。理解这些范式,超越静态的、一刀切的观点,对于有效干预从人体到全球气候等多样化系统至关重要。
本次探索分为两部分。在第一章“原理与机制”中,我们将解构复杂行为的基本构成单元,探索反馈回路等简单的网络基序如何产生生物钟和记忆开关等复杂功能。我们将看到,同一个系统如何根据其历史和输入表现出多种截然不同的行为。在第二章“应用与跨学科联系”中,我们将见证这些原理的实际应用,揭示它们通过动态治疗方案对个性化医疗产生的变革性影响,以及它们在解释网络科学和气候建模现象方面的力量。这段旅程将揭示,从动力学范式的角度思考,为我们理解和影响复杂世界提供了一个强大而统一的视角。
在我们理解世界的征程中,我们常常倾向于一个简单而令人安心的因果图景:一个线性的事件链。多米诺骨牌 A 推倒骨牌 B,B 再推倒骨牌 C。在生物学中,我们可能会想象一个信号激活了蛋白质 P1,P1 接着激活 P2,P2 再激活 P3,依此类推。这幅图景清晰、直接,是一个有用的起点。但生命中错综复杂的舞蹈很少如此线性。真正的魔力,即我们在生命系统中看到的那些复杂而惊人行为的源泉,往往始于链条回环之处。
当通路中的下游组件反过来影响上游组件时会发生什么?这种循环的影响流被称为反馈,它是自然界最基本的设计原则之一。相互作用的分子网络中一个简单的回路,就能将一个平淡无奇的信号链转变为一个具有非凡能力的精密设备。通过仅仅组合几个相互作用的基因或蛋白质,演化创造了一个多功能的工具箱,用以生成复杂的行为。
想象一下两个相互抑制的基因,我们称之为 A 和 B。如果蛋白质 A 的水平很高,它会抑制蛋白质 B 的产生。在蛋白质 B 缺失的情况下,没有什么能阻止蛋白质 A 的产生,从而将其锁定在“高”状态。反之,如果蛋白质 B 的水平很高,它会抑制 A,将系统锁定在另一个不同的状态。这种被称为拨动开关的结构,是正反馈回路的一个经典例子(双重负向作用在功能上是正向的)。
这个回路不仅仅是传递信号;它创造了双稳态,意味着系统可以稳定地停留在两个截然不同的状态之一:(高 A,低 B)或(低 A,高 B)。它就像一个细胞记忆,一个生物触发器。一旦外部信号将系统推入一个状态,即使信号消失,它也会保持在该状态。这是生物学中不可逆决策的基础,比如干细胞决定分化为肌肉细胞或神经元。这个简单的双基因基序为实现稳健的、开关般的控制和细胞记忆提供了机制。
现在,让我们考虑一种不同类型的回路。假设基因 A 抑制基因 B,基因 B 抑制基因 C,而为了完成这个循环,基因 C 又抑制基因 A。这个基序,以人工合成为抑制振荡器而闻名,是一个时滞负反馈回路。A 的增加导致 B 的减少,接着导致 C 的增加,最终又反过来导致 A 的减少。A 对其自身的净效应是负向的,但信号绕回路一周需要时间。
这种负反馈和时间延迟的组合,是产生持续振荡的完美配方。蛋白质浓度不会稳定在某个固定值,而是在一个永恒的循环中相互追逐,以规律的节奏起伏。这将一组简单的基因变成了一个生物钟,它是从细胞分裂周期到掌管我们睡眠-觉醒模式的昼夜节律等一切生命活动的基本组成部分。必须注意的是,并非任何负反馈都能产生振荡。一个抑制自身产生的单一基因通常只会稳定其浓度并加快其响应时间;需要一个具有足够延迟的回路(通常由多组分环中的中间步骤提供),才能使系统“过冲”其稳态并引发振荡。
大自然的工具箱不仅限于开关和时钟。考虑一个相干前馈环,其中主信号 通过两条平行路径激活输出 。一条是直接路径(),另一条是间接路径,通过一个中间体 ()。现在,想象一下输出 需要来自 和 两者的激活才能开启(一个生物“与门”)。
当信号 出现时,直接路径立即被激活,但间接路径需要时间,因为蛋白质 必须首先被生产出来。只有当 积累到足够水平时,输出 才能最终开启。这就产生了一个时间延迟。如果输入信号 只是一个短暂的、嘈杂的闪烁,它可能在 有时间积累起来之前就消失了,输出 将永远不会开启。该回路充当了一个持续性检测器,过滤掉短暂、虚假的信号,只对持续的、有意的输入做出响应。这是细胞确保自己不被随机噪声干扰的一种简单而优雅的方式。
这些基序——开关、时钟、滤波器——是基本构件。但一个更复杂的单一网络可以根据情境表现出多种行为。它的行为并不仅仅由其布线图决定。它在特定情况下的行为方式就是它的动力学范式。
以 JAK-STAT 系统为例,这是一个对我们免疫反应至关重要的真实信号通路。一个信号(一个细胞因子分子)与细胞表面的受体结合,触发一个级联反应,激活 STAT 蛋白。这种激活受到至少两种形式的负反馈的制衡:激活的受体被拉入细胞内并降解,同时 STAT 蛋白自身会开启一个抑制蛋白(称为 SOCS)的基因。
这些力量的相互作用可以导致同一个网络产生截然不同的结果。
动力学范式是一种涌现属性,是外部世界(信号)与细胞内部状态(决定反馈和恢复时间尺度的参数)之间对话的结果。
如果生物系统在这些复杂的、适应性的范式下运作,那么我们试图控制它们的努力——正如我们在医学中所做的那样——也必须同样精妙。仅仅给予固定剂量的药物并期望最好结果往往是不够的。这一洞见引出了动态治疗方案 (DTR) 的概念。
DTR 不是一个静态的处方,而是一系列根据患者不断演变的状态来调整治疗的规则。它将个性化、适应性医疗的理念形式化。例如,一个治疗 HIV 的静态方案可能是“每天服用药物 X”。而一个动态方案可能是“每月监测患者的 CD4 细胞计数(免疫健康指标)。如果计数 降至 350 以下,开始治疗 。如果升至 350 以上,可以停止治疗,”。治疗是患者演变历史的函数。这是现代医学的梦想:成为一个熟练的木偶师,轻柔地引导身体复杂的动力学回归健康状态。
那么,我们如何发现最佳的 DTR 呢?一个显而易见的想法是查看观测数据——来自常规临床护理的庞大电子健康记录档案——看看什么方法有效。但在这里,我们掉进了一个深奥的思维陷阱,一个可能完全误导我们的“数据中的幽灵”。
这个问题被称为受既往治疗影响的时变混杂。让我们回到那位治疗慢性炎症性疾病患者的医生。在第 次就诊时,患者的炎症水平 很高。看到这一点,医生开出了高剂量的类固醇 。类固醇有帮助,但也有副作用,影响了患者在下一次就诊时的状态 。现在,如果我们简单地分析数据,会发现高剂量的类固醇与高水平的炎症相关。我们可能会错误地得出结论,认为类固醇无效甚至有害。
变量“炎症水平” 是麻烦制造者。它是一个混杂因素,因为它影响医生的治疗决策(),并且也预测最终结局。但它也是从过去治疗到结局的因果路径上的一个中介变量()。如果我们使用标准的统计回归来“调整” ,我们试图修正混杂,但这样做时,我们却阻断了我们想要测量的 的因果效应。这是一个统计学上的第二十二条军规。
这个问题甚至更深。如果在我们的观测数据中,出于安全原因,医生从不给患有特定病症(比如严重低血压)的患者使用高剂量药物怎么办?而我们想要测试的 DTR 却建议根据其他一些风险评分给这些患者高剂量药物。在这种情况下,我们遇到了正性假设违背。我们的数据中完全没有关于在该提议的行动下,这个患者亚组会发生什么的信息。我们无法学习我们看不到的东西。我们得出的任何估计都将基于纯粹的外推——一个猜测,而非证据。唯一有原则的前进方式是,要么将我们的问题限制在我们确实拥有数据的人群中,要么修改我们想研究的治疗方案,使其与可能的情况保持一致。这揭示了仅通过观察所能学到的东西的根本局限。
这段从简单回路到因果推断复杂挑战的旅程,引出了最后一个令人谦卑的问题:当我们观察一个复杂系统时,我们到底应该关注什么?
想象一个高维系统,比如一个在水中摆动和折叠的蛋白质,由数千个原子的位置描述。我们希望将这种复杂性简化为几个关键变量,来讲述蛋白质功能的“故事”。一个自然的想法是使用像主成分分析 (PCA) 这样的方法,它能找到方差最大的集体运动——即系统运动最多的方向。
但是,最大的运动就是最重要的吗?不一定。最重要的过程可能是一个缓慢、微妙的构象变化,这对蛋白质与其他分子结合至关重要。这个“慢模式”的振幅可能很小(低方差),完全被 PCA 忽略。相反,蛋白质表面某个松散环路可能存在非常快速、高振幅的摆动,但这与功能无关。PCA 会将这种摆动标记为“主成分”,从而误导我们。
关键的洞见是,对于动力学系统,持久性通常比方差更重要。真实的故事是由那些变化缓慢的变量讲述的,因为它们代表了稳定状态以及状态之间的能垒,这些共同决定了系统的长期行为。将快速、高振幅的抖动与缓慢、功能上重要的转变分离开来,是一个核心挑战。这提醒我们,理解动力学范式始于对观察对象的深刻选择——一个在观察表面的嘈杂波浪与辨别真正引导航程的深层、缓慢洋流之间的选择。
在经历了动力学范式基本原理的旅程之后,我们现在到达了探索中最激动人心的部分:在现实世界中看到这些思想的实际应用。系统占据不同状态并遵循不同演化规则这一抽象概念,不仅仅是一个理论上的好奇心;它是一个强大的视角,通过它我们可以理解、预测和影响科学与工程中一些最复杂的挑战。从为个体独特的病程量身定制医疗方案,到驾驭庞大的网络和模拟我们星球的气候,动力学范式的概念为适应性思维提供了一个统一的框架。
这种思维方式最深刻的应用或许是在医学领域,它正在催化从“一刀切”的治疗向真正个性化、适应性护理的转变。治疗慢性病的医生很少只做一个决定就走开。相反,他们遵循一个策略,一个随时间调整的方针。
想象一下管理高血压。医生的策略不仅仅是“开药物 X”,而是一套复杂的规则:“从低剂量的药物 X 开始。如果三个月后血压仍高于 140 mmHg,增加剂量。如果患者出现副作用,换用药物 Y。”这一系列规则正是我们所说的动态治疗方案(DTR)或适应性治疗策略。它将优秀的临床实践艺术形式化为一个可供检验的科学对象。
但如果这些策略如此直观,为什么研究它们如此困难呢?难点在于时间的箭头。在患者的病史中,治疗和健康状况被锁定在一个反馈回路中。药物可以降低血压,但也可能影响肾功能。肾功能的这种变化(一个时变混杂因素)又会影响医生关于降压药的下一个决定。仅仅比较最终接受不同药物序列的患者是极具误导性的,因为我们比较的并非同类。我们比较的是那些自身不断演变的健康状况引导他们走上不同道路的人群。
为了解开这个结,科学家们发展了两种非凡的方法,类似于侦探和建筑师的不同方法。
侦探的方法是筛选现有数据(如数百万份电子健康记录 (EHR))中留下的海量线索。挑战在于提出这样一个问题:如果当初遵循了不同的策略,会发生什么?因果推断为构建这些反事实提供了工具。
一个强大的思想是逆概率加权 (IPW),它是边际结构模型 (MSM) 等方法背后的引擎。其直觉是通过统计重新加权来创建一个“伪人群”。在现实世界中,病情较重的患者可能更有可能接受积极的治疗。IPW 对数据中那些病情较重但偶然接受了较不积极治疗的罕见个体,以及那些较健康但接受了积极治疗的个体赋予更高的权重。通过这种方式小心地平衡天平,我们可以创建一个新的、假设的人群,在这个人群中,治疗决策在每个时间点上都不再与患者风险纠缠在一起。在这个伪世界中,我们可以公平地比较不同 DTR 的结果。这项技术用途广泛,甚至可以用来估计在特定的适应性策略下,像心脏病发作这样的事件风险如何随时间演变。
另一种方法是 G-computation,它不像加权证据,更像是构建一个模拟。科学家们使用观测数据来构建一个患者群体的“数字孪生”,拟合统计模型来学习健康状态(如血糖或肾功能)如何响应不同治疗而逐月演变。一旦这个模拟建成,我们就可以在上面进行在现实世界中不可能做的实验。我们可以取一百万个模拟患者,强迫他们都遵循一个 DTR(例如,一个积极的胰岛素滴定规则),然后看他们的平均结局是什么。然后,我们可以“重置”,取同样的一百万个模拟患者,强迫他们遵循一个不同的、更保守的 DTR。通过比较这两个模拟世界的结果,我们可以估计一个策略相对于另一个策略的因果效应。
虽然从过去学习很强大,但建筑师的方法是为未来设计一个更好的实验。如果我们想知道哪种适应性策略最好,为什么不把适应性直接构建到我们的临床试验中呢?这就是序贯多重分配随机试验 (SMARTs) 背后的绝妙想法。
在传统试验中,你被随机分配一次到药物 A 或药物 B。在 SMART 中,随机化是分阶段进行的。例如,所有患者可能被随机分配到一种初始疗法。八周后,我们将他们分类为“响应者”或“非响应者”。然后,非响应者被再次随机分配到不同的补救选项。通过在关键决策点嵌入多次随机化,SMART 被明确设计用来为我们提供比较不同 DTR 长期有效性所需的高质量数据。这种设计理念不仅可以应用于个体患者,还可以应用于整个社区,例如,用于寻找部署公共卫生项目的最佳适应性策略。
研究 DTR 的最终目标是做出更好、更理性的决策。通过将 g-公式的模拟能力与经济数据相结合,研究人员可以对不同的适应性策略进行成本效益分析。使用 g-公式,人们可以模拟在不同方案下,不仅仅是健康结局(如质量调整生命年)的整个轨迹,还包括成本的轨迹。这使我们能够计算出哪种策略能提供最大的“性价比”,为卫生政策提供循证基础,并确保资源被导向那些在整个病程中对患者真正最有效的护理策略。
以范式思考的力量远远超出了临床范围。它是理解和控制物理系统的基本概念,从工程网络到自然世界。
考虑一个复杂的网络,如电网、通信系统,甚至是细胞内相互作用的蛋白质网络。其集体行为通常可以由一组基本模式或动力学范式来描述——可以把它们看作是网络喜欢振动的自然“音符”。网络科学中的一个关键问题是可控性:如果我们能“推动”网络中的一个或多个节点,我们能将整个系统引导到期望的状态或范式吗?
分析揭示了一个美丽而直观的结论。如果一个网络具有模块化或社群结构,其动力学模式通常主要“存在”于某个社群内部。要有效地激发或抑制与特定社群相关的模式,你必须将你的控制输入施加到该社群内的节点上。推动另一个社群中遥远的节点对该模式几乎没有影响。这个从线性系统数学中涌现出的原理,将网络的抽象动力学范式与其物理拓扑直接联系起来,为我们设计复杂互联系统的控制策略提供了蓝图。
最后,动力学范式并不总是我们设计或控制的东西;它们常常是从自然法则中涌现出的独特物理状态。一个惊人的例子可以在极地海洋中找到。海冰并非一个单一、均质的实体。气候科学家必须区分至少两种关键的范式:内部密集冰区和边缘冰区 (MIZ)。
内部密集冰区是一片广阔、几乎连续的冰盖。在这里,冰的行为像一个单一的、坚固的(尽管可裂)物体。它的运动受巨大的内应力支配,来自开阔海洋的海浪无法深入其中。
相比之下,边缘冰区则是一个完全不同的世界。它是一个由单个浮冰组成的破碎区域,从小的饼状冰到较大的冰筏,在冰缘充满波浪的湍流水域中拥挤碰撞。在这里,内应力很弱,因为浮冰没有被锁定在一起。相反,一个主导的力量是海浪不懈的推拉。热力学也不同。密集冰区主要从顶部和底部融化,而边缘冰区的浮冰则从四面八方受到侵蚀,这种增强的“侧向融化”是控制冰缘位置的关键过程。要建立一个准确的气候模型,不能对所有海冰使用同一套方程。必须承认边缘冰区和内部密集冰区是两种不同的动力学和热力学范式,每种都有自己的一套规则,并处理它们之间的转换。
从医生办公室到北冰洋,一个共同的线索浮现出来。复杂系统通常不会以单一、统一的方式行事。相反,它们表现出不同的范式——响应的范式、运动的范式、物理状态的范式。通过识别这些范式并理解支配它们的规则,我们可以超越对世界简单、静态的看法。我们可以开始提出更复杂的问题:不仅仅是“什么是最佳行动?”而是“在一个变化的世界中,最佳的行动策略是什么?”这就是以动力学范式思考的力量和魅力所在。