
世界上许多最错综复杂的系统——从活细胞到全球生态系统——都难以用简单的语言解释。几个世纪以来,一种强大的科学策略是:将这些系统分解,成对地研究其组成部分,然后将效应相加。然而,这种方法常常失效,因为整体的行为方式往往神秘地大于或小于其各部分之和。我们理解上的这一差距正是高阶相互作用概念变得至关重要的地方,它描述的是一种涌现效应,即两个实体间的关系因第三个实体的存在而发生根本性改变。
本文深入探讨了这一关键概念,揭示了复杂性背后隐藏的架构。文章的结构旨在构建一幅从理论到实践的完整图景:
原理与机制揭开了高阶相互作用的神秘面紗。通过简单的类比和形式化模型,本部分揭示了它们与成对关系在根本上有何不同,以及如何用数学方法描述和检测它们。
应用与跨学科联系展示了这些相互作用在不同科学领域的深远影响。本部分探讨了群体效应如何调控从基因调控、疾病进展到先进材料特性以及大脑信息处理的方方面面。
通过探索基本原理及其在现实世界中的表现,您将获得一个全新的视角来审视世界错综复杂的相互联系。
想象一下,你在厨房里品尝各种配料。你尝了一小撮糖——它是甜的。你尝了一小撮盐——它是咸的。当你把它们一起品尝时会发生什么?你的大脑不仅仅是记录“甜加咸”。一种新的、更复杂的味道出现了。盐可以增强甜味,或者在不同比例下,甜味可以缓和咸味。整体不同于部分之和。这个简单的体验是理解现代科学中最深刻、最具挑战性的概念之一——高阶相互作用——的入口。
长期以来,科学界一种强大而成功的策略是还原论:要理解一个复杂系统,就将其分解成各个组成部分,成对地研究它们,然后将它们的效应相加。如果气候变暖对一种植物有害,干旱也对它有害,我们或许可以通过简单地将这两种伤害相加来预测它们的综合效应。但如果饱受热胁迫的植物对即使是轻微的干旱也变得极其脆弱呢?那么组合造成的损害可能远大于各部分之和。这被称为协同(synergistic)相互作用。相反,如果植物对热的反应包括产生一种也能保护其免受水分流失的化学物质呢?那么组合造成的损害将小于各部分之和。这是一种拮抗(antagonistic)相互作用。简单地假设可加性(additivity)——即效应只是简单相加——可能会导致预测结果不仅是略有偏差,甚至是灾难性的错误。
高阶相互作用是宇宙提醒我们“情境即一切”的方式。两个组分之间的相互作用会因第三个组分的存在而发生根本性的改变。这不仅仅是偶尔出现的麻烦;它是复杂性的核心特征,从基因和蛋白质的微观舞蹈到生态系统中广阔而错综复杂的生命之网,无不如此。
让我们构建一个看似谜题般简单,却又精妙到能骗过我们许多标准工具的系统。想象有三个电灯开关 A、B 和 C。我们设定一个简单的游戏规则:
这个规则是一个经典的逻辑运算,称为异或(exclusive OR),或 XOR。现在,让我们来扮演侦探。你看不到规则手册,只能通过多轮游戏观察这些开关。你决定做一个优秀的还原论者,检查各对开关之间的关系。
你首先观察 A 和 B。正如预期的那样,它们的行为就像独立的硬币投掷。知道 A 的状态完全无法告诉你 B 的状态。它们是成对独立的。
接下来,你观察 A 和 C。你一丝不苟地记录它们的状态。你会发现,当 A 为“开”时,C 有一半时间为“开”,一半时间为“关”。当 A 为“关”时,C 同样有一半时间为“开”,一半时间为“关”。知道 A 的状态对预测 C 的状态没有任何帮助。它们似乎也是完全独立的!同样令人惊讶的结果也适用于 B 和 C。
悖论就在这里:每一对开关——(A, B)、(A, C) 和 (B, C)——都是完全独立的。一个只寻找成对相关性的科学家会宣称这个系统是由三个不相关的随机组件组成的。然而,整个系统却包含一个完美的、确定性的依赖关系:C 的状态总是由 A 和 B 决定。整个关系并不存在于任何一对开关中;它只在你同时观察三者时才存在。这是一个纯粹的、不可简化的三体相互作用。
我们标准的成对分析工具对此视而不见。但其他工具并非如此。在信息论中,A 和 C 之间的成对互信息为零,反映了它们表观上的独立性。然而,一个更强大的量,称为总相关性(total correlation,或多信息),可以衡量系统中的总依赖量。它量化了将系统描述为一组独立部分与描述真实联合系统之间丢失了多少信息。对于我们的开关游戏,总相关性是整整一个“比特”的信息,精确地捕捉了我们使用的确定性规则,尽管所有的成-对测量值都为零。这个系统揭示了依赖关系可以隐藏在众目睽睽之下,编织在多方关系的结构之中。
科学家们如何将这种“情境即一切”的原则融入他们的数学模型中?让我们看看生态学,在这里,生存斗争是复杂相互作用的沃土。
一个经典的物种间竞争模型是洛特卡-沃尔泰拉模型。在其最简单的形式中,对于三个物种(),物种 的人均增长率可能如下所示:
在这里, 代表种群密度, 是内禀增长率, 系数代表竞争。 项是物种 对物种 施加的竞争性伤害。在这个世界里, 对 的影响完全不受物种 是否存在的影响。这是一个成对的、可加的世界。
为了引入一个高阶相互作用,我们增加一个新项:
现在,来自物种 的总竞争效应不再简单。来自物种 单个个体的单位竞争伤害现在是 。 和 之间相互作用的强度确实取决于物种 的种群大小!如果 为正,这意味着物种 增强了 和 之间的竞争(协同作用)。如果为负,物种 则会削弱它(拮抗作用)。
这不仅仅是数学上的奇想。它可以由具体的生物学机制产生。例如,如果物种 和 都消耗物种 需要的一种资源,那么 的存在会消耗掉该资源,这可能会非线性地改变 对 生长的影响程度。
这个项对生态系统会产生什么影响?在成对的世界里,共存的条件通常可以被可视化为直线(称为等斜线)。高阶项则会弯曲这些线。一个协同竞争项()可以使边界向内弯曲,缩小了物种可以共存的空间,使得竞争排斥更有可能发生。一个拮抗项()可以使边界向外弯曲,创造出成对模型永远无法预测的新的稳定共存可能性。一个物种的生死存亡可能就取决于这个微妙的三体项的符号。
当我们想到关系时,我们通常会画一个网络:由线或边连接的节点。这种语言建立在一个成对的假设之上——一条边连接两个节点。但是我们如何处理我们的 XOR 开关或三体生态相互作用呢?一个常见但危险的捷径是将高阶结构投影到一个简单的图上。如果 A、B 和 C 形成一个群体,我们就在 (A,B)、(B,C) 和 (C,A) 之间画边,形成一个三角形。这被称为团扩展(clique expansion)。
这个看似无害的步骤可能导致灾难性的信息丢失。让我们来看一个来自社会影响力的鲜明例子。
如果我们将这两个系统画成简单的图,我们会得到完全相同的一幅画:一个由三个节点和三条边组成的三角形。一个通过计算三角形数量来分析网络结构的科学家将看不到任何区别。
但它们的动态却天差地别。在系统 1 中,如果两个节点变得“活跃”,第三个节点会立即受到强大的压力去遵从。在系统 2 中,这种内聚的、增强的群体效应并不存在。对图结构的还原论分析对这种关键差异是盲目的。
这迫使我们承认,简单图的语言是不够的。我们需要一种更丰富的语言。其中一种语言是超图(hypergraphs),其中一条“边”(超边)可以连接任意数量的节点。我们在系统 1 中的三人组不是三条边;它是一个大小为三的单一超边。这种表示忠实地保留了相互作用的“全有或全无”的群体性质。
如果高阶相互作用如此关键,却又如此容易被忽略,我们如何能确定我们看到的是世界的真实面貌?我们需要一些策略来揭开这层幕布。
1. 设计揭示性实验
最直接的方法是迫使系统亮出底牌。要测试因子 之间的三体相互作用,仅仅一次扰动一个或两个因子是不够的。你必须进行全因子实验,一丝不苟地测试所有 种可能的扰动组合(无扰动、 单独、 单独、 单独、,以及最后的 全部一起)。只有通过测量这最后的三重扰动状态下的结果,并将其与基于单一和双重扰动得出的预期进行比较,你才能分離出只有从三者组合中才会出现的独特效应。任何少于这种完整组合设计的方法,都需要对你正试图发现的相互作用做出无法检验的假设。
2. 在数据中寻找确凿证据
当我们无法进行如此完美的实验时,我们可以在观测数据中寻找统计学和结构上的指纹。
统计检验:我们可以推广我们的 XOR 谜题中的逻辑。对于一个怀疑存在于变量 之间的三阶相互作用,我们可以计算它们乘积的平均值 (跨越多个样本)。在简单的独立性假设下,这个平均值应该为零。一个显著不为零的值就是存在三体依赖的确凿证据,而成对相关性会忽略这种依赖。更广泛地说,我们可以拟合包含显式高阶项(如 )的统计模型,看看这些项对于准确预测我们的数据是否是必需的。
拓扑特征:这就引出了一个最优雅的想法。当我们使用像单纯复形(simplicial complex,一种具有层级感的超图)这样更丰富的表示法时,我们可以运用拓扑学的数学工具来分析其形状。在这种观点下,我们数据中的一个三角形可能意味着两种截然不同的事情。它可能是一个“实心”三角形——一个 2-单纯形——代表一个直接观察到的三体群体。在拓扑学上,这是一个实体,而不是一个洞。或者,它可能只是三条恰好连接成环的成对边。这是一个“空心”三角形,是网络中一个真正的结构性空洞——一个尚未实现的群体的可能性。简单的图将这两种根本不同的结构混为一谈。而拓扑学方法可以区分它们,将真正的内聚与纯粹的巧合分离开来。
这种超越成对视角的原则并不仅限于一个领域。在材料科学中,设计具有前所未有性能的新型“高熵合金”的梦想因简单模型的失败而受阻。这些复杂混合物的稳定性和行为取决于作为直接邻居的三、四或五种不同类型原子所带来的微妙能量成本。通过热力学预测中的差异所揭示的成对可加模型的失效,正是这些关键多体效应的标志。
从我们舌尖上的味道到生态系统的稳定,从我们基因的逻辑到新合金的强度,世界都在低声诉说着一个一致的信息:要真正理解它,我们不仅要学会看成对的组合,还要学会看群体。我们必须拥抱高阶相互作用那美丽、富于挑战性且不可简化的复杂性。
在深入探讨了高阶相互作用的原理之后,我们现在踏上旅程,去看看它们在实际中的应用。如果说成对相互作用是自然界中简单而优雅的二重奏,那么高阶相互作用就是一首完整的交响乐——复杂,有时不和谐,但能产生任何一对乐器都无法企及的丰富性。你会发现,这并非科学的某个深奥角落。相反,一旦你开始寻找它们,你就会发现这些群体效应无处不在,调控着从基因的微观舞蹈到社会宏大、 unfolding dramas 的各种系统行为。
让我们从生物学的最基本单元——基因开始。一个受精卵,拥有一个基因组,是如何协调创造出头部、尾巴、翅膀和腿,并让它们各就其位的?部分答案在于基因控制元件之间美妙的协同作用。想象两个名为增强子的 DNA 序列,在果蝇胚胎发育过程中,它们各自都能微弱地激活附近的一个基因。一个朴素的观点会认为,同时拥有这两个增强子只会得到它们各自效应的总和。但大自然远比这聪明。实验表明,当两个增强子都存在时,基因的激活不仅仅是加倍;它变得显著更强,并且对塑造胚胎的分子信号更加敏感。这个组合系统就像一个精密的开关,创造出一种尖锐、果断的响应,这种响应大于其各部分之和。这种协同逻辑,即调控部分协同工作以产生非线性输出,是从单一蓝图构建复杂生物体的基本设计原则()。
当我们上升到细胞群落的层面时,“整体大于部分之和”这一主题仍在继续。考虑一个不幸的产后感染病例。这很少是单一“恶棍”细菌的杰作。相反,它是一场多微生物的共谋,是病理协同作用的典型案例。最初的定殖者通常是耐氧的细菌(需氧菌)。通过消耗局部组织中所有可用的氧气,它们为它们的厌氧伙伴创造了一个完美的、无氧的避风港,使其得以茁tt壮成长。而这些厌氧菌,反过来,通常是这个团伙中更具破坏性的成员,它们产生能溶解宿主组织的酶,甚至大量产生能保护它们需氧菌朋友免受抗生素攻击的分子。任何一个群体单独存在时,危险性都远不及此。正是它们的三方互动——需氧菌、厌氧菌和宿主环境——驱动了疾病的严重性。要治疗这样的感染,医生不能只针对一个罪魁祸首;他们必须采用广谱方法来瓦解整个协作集團()。
当我们考虑整个生物体的健康时,这种跨尺度的相互作用达到了顶峰。19世纪伟大的医生 Rudolf Virchow 有句名言:“omnis cellula e cellula”(“细胞皆源于细胞”),将疾病定位到细胞的功能障碍上。但这并非一种头脑简单的还原论。对像心力衰竭这样的疾病的现代理解是深刻的 Virchow 式的,揭示了跨越多个组织层次的因果级联。它可能始于社会因素——贫困、压力、不良饮食——这些因素导致了像高血压这样的系统性问题。这种器官层面的压力给心脏带来了机械负荷,引发了单个心肌细胞内部的病理变化:它们变得过大,支持细胞沉积僵硬的疤痕组织,细胞开始死亡。这是细胞病理学。但故事并未就此结束。衰竭的器官无法有效泵血,引发了身体荷尔蒙系统的恐慌反应。这些荷尔蒙虽然本意是短期修复,却给已经受损的心脏细胞带来了更大压力,加速了它们的死亡。这个从社会到系统再到细胞并返回的恶性循环,是一个宏大而悲剧性的高阶系统范例,其中不同层次间的相互作用串通一气,使疾病得以延续([@problem-id:4762701])。
协同作用的概念不仅用于解释疾病;它对于理解风险和设计干预措施也至关重要。在公共卫生领域,我们经常谈论像心脏病发作这样的疾病的风险因素。一个经典的例子涉及吸烟和高血压。流行病学研究揭示了一个惊人的现实:如果吸烟使你的风险增加三倍,高血压使其增加两倍,那么同时拥有两者并不仅仅是将这些风险相乘得到六倍的风险。相反,观察到的风险可能是基线风险的八倍,甚至更多。为什么?因为底层的生物学是非线性的。吸烟和高血压都会损害你血管的脆弱内膜。每一次伤害都使另一次伤害更容易造成损害,它们共同作用可以将系统推过一个关键的“临界点”,进入一个快速形成斑块和炎症的状态。这是一种协同相互作用,其中组合效应是超加性的,这意味着公共卫生信息必须强调组合风险的特别严重危险([@problem-D:4946510])。
这种相互作用的危机理念在“协同流行病”(syndemic)的概念中得到了最强有力的表达。考虑在一个面临贫困和歧视等重大社会逆境的社区中,抑郁症、药物滥用和艾滋病毒(HIV)这些相互交织的流行病。它们不是三个独立的问题。它们形成了一个自我强化的、破坏性的引擎。社会逆境可以助长抑郁和药物使用。抑郁可能导致药物使用作为一种自我治疗的形式,而药物使用又可能加重抑郁。它们共同作用会损害判断力,导致增加艾滋病毒风险的行为。反过来,艾滋病毒诊断又会极大地加重抑郁并引发药物使用。每个问题都 fueling the others,形成一个反馈循环,其中疾病的总负担远远大于每种流行病孤立存在时的总和。一个成功的干预不能只治疗艾滋病毒,或者只治疗抑郁;它必须整体地解决这个相互作用的系统,包括为其提供燃料的潜在社会条件()。
但这里有一个美妙的转折:如果破坏性的协同作用可以导致疾病,那么我们或许可以设计出治疗性的协同作用来治愈它。这就是癌症治疗中寻找“合成致死”(synthetic lethality)背后的逻辑。许多癌细胞之所以能够存活,是因为虽然它们有一个基因缺陷,但它们有另一条途径来补偿它。单靠这个缺陷本身并不致命。如果我们能设计一种药物,专门阻断那条补偿途径呢?这种药物本身对正常细胞可能无害。但在一个已经有第一个缺陷的癌细胞中,阻断备用途径是灾难性的。预先存在的缺陷和药物的组合,创造了一种针对癌细胞特异的、协同的、致死的相互作用。这个概念可以扩展到三个或更多因素,为利用肿瘤独特的高阶脆弱性开发高度靶向的组合疗法打开了大门()。
高阶相互作用的力量远远超出了生物学的范畴。构建我们未来的材料就是这一原则的证明。几个世纪以来,合金是通过混合两种或三种金属制成的。但一类被称为高熵合金的新材料,是通过将五种、六种甚至更多元素以大致相等的比例混合制成。它们卓越的性能——超凡的强度、韧性和抗腐蚀性——无法仅通过观察原子对来理解。这些材料的稳定性和行为关键取决于每个原子的局部环境,这涉及到与整个邻域中不同原子种类的同时相互作用。这些性能源于复杂的三元()、四元乃至更高阶的能量项。通过掌握这些群体相互作用,我们可以设计出一度被认为不可能的性能的材料()。
为了形式化地描述具有群体相互作用的系统,科学家们越来越多地转向新的数学工具。在生态学中,我们通常认为相互作用是成对的:捕食者吃掉猎物,两个物种竞争资源。但如果一个物种改变环境的方式帮助了另外两个物种茁壮成长呢?这不是成对的相互作用;这是一种群体效应。这种相互作用可以用“超图”来表示,其中的边不仅可以连接两个节点,还可以连接三个、四个或任意数量的节点。通过使用包含这些高阶项的方程组来为生态系统建模——例如,在第三个物种 的生长方程中加入一个捕获促进作用的项,如 ——我们可以揭示出令人惊讶的动态。我们可能会发现,看似有益的强合作反而可能悖论性地导致稳定共存的崩溃,这是一个纯粹的成对视角所无法看到的现象()。
这种需要“超越成对”的视角对于理解我们自己的大脑如何工作也至关重要。高效编码假说提出,我们的感觉系统经过优化,能够以最小的冗余度处理来自世界的信息。第一步是从图像中移除简单的相关性,例如。这个过程称为“白化”。但如果你对一幅自然图像进行白化,移除了所有的二阶相关性,你得到的并不是无意义的噪声。所有的结构——边缘、轮廓、物体——都保留了下来。这种结构被编码在图像的高阶统计量中,这些微妙的依赖关系是简单的相关性无法捕捉的。为了真正高效地处理图像,大脑必须对这些高阶模式敏感。这就是像独立成分分析(ICA)这样的理论背后的动机,它提出视觉皮层学会了在视觉世界中找到“独立的”隐藏原因,这是一项需要超越去相关并拥抱高阶结构丰富性的任务()。
最后,高阶相互作用的挑战每天都出现在数据科学和机器学习的世界中。想象一下,试图根据医学影像特征预测一个肿瘤是否为恶性。你可能会发现两个特征,它们单独来看与恶性程度完全没有相关性。一个筛选“最佳”单一预测因子的朴素算法会把它们当作无用之物丢弃。然而,很可能这两个特征组合在一起是完全具有预测性的。这就是著名的“XOR”问题:一个特征只有在另一个特征的背景下才具有信息量。一个无法看到这些协同相互作用的机器学习模型实际上是盲目的。检测这些模式需要明确地去寻找它们,例如,通过测量特征对或三元组提供的关于结果的信息,即使单个特征看起来很弱()。
我们的旅程从基因密码到社会结构,从新材料的设计到大脑本身的设计。统一的教训是明确的:世界的内在联系方式超越了简单的成对关系。真正的理解、预测和创新往往在于欣赏那些由众多相互作用产生的复杂、涌现的现象。最有趣的故事不是用二重奏讲述的,而是用交响乐那完整、辉煌、有时令人困惑的声音讲述的。