try ai
科普
编辑
分享
反馈
  • 基因调控网络建模:从原理到应用

基因调控网络建模:从原理到应用

SciencePedia玻尔百科
核心要点
  • 稳定的细胞类型对应于底层基因调控网络的吸引子,代表了细胞动力学的最终、稳健状态。
  • 网络基序,特别是正反馈回路,为细胞命运决定创造了开关般的行为;而负反馈回路则为生物钟产生振蕩。
  • 像Perturb-seq这样的实验技术,与动力学系统理论相结合,使科学家能够反向工程基因网络内的因果联系。
  • 将GRN与物理力和传输现象耦合的多尺度模型,对于解释遗传蓝图如何指导组织的物理塑形(形态发生)至关重要。

引言

一个单一的基因组,一段静态的DNA序列,是如何调控一个复杂多细胞生物体的发育过程的?这个深刻的问题处于现代生物学的核心。答案不仅在于基因本身,更在于它们之间复杂而动态的相互作用。基因调控网络 (GRN) 是复杂的控制系统——细胞的“软件”——它们读取基因组这一“硬件”,以做出决策、创造模式并构建生物形态。本文旨在介绍对这些网络进行建模的艺术与科学,并探讨如何从可观测数据中推断细胞隐藏逻辑这一挑战。我们将开启一段从抽象原理到具体应用的旅程。在“原理与机制”一章中,我们将探索用于描述这些网络的数学语言,从简单的图到复杂的微分方程,并揭示反馈、稳定性和吸引子等基本概念。接下来,“应用与跨学科联系”一章将展示这些模型如何为胚胎发育和疾病等真实生物过程提供深刻见解,以及这些相同的原理如何在物理学和经济学等不同领域中产生共鸣。

原理与机制

想象一下,您正试图理解一座宏伟古钟的内部运作。您看不见单个齿轮的转动,但您可以观察到它的指针移动、钟声敲响,您甚至可以轻轻推它一下,看看它如何响应。对基因调控网络进行建模也是类似的工作。我们试图从对其状态的观察中,推断出细胞隐藏的“齿轮”——即控制其行为的、由基因和蛋白质组成的复杂网络。为此,我们需要一种语言,一套能将细胞复杂的生物化学过程转化为我们可以分析的数学框架的原理。

生命的语言:基因网络

基因调控网络的核心在于关系:哪个基因影响哪个其他基因?描绘这种关系最自然的方式是构建一个​​网络​​,或者用数学术语来说,一个​​图​​。在这个图中,我们系统的组成部分——基因、它们的RNA转录本以及它们编码的蛋白质——被表示为​​节点​​。它们之间的调控影响则被表示为有向的​​边​​,或箭头。一个从节点A指向节点B的箭头意味着A调控B。

但是,这幅简单的图景还不够。我们需要知道调控的性质。蛋白质A是开启基因B,还是关闭它?我们通过为每条边赋予一个​​符号​​来捕捉这一点。从A到B的边上的正号(+++)意味着A​​激活​​B,也许是通过帮助启动转录。负号(−-−)则意味着A​​抑制​​B,也许是通过阻断转录机器,或者标记B的产物以便销毁。这样我们就得到了一个​​有符号有向图​​,这是细胞控制系统的基本蓝图。

例如,一个转录因子蛋白(p1p_1p1​)促进了一个微小RNA(r2r_2r2​)的产生,这可以表示为一条边 p1→+r2p_1 \xrightarrow{+} r_2p1​+​r2​。如果该微小RNA接着导致一个信使RNA(m3m_3m3​)的降解,这是一个抑制性的转录后相互作用,我们可以将其画为 r2→−m3r_2 \xrightarrow{-} m_3r2​−​m3​。至关重要的是要看到,所有这些分子角色——蛋白质、mRNA和miRNA——都可以成为我们网络中的节点,而边代表的是信息的流动,而非物理物质的流动。这与代谢网络是一个关键的区别,在代谢网络中,边代表一种物质到另一种物质的转化。

生命也并非静止不变;它会对环境做出响应。一个细胞在正常条件下可能表现出一种行为,而在压力下,如缺氧(hypoxia),则表现出完全不同的行为。我们的模型必须捕捉到这一点。我们可以通过允许边的强度,甚至存在与否,根据外部信号而改变,从而使我们的网络具有​​上下文依赖性​​。例如,一个仅在缺氧条件下才活跃的抑制蛋白,可以表示为一条仅在缺氧的上下文变量为“开启”时才“存在”的边。

从静态地图到动态图像:调控的动力学

网络图是一张静态的地图。但细胞是一个动态的、活生生的系统。它的状态——其所有蛋白质和RNA浓度的集合——在不断变化。我们的目标是创建细胞的“动态图像”,根据其当前状态和调控图谱来预测其未来。这就是对​​动力学​​的研究。

想象一个细胞的状态是一个广阔、多维空间中的一个点,其中每个轴代表一种特定分子的浓度。这是系统的​​相空间​​。在这个空间中的每一点,调控网络都定义了一个“流”——一个方向和速度,告诉细胞状态下一步该去向何方。这些箭头的集合被称为​​矢量场​​。​​轨迹​​则是细胞状态随时间被这个矢量场推动所描摹出的路径。

为了精确描述这种运动,我们通常使用​​常微分方程(ODEs)​​。对于每个分子 xix_ixi​,我们写出一个关于其变化率 dxidt\frac{dx_i}{dt}dtdxi​​ 的方程,这个方程是网络中所有其他分子浓度的函数。该函数是根据网络图谱构建的:激活边对变化率贡献正项,抑制边贡献负项。当我们能够将浓度视为连续量,并且有足够的数据来确定方程参数时,这个框架非常强大。

在这个连续的世界里,相空间的几何学变得非常有启发性。我们可以画出称为​​零斜线​​的特殊曲线。一条xxx-零斜线是所有浓度xxx不发生变化(dxdt=0\frac{dx}{dt} = 0dtdx​=0)的点的集合,这意味着在两个分子的相平面中,矢量场纯粹指向“垂直”方向。类似地,一条yyy-零斜线是dydt=0\frac{dy}{dt} = 0dtdy​=0的地方,此时流是纯粹“水平”的。在这些零斜线相交之处,两个变化率都为零。这些点是系统的​​平衡点​​或​​不动点​​——细胞原则上可以永远停留的完美平衡状态。

然而,有时我们不知道精确的生物化学速率,或者我们对更定性的、宏观的视角感兴趣。在这些情况下,我们可以做一个巧妙的简化。我们可以将每个基因视为简单的“开”(1)或“关”(0)。这就是​​布尔网络​​的世界。替代平滑的微分方程,基因在下一个时间步的状态由一个基于其调控因子当前“开/关”状态的逻辑规则决定。例如,一个基因可能在其激活因子为“开”且其抑制因子为“关”时开启。这种粗粒度的方法对于理解细胞命运决定的逻辑非常强大,尤其是在调控相互作用具有开关特性时[@problem-id:2956805]。

命运的架构:反馈、吸引子与细胞身份

所以,我们有了地图(网络)和运动规则(动力学)。那么系统会去向何方?在一个像细胞这样的有界、耗散系统中,轨迹不会游走到无穷远处。它们最终会稳定到一个终态或一个重复的模式。这些最终的目的地被称为​​吸引子​​。

吸引子的概念是系统生物学中最深刻的思想之一。它为“什么是细胞类型?”这个问题提供了数学上的答案。该理论提出,一个稳定的、分化的细胞类型——如皮肤细胞、神经元或肝细胞——对应于底层基因调控网络的一个稳定吸引子。细胞的状态可能会受到小的随机波动干扰,但它会可靠地返回到这个稳定状态,就像碗里的弹珠总会滚回碗底一样。所有能够导向同一个吸引子的初始状态集合被称为它的​​吸引盆​​。

是网络架构的哪些特征创造了这些吸引子并决定了细胞的命运?答案在于​​反馈回路​​。反馈回路是一条闭合的调控路径,其中一个基因通过一个或多个中介链条最终调控自身。它们是产生复杂行为的“基序”,并主要分为两种类型,遵循两条优美的经验法则:

  1. ​​正反馈创造记忆和开关:​​ ​​正反馈回路​​是一个含有偶数个(或零个)抑制性相互作用的循环。最简单的例子是一个基因激活自身的转录。这创造了一个自我强化的开关。一旦基因被开启,它就保持自身开启。如果它是关闭的,它就保持关闭。这种机制可以从同一个基因组中创造出多个稳定吸引子(​​多稳态​​)。这是细胞分化的基本原理:一个祖细胞接收到一个瞬时信号,翻转了一个开关,将其锁定在一个新的、稳定的命运中。

  2. ​​负反馈创造时钟和稳定性:​​ ​​负反馈回路​​是一个含有奇数个抑制性相互作用的循环。经典的例子是一个基因产生的蛋白质,在经过一段时间延迟后,抑制该基因自身的转录。这会产生振荡。基因开启,产生抑制剂,抑制剂积累并关闭基因,然后抑制剂降解,基因再次开启。这是生物节律背后的核心机制,从细胞周期到昼夜节律钟。

这些反馈回路是如此基础,以至于它们对应于网络图的一个深层结构特性。一个反馈回路就是一个​​有向环​​。所有通过有向路径相互可达的节点的集合构成一个​​强连通分量(SCC)​​。这些SCC是网络中富含反馈的模块,是复杂动力学的引擎。整个网络可以看作是这些模块的层级结构,一个​​凝聚图​​,它揭示了信息从上游信号模块流向下游命运决定模块的过程[@problemid:3317495]。

合理的怀疑:假设与现实检验

与任何科学模型一样,我们必须不断质疑我们的假设。我们的数学图景是否真实?

在ODE模型中,一个关键假设是细胞核是“充分混合”的——即一个转录因子分子能够非常迅速地找到其靶基因,以至于我们可以认为其浓度在整个细胞核内是均匀的。这是否合理?让我们做一个快速计算。一个分子扩散距离RRR的特征时间大约为 tD∼R2/Dt_D \sim R^2/DtD​∼R2/D,其中DDD是其扩散系数。对于一个真核细胞核中的典型蛋白质,这个时间大约是秒的量级。相比之下,将一个基因转录为mRNA或将该mRNA翻译为蛋白质所需的时间通常是分钟的量级。由于扩散比基因表达的核心过程快得多,因此充分混合的假设通常是一个非常合理的出发点。

一个更深层次的挑战是​​可识别性​​。假设我们建立一个模型,并使用实验数据来估计其参数,如反应速率或结合亲和力。我们如何知道我们找到了正确的参数?完全不同的两组参数可能产生完全相同的可观察行为。如果是这样,这些参数就是​​结构上不可识别的​​。这是模型自身的属性。即使一个模型理论上是结构可识别的,我们的数据也可能噪声太大或实验信息不足,无法精确确定参数值。这就是​​实践中不可识别​​。区分这两者至关重要。这相当于区分“这个问题原则上能被回答吗?”和“我能用我现有的工具回答这个问题吗?”。

最后,即使是我们最简单的模型也包含着微妙但重要的假设。在布尔网络中,我们如何建模时间是至关重要的。是所有基因在同一瞬间更新它们的状态(​​同步更新​​)?还是它们以未知的顺序一个接一个地更新(​​异步更新​​)?后者可以有力地表达我们对于比我们能测量的更快发生的事件的精确相对时间顺序的无知。或者,如果我们知道特定过程的持续时间——例如,转录所需时间是蛋白质修饰的两倍——我们可以使用​​显式延迟​​将此信息构建到模型中。每一种选择都反映了关于我们对系统时序已知和未知的不同认知立场。

因此,对基因调控网络进行建模不仅仅是一次数学习题。它是一次发现之旅,我们在这里构建现实的简化图景,测试它们,并利用它们揭示出优雅的反馈、稳定性和信息处理原理,正是这些原理使得单个基因组能够指挥生命的交响乐。

应用与跨学科联系

在熟悉了基因调控网络的原理和数学形式之后,我们现在来到了旅程中一个激动人心的部分。就像学习国际象棋的规则一样,理解基本走法是一回事,而观赏大师对弈中展现出的惊人策略则是另一回事。在本章中,我们将探索节点、边和微分方程这些抽象概念如何为生物现象注入生命,甚至在远超生物学的领域中找到回响。我们将看到,对基因调控网络进行建模不仅仅是编目零件;它是一种思维方式,一个我们可以借此洞察生命复杂织锦中深刻、内在统一性的透镜。

生命的逻辑:解码发育程序

如果DNA是细胞的硬件,那么基因调控网络就是它的软件——执行宏伟发育程序的复杂算法。这些程序并非用简单的线性代码编写;它们是动态的、响应迅速的,并且充滿了优雅的逻辑。其中一些最基本的操作是决策和时钟。

想象一个处于十字路口的细胞,需要决定走向两种不同命运中的一种——成为形成稳定片层的上皮细胞,还是准备迁移的间充质细胞。这就是上皮-间充质转化(EMT)的本质,这一过程对胚胎发育至关重要,但不幸地在癌症转移中被利用。细胞如何做出这样二元、不可逆的选择?答案往往在于一个简单而优美的电路:​​触发开关​​。这个网络涉及两个转录因子,比如说SSS和ZZZ,它们相互抑制。当SSS水平高时,它关闭ZZZ;当ZZZ水平高时,它关闭SSS。这种相互拮抗创造了两种稳定状态,或称*吸引子*:一种是高SSS低ZZZ(“S-开启”状态),另一种是低SSS高ZZZ(“Z-开启”状态)。该系统就像一个简单的电灯开关;一旦翻转,它就保持其状态,提供了一种细胞记忆的形式。通过分析该系统的数学原理,我们发现这种双稳态仅在抑制足够强且非线性时才会出现——这个条件被称为分岔。一旦超过调控强度的临界阈值,那个单一的、未决定的状态就会分裂成两个稳定的、已定的命运。

模拟这些急剧的、类似开关的转变,对计算科学家来说是一个引人入胜的挑战。系统的动力学可能是“刚性的”——长时间的缓慢变化 punctuated by(穿插着)极其快速的转变时刻。一个幼稚的数值模拟可能会在这里 stumbling(遇到困难),采取极小的步长或产生无意义的振荡。为了准确捕捉这种行为,我们必须转向数值分析中更稳健的工具,如后向欧拉法,即使在系统发生剧烈跳跃时它也能保持稳定。这是一个完美的例子,说明了生物学中的深刻问题如何推动创新并需要数学和计算机科学的复杂工具[@problemid:3208308]。

除了做决策,发育还需要精确的时间控制。以线虫 C. elegans为例,这是发育生物学家钟爱的模式生物。它的幼虫发育经历一系列离散的阶段,从L1到L4,这些转变由一个“异时”通路控制。一个关键事件是从L1到L2的转变,这是由一个名为 lin-14 的蛋白质被抑制所驱动的。其抑制物不是另一个蛋白质,而是一个小RNA分子,一个名为 lin-4 的微小RNA。在早期的L1阶段,lin-4 缺失,所以 lin-14 蛋白很丰富。随着幼虫的发育,lin-4 水平上升。这些微小RNA与 lin-14 的信使RNA结合,不是摧毁它,而是阻止它被翻译成蛋白质。我们可以用简单的质量作用动力学来对此建模。随着 lin-4 浓度 RRR 的增加,lin-14 蛋白的稳态水平 PssP_{\mathrm{ss}}Pss​ 根据类似 Pss∝(KK+R)nP_{\mathrm{ss}} \propto \left(\frac{K}{K+R}\right)^nPss​∝(K+RK​)n 的关系急剧下降,其中 nnn 是结合位点的数量。一旦 PssP_{\mathrm{ss}}Pss​ 降至一个临界阈值以下,向L2阶段的转变就被触发。这个优雅的机制就像一个分子时钟,确保发育事件以正确的顺序和在正确的时间发生。

处理信号与创造模式

细胞并非孤立存在;它们不断交流,告诉彼此它们在哪里以及应该变成什么。基因调控网络是这个操作的大脑,处理传入的信号以生成连贯的空间模式。

一个经典的例子是Notch-Delta信号通路,它在整个动物王国的组织中创造出精细的模式。在我们的肠道内壁,干细胞必须决定是成为吸收细胞还是分泌细胞。一个在其表面表达高水平Delta配体的细胞会激活其邻居细胞中的Notch受体。这种Notch激活反过来会抑制接收细胞内的 Atoh1 基因。高 Atoh1 导致分泌性命运,而低 Atoh1 导致吸收性命运。这是一个“侧向抑制”的优美实例:一个选择分泌命运的细胞告诉它的邻居,“不要像我一样!”结果是在大多数吸收细胞中散布着少数分泌细胞。我们可以将这整个逻辑链捕捉到一个定量模型中。外部Delta信号 DextD_{\mathrm{ext}}Dext​ 产生一个内部Notch活性 NNN,后者又设定 Atoh1 的水平 AAA。通过组合这些函数,我们可以推导出一个精确的解析表达式,用于计算能够翻转 Atoh1 开关并决定细胞命运的临界外部Delta水平。

当然,自然界是充满噪声的。信号可能会波动,细胞必须做出可靠的决策。在这里,另一个常见的网络基序,​​前馈回路(FFL)​​,发挥了作用。在一个相干FFL中,一个主转录因子 XXX 直接激活一个靶基因 ZZZ,同时也激活一个中间因子 YYY,而 YYY 也回头激活 ZZZ。这种布局可以充当一个“持久性检测器”。一个短暂的、虚假的 XXX 脉冲可能持续时间不够长,不足以让 YYY 积累并激活 ZZZ。只有来自 XXX 的持续信号才能使电路的两个分支都变得活跃,从而在 ZZZ 处产生强烈的输出。为了真正理解这类电路的逻辑,我们可以采用物理学家常用的一个经典技巧:无量纲化。通过对时间和浓度变量进行重新缩放,一个有十几个参数的系统可以被简化为少数几个控制其定性行为的、本质性的无量纲组。这揭示了其中起作用的核心原理,将它们与特定单位或尺度的偶然细节分离开来。

从蓝图到建筑:形态发生的物理学

基因调控网络是发育的蓝图,但蓝图不是建筑。GRN的“软件”如何指导细胞的“硬件”来物理地塑造一个组织,将一个上皮片层折叠成一个芽,或者形成肠道复杂的隐窝和绒毛?答案在于生物学、物理学和工程学的交叉点——在多尺度建模领域。

让我们想象一个类器官,一个在培养皿中生长的“迷你器官”,它从一个简单的球形细胞壳开始。要预测这个球体如何可能自发地打破对称性并形成芽,我们必须考虑在巨大差异的空间和时间尺度上发生的各种过程的相互作用。我们有每个细胞内部的GRN,在分钟到小时的时间尺度(τg\tau_gτg​)上响应它们的环境。这些细胞正在消耗营养物质,这些物质在秒到分钟的时间尺度(τd\tau_dτd​)上通过组织扩散。GRN反过来控制着细胞增殖,这发生在数小时(τp\tau_pτp​)的时间尺度上,并调节细胞内部的细胞骨架,产生主动的机械力。这些力使组织变形,组织在秒的时间尺度(τm\tau_mτm​)上机械地松弛。

通过比较这些特征时间尺度,一个清晰的图景浮现出来:τm≪τd≪τg≲τp\tau_m \ll \tau_d \ll \tau_g \lesssim \tau_pτm​≪τd​≪τg​≲τp​。力学过程是如此之快,以至于可以认为组织在任何时候都处于力平衡状态——一种准静态平衡。与基因表达相比,营养场也很快,因此我们可以在每个时间点求解空间营养梯度。GRN和细胞生长是缓慢的驱动过程。因此,一个预测性模型必须耦合这些尺度:

  1. 一个​​传输模型(PDE)​​计算空间营养梯度。
  2. 局部营养浓度输入到每个细胞中的​​GRN模型(ODEs)​​。
  3. GRN的输出决定了局部属性,如主动收缩性和增殖率。
  4. 这些属性输入到一个​​组织力学模型(PDE)​​,该模型计算力以及由此产生的形状变化。
  5. 新的形状更新了营养传输模型的几何结构,从而闭合了回路。

这是一曲真正的科学交响乐,其中基因调控、传输现象和固体力学汇聚在一起,预测生物形态的涌现。它表明,要理解一个有机体是如何构建的,你不能只做一个生物学家;你还必须有点像物理学家和工程师。

反向工程网络:从数据到发现

到目前为止,我们大多假设我们知道网络的布线图。但如果我们不知道呢?这是现代基因组学的核心挑战:我们可以测量细胞中每个基因的表达,但我们如何推断它们之间调控连接的网络?这就像同时聆听管弦乐队中所有乐器的演奏,并试图重建作曲家的乐谱。

简单地关联基因表达水平的幼稚方法充满了危险。两个基因可能高度相关,仅仅因为它们都在同一种细胞类型中活跃,或者都响应同一个上游信号,而不是因为一个调控另一个。为了揭示因果联系,我们需要做一名优秀科学家总是做的事情:进行实验。我们需要干预。现代的工具是​​Perturb-seq​​,我们使用CRISPR技术系统地敲低或“扰动”特定基因,然后在单细胞中测量全部的转录组后果。

这正是我们的理论模型为数据分析提供强大指导的地方。回想一下,在我们的ODE模型中,雅可比矩阵JJJ编码了网络的直接因果联系——条目JijJ_{ij}Jij​是基因jjj对基因iii变化率的影响。当我们对一个基因的生产率施加一个小的、靶向的扰动u\mathbf{u}u时,系统会稳定到一个新的稳态,表达上有一个小的变化Δx\Delta\mathbf{x}Δx。动力学系统理论告诉我们,这些量由一个简单而深刻的方程联系在一起:JΔx≈−uJ \Delta\mathbf{x} \approx -\mathbf{u}JΔx≈−u。这是线性响应理论,物理学的一个基石,被重新用于反向工程一个活体网络。通过逐个扰动我们感兴趣的每个基因并测量响应矩阵ΔX\Delta XΔX,我们基本上可以求解雅可比矩阵,J≈−U[ΔX]−1J \approx -U [\Delta X]^{-1}J≈−U[ΔX]−1,从而读出网络的布线图。

当然,单一实验永远不够。通过整合多种正交的数据类型,我们可以获得巨大的信心。例如,在研究植物的茎端分生组织时,我们可以结合几种前沿技术。我们可以使用​​RNA velocity​​,它分析剪接和未剪接的转录本,以获得系统动力学的一个快照——我们ODE中dxdt\frac{dx}{dt}dtdx​项的一个估计。我们可以使用​​空间转录组学​​来了解哪些细胞是邻居,从而约束哪些细胞可以相互发出信号。我们还可以使用​​ATAC-seq​​来绘制开放染色质的区域,告诉我们转录因子可能在哪里结合。然后,强大的计算框架,如动态贝叶斯网络或基于ODE的稀疏回归,可以整合所有这些信息来源——动力学、空间邻接性和先验可能性——来推断一个丰富的、具有空间意识的、因果的基因调控网络模型。

普适原理:超越生物学

网络组织和动力学的原理是如此基本,以至于它们超越了生物学。我们在各种系统中都能发现相同的思想、相同的基序和相同的数学结构。

考虑演化的宏大画卷。新的生物形态和功能是如何产生的?演化是一个修补匠,而不是一个工程师。它很少从头构建新的结构;相反,它征用并重新布线现有的基因调控网络。我们可以使用像​​布尔网络​​这样的简化框架来对此过程建模。在这里,基因是简单的开/关开关,表型对应于网络的吸引子——基因表达的稳定模式。导向特定吸引子的初始状态集是其“吸引盆”,这可以看作是发育稳定性的一个隐喻。现在,想象一个突变创造了一个新的增强子,这可以建模为添加一个新的输入,迫使某个特定基因为“开”。通过模拟这个变化前后的网络,我们可以看到这个简单的重新布线如何戏剧性地重塑了可能性的景观。一个古老的祖先表型的吸引盆可能会缩小,而一个新的、衍生表型的吸引盆可能会出现或增长。这为思考可演化性——网络结构如何促进或约束新颖性在演化时间中的出现——提供了一个具体的、可计算的框架。

也许最令人惊讶的是,这些思想在金融和经济学世界中也找到了用武之地。让我们看看银行间借贷的网络。如果银行iii对银行jjj有风险敞口,我们可以从iii到jjj画一条有向边。一位受GRN启发的学者可能会在这个金融网络中寻找网络基序。其中一个基序是“双扇”,即两个贷款银行都贷款给相同的两个借款银行。这在结构上类似于GRN中的“密集重叠调控子”(DOR),即两个主转录因子共同调控一组靶基因。在金融网络中,这个基序可能看起来很高效,但它也创造了一个紧密相连的、集中的、相关的风险集群。如果其中一个借款人遇到麻烦,它会立即影响到两个贷款人;如果其中一个贷款人倒闭,两个借款人都将失去一个资金来源。这个基序可能是系统性风险的一个指标——一个“大到不能倒”的集群。

为了检验这个假设,必须严谨。不能简单地计算基序的数量。必须问:它们是否“富集”?也就是说,与一个保留了真实网络基本属性(如每家银行发放和接收的贷款数量)的随机网络相比,它们出现的次数是否比偶然预期的要多?此外,如果我们测试数百种不同的基序,我们必须进行多重假设检验校正,以避免被随机性所愚弄。最后,就像在生物学中一样,仅仅发现一个富集的结构是不够的。我们必须将其与动力学联系起来——通过在网络上模拟金融传染或分析历史数据——来证明这些基序确实在放大金融冲击中发挥了作用。这个例子有力地提醒我们,网络科学的原理——以及严谨科学探究的原理——为理解复杂的、相互连接的系统提供了一种通用语言,无论这些系统是由蛋白质、神经元还是美元构成的。