
进化是如何构建复杂性并找到解决方案的,从一个更高效的酶到一个耐药细菌?这个过程可以被看作是一场穿越广阔可能性空间的旅程,一个“适应度景观”,其中海拔代表性能。适应性行走是描述这场旅程的强大模型,解释了种群如何一步步地攀登这个景观,走向更高的适应度。然而,这条路很少是笔直的,这就引出了问题:是什么决定了路线?当旅程受阻时会发生什么?本文深入探讨了适应性行走模型。在第一章“原理与机制”中,我们将解析基本概念,从最简单的上坡攀登到崎岖景观、上位性和进化死胡同的复杂性。随后,在“应用与跨学科联系”中,我们将看到这个抽象模型如何为医学、分子生物学乃至复杂社会系统动力学等紧迫的现实世界挑战提供关键见解。
想象一下,你想创造出某物的最佳版本——一辆更快的汽车、一个更高效的酶,或者一种能逃避我们免疫系统的病毒。所有可能设计的集合,即你能构想出的每一个蓝图,构成了一个广阔的可能性空间。在生物学中,这被称为基因型空间。让我们用一种简单的方式来描绘它。如果一个设计由一个包含 个开关的序列指定,每个开关要么是“开”(1)要么是“关”(0),那么我们就有 种可能的基因型。这些基因型并非一团乱麻,它们是相互连接的。一次开关的翻转——即一次突变——会将你从一个基因型移动到这个巨大超维空间中的一个相邻基因型。距离给定基因型只有一个突变之遥的所有基因型的集合,就是它的邻域。
现在,有些设计比其他的更好。我们可以为每个基因型分配一个“性能得分”或适应度,我们可以把它想象成该点上陆地的高度。这就创造了一个壮丽的、多维度的适应度景观。宏大的进化过程,其本质就是在这个景观上的一次行走。适应性行走是描述这场旅程最简单也最强大的模型。它描述了一个种群从较低适应度状态到较高适应度状态的逐步跋涉。
为了理解这种行走,我们从最简单的条件开始,即生物学家所称的强选择弱突变(SSWM)范式。这个名字听起来复杂,但其思想既简单又优美。“弱突变”意味着突变非常罕见,以至于种群一次只处理一个突变。一个新的突变出现后,在下一个突变出现之前,第一个突变要么已经消失,要么已经遍布整个种群(这一事件称为固定)。“强选择”意味着适应度差异至关重要。如果一个突变是有益的,选择会青睐它并推动其固定;如果它是有害的,选择会无情地将其清除。
因此,在 SSWM 条件下,适应性行走是一系列有益突变的序列,每一个突变都取代前一个,推动种群在适应度景观上稳步上坡。最简单的景观是什么样的?它是一个没有意外的景观,一个像富士山(Mount Fuji)一样平滑、雄伟的山峰。在这样的景观上,被称为加性景观,基因型各部分的适应度贡献与其他所有部分都是独立的。改变一个开关会增加或减少一个固定的适应度量,而不管其他开关的状态如何。
在这种田园诗般的景观上,到达顶峰的旅程异常直接。从任何非全局峰值的点出发,总有一个上坡的步骤可供选择。适应性行走就是将所有“关”的开关翻转到其最佳“开”状态所需的一系列步骤。如果全局峰值距离有 个突变,那么行走将恰好需要 步。而且由于顺序无关紧要,到达那里有 (L的阶乘)条惊人数量的不同路径,所有路径都是严格上坡的。这是进化美丽而可预测的基线。但是,正如你可能猜到的,自然界很少如此简单。
在一个完美简单的世界里,每一次改进都会让你更接近最终的顶峰。但自然是一场更微妙的游戏。一个变化的效果常常取决于它之前的变化。这个关键概念被称为上位性。想象一个细菌试图进化出对抗生素的耐药性。有两个可能的突变,A 和 B。从野生型(wt)开始,获得突变 B 会给它带来不错的适应度提升。但单独获得突变 A 实际上是有害的——它使细菌的适应度降低。所以路径 是一个下坡步骤,进入一个适应度谷,自然选择会迅速将其淘汰。前进的唯一途径是 。
然而,一旦细菌拥有了突变 B,神奇的事情发生了:获得突变 A 现在变得非常有利!这被称为符号上位性:一个突变效果的符号(好或坏)会根据遗传背景而翻转。这一个现象带来了深远的影响:它创造了路径依赖。进化之旅不再是自由放任的;它变成了一个受约束的、历史上偶然的过程。种群的命运取决于哪个突变先发生。事件的顺序至关重要,两种可能的突变顺序中只有一种是进化可以利用的。
这种路径依赖可能导致一个更奇怪的结果:被困住。因为自然选择从根本上是短视的——它只能偏爱当前更好的选择——它没有能力做长远规划。这种短视性可以引导一个种群走向进化的死胡同。
考虑一个简单基因调控网络的进化,其中几个连接的有无决定了一个基因的活性水平,而目标是达到一个特定的目标活性水平。追踪可能的适应性行走会发现,虽然一些突变路径通向具有最高适应度的基因型(全局峰值),但其他路径最终会停留在作为局部适应度峰值的基因型上。一个局部峰值是一座不错的山丘,但不是景观中最高的山。从这个位置看,每一步单突变都会导致下坡。种群被困住了。
即使通往全局峰值的路径存在,这种陷阱也可能发生。在某些景观中,提供最大即时适应度回报的步骤可能会引诱种群走上一条终止于次优局部峰值的轨迹。而一个替代的、起初不太有希望的步骤——纯粹的贪心算法会忽略的步骤——可能才是解锁通往真正顶峰路径的关键。进化,就其本质而言,无法看到整个地图。它攀登最近的斜坡,却不知道这可能只会通向一个小山顶,而不是珠穆朗玛峰。
我们已经看到了复杂景观的后果——偶然性和陷阱——但究竟是什么首先让景观变得崎岖不平?一个名为NK 模型的绝妙理论工具为我们深入理解这个问题提供了可能。想象一个有 个部分(如基因)的系统。其适应度景观的崎岖程度由一个参数 控制,该参数代表每个部分与其他多少个部分相互作用。
当 时,不存在上位性。每个部分对适应度的贡献是独立的。这给了我们开始时那个平滑、可预测的“富士山”景观,它只有一个峰值。随着我们增加 ,我们增加了上位性相互作用的网络。现在,一个单一的突变会产生级联效应,同时改变许多部分的适应度贡献。景观变得褶皱和折叠,变得更加崎岖。局部峰值的数量呈爆炸式增长。
在极限情况下,当 时,每个部分都与所有其他部分相互作用。这是一个最大复杂的“纸牌屋”(House-of-Cards)景观。任何突变体的适应度几乎与其亲本完全不相关。在这样的景观上,局部峰值的数量是巨大的。事实上,对于一个随机选择的基因型,它成为局部最大值——即适应性行走的死胡同——的概率是一个惊人地简单的 。对于任何复杂系统来说,这意味着被困住不仅仅是一种可能性,而是一种压倒性的预期。
经典的适应性行走是一个强大的起点,但我们可以增加现实层面,使其更能描述自然世界。
随机步长与突变偏好: 最简单的行走假设任何上坡的步骤都会被采纳。但是哪一个呢?贪心行走总是选择适应度最高的邻居。而更现实的随机行走可能会在可用的上坡步骤中进行概率性选择,也许会偏爱适应度增益更大的步骤,但并不保证选择它们。此外,行走的方向不仅仅由适应度决定。一些突变本质上比其他突变更容易发生。例如,在病毒的进化中,走某条特定路径的概率取决于每个突变的适应度优势及其潜在突变率的组合。进化是一场赛跑,奖品的大小和赛跑者的速度都同样重要。
重组的巨大飞跃: 仅通过单一突变进化的无性生物被限制在探索景观上的直接邻域。而有性生殖,或任何形式的重组,则完全改变了游戏规则。通过洗牌来自不同亲本的遗传物质,重组可以在一代之内创造出与任一亲本相距多个突变步骤的后代。这使得种群能够在基因型空间中进行“长距离跳跃”,有可能直接越过那些会困住适应性行走的适应度谷。这是进化为解决被困问题所设计出的最巧妙的方案之一。
最后,我们必须考虑对这幅图景的一个最深刻的补充:并非所有突变都会改变适应度。对适应度没有影响的突变被称为中性突变。由中性突变连接起来的基因型集合在适应度景观上形成了广阔的中性网络或高原,所有这些都处于相同的“海拔”高度。
在中性高原上,选择是盲目的。种群不是在攀登,而是在随机漂变,在基因型空间中进行一种类似醉汉行走的运动。这种徘徊并非毫无意义。通过漂变,种群可以在不付出适应度代价的情况下探索广阔的新景观区域。最终,它可能漂变到高原上的一个位置,该位置邻近一个全新的适应性峰值,为新一轮的攀登打开了一扇门。找到这样一条出路所需的时间取决于中性网络的结构,以及种群在远离这些进化出口的区域花费了多少时间。
当中性漂变和适应性攀登之间的这种相互作用在环境变化时尤为关键。一个突然的变化,比如引入一种新药,可以从根本上重塑整个适应度景观。曾经的高峰可能变成深谷。一个被困在那个前高峰上的种群现在处境岌岌可危,可能需要穿越一个宽阔的低适应度鸿沟才能生存。但一个一直在中性网络上漂变的种群可能会因为纯粹的运气,发现自己已经位于某个新出现的峰值附近,从而在新的进化竞赛中获得关键的领先优势。因此,适应性行走不仅仅是一场不懈的攀登,它是一场在攀登、漂变和适应度景观本身不断变化的崎岖地形之间的复杂舞蹈。
我们在抽象形式下探讨的适应性行走于适应度景观之上的思想,远不止是一个科学比喻。它是一面透镜,一种思维工具,为我们周围世界中一些最复杂和最重要的过程带来了清晰的认识。一旦你学会用景观和行走的视角看待世界,你就会开始在各处看到它们——从单一感染的微观战场,到生命历史的宏伟织锦,甚至延伸到人类社会的复杂网络中。让我们踏上穿越这些不同领域的旅程,看看这个简单的概念如何照亮它们所有。
适应性行走最直接、最紧迫的应用可能是在医学领域,我们在此与不断进化的病原体进行着一场永无休止的军备竞赛。每当我们使用一种新药,我们不仅是在治疗一个病人,我们也是在改造一个适应度景观,而病原体则重新开始它们的行走。
思考抗生素耐药性这一祸害。细菌,凭借其庞大的种群和快速的代际时间,是适应度景观的探索大师。当我们使用抗生素时,我们创造了一个强大的选择压力——景观上的一座陡峭山峰,其顶峰代表完全耐药。一个最初在易感性的低适应度平原上挣扎的细菌种群,开始了它的适应性行走。它所走的路径并非随机。它几乎总是会遵循最陡峭的上升路径,采取能提供最大即时生存优势的突变步骤。
这不仅仅是一个理论游戏。通过对不同突变的适应度进行建模,我们可以预测通往耐药性的可能路径,更重要的是,可以设计策略使这条路径尽可能难以逾越。例如,一个模型可能显示,联合使用两种药物会创造一个细菌必须穿越的“适应度谷”——这条路径代价如此之高,以至于进化被有效阻止。相反,依次使用同样的两种药物可能会为通往多重耐药性顶峰提供一条平滑的、阶梯式的斜坡。因此,适应性行走框架将公共卫生策略从一种猜谜游戏转变为一种进化预测的形式。
同样的剧情在我们自己身体内癌症进展的过程中上演。一个肿瘤不是一个静态的整体,它是一个翻腾、进化的细胞种群。这个过程,被称为体细胞进化,是一次教科书式的适应性行走。“适应度”对于一个癌细胞来说是其增殖、逃避免疫系统和抵抗治疗的能力。这个景观极其崎岖,由基因间的复杂相互作用所定义。一个基因的突变可能是有益的,但它的效果可能被另一个基因的突变放大甚至抵消——这种现象被称为上位性。这创造了一个充满险恶峰谷的景观。一个癌细胞种群可能攀升到一个“局部峰值”,对一种疗法产生抗性,结果却被困住,无法在不先下降到适应度更低的谷底的情况下找到通往更高恶性程度峰值的路径。理解这个崎岖的景观是现代癌症治疗的关键,其目的就是将进化中的癌症困在这些进化死胡同里。
故事在病毒这里继续,它们是进化世界的短跑选手。对于像艾滋病病毒(HIV)这样的病原体,适应度景观甚至不是固定的;它是一个动态的、晃动的地形。病毒变种的适应度取决于抗病毒药物的浓度,而这在病人体内是随时间变化的。因此,病毒是在一个随着每一剂药物而起伏变形的景观上进行适应性行走。更可怕的是人畜共患溢出的可能性——病毒从动物宿主跳到人类宿主。一种动物病毒可能距离获得与人类细胞结合的能力仅有一两个突变“步骤”。利用适应性行走的原理,群体遗传学家可以根据病毒突变率和每一步所赋予的适应度优势等因素,估算出这次进化飞跃发生的预期等待时间。这使我们能从对“下一次大流行”的模糊焦虑,转向对风险的定量评估,识别出哪些动物宿主中的哪些病毒构成了最可信的威胁。
适应性行走不仅是关于破坏和疾病的故事。它也是生物新颖性的总设计师,是生命优雅的复杂性得以一步步构建起来的过程。
思考我们自身基因组的进化。创新的最强大引擎之一是基因重复。当一个基因被意外复制时,生物体就有了备用件。这个多余的拷贝会发生什么?答案由一场关于功能的适应性行走决定。行走可能导致亚功能化,即每个拷贝专门化并分担原始基因的职责。或者,它可能导致新功能化,这是一个更令人兴奋的结果,即备用拷贝可以自由探索新的突变路径,最终为生物体获得一个全新的功能。正是这个过程,在获得新功能的好处和维持基因的成本之间的权衡引导下,解释了控制从我们免疫系统到大脑发育的一切的庞大基因家族的起源。
这种构建过程也可以在更宏大的尺度上发生。复杂的分子机器通常不是从零开始发明的,而是由预先存在的功能模块组装而成。例如,使我们神经冲动成为可能的优雅的电压门控钾离子通道,被认为起源于一个更简单的细菌祖先。进化的“步骤”不是一个单点突变,而是一个基因融合事件,它将一个预先存在的“电压感应”模块栓接到了一个祖先的“孔道”模块上。从这个意义上说,进化是一位乐高大师,它的适应性行走涉及添加整个预制模块来创造具有新能力的新结构。
但这个“适应度”景观究竟是由什么构成的?它并非抽象之物。通常,它是由物理和化学的硬性约束锻造而成。想象一个病毒,它面临一个根本性的权衡。它必须足够稳定以在从一个宿主到另一个宿主的旅程中存活,但它也必须足够不稳定以便在进入宿主细胞后分解并释放其遗传物质。这是一个生物物理优化问题。太稳定,感染就会失败。太不稳定,病毒粒子就会在环境中消亡。存在一个“金发姑娘区”般的稳定性区域。病毒的适应性行走是在可能蛋白质结构空间中寻找这个最佳物理特性的峰值,平衡稳定性和脱壳的能量壁垒,以最大化其传播机会。
从单个分子和基因的尺度放大,适应性行走能告诉我们关于数百万年进化宏大模式的任何信息吗?生命史上的一个巨大谜题是在化石记录中看到的间断平衡模式——长期的表面停滞,被快速的变化爆发所“间断”。这似乎与缓慢、渐进的行走观念相矛盾。
但是,一个巧妙的适应性行走模型可以解决这个悖论。想象一个生物体有一个可以缓冲遗传突变影响的“稳健性”机制。在这种情况下,遗传变异可以悄无声息地累积,就像弹簧中积聚的张力。生物体的表型没有改变,所以它看起来处于停滞状态。然而,这种隐藏的变异仍然存在。如果稳健性机制——由于环境压力或一个关键突变——失效,所有累积的变异可以一次性释放出来,导致生物体形态的突然、剧烈跳跃。遗传行走是渐进的,但表型表达是间断的。值得注意的是,这类模型预测这些进化跳跃的大小应遵循一种特定的数学模式,即幂律分布,这是在许多复杂自然现象中看到的标志。
当谱系在进化时间中进行这些行走时,它们在DNA中留下了足迹。我们如何重建这条路径?这是系统发育学的工作,一种进化法医学。通过比较现存生物的基因组,科学家可以识别出共享的遗传变化——从单字母的单核苷酸多态性(SNPs)到大规模的结构变异——这些变化充当可遗传的标记。例如,基因组重排的断点可以被视为构建进化树的性状。这棵树是无数谱系所走的适应性行走的地图,使我们能够追踪像 SARS-CoV-2 这样的病毒在宿主物种之间跳跃时的传播路径。
一个科学概念真正的力量和美丽在于它超越了其原始领域。适应性行走不仅仅是关于生物学的。它是任何复杂适应性系统(CAS)中变化的基本描述。CAS 是指任何由众多相互作用的“智能体”组成的系统,这些智能体根据其环境的反馈来调整自己的行为。
想一个试图减少吸烟的社区健康倡议。该社区就是一个 CAS。“智能体”是根据成本、社会规范、广告和自身健康做出决策的个人。一项干预措施——比如新的税收或广告宣传——改变了这些决策的“景观”。社区的整体吸烟率并不仅仅是线性变化的;它可能会达到一个临界点,届时社会规范发生转变,并发生戒烟的级联效应。人们根据看到对朋友有效的方法来调整自己的策略。过去干预的历史很重要。这整个过程,及其非线性、反馈、适应性和路径依赖性,就是一个社会在公共卫生景观上的一次适应性行走。
这种思维方式无处不在。一项新技术的开发是在设计空间中的一次适应性行走。一个经济体的演变是在政策和市场机会景观上的一次适应性行走。甚至科学本身的进步也是一种适应性行走,因为理论根据其解释世界的能力而被修改和选择。
从一个细菌进化出对药物的抗性,到生命复杂性的起源,再到我们社会变革的方式,一个在景观上行走的简单、直观的图像提供了一个深刻而统一的框架。它告诉我们,变化通常是渐进的,但并非总是平滑的;历史很重要;世界是由相互关联、不断演变的系统组成的织锦,所有系统都在寻找更高的地方。