Home进化中的上位性

进化中的上位性

SciencePedia

定义

进化中的上位性是指基因非叠加效应引起的现象，即某一突变的效应取决于其出现的遗传背景。上位性通过产生具有多个峰值和谷值的崎岖适应度地形，使得进化成为一个依赖于突变顺序的历史偶然过程。它是导致物种形成、耐药性进化以及病毒和癌症适应等重大进化现象的核心驱动力。

核心要点

上位性是指任何偏离基因加性效应的现象，意味着一个突变的影响取决于它出现的遗传背景。
通过创造一个包含多个高峰和低谷的“崎岖适应度景观”，上位性使进化成为一个突变顺序至关重要的、历史上偶然的过程。
交互符号上位性，即两个突变单独有害但共同存在时有益，是形成多个适应度高峰和局部最优点的根本原因。
上位性是许多主要进化现象背后的驱动力，包括通过遗传不相容性产生新物种、耐药性的进化，以及病毒和癌症的适应。

引言

在生命研究中，我们常常寻求简单的法则，认为生物体的性状是其遗传部件的总和。然而，这种加性观点是极不完整的。基因并非独立运作；它们是复杂互动网络的一部分，其中一个基因的作用取决于其他基因。这种基因背景依赖性的基本原理被称为上位性，它解决了对基因的简单计算与生物功能和进化的真实复杂性之间的关键知识鸿沟。本文将深入探讨由这些基因相互作用所塑造的世界。

本文将首先在“原理与机制”部分解析核心概念，定义上位性，区分其各种形式，并介绍 Sewall Wright 提出的强大隐喻——崎岖的适应度景观。随后，“应用与交叉学科联系”部分将探讨这些原理如何在生物世界中发挥作用，揭示上位性在从单个蛋白质折叠、耐药性进化到新物种起源等一切事物中的“无形之手”。通过理解这些相互作用，我们不再将进化视为简单的攀登，而是欣赏其为一个复杂、偶然且无穷迷人的旅程。

原理与机制

想象一下你在造一辆车。你有一个引擎、一套轮子、一个底盘和一个方向盘。你可以孤立地衡量每个部件的“优良”程度。引擎很强大，轮胎抓地力极佳。但是，它们各自品质的简单相加，能告诉你这辆车开起来感觉如何吗？当然不能。引擎必须与底盘匹配，转向系统必须与车轮连接。这些部件必须相互作用。它们的价值是与背景相关的。遗传学的世界也是如此。基因不是孤独的记账员，各自为生物体的适应度添砖加瓦。它们是一个委员会、一个团队、一个复杂互动网络的成员。一个基因的效果常常戏剧性地取决于其他哪些基因存在。这种遗传背景依赖现象被称为上位性。

一个充满相互作用的世界：什么是上位性？

要理解相互作用，我们必须首先想象一个没有相互作用的世界。让我们想象一个简单的生物，比如一个只有两个基因 A 和 B 的细菌。我们可以做出的最简单、最直接的假设——我们的“零假设”——是突变的效果是加性的。如果基因 A 的一个突变给生物体的适应度增加了 $s_A$ 的值，而基因 B 的一个突变增加了 $s_B$ 的值，那么两个突变一起应该增加 $s_A + s_B$ 。双突变体的适应度将是祖先的适应度加上各个独立效应的总和。这是一个干净、简单、线性的世界。

上位性，简而言之，就是对这种加性预期的任何偏离。它是遗传学家用来描述整体不总是部分之和这一原则的术语。它是生命方程中的相互作用项。我们可以量化它。如果我们将祖先的适应度记为 $w_{ab}$ ，单突变体记为 $w_{Ab}$ 和 $w_{aB}$ ，双突变体记为 $w_{AB}$ ，那么双突变体的加性预测是 $w_{pred} = w_{ab} + (w_{Ab} - w_{ab}) + (w_{aB} - w_{ab})$ 。上位性偏差 $\varepsilon$ 是现实与此预测之间的差异： $\varepsilon = w_{AB} - w_{pred}$ 。如果 $\varepsilon$ 为零，我们就生活在一个加性的世界里。如果 $\varepsilon$ 不为零，那么上位性就在起作用。

这种偏差可以有多种“风格”，每种都有截然不同的后果。

首先是幅值上位性。在这种情况下，突变效果的符号不变，但其幅度会改变。一个突变本身可能是有益的，在第二个突变存在时甚至更有益。例如，在暴露于抗生素的细菌中，一个突变可能削弱药物的结合，而第二个突变可能更有效地将药物泵出。它们共同的效果可能大于它们各自效果的总和。这也被称为协同上位性。相反，两个有益突变的组合效果可能小于它们各部分的总和——这是一种收益递减的情况，或称为拮抗上位性。

真正的进化戏剧始于符号上位性。这时，一个突变的效果会根据其遗传伙伴从正转为负（或反之）。想象一个微生物实验装置，我们测量两种突变 A 和 B 的适应度效应。我们可能会发现，突变 A 单独存在是有害的；它降低了微生物的适应度（ $w_{Ab} w_{ab}$ ）。但在一个已经拥有突变 B 的微生物中，加入突变 A 突然变得有益了（ $w_{AB} > w_{aB}$ ）。突变 A 从敌人变成了朋友，全因为背景改变了。

最极端且最迷人的形式是交互符号上位性。这种情况发生在两个突变单独有害，但共同存在时却极好。考虑一个假设情景，其适应度值如下：祖先（ $ab$ ）的适应度为 0，每个单突变体（ $Ab$ 和 $aB$ ）的适应度为 -1，但双突变体（ $AB$ ）的适应度为 +3。在这里，突变 $A$ 在祖先背景下是有害的（ $0 \to -1$ ），但在 $B$ 背景下却是有益的（ $-1 \to 3$ ）。突变 $B$ 也是如此。每个突变都需要另一个突变的存在才变得有益。为了从祖先状态达到高适应度的双突变体状态，种群必须穿过一个“适应度谷”。

相互作用的语言：基因、等位基因和尺度

在我们探究这些相互作用的后果之前，我们必须精确我们的语言。生物学家经常谈论另一种相互作用：显性。区分这两者至关重要。显性是一种位点内相互作用，即在二倍体生物（如人类）中单个基因上两个等位基因之间的相互作用。例如，在 Gregor Mendel 的豌豆中，紫色花等位基因（ $P$ ）对白色花等位基因（ $p$ ）是显性的。基因型为 $Pp$ 的植株开紫花； $p$ 等位基因的效果被掩盖了。这是在基因组同一地址上 $P$ 和 $p$ 之间的相互作用。而在现代用法中，上位性指的是位点间相互作用——一个基因（例如，决定花色的基因）上的等位基因如何受到另一个基因（例如，控制色素产生的基因）上等位基因的影响。

此外，上位性的检测本身就取决于你选择如何测量事物。这有点像描述运动；你的描述取决于你的参考系。在遗传学中，我们的“参考系”是我们用来度量适应度的数学尺度。想象两个突变，一个使适应度加倍（ $w \to 2w$ ），另一个使其增加两倍（ $w \to 3w$ ）。如果我们使用乘性尺度（赖特适应度），我们期望双突变体的适应度是原始适应度的 $2 \times 3 = 6$ 倍。如果是这样，我们会说没有上位性。但在加性尺度上，如果祖先的适应度为 1，第一个突变的效果是 $+1$ ，第二个效果是 $+2$ 。我们预测最终适应度为 $1+1+2=4$ 。由于实际适应度是 6，我们将检测到强烈的正上位性！。

两种观点都不能说是“错的”，但其中一种可能更自然或在数学上更方便。为了使乘性效应看起来像加性效应，我们可以切换到对数尺度，通常称为马尔萨斯适应度（ $m = \ln w$ ）。在这个尺度上，原始尺度上的乘性效应变成了加性效应。这就是为什么许多群体遗传学家将上位性定义为在马尔萨斯尺度上偏离加性的程度。关键在于，上位性是一个关于效应如何组合的统计陈述，它与一个选定的非相互作用基线模型相关。

崎岖的进化景观

这些相互作用对进化过程意味着什么？伟大的进化生物学家 Sewall Wright 给了我们一个强有力的比喻：适应度景观。想象一张巨大的、高维度的地图，其中的坐标代表所有可能的基因型，而每个点的高度代表该基因型的适应度。在这幅图景中，进化是一个种群的探险者试图攀登到最高的山峰。

在一个没有上位性的世界里，景观是简单的。它是一座单一、平滑的山，就像一座“富士山”。每一步（突变）只要能让你稍微向上走，最终都会把你引向那唯一的顶峰。进化路径是可预测和直接的。

然而，上位性打破了这幅简单的图景。它使景观变得崎岖。我们面对的不再是一座孤山，而是一个广阔的山脉，有无数高低不一的山峰，它们之间由深谷、险峻的山脊和蜿蜒的小径隔开。

让我们通过观察一个真实的生物机器——一种酶——来具体化这一点。一种酶在特定任务中的适应度取决于许多因素，但两个关键因素是其催化活性（其工作速度，与 $k_{cat}/K_M$ 等参数相关）和其稳定性（它是否能保持其正确的三维形状以完成工作，与其折叠自由能 $\Delta G_{fold}$ 相关）。现在，考虑酶活性位点的一个突变，它使其工作得更好。这听起来很棒，但这类突变通常有代价：它们会使蛋白质不稳定，使其更容易错误折叠而失效。这是一个经典的活性-稳定性权衡。这个突变单独存在时，甚至可能是有害的，因为稳定性损失超过了活性增益。现在，引入第二个突变，位于蛋白质结构中完全不同的地方。这个突变对酶的活性毫无影响，但碰巧能稳定蛋白质的折叠。它本身是中性的。但当与第一个突变结合时，它就改变了游戏规则。它抵消了不稳定的效应，使蛋白质能充分享受其增强活性的好处。这两个突变共同带来的益处远超加性预测。这是一种正上位性的生物物理机制，它创造了崎岖性。

这种崎岖性具有深远的影响。符号上位性的存在直接告诉我们，并非所有路径都对进化开放。在我们的微生物实验中，如果突变 A 在祖先背景下是有害的，那么在强选择下进化的种群根本无法迈出这第一步。这是一条禁忌之路。进化被迫探索其他选项，比如先获得突变 B，而突变 B 的存在又改变了景观，使突变 A 变得有利。突变出现和固定的顺序变得至关重要。进化不再是简单的爬山；它是一个偶然的、历史性的过程，永远被事件的顺序所塑造。

进化“僵局”——即多个不同适应度高峰的存在——的最终根源有一个精确的遗传原因。对于一个适应度景观要拥有不止一个高峰，数学上必然要求在该景观的某处至少有两个基因之间存在交互符号上位性。那些由两个单独有害但共同有利的突变所创造的适应度谷，是构建一个多峰、崎岖世界的基本要素。它们解释了为什么一个种群会被困在一个“局部最优点”上，这是一个好的但并非最佳的解决方案。要达到更高的山峰，它必须先走下坡路，而自然选择在大的种群中禁止这种行为。

相互作用的涟漪效应

上位性的后果会向外扩散，不仅塑造了适应的路径，还塑造了进化过程的结构和可预测性。

一个崎岖的景观是否意味着进化完全不可预测？不一定。有趣的是，上位性有时反而会增加短期的可预测性。想象一个景观，从祖先出发有三条可能的突变路径。如果其中两条因为符号上位性而变得有害，那么进化就被引导到唯一剩下的那条有益路径上。第一步变得几乎是确定性的。不可预测性在第二步重新出现。第一个突变的获得现在可以改变景观，使得之前两个有害的突变都变得有益。现在，种群站在一个岔路口。它会走哪条路？这个选择是一场赛跑，尽管会受到不同突变带来的相对适应度优势的影响，但这仍然是一场赛跑。上位性就像一系列的门和通道，在一瞬间约束进化，又在下一刻开启一套新的可能性。

也许最深远的是，上位性影响遗传系统本身的进化，包括性（sex）和重组的进化。当选择偏爱某个特定的等位基因组合时——比如在病原体中赋予耐药性的 $AB$ 单倍型——它会在种群中造成 $A$ 和 $B$ 等位基因之间的统计关联。它们同时出现的频率比随机预期的要高。这种非随机关联被称为连锁不平衡（ $D$ ）。上位性是产生连锁不平衡的强大引擎。但重组的作用恰恰相反：它打乱等位基因，破坏成功的组合，减少连锁不平衡。

思考一下其后果。如果正上位性已经造成了高适应度的 $AB$ 和 $ab$ 单倍型的过剩，重组会把它们拆开，产生适应度较低的 $Ab$ 和 $aB$ 中间体。在这种静态环境下，重组实际上降低了种群的平均适应度！这产生了一种选择压力，有利于那些降低重组率的“修饰等位基因”，这是一种倾向于保持优秀基因团队的力量。在这里，我们看到了进化理论优美的统一性：上位性不仅定义了景观，它还直接影响着塑造探索这张景观的遗传机制本身的选择力量。

从折叠蛋白质中氨基酸的分子之舞，到基因组进化的宏大策略，上位性是不可或缺的成分。它是约束与创造力的源泉，是历史偶然性与意外新颖性的源泉。它使进化从一次简单可预测的攀登，变成了一场丰富、复杂、永无止境的迷人发现之旅。

无形之手：遗传相互作用如何塑造生命世界

如果基因组是一本简单的食谱，进化将是一件直截了当的事情。要构建一个更好的生物，你只需从一页中加入一撮“跑得更快”的配方，再从另一页中撒上一抹“消化更好”的配方。最终的结果将是各部分的总和。但正如我们从遗传学原理中所看到的，生命之书并非如此简单。各种成分相互作用，方式常常出人意料。将柠檬汁加入热茶中会得到一杯怡人的饮品；将其加入温牛奶中则会得到一团凝固的混乱。柠檬汁的效果完全取决于它的背景。

在遗传学中，这种背景依赖性的基本原理被称为上位性。它意味着一个基因或一个突变的效果不是固定的，而是取决于基因组中存在的其他基因。在探索了上位性的基本机制之后，我们现在可以踏上一段旅程，看看这只“无形之手”如何雕塑从我们细胞内最微小的分子到地球上宏伟的生命全景的一切。正是在这些应用中，这个概念的真正力量和普遍性才得以显现。

分子探戈：单个蛋白质内部的上位性

让我们从最基本的层面开始：单个蛋白质，细胞的主力。你也许认为蛋白质只是一条氨基酸链，一个能改善其功能的突变总是一件好事。但蛋白质是一个折叠精巧的三维机器。改变一个部分可能会在整个结构中产生连锁反应。

想象一下工程师试图通过修改单个零件来改进汽车引擎。一个突变可能就像换上一个能提供更多动力的活塞。这听起来不错，但如果新活塞更重，导致引擎失衡并在高速下震散了呢？这个“有益”的改变就变成了灾难性的。这正是蛋白质中发生的情况。定向进化实验，即科学家在实验室里快速进化蛋白质，不断揭示这一点。一个在孤立状态下能提高酶催化速率的突变，可能同时会破坏蛋白质折叠结构的稳定性，导致其解体。其净效应可能是功能丧失。

这种相互作用创造了生物学家所谓的适应度景观——一个崎岖的山地，其高度代表蛋白质的功能效率。一个突变将蛋白质移动到这个景观上的一个新位置。由于上位性的存在，这个景观不是一个简单、平滑的山丘，而是一个布满山峰、山谷和山脊的险峻山脉。一个在野生型遗传背景下有益的突变，当被添加到已经有其他突变的蛋白质上时，可能变得有害。这被称为符号上位性。例如，在一种工程酶中，一个特定的突变（M3）本身可能提高活性，但当被引入一个已经含有另外两个有益突变（M1和M2）的酶变体中时，它可能导致活性下降。新的零件组合就是无法很好地协同工作，蛋白质从一个“适应度高峰”上跌落下来。

这种崎岖的景观给进化提出了一个有趣的难题。有时，最有益的状态——景观上的最高峰——无法通过一系列小的、有益的步骤达到。考虑一种强效抗体的进化，它能够中和多种病毒株。通常，实现这种高亲和力需要的不是一个，而是一个特定的多个突变的组合。问题是，这些突变中的每一个，当它们独自出现时，实际上可能削弱与目标的结合！这是一种交互符号上位性的情况。抗体谱系发现自己处于一个适应度谷中：它迈出的任何一步都是下坡路。它如何才能穿过这个山谷，到达另一边的高亲和力状态？

进化有巧妙的解决方案。其中之一是获得容许性突变。抗体的其他地方可能会发生一个不同的突变，这个突变要么是中性的，要么是略微有益的。然而，它的真正价值在于，它重塑了局部景观，“铺平”了适应度谷，将先前有害的步骤转变为有益的步骤。这表明进化不是一个简单的、确定性地攀登最近山丘的过程；它是一场复杂的舞蹈，是一次穿越由上位性塑造的、不断变化的景观的、依赖于路径的旅程。

进化的基因组：从耐药性到物种起源

从单个蛋白质尺度放大，我们发现同样的原则也支配着整个基因组和种群的进化。在抗击传染病的斗争中，这一点尤为关键。

当我们用两种抗生素联合治疗细菌感染时，我们正是在利用上位性。想象一个细菌可以通过突变 $a$ 进化出对药物 A 的抗性，通过突变 $b$ 进化出对药物 B 的抗性。通常，这些突变单独存在时代价高昂或仅有轻微益处。但当同时暴露于两种药物时，景观可能发生巨大变化。突变 $a$ 和 $b$ 的组合可能变得高度协同，提供的适应度益处远大于它们各自效应的总和。相反，交互符号上位性可能创造一个适应度谷，在这种情况下，单独获得任何一种抗性突变都会使细菌在两种药物同时存在时适应度更低。这样的山谷使得抗性极难进化，为抗生素治疗提供了一种强有力的策略。药物组合的选择，甚至其给药时机（例如，序贯 vs. 同时），都可以用来引导进化走向对病原体不利的路径。

上位性使进化变得偶然和不可预测，这是一个普遍的真理。在著名的 Richard Lenski 及其同事用大肠杆菌（E. coli）进行的长期进化实验中，他们观察了12个最初完全相同的种群进化了数十年。虽然所有种群都适应了它们的环境，但它们的遗传解决方案往往不同。为什么？因为在每个种群中，随机突变出现和固定的顺序是不同的。在某个谱系中第一个确立的有利突变，改变了所有后续突变的适应度景观。它将种群置于一条独特的路径上，关闭了一些进化途径，同时开启了另一些。上位性确保了即使从相同的起点出发，进化的旅程也不是完全可重复的。

这种路径依赖性甚至可能导致进化中最深刻的事件之一：新物种的起源。想象一下，同一物种的两个种群在地理上被隔离开来。即使它们的环境完全相同，它们也开始了独立的进化之旅。由于突变是随机的，它们很可能会找到应对相同环境挑战的不同解决方案——也就是说，它们会攀登崎岖的、充满上位性的适应度景观上的不同山峰。一个种群可能固定了突变 A 和 B，而另一个种群则固定了 C 和 D。每一组突变在各自的遗传背景下都运作得很好。但如果这两个种群再次相遇并试图杂交会发生什么？一个杂交后代可能从一个亲本那里继承了突变 A，从另一个亲本那里继承了突变 D。由于负上位性，这个新的组合可能功能失调甚至致命。这些遗传不相容性，被称为杜布赞斯基-马勒不相容性，在种群之间建立了生殖隔离。它们无法再成功地进行杂交。一个新物种诞生了，不是因为环境不同，而仅仅是因为其基因组在机会驱动下的上位性分化。

生命的架构：发育、疾病与病毒

在复杂的多细胞生物中，上位性扮演着总建筑师的角色，塑造发育并导致疾病。

现代进化生物学中最令人费解的思想之一是发育系统漂变。想一想花瓣的数量或你手上的五根手指这样的特征。这些性状在数亿年的进化过程中通常被深度保守。你可能会认为构建它们的底层遗传程序同样是静态的。但你错了。在一个保守的表型之下，基因调控网络可能正在发生剧烈的分化。这怎么可能？答案是稳定选择和上位性。只要最终的产出（正确的花瓣数量）得以维持，进化就对底层的回路视而不见。一个可能破坏该过程的突变可以被网络中其他地方的另一个突变所补偿。网络随着时间的推移自我重连，新的连接形成，旧的连接消失，而发育产出保持不变。这种隐藏的遗传分歧只有在你将两个物种进行杂交时才会显现出来。它们分化的、补偿性网络中不匹配的部分可能会灾难性地失效，导致发育缺陷——这是杜布赞斯基-马勒不相容性在起作用的又一个美丽例证。

同样的遗传相互作用原理在癌症的进化中也大规模地体现出来。肿瘤是一个不断进化的细胞群体。通过对数千个肿瘤基因组进行测序，科学家可以寻找上位性的统计特征。某些致癌突变对一起出现的频率远高于我们随机预期的频率。这表明存在正上位性或协同作用：这两个突变共同为癌细胞提供了比任何一个单独存在时大得多的选择优势。其他一些突变对几乎从不一起出现（一种称为相互排斥的模式），这可能预示着负上位性——也许这两个突变是多余的，或者它们的组合对细胞是致命的。理解这个癌症基因的“相互作用图谱”对于开发靶向治疗至关重要。然而，我们必须小心。有时，相互排斥的模式可能是一种统计幻象，一种辛普森悖论的形式，是由汇集具有不同突变偏好的不同癌症亚型的数据造成的。

即使是看似简单的病毒，也是上位性力量的证明。一个病毒蛋白通常有多种功能——它可能负责附着宿主细胞、触发进入，并帮助新的病毒颗粒组装。这种一个基因影响多种性状的特性被称为基因多效性。这样一个蛋白中的一个突变可能会改善其进入功能，但损害其附着能力。病毒的整体“适应度”是其在每一个连续步骤中成功与否的产物。由于这种多效性效应的乘法耦合，病毒的适应度景观极其复杂，充满了上位性的权衡，这限制了其在免疫逃逸或转换到新宿主等方面的进化途径。

超越有机体：生命网络中的上位性

到目前为止，我们所看的都是单个基因组内部的上位性。但这个概念甚至更广。它可以扩展到物种之间的相互作用。

在生态系统中，物种被连接在一个复杂的相互作用网络中。它们为资源而竞争，相互捕食，并参与共生关系。这种生态背景创造了一个新层次的上位性。考虑一个在实验室中设计的由两种微生物组成的简单群落。物种 A 的基因型决定了它向环境中分泌多少有用的代谢物。物种 B 的基因型决定了它吸收该代谢物的效率。

在这里，物种 A 的遗传变化实际上改变了物种 B 的环境。这意味着物种 B 基因型的适应度效应现在取决于物种 A 的基因型。我们可以测量一个群落水平的表型，比如总生物量，并发现某些基因型组合产生的协同生长效应远远超过你将它们各自贡献相加所预期的。这就是种间上位性。一个基因效应的定义本身就超越了单个生物体的界限，成为群落自身的属性。

结论

我们的旅程结束了。我们已经看到，基因的相互作用——上位性，不是一个晦涩的例外，而是一个在生物学各个层面上运作的普遍规则。它解释了为什么蛋白质的功能不仅仅是其各部分的总和。它塑造了进化所跋涉的崎岖景观，创造了适应度谷和依赖于路径的历史。它驱动了新物种的起源，编排了发育程序的无声分化，决定了病原体和癌症的剧本，甚至编织了整个生态系统的结构。

理解这些错综复杂的遗传对话是现代生物学的前沿。它将我们对进化的看法从一个积累“好基因”的简单过程，转变为一个相互作用部件的复杂舞蹈。基因组不是一份指令清单；它是一个网络，一个不断对话的基因生态系统。解读这些对话，就是开始理解写在我们自己DNA中的历史，以及生命世界令人叹为观止的复杂性和内在美。