try ai
科普
编辑
分享
反馈
  • 符号上位性

符号上位性

SciencePedia玻尔百科
核心要点
  • 符号上位性指突变在不同遗传背景下,其效应会从有利变为有害,或从有害变为有利。
  • 通过使进化步骤依赖于先前的突变,符号上位性可以限制进化路径,并增加短期可预测性。
  • 交互性符号上位性,即两个突变单独有害但共同有利,是创造多个适应度峰的基本机制。
  • 这一概念对于理解多种生物学现象至关重要,包括物种形成、耐药性进化以及蛋白质工程中的挑战。

引言

在进化研究中,我们通常从一个简单的模型开始,该模型假设突变效应是独立且可加的。然而,现实远比这复杂,基因之间持续的相互作用能够极大地改变进化结果。在这些相互作用中,最深刻的是​​符号上位性​​(sign epistasis),即一个突变的效应会根据遗传背景从有利转变为有害。这一现象挑战了我们关于进化可预测性和适应性的基本假设。本文将通过首先探讨其基本原理和机制来阐释符号上位性的概念,并使用“适应度景观”这一有力的类比来说明它如何限制进化路径并创造崎岖的地形。随后,文章将把它与从医学到合成生物学等领域的关键应用和跨学科问题联系起来,从而展示符号上位性巨大的解释力。

原理与机制

要真正领会符号上位性的力量与精妙之处,我们必须首先想象一个没有它的世界。把进化过程想象成一个徒步者在探索一片广阔、云雾缭绕的山脉。徒步者的目标是始终向上走,寻找更高的地方。在这个类比中,景观代表所有可能的基因组合,而海拔代表​​适应度​​(fitness)——即生物体生存和繁殖的能力。徒步者迈出的每一步都是一次单一突变。

理想化的世界:攀登平滑的山丘

在最简单的世界里,我们的遗传景观不是崎岖险峻的山脉,而是一座单一、平滑的山丘。是什么让它如此简单?是​​独立性​​(independence)的假设。我们设想每个突变的效果完全独立于所有其他突变。如果突变 AAA 给你带来 5 点适应度提升,突变 BBB 带来 10 点提升,那么同时拥有这两个突变就会给你带来完美的 15 点提升。效应只是简单相加。

科学家们通常很自然地使用对数尺度来衡量适应度,称为​​马尔萨斯适应度​​(Malthusian fitness)(我们称之为 mmm),在此尺度下,乘法优势变为加法优势。在这个尺度上,双突变体(mABm_{AB}mAB​)的适应度预期为祖先(mabm_{ab}mab​)的适应度加上每个突变的单独效应:mAB=mab+(mAb−mab)+(maB−mab)m_{AB} = m_{ab} + (m_{Ab} - m_{ab}) + (m_{aB} - m_{ab})mAB​=mab​+(mAb​−mab​)+(maB​−mab​)。在这样的世界里,任何有利的突变在任何地方都是有利的。徒步者的策略万无一失:任何向上的步伐都是好的一步。进化是可预测且高效的,稳步走向唯一的辉煌顶峰。

当基因相互作用时:景观变得有趣

但事实证明,自然界远比这要“健谈”。基因并非孤立作用;它们存在于一个复杂的相互作用网络中。一个基因的效应通常取决于其他基因所设定的背景。这种独立性的瓦解被称为​​上位性​​(epistasis)。它是你组合突变时得到的“意外”。总效应不仅仅是各部分之和。我们甚至可以用​​上位性系数​​(epistasis coefficient)ϵ\epsilonϵ 来量化这种意外,其定义为双突变体的实际适应度减去预期的加性适应度:ϵ=mAB−mAb−maB+mab\epsilon = m_{AB} - m_{Ab} - m_{aB} + m_{ab}ϵ=mAB​−mAb​−maB​+mab​。如果 ϵ\epsilonϵ 不为零,景观就不再是完全平滑的了。

然而,并非所有的相互作用都会从根本上改变游戏规则。最温和的形式是​​量级上位性​​(magnitude epistasis)。在这种情况下,一个有利的突变在任何遗传背景下都仍然是有利的,但其效应大小会发生变化。例如,一个突变本身可能是有益的,但在与另一个突变结合时效果更好(协同作用),或者其益处可能略有减弱(拮抗作用)。想象一个适应度排序,如 w11>w10>w01>w00w_{11} > w_{10} > w_{01} > w_{00}w11​>w10​>w01​>w00​,其中“1”表示新突变,“0”表示祖先状态。无论单独存在还是共同存在,这两个突变总是有利的。徒步者仍在攀登,可能坡度更陡或更缓,但每一步可能的“向上”方向都保持不变。通往顶峰的道路是清晰的。

符号上位性:改变游戏规则

真正具有革命性的概念是​​符号上位性​​(sign epistasis)。这不仅仅是量级的变化,而是突变效应本质——符号——的改变。一个在某种背景下有利的突变,在另一种背景下会变得有害。形式上,一个位点上突变(比如从等位基因 aaa 到 AAA)的效应符号,会根据第二个位点上的等位基因(BBB 或 bbb)而改变。适应度差异 (wAb−wab)(w_{Ab} - w_{ab})(wAb​−wab​) 可能为正,而差异 (wAB−waB)(w_{AB} - w_{aB})(wAB​−waB​) 则为负。

这个简单的改变带来了深远的影响。这意味着“正确”的进化步骤不再是绝对的;它​​取决于​​(contingent)生物体的遗传历史。突变的顺序突然变得至关重要。

为了理解其原因,让我们来玩一个简单的进化游戏,其规则由​​强选择弱突变(SSWM)​​模型定义。这是一个理论框架,其中选择足够强大,可以迅速清除有害突变并固定有利突变,而突变又足够罕见,我们只需一次考虑一个变化。我们的徒步者迈出一步,评估新的海拔,只有在更高的情况下才会停留在新位置。

考虑一个具有以下适应度值的景观:祖先00的适应度为 w00=1.00w_{00} = 1.00w00​=1.00。单突变体的适应度分别为 w10=1.08w_{10} = 1.08w10​=1.08 和 w01=0.95w_{01} = 0.95w01​=0.95。双突变体的适应度为 w11=1.20w_{11} = 1.20w11​=1.20。

从00出发,徒步者有两个选择:

  1. 突变第一个位点得到 10。适应度从 1.001.001.00 增加到 1.081.081.08。这是一个上坡的步伐。
  2. 突变第二个位点得到 01。适应度从 1.001.001.00 下降 到 0.950.950.95。这是迈入了​​适应度谷底​​(fitness valley)。

在我们的 SSWM 规则下,徒步者永远不会选择第二步。唯一可行的路径是首先获得第一个位点的突变。从那里(基因型 10),突变第二个位点现在变得有利(适应度从 1.081.081.08 增加到 1.201.201.20)。符号上位性创造了一道鸿沟,阻断了一条进化路径,迫使进化走向另一条。顺序是固定的:00 →\to→ 10 →\to→ 11。另一个例子显示了类似的限制:在一个景观中,突变为等位基因 AAA 本身是有害的(wAb=0.95w_{Ab}=0.95wAb​=0.95 对比 wab=1.0w_{ab}=1.0wab​=1.0),但在 BBB 存在的情况下是有利的(wAB=1.20w_{AB}=1.20wAB​=1.20 对比 waB=1.05w_{aB}=1.05waB​=1.05)。在这里,进化必须在获得 AAA 之前获得 BBB。

在崎岖世界中的可预测性

你可能会认为这种崎岖性使进化完全不可预测。但在这些简单的情况下,情况恰恰相反:符号上位性通过关闭某些进化路径的“大门”来增加短期的可预测性。它决定了事件发生的必要顺序。

在一个稍微复杂一点的场景中会发生什么?想象一个从 000 开始的三位点系统。假设突变 AAA 是有利的,但突变 BBB 和 CCC 本身是有害的。和之前一样,第一步是可预测的:进化被迫固定突变 AAA。但现在,从 100 的背景出发,突变 BBB 和 CCC 都变得有利了。进化走到了一个岔路口。

这个选择是随机的吗?不完全是。骰子被动了手脚。在 SSWM 世界中,固定一个有利突变的概率与其选择优势 sss 成正比。如果突变 BBB 提供的适应度提升比 CCC 大(例如,sB∣A>sC∣As_{B|A} > s_{C|A}sB∣A​>sC∣A​),它就更有可能先出现并被固定。对于某个案例中的特定适应度值,下一步固定 BBB 的概率是 sB∣AsB∣A+sC∣A≈0.625\frac{s_{B|A}}{s_{B|A} + s_{C|A}} \approx 0.625sB∣A​+sC∣A​sB∣A​​≈0.625,而不是 0.50.50.5。路径不再是完全确定的,但它是有偏向的。由上位性塑造的景观使某些未来比其他未来更有可能发生。

终极进化陷阱:交互性符号上位性

这把我们带到了最富戏剧性的遗传相互作用形式:​​交互性符号上位性​​(reciprocal sign epistasis)。当依赖性是相互的时候,就会发生这种情况。没有 BBB 的情况下突变 AAA 是有害的,没有 AAA 的情况下突变 BBB 也是有害的。两个突变都需要彼此才能变得有利。

这种看似简单的安排会带来一个惊人的后果:它是创造一个具有​​多个适应度峰​​(multiple fitness peaks)的真正崎岖景观的基本机制。

考虑这个最小的景观:w00=1.0w_{00} = 1.0w00​=1.0, w10=0.8w_{10} = 0.8w10​=0.8, w01=0.8w_{01} = 0.8w01​=0.8, 以及 w11=1.1w_{11} = 1.1w11​=1.1。

  • 祖先基因型 00 是一个​​局部峰​​(local peak)。为什么?因为任何离开它的一步——无论是到 10 还是 01——都是适应度的下降。一个由 00 个体组成的种群被困住了。
  • 双突变体 11 也是一个局部峰。从它的角度看,任何一步退回——到 10 或 01——同样是走下坡路。一个由 11 个体组成的种群也是稳定的。

两个单突变基因型 10 和 01 形成了一个分隔两个山峰的深深的适应度谷。整个种群可能会被困在较低的 00 峰上,无法到达更高的 11 峰,因为它需要穿越一个适应度较低的山谷,而这是自然选择所禁止的行为。

这不仅仅是一种奇特现象;它是一个深刻而普遍的原则。在任何双等位基因适应度景观中,多个峰的存在逻辑上等同于交互性符号上位性的存在。要有两个独立的山峰,它们之间必须有一个山谷,而山谷两侧的基因型要成为稳定的山峰,唯一的途径就是进入山谷的第一步是下坡的。这种“下坡-上坡-下坡”的模式正是交互性符号上位性的定义。它是进化陷阱的基本要素。

但是,自然在这里增添了最后一个美妙的转折。虽然交互性符号上位性是多个峰存在的​​必要​​条件,但当我们超越简单的双基因系统时,它并​​非总是充分​​的。想象一下,我们的山谷和两个山峰存在于一个由三个或更多基因构成的景观中。一个在由基因A和B定义的二维“平面”上具有交互性符号上位性的景观,总体上可能仍然只有一个峰。怎么会这样?可能存在通过第三个维度——基因C的突变——的“绕行路径”,它能建起一条平缓的斜坡,让进化逃离陷阱,继续攀登至唯一的全局顶峰。在二维空间中发现的简单规则提供了关键的洞见,但全景图揭示了景观的复杂性是一个由其所有维度同时书写的故事。

应用与跨学科联系

理解了符号上位性的原理——即一个突变的效应会根据其遗传伙伴从有利变为有害——我们现在可以开始一段旅程。我们将看到这个单一而优雅的概念如何影响生物学的几乎每一个角落,从最宏大的进化戏剧到最紧迫的医学挑战。它不仅仅是一种奇特现象;它是生命法则中的一条基本规则,塑造着生物的过去、现在和未来。就像一把万能钥匙,它解锁了我们对那些否则看起来会异常复杂的现象的理解。

塑造适应度景观:从平滑山丘到崎岖山脉

将进化想象成一个徒步者探索广阔的景观,始终寻求更高的地方。“适应度景观”是一张地图,其中位置代表可能的基因组,海拔代表适应度——即生存和繁殖的能力。在一个简单的世界里,每一次有利的突变都会带领我们进一步上山,使得通往最高峰的旅程一帆风顺。这是一个没有上位性的世界,一个平滑、起伏的景观。

但自然界很少如此简单。上位性带来了曲折和转折。大多数上位性只是改变了攀登的陡峭程度;一个有利的突变在新的背景下可能更有利或不那么有利,但它仍然是有利的。这被称为​​量级上位性​​。通往顶峰的道路依然存在,即使沿途的攀登变得更容易或更困难。

然而,​​符号上位性​​从根本上改变了地形。它可以创造死胡同并迫使进化走很长的弯路。一条看似充满希望的路径可能会突然通向悬崖边缘。在一条路径上有利的突变变得有害,迫使进化的徒be者原路返回或寻找其他途径。这使得适应取决于突变出现的精确顺序。

最剧烈的转变发生在​​交互性符号上位性​​中,即两个突变单独有害但共同有利。这是在适应度景观上雕刻出深谷并隆起全新山峰的地质力量。一个种群可能会发现自己身处一个相当不错的山丘——一个局部适应度峰——但与一个更高、更宏伟的山峰之间隔着一个无法逾越的低适应度山谷。在大多数情况下,自然选择无法穿越这样的山谷,因为这样做需要向下走一步,而这是其“程序”所禁止的。因此,交互性符号上位性是创造一个点缀着多个山峰的“崎岖”景观、将种群困在次优解上的基本要素。

我们甚至可以用一个优美的数学抽象来思考这个问题。想象所有可能的基因组是一个巨大的多维超立方体的角。一个双位点相互作用,就像我们两个突变之间的作用一样,对应于这个立方体上的一个简单的正方形“面”。这个面上的交互性符号上位性意味着正方形的两个对角是峰,另外两个是谷。通过计算超立方体上数十亿个这样的面中有多少个表现出这种特性,我们可以得出一个衡量整个景观崎岖程度的量化指标。这样的相互作用越多,峰和谷就越多,进化的旅程也就越险恶。

宏大的进化戏剧:物종形成与性别之谜

带着我们对崎岖景观的新认识,我们现在可以着手解决进化中两个最深刻的问题。

首先,新物种是如何产生的?想象同一物种的两个种群被山脉或海洋等地理屏障隔绝了数千年。在其新家园,第一个种群进化出了一个有利的突变,我们称之为 AAA。在其家园,第二个种群独立进化出了另一个有利的突变 BBB。两个种群都在繁荣发展,各自攀登了自己的局部适应度山丘。现在,如果屏障消失,两个种群相遇并杂交,会发生什么?产生的杂交后代可能同时继承来自一个亲本的突变 AAA 和来自另一个亲本的突变 BBB。但如果 AAA 和 BBB 表现出交互性符号上位性呢?虽然在它们各自的遗传背景下是有利的,但它们的组合却是有毒的。ABABAB 杂交后代的适应度极低——它掉入了一个深深的适应度谷。这种遗传不相容性,被称为 Dobzhansky-Muller 不相容性,构成了一道强大的生殖隔离屏障。这两个种群再也无法成功地混合它们的基因。实际上,它们已经变成了两个不同的物种。符号上位性是生命多样性的总设计师。

其次,为什么有性生殖——通过重组大量洗牌基因——会存在?一个成功的生物体,根据定义,拥有一套“好”的基因组合。重组打破了这些“中奖彩票”,似乎毫无道理。这种洗牌的直接后果通常是降低后代的平均适应度,因为它拆散了选择精心构建的有利基因组合。那么何必多此一举?答案再次在于由上位性决定的景观形状。当上位性主要为负向时——这是一种常见情况,即多个有害突变合在一起的危害性大于其各自危害之和——从长远来看,重组就成了英雄。它可以将两个“还行”的亲本(各自带有一个有害突变)结合,产生一个没有有害突变的“完美”后代和一个带有两个有害突变的“灾难性”后代。这增加了种群的变异,为自然选择提供了更明确的目标。它使得最有害的组合被有效清除,而最好的组合得以再生。从这个角度看,性是一种更有效地穿越充满有害突变的崎岖景观的策略。

分子军备竞赛:耐药性与病毒进化

在医学背景下,适应度景观的抽象地形变得异常真实。病原体在患者体内的进化,是在由我们的药物和免疫系统塑造的景观上进行的一场高风险攀登。

思考一下抗生素耐药性的进化。一个突变的出现使细菌对药物产生抗性,可能是通过改变药物靶向蛋白的形状。这听起来像是向适应度山丘迈出的简单一步。但很多时候,这种抗性是有代价的。改变后的蛋白质在执行其正常功能时可能效率较低,导致细菌在没有药物的情况下生长更慢。现在,想象第二个“补偿性”突变的出现,它在不牺牲抗性的前提下恢复了蛋白质的功能。这是一个典型的符号上位性案例。耐药性突变在药物存在时是有利的,但单独存在时是有代价的;补偿性突变本身可能是中性或有害的,但在有代价的耐药性突变存在时,它变得非常有利。

我们可以在实验室里直接观察到这一点。对于给定的抗生素,我们可以测量最低抑菌浓度(MIC)——即阻止细菌生长所需的药物量。我们可能会发现一个突变 AAA 将 MIC 从 111 单位增加到 444 单位。第二个突变 BBB 将其增加到 888 单位。直观地,我们期望双突变体 ABABAB 的 MIC 大约是 323232。但如果我们测量后发现其 MIC 只有 222 呢?这是一个戏剧性的符号上位性案例:突变 AAA 单独有利,但与 BBB 结合后变得有害,实际上使细菌对药物更敏感。

这一见解对临床实践具有革命性意义。由于进化被限制在遵循适应度增加的路径上,这些上位性“陷阱”和“弯路”意味着高水平耐药性的进化并非不可避免。突变的顺序至关重要。这使我们能够设计巧妙的多药鸡尾酒疗法。通过同时使用两种药物,我们可以创造一个适应度景观,其中任何赋予对一种药物抗性的突变都会使病原体对另一种药物更敏感。我们实质上是在加深适应度谷,使得病原体几乎不可能找到同时抵抗两种药物的进化路径。

同样的分子军备竞赛也在病毒与我们的免疫系统之间上演。病毒可能会进化出帮助它逃避抗体(一种“逃逸突变”)的突变。但这种改变可能会使关键的病毒蛋白不稳定,或削弱其与我们细胞结合的能力,从而带来适应度代价。这正是在从 HIV 到 SARS-CoV-2 的病毒中观察到的现象。在 SARS-CoV-2 的一个引人入胜的例子中,一个逃逸突变被发现本身是有害的,因为它削弱了病毒与人类细胞上 ACE2 受体的结合能力。然而,当与另一个增加 ACE2 结合能力的“补偿性”突变配对时,该逃逸突变的效果从有害翻转为有利。这两个突变共同创造了一种适应度高、能逃避免疫的病毒。通过理解这些上位性网络,我们可以更好地预测病毒进化的未来轨迹,并设计靶向这些进化依赖性的疗法。

工程生命:酶与设计挑战

我们旅程的最后一站将我们从观察进化带到主动指导进化。在合成生物学和蛋白质工程领域,科学家们致力于创造新颖的酶,用于从分解塑料到生产生物燃料等各种用途。这个过程被称为“定向进化”,它在试管中模仿自然选择。我们创造一个酶的许多变体,并选择表现最好的那些。

在这里,符号上位性同样是“机器中的幽灵”。假设我们试图提高一种酶的催化效率,这是一个衡量它完成工作速度的指标。我们发现一个突变 AAA,在某种背景下看起来很有希望。我们又发现另一个突变 BBB,看起来也不错。当我们将它们组合在一起时会发生什么?我们可能希望得到一个超级酶,但上位性通常另有安排。一个引人注目的实验室例子显示,突变 AAA 本身实际上降低了酶的适应度。它是个“哑弹”。但是,当它被引入到一个已经拥有有利突变 BBB 的酶中时,“哑弹”突变 AAA 突然变得有利,并且这个组合产生的酶远比仅有 BBB 的酶要好。AAA 的效应从负转为正。

这给了我们一个谦卑的教训。我们不能简单地将单个“好”突变的效应相加,就期望能设计出一个完美的蛋白质。整体确实不同于部分之和。通往更好酶的道路不是一条笔直的大道;它是一次穿越崎岖、上位性景观的跋涉,其中每一步的效果都取决于你所站的位置。理解这种相互关联性是成功驾驭该景观并设计未来生物解决方案的关键。

因此,我们看到了一个单一思想的统一力量。符号上位性不是遗传学教科书中一个晦涩的脚注。它是一个深刻的原则,解释了为什么有如此多的物种,为什么性是一种成功的策略,病原体如何智胜我们的药物,以及为什么构建一种新酶如此具有挑战性。它告诉我们,在生命之网中,没有什么是孤立作用的。每个基因、每个突变,只有在与它的伙伴们的对话中才能讲述它的故事——而这种对话可以在现代生物学实验室中以惊人的严谨性进行测试和证明。