try ai
科普
编辑
分享
反馈
  • 驱动突变与乘客突变:癌症演化的引擎与搭便车者

驱动突变与乘客突变:癌症演化的引擎与搭便车者

SciencePedia玻尔百科
核心要点
  • 驱动突变为癌细胞提供选择性生长优势,而乘客突变是中性的,随着肿瘤生长偶然累积。
  • 科学家通过寻找正选择的统计信号(例如跨肿瘤的复发性和大于1的dN/dS比率)来区分驱动突变与数量远多于前者的乘客突变。
  • 这一区分在医学中至关重要,可用于开发基于癌基因成瘾的靶向疗法、监测微小残留病灶以及理解耐药机制。
  • 驱动突变和乘客突变的概念不仅限于癌症,也适用于健康组织中的体细胞演化,通过克隆性造血等过程为理解衰老提供见解。

引言

人们日益认识到,癌症并非一种静态疾病,而是一个在我们身体细胞内上演的动态演化过程。这一过程的核心是基因突变——细胞DNA发生的随机变化,这些变化为其生长和适应提供了燃料。然而,一个典型的肿瘤基因组是一个混乱的景象,包含数千个突变。这带来了一个关键挑战:这些突变中的绝大多数是对细胞行为没有影响的无害“乘客”,而只有少数是积极推动癌症发展的“驱动者”。我们如何从压倒性的噪音中区分出关键信号呢?

本文为理解这一根本区别提供了一个框架。第一章“原理与机制”将深入探讨区分驱动突变与乘客突变的演化逻辑,以及科学家用于发现它们的统计工具。随后的“应用与跨学科联系”将探讨这些知识如何革新现代医学,从创造个性化疗法、追踪疾病到理解衰老过程本身。

原理与机制

想象一座巨大、蔓延的城市,充满生机。现在想象这座城市位于一个人的体内,其居民是细胞。这就是肿瘤。它不是一个单一、同质的实体,而是一个由数万亿个别细胞组成的动态、演化的群体。与任何群体一样,它也受制于演化的铁律:可遗传变异和自然选择。这种将癌症视为一个演化过程的视角,改变了我们对该疾病的理解。它将一堆混乱的遗传错误,转变为一个具有深刻逻辑甚至一种奇异、可怕美感的故事。

这座细胞城市中变异的来源是​​突变​​——在细胞分裂时发生的脱氧核糖核酸(DNA)的随机变化。这些突变是可遗传的;它们从一个母细胞传给她的两个子细胞。选择的力量作用于这种变异。大多数突变是无害的,有些是有害的,但极少数可能会让一个细胞在体内残酷的生存斗争中获得轻微优势。我们的故事就从这里开始,从区分癌症基因组中两种关键突变类型开始:驱动突变和乘客突变。

引擎与搭便车者

​​驱动突变​​是癌症的引擎。它是一种特定的遗传变化,赋予携带它的细胞选择性适应优势。在演化论的语言中,“适应度”有着精确的含义:它关乎繁殖成功。驱动突变可能使细胞分裂得更快,抵抗身体发出的停止生长信号,逃避免疫系统,或忽略程序性细胞死亡(细胞凋亡)的指令。实际上,它是一种遗传作弊码,推动该细胞及其后代走向主导地位。

因为这些突变非常有利,它们受到强烈的​​正选择​​。因此,它们看起来并非随机。想象一下对一千个肝肿瘤的基因组进行测序。你可能会发现,在超过80%的肿瘤中,某个特定激酶蛋白中完全相同的氨基酸发生了改变,导致该蛋白永久处于“开启”状态,从而驱动细胞无休止地分裂。这不是巧合;这是选择的足迹,它反复发现解决生长问题的同一方案。

与此形成鲜明对比的是,​​乘客突变​​是一个中性的搭便车者。它在一个细胞中偶然出现,对细胞的行为没有可辨别的影响。它不会让细胞长得更快或死得更慢。它只是……存在而已。它之所以能够持续存在,不是因为它有益,而是因为它恰好与一个也偶然获得了强大驱动突变的细胞处在同一个细胞中。当携带驱动突变的克隆扩展成一个大群体时,它被动地将乘客突变一同带上。

如果我们回头看那一千个肝肿瘤,我们可能会发现,一个编码嗅觉受体(一种与嗅觉有关、与肝功能完全无关的蛋白质)的基因在95%的肿瘤中都发生了突变。这种高频率起初可能看似重要。但当我们仔细观察时,会看到一个完全不同的模式:这些突变随机地散布在整个基因上,并且类型各异——错义突变、无义突变、缺失。没有特定的、复发的改变。这是乘客突变的标志。其高频率并非源于对该基因本身的选择,而可能是因为该基因位于基因组的一个“坏邻区”,一个背景突变率很高的区域。

细胞分裂的滴答时钟

这种区分不仅仅是学术上的;它触及了肿瘤本质的核心。肿瘤的侵袭性不是由其突变总数决定的,而是由其驱动突变的数量和强度决定的。一个有一万个突变但只有三个是驱动突变的肿瘤,其危险性可能远低于一个只有150个突变但其中八个是影响关键生长通路的强效驱动突变的肿瘤。

那么,为什么会有这么多乘客突变呢?答案在于细胞分裂的简单算术。每当一个细胞分裂时,都存在一个微小但非零的新突变产生的概率。癌症是一种不受控制的细胞分裂疾病。一个单细胞可能需要分裂30、40或50次才能形成一个可检测到的肿瘤。

我们可以建立一个简单的模型来看看会发生什么。假设一个单癌细胞起始时有一个驱动突变和零个乘客突变。在每一代(GGG),每个细胞都分裂。获得一个新乘客突变的概率是upu_pup​,一个新驱动突变的概率是udu_dud​。经过GGG代后,任何给定细胞中乘客突变的平均数量将大致与分裂次数成正比:即G×upG \times u_pG×up​。驱动突变的数量将是起始的一个加上任何新增的:1+G×ud1 + G \times u_d1+G×ud​。因此,乘客突变与驱动突变的比率大约为Gup1+Gud\frac{G u_p}{1 + G u_d}1+Gud​Gup​​。由于基因组中可以发生中性突变的位置数量远远大于可以发生有益驱动突变的位置数量,所以upu_pup​远远大于udu_dud​。随着肿瘤的生长和GGG的增加,这个分数的分子比分母增长得快得多。肿瘤基因组不可避免地被乘客突变所淹没。

在噪音中寻找信号

这对科学家来说是一个巨大的挑战。如果一个典型癌细胞的基因组包含数千个乘客突变和仅少数几个驱动突变,我们如何在干草堆中找到针呢?我们如何将演化信号与压倒性的中性噪音分离开来?这正是现代癌症基因组学真正精妙之处。科学家已成为法医演化学家,寻找选择的印记。

正如我们所见,第一个线索是​​复发性​​。在许多独立的肿瘤中,在同一个基因里发现相同的突变,是正选择的有力迹象。然而,这个线索可能具有误导性。一些肿瘤存在有缺陷的“看护者”基因——负责DNA修复的基因。在这类肿瘤中,背景突变率可能比正常高出100倍。这会产生一种“高突变”表型,即使是长的中性基因也可能纯粹因为偶然,在相当一部分患者中获得乘客突变,从而产生复发性的假信号。

为了解决这个问题,我们需要一个更复杂的衡量标准。这由​​dN/dSdN/dSdN/dS比率​​这一优美的概念提供。当我们观察蛋白质编码基因时,一些突变会改变最终的氨基酸(​​非同义突变​​,或NNN),而另一些则不会(​​同义突变​​,或SSS)。同义突变在很大程度上对选择是不可见的;它们是完美的中性时钟,以背景突变率滴答作响。如果一个基因正在中性演化(即它是一个乘客基因),我们预期非同义突变的累积速率与同义突变大致相同,因此它们速率的比值dN/dSdN/dSdN/dS应该接近1。如果该基因处于正选择之下(即它是一个驱动基因),自然选择将偏爱对蛋白质的改变。非同义突变将被富集,我们将观察到dN/dS>1dN/dS > 1dN/dS>1。这个比率,当在大型肿瘤队列中被正确计算时,是我们区分驱动基因与乘客基因海洋的最强大工具之一。

通过结合这些证据线索——复发模式、功能热点、dN/dSdN/dSdN/dS比率,以及更高级的统计模型(这些模型会权衡一个突变的估计适应度效应与其在肿瘤中的观测频率),科学家可以为哪些突变是真正驱动癌症的建立一个强有力的论证。

演化的变动景观

然而,这个故事还有最后一个引人入胜的复杂层次。“驱动者”和“乘客”之间的区别不是绝对的;它依赖于环境。想象一个在患者体内演化的肿瘤。一个赋予增殖优势的突变出现,并席卷整个群体——一个经典的驱动突变。然后,患者开始接受靶向药物治疗。环境现在发生了巨大变化。一个罕见的、预先存在的编码药物外排泵的突变——以前毫无用处——突然成为肿瘤中最重要的基因。在药物存在的情况下,拥有这个突变的细胞存活下来,而所有其他细胞都死亡。这个曾经中性(甚至是有代价的)的突变,现在成了一个强大的、环境依赖性的耐药性驱动突变。适应度不是一个静态属性,而是一个基因与其环境之间的关系。

此外,肿瘤内部的演化并非完全高效。与能够通过重组洗牌基因的有性物种不同,肿瘤在很大程度上是一个无性繁殖群体。一条染色体上的所有基因都紧密连锁,注定作为一个整体被遗传。这导致了一种称为​​Hill-Robertson干扰​​的现象,它降低了选择的效力。 两个强大的驱动突变可能出现在两个不同的细胞中。在有性群体中,它们可以被组合成一个超强适应性的后代。但在肿瘤中,它们不能。这两个克隆必须竞争,这个过程称为​​克隆干扰​​。一个克隆将不可避免地将另一个驱向灭绝,一个完美的驱动突变就这样消失在演化的虚空中。

与此同时,一个新出现的驱动突变可能会发现自己位于一条已经携带了许多轻微有害的乘客突变的染色体上。这种“不良包袱”会减慢其崛起的速度,这个过程被称为​​背景选择​​。总体效果是选择比它本可以达到的更弱。轻微有害的乘客有时可以通过搭便车达到高频率,而有益驱动突变的固定则受到阻碍。这种混乱的现实模糊了我们简单模型所描绘的清晰界线,将整个基因组观测到的dN/dSdN/dSdN/dS比率推向更接近1,使得寻找驱动突变的侦探工作更具挑战性。

理解这些原理——驱动突变的引擎,乘客突变的庞大数量,选择的统计信号,以及演化的混乱、环境依赖的现实——是现代肿瘤学的基础。它使我们能够在其基因组中读取肿瘤的历史,识别其弱点,并设计出针对其生长引擎的疗法。

应用与跨学科联系

在掌握了区分少数“驱动”突变与大量“乘客”突变的基本原理后,我们现在可以开始一段旅程,看看这个简单而优雅的区别如何在科学和医学领域产生深远影响。我们将看到,理解这一概念不仅仅是一项学术活动;它是现代癌症治疗赖以建立的基石,是我们观察演化在单个人体内实时展开的视角,也是一个甚至能阐明衰老过程本身的原则。

基因组作为历史记录

想象一个癌症的基因组是一座古老、埋藏的城市。当遗传学家对其进行测序时,他们就像在挖掘遗址的考古学家。他们发掘出的是一堆混乱的文物。其中一些是让城市得以建造和繁荣的基础工具和结构——这些是驱动突变。但到处散落的都是瓦砾、破碎的陶器和随时间累积的杂物——这些是乘客突变。对于科学家来说,就像对于考古学家一样,首要且最关键的任务是区分它们。

这是如何做到的呢?科学家寻找线索,就像考古学家一样。其中最强大的线索之一是复发性。如果你从同一个文明中挖掘出一百个不同的废墟城市,并且在几乎每一个城市中都发现了完全相同的奇怪的齿轮状工具,你就可以相当肯定它曾是必不可少的。同样,如果一个特定的突变,比如像SIG_PATH_B这样的原癌基因中的“热点”密码子的激活性改变,在30%的结肠癌中被发现,那么它几乎可以肯定是驱动突变。相反,一个对蛋白质没有影响的沉默突变,仅在0.01%的肿瘤中见到,很可能只是一个随机的碎片。另一个线索是损伤的性质。如果你持续发现某个负责给细胞生长“踩刹车”的基因(CELL_REG_A)被无义突变所破坏,这强烈表明破坏这个刹车是城市(或肿瘤)失控扩张的关键步骤。这些权衡复发性、功能影响和实验验证证据的基本原则,使我们能够从噪音中过滤出信号。

这种侦探工作还延伸到了解环境因素如何导致癌症。例如,太阳的紫外线(UV)是一种诱变剂,它在我们的DNA中留下了非常特定的“名片”:胞嘧啶到胸腺嘧啶(C>TC>TC>T)变化的高比率。一个来自阳光暴露区域的皮肤损伤将充满数千个这样的紫外线特征突变。它们都是驱动突变吗?当然不是。这个特征告诉我们谁是罪魁祸首(紫外线),但没有告诉我们犯了什么罪。在一个像TP53这样的关键肿瘤抑制基因中的紫外线特征突变是一个确凿的证据——一个驱动事件。但基因组中一个广阔的、非功能性“沙漠”地带的紫外线特征突变只是一个乘客,是诱变剂经过时留下的一个足迹。仅有特征本身并不能确立选择性优势。

科学侦探:在实验室中证明因果关系

发现一种在癌症中常见的突变是强有力的间接证据,但它不是因果关系的证明。要获得“定罪”,科学侦探必须在实验室中证明此案。要检验的核心思想是现代癌症生物学中最重要的概念之一:​​癌基因成瘾​​。

想象一个带有驱动突变的癌细胞,就像一个绝望的瘾君子。这个驱动突变,比如说,肺癌中一个改变了的表皮生长因子受体(EGFR),提供了一个持续、强大的“生长,生长,再长!”的信号。细胞变得如此完全依赖于这单一、强大的信号,以至于其整个生存机制都围绕它重新布线。它上瘾了。

科学家可以通过一系列惊人的实验来证明这种成瘾性。首先,他们可以用一种靶向药物(如吉非替尼)来治疗这些成瘾细胞,这种药物专门阻断突变的EGFR。如果该突变是驱动突变,这些细胞在被剥夺了它们的“毒品”后会迅速死亡。作为对照,那些拥有不同驱动突变(如KRAS突变)和正常EGFR基因的细胞则完全不受该药物影响。下一步是使用更精确的遗传工具,如短干扰RNA(siRNA),来特异性地关闭EGFR蛋白的产生。同样,如果细胞是成瘾的,它们将触发细胞凋亡——一种程序性自毁序列。与此同时,关闭一个邻近的乘客突变则没有任何效果。最后、最优雅的证明是拯救实验。科学家们取出成瘾的细胞,用药物杀死它们,然后使用CRISPR基因编辑技术在EGFR基因中插入一个新的突变,这个新突变已知能使其对药物产生抗性。奇迹般地,即使在药物存在的情况下,细胞也能恢复生机。这一证据链——对抑制的敏感性、撤除后的死亡以及被耐药版本拯救——是癌基因成瘾的无可辩驳的证据,毫无疑问地确立了EGFR突变是驱动者。

达尔文在诊所:人类时间尺度上的演化

患者的癌症与其医生之间的战斗是达尔文式演化的一个戏剧性的、高风险的例子,它不是在数千年的时间里上演,而是在数月之间。驱动突变和乘客突变之间的区别是理解并有望赢得这场战斗的关键。

追踪敌人

白血病患者接受化疗后,医生如何知道是否还有癌细胞残留?他们可以寻找乘客突变,但这就像试图通过寻找敌人制服上掉落的纽扣来评估敌军的状态。纽扣可能不见了,但军队可能正在重新集结。一个更好的策略是追踪军队的将军。在许多白血病中,将军是一个强大的驱动突变,如BCR-ABL1融合基因。因为这个基因是癌症的真正引擎,它必须存在于每一个白血病细胞中。通过使用高灵敏度的测试来搜寻这个驱动基因的哪怕最微弱的痕迹,临床医生可以以惊人的精确度监测“微小残留病灶”(MRD)。如果驱动基因消失了,患者就处于深度缓解状态。如果驱动基因开始重新出现,那就是即将复发的第一个迹象。

不可避免的耐药性

治疗本身就是一种强大的选择压力。如果一种治疗方法不能根除每一个癌细胞,它将不可避免地选择出耐药细胞的增殖。肿瘤实现这种耐药性的方式是演化在行动中的美丽而悲惨的例证。

考虑一个由雌激素信号驱动的乳腺癌。一种标准治疗是使用CDK4/6抑制剂,这种药物通过加强由视网膜母细胞瘤蛋白(pRB)控制的细胞周期“刹车”来起作用。该药物保持pRB的活性,pRB阻止细胞分裂。这是一个非常有效的策略,直到肿瘤演化。通过监测患者的血液,医生可以看到一个新的RB1突变出现并在患者病情恶化时频率上升。这个新突变是一个截短突变——它完全破坏了pRB蛋白。癌症演化出了一个简单而粗暴的解决方案:如果疗法是通过踩住刹车踏板起作用的,癌症干脆就把刹车整个拆掉。药物现在毫无用处,因为它的靶点消失了。

一个更微妙和迷人的演化斗争发生在免疫疗法中。免疫系统通过识别新抗原——展示在细胞表面的突变肽——来识别癌细胞。许多这些新抗原来自乘客突变。在免疫系统的攻击下,癌细胞可以轻易地摆脱一个乘客突变以变得不可见;这样做没有适应度成本。但如果新抗原来自一个驱动突变呢?现在癌症陷入了一个可怕的困境。它的生存“成瘾”于驱动蛋白。它不能在不杀死自己的情况下摆脱驱动突变。然而,正是那个驱动突变的存在使其成为免疫系统的目标。这种“成瘾”为免疫疗法创造了一个稳定、不会丢失的靶点,是肿瘤无法修补的盔甲上的裂缝。

癌症之外:体细胞演化与衰老

体细胞演化的原则并不仅限于癌症。它们是普适的。我们的身体是数万亿细胞的广阔生态系统,即使在健康组织中,突变也会出现,克隆也会扩张。这是衰老的一个基本部分。

一个显著的例子是“克隆性造血”(CH),即单个造血干细胞获得一个体细胞突变并开始在竞争中胜过其邻居,导致一个不断增长的、所有细胞都共享相同突变的血细胞克隆。通过对同一个人多年来的血液进行测序,科学家可以直接观察到这一过程。一个真正的克隆性造血驱动突变,如DNMT3A基因中的突变,其频率会随着时间的推移稳步、不可阻挡地上升。它将在长寿的干细胞中被发现,并且会在许多不同的人群中复现,带有正选择的所有统计特征。然而,大多数突变是乘客。它们的频率会漫无目的地上下波动,或者只在短寿命的细胞中被发现,注定会消失。这一发现——驱动癌症的相同演化力量在正常衰老过程中也在起作用——将乘客突变的研究与老年学和预防医学联系起来,揭示了我们生命周期生物学中深刻的统一性。

联合各学科:从代码到治愈

这些知识的最终应用在于其综合——将遗传学、免疫学、计算机科学和临床医学结合起来,为单个患者做出挽救生命的决定。

想象一下设计个性化癌症疫苗的挑战。患者的肿瘤有20,00020,00020,000个突变。哪一个会产生一种肽,当作为疫苗给予时,会引发强大而治愈性的免疫反应?为了解决这个问题,生物信息学家构建了复杂的计算流程。这些算法充当了终极的综合器,整合了我们讨论过的所有原则。对于每个突变,算法会问:突变的基因是否高度表达?该突变是否是克隆性的,存在于所有肿瘤细胞中?产生的肽是否能与患者特定的免疫呈递分子(HLA)结合?突变肽与正常版本相比是否足够“外源”?以及,至关重要的是,它是否是肿瘤所成瘾的驱动基因的一部分?只有通过结合所有这些概率,人们才有希望从数千个无用的乘客突变中识别出少数真正的、具有免疫原性的驱动新抗原。

这一切最终汇集在现代精准肿瘤学“肿瘤委员会”上。在这里,来自十几个领域的专家聚集在一起,审查单个患者的病例。他们拥有原始基因组序列、功能实验的实验室数据、临床前模型的结果以及临床试验的结果。他们极其谨慎地权衡证据。在这个患者身上看到的这个特定变异,仅仅是另一个乘客吗?还是它符合了作为因果性、致癌性驱动突变的严格标准?实验室模型中必要性和充分性的证据、人群中正选择的信号以及生物标志物驱动的临床试验结果,是否达到了可以自信地称之为“可成药驱动突变”的水平?。

从在数据库中识别一个奇怪的、复发的突变,到做出改变生命的治疗决策,这是一段漫长而严谨的旅程。它证明了一个单一、统一思想的力量:在一个细胞基因组美丽而混乱的景观中,必须学会区分驱动者与乘客。