
癌症通常被视为一种单一疾病,但这种观点忽略了其最强大的特征:内部多样性。在单个肿瘤内部,存在着一个由不同细胞群体组成的复杂生态系统,它们在不断竞争和演化。这种被称为肿瘤异质性的现象不仅是一种生物学上的奇特现象,更是癌症具有韧性、能够逃避免疫系统以及在看似成功的治疗后频繁复发的根本原因。本文深入探讨了驱动这种多样性的演化原理,并探讨了其对我们诊断和治疗癌症的深远影响。接下来的章节将探讨异质性如何由基因突变和选择产生,从而在肿瘤内创建一个细胞谱系的家族树,并展示这种异质性在临床实践中——从病理学家的活检到肿瘤学家的治疗选择——带来的重大挑战,同时重点介绍为绘制和克服这种复杂性而开发的创新技术。
要真正理解癌症,我们必须停止将其视为一个单一的实体,一个无限增殖的流氓细胞。相反,我们必须将其想象成一个繁华、混乱且不断变化的城市,一个充满数十亿个体细胞公民的动态生态系统。在这一单个肿瘤中,细胞群体生存与死亡、竞争与合作,最重要的是,它们在演化。这种内部多样性,即瘤内异质性,不仅仅是一个奇特的细节,它是癌症顽固性及其令人沮丧地能够智胜我们最先进疗法的核心原因。要理解癌症的挑战,我们必须首先领会其演化背后那美丽而可怕的逻辑。
从某种意义上说,每个肿瘤都始于一个单一的创始者——一个其遗传蓝图(DNA)发生了灾难性错误的细胞。这一起始事件使其走上了不受控制的增殖之路。当这个创始细胞分裂时,它将其遗传遗产,包括最初的驱动突变,传递给其所有后代。如果细胞分裂是一个完美的过程,那么由此产生的肿瘤将是由相同克隆组成的均一肿块。
但生命并不完美。复制DNA的细胞机器虽然精确得惊人,但并非万无一失。每一次分裂,都有微小但有限的几率出现“印刷错误”——即体细胞突变——悄悄进入子细胞的DNA中。根据分子生物学中心法则,这份DNA蓝图通过RNA和蛋白质决定了细胞的形态和功能。因此,DNA中的一个“印刷错误”可能会改变细胞的行为,或许使其分裂速度稍快一些,在低氧条件下存活得更好,或者能够对免疫系统隐形。至关重要的是,这个新性状是可遗传的;它会传递给该细胞的所有后代,从而在肿瘤不断增长的群体中创造出一个新的、独特的谱系。这正是演化的原材料:可遗传变异。
一旦变异存在,大自然的伟大筛选原则便开始发挥作用:选择。肿瘤并非天堂,而是一个严酷的环境。细胞争夺氧气和营养等有限资源,还必须躲避身体免疫系统的攻击。在这场内部生存斗争中,并非所有细胞生而平等。
想象一个简单的场景。一个肿瘤起始于一个庞大的创始细胞群体,我们称之为克隆 ,其净增长率为 。在这个群体中,一个新的突变产生了一个小的亚群体,即克隆 ,其增长率显著增强,为 。即使克隆 最初只是一个极小的少数派——比如在一百万细胞的海洋中只有一千个细胞——它的命运也由指数增长的简单数学法则所注定。其优越的适应性意味着它的群体数量将比克隆 快得多地翻倍。在几周之内,这个最初罕见的亚克隆将扩张到超过并最终主导整个肿瘤。这就是最纯粹形式的克隆选择:最“适应”的细胞的差异性存活和扩增。
当我们进行治疗干预时,这场演化大戏变得最为明显。一种靶向药物可能被精巧地设计用于杀死携带特定突变的细胞。最初,治疗效果显著,肿瘤急剧缩小。但这种治疗干预是一种强大的选择行为。如果在肿瘤最初的多样化群体中,存在一个微小的、预先存在的细胞亚群,由于随机偶然的机会,恰好携带了另一种突变,使其对该药物具有耐药性,那么它们将在这场化学攻击中存活下来。治疗通过消灭它们所有的竞争者,为它们扫清了道路。这个曾经无足轻重的耐药少数派,现在拥有无限的资源来生长并重新占据肿瘤,导致了获得性耐药和治疗失败这一令人心碎的现象。药物并非创造了耐药性;肿瘤的异质性确保了耐药性早已存在,只待时机。
如果一个肿瘤是一个由不同谱系组成的庞大家族,我们能重建它的家族树吗?答案是肯定的,这是现代癌症基因组学的伟大胜利之一。关键在于区分所有细胞共享的突变和特定家族分支独有的突变。
在肿瘤生命早期,即所有癌细胞的共同祖先中发生的突变,被称为主干突变。就像家族姓氏一样,它们存在于肿瘤的每一个细胞中。后期在特定亚谱系中发生的突变,被称为分支突变。这些突变定义了构成肿瘤多样化群体的亚克隆。这种从共同祖先分化的模式被称为分支演化。
揭示这棵树是一项杰出的科学侦探工作。当我们对肿瘤样本进行测序时,我们测量每个突变的变异等位基因频率 (VAF)——即包含该突变的DNA读数的比例。然而,原始的VAF可能会产生误导。肿瘤活检是癌细胞与正常健康细胞(如基质细胞和免疫细胞)的混合物。为了找出携带突变的癌细胞的真实比例,我们必须对这种“污染”(肿瘤纯度,)以及癌细胞中该基因的拷贝数(拷贝数,)进行校正,因为在癌症演化的混乱过程中,基因拷贝数可能会被扩增或删除。
通过应用一个考虑了这些因素的公式,我们可以计算出每个突变的真实癌细胞分数 (CCF)。在肿瘤的每个空间上不同的区域中,CCF接近的突变被确认为主干事件。CCF较低或仅存在于部分区域的突变则是分支事件。通过拼接哪些突变共存的信息,我们可以绘制出一棵系统发育树,它描绘了肿瘤的整个演化历史,揭示了事件的顺序以及共存亚克隆之间的关系。
到目前为止,我们一直用遗传学的语言来谈论异质性——即DNA序列本身的变化。但一个细胞的身份不仅仅由其原始的遗传蓝图所塑造。肿瘤在多个层面上表现出惊人的多样性。
表观遗传异质性指的是不涉及改变DNA序列的可遗传基因活性变化。可以把基因组想象成一本巨大的食谱。表观遗传学决定了哪些食谱是打开的,哪些页面是粘在一起的。像DNA甲基化这样的化学标记,可以像直接突变一样有效地沉默一个抑癌基因。这些表观遗传状态可以通过细胞分裂遗传下去,创造出不同的亚克隆,但它们也比基因突变更具流动性和可逆性。这种可塑性使癌细胞能够快速适应环境线索来改变其状态。
最终,最重要的是表型异质性:癌细胞外观和行为上的可观察差异。这包括它们的形状、增殖速率(通过Ki-67等标志物测量),以及它们采用的复杂行为程序,如上皮-间质转化 (EMT),这使它们能够变得具有迁移性和侵袭性。这些表型是一个细胞的基因、其表观遗传状态以及它从局部环境接收到的信号之间复杂相互作用的产物。
肿瘤不是一袋混合均匀的细胞。它有地理分布,而且这种地理分布很重要。空间异质性描述了亚克隆组成在肿瘤内部不同物理位置的变化情况。来自肿瘤缺氧、坏死的中心区域的活检样本可能揭示生长缓慢且表型独特的细胞,而这些细胞与在富含血管的肿瘤边缘发现的高度增殖和侵袭性细胞不同。这就是为什么单次活检可能具有危险的误导性;它只提供了广阔多变景观的一个微小快照。来自同一肺部肿块的两次不同活检可能显示出看似两种不同级别的癌症,这证明了亚克隆存在深刻的空间分隔。
这种空间复杂性之上还叠加了第四个维度:时间。时间异质性指的是肿瘤克隆结构随时间的变化。这是演化过程的实时捕捉。我们今天活检的肿瘤与六个月后的肿瘤不同,尤其是在经历了强烈的治疗选择压力之后。一个在诊断时只是次要角色的亚克隆,在复发时可能成为主导克隆,甚至可能改变其整个组织学外观——例如,肺腺癌转变为更具侵袭性的小细胞癌。
因此,要理解一个肿瘤,就必须将其理解为一个四维的、演化中的实体。其遗传景观是通过无情的正向选择和中性漂变——在遗传空间中的随机漫步——累积突变的混合体。我们甚至可以应用生态学指标来量化这种多样性,不仅测量克隆的数量(丰富度),还测量它们的相对丰度(均匀度)。归根结底,瘤内异质性是统一肿瘤过去、现在和未来的生物学原理。它解释了癌症如何产生、如何生长,以及最关键的是,它们如何学会从我们试图摧毁它们的努力中存活下来。
肿瘤并非一支由完全相同、步调一致的士兵组成的单一军队。一个更好但更令人不安的比喻是,它是一个繁华、混乱且不断演化的城市。它是一个充满多样化居民的生态系统——不同的癌细胞派系、叛变的免疫细胞、合作的结构细胞——所有这些都在争夺资源,适应新的压力,并开辟自己的生态位。这种多样性,即瘤内异质性,在癌症研究中并非无足轻重的注脚。它是解释为什么癌症如此难以确诊、难以有效治疗、难以永久治愈的核心、统一的主题。在这里,纯粹的遗传学和演化法则与混乱的医学现实发生碰撞,创造了从病理实验室到超级计算机集群等各个学科都面临的挑战。
我们与肿瘤的初次接触几乎总是通过活检——一小片组织,通常不比一粒米大,由穿刺针取出。病理学家必须从这单个样本中推断出整个城市的性质。这是一项极其困难的任务,类似于根据格林威治村一个街角的照片来描述整个纽约。
想象一个在临床上司空见惯的场景:一位患者患有乳腺肿瘤。从肿块中心取出的穿刺活检可能显示细胞看起来相对有序,分裂缓慢,且缺乏侵袭性标志物。诊断结果是:低级别癌症,或许适合采用较不激进的治疗方案。但另一次从肿瘤外缘进行的活检,可能会讲述一个截然不同的、可怕的故事:细胞混乱且呈间变性,分裂迅速,并表达如HER2之类的蛋白质,这些蛋白质标志着它们具有高度侵袭性,需要特定的、强效的靶向药物。两份报告都是对载玻片上所见情况的事实描述,但它们描绘了同一肿瘤的矛盾图像。这不是错误,而是空间异质性的直接后果。具有不同遗传和行为的的不同亚克隆占据了肿瘤的不同区域,而穿刺针恰好取样了两个不同的“街区”。
这种取样随机性的后果可能是深远的。考虑一个肿瘤,假设其体积的由行为良好、低级别的成分组成,但关键的已经演化成高度侵袭性的间变形式。肿瘤的真实“个性”由其最危险的成分决定。然而,如果病理学家随机抽取两个核心样本,简单的概率法则告诉我们,有的几率——即高达的可能性——两根针都完全错过高级别区域。由此得出的诊断将是危险的、令人宽慰的,导致分级偏低和潜在的治疗不足,这一切都是因为活检提供了一个不完整、有偏见的、关于异质性现实的快照。
这一挑战迫使病理学家发展出复杂的判读规则。在对乳腺癌中的激素受体进行评分时——这是一个关键的预测性标志物——他们不能仅仅关注一个染色的“热点”。相反,他们必须进行“整体”评估,在脑海中对肿瘤所有不同区域的染色比例和强度进行平均,以得出一个最能代表整体的评分。这是一种有意识的努力,旨在弥补他们正试图测量的异质性本身。
如果说异质性使诊断复杂化,那么它绝对是治疗的克星。当我们施加强力治疗时,我们不只是在毒害一个静态的目标;我们是在对一个演化中的生态系统施加强大的选择压力。我们是在对一片杂草地施用强效除草剂。除草剂可能对的杂草非常有效,但只要有几株植物预先携带了使其具有抗性的性状,它们就会存活下来,在新生长的空地上繁盛,它们的后代将构成新的、完全抗药的杂草群体。这就是达尔文演化论,它在癌症患者体内以月而不是万年为单位上演。
这场戏剧在肺癌治疗中不断上演。一个由表皮生长因子受体 (EGFR) 突变驱动的肿瘤患者可能会接受一种阻断EGFR信号的靶向药物。结果往往是肿瘤急剧缩小——一个极好的初步反应。但胜利往往是短暂的。为什么?因为深藏在原始肿瘤中,也许只占细胞的一小部分,存在一个已经获得了第二种突变(如著名的T790M)或激活了旁路途径(如MET扩增)的亚克隆。这些细胞不依赖于药物所阻断的通路。治疗通过消灭它们所有的竞争者,为这个预先存在的耐药亚克隆扫清了道路。随后的复发是一个几乎完全由这些耐药细胞组成的肿瘤,它们是从原始异质性的种子中生长出来的。
有时,肿瘤的策略不是演化出单一的耐药克隆,而是从一开始就以不同群体的联合形式存在。在最富侵袭性的脑瘤——胶质母细胞瘤中,常见的情况是一个区域由EGFR基因的扩增驱动,而另一个独立的区域则由PDGFRA的扩增驱动。这是驱动癌症生长的两个不同引擎。只针对EGFR的治疗对PDGFRA驱动的细胞毫无效果,这些细胞将继续不受控制地生长。这就像试图通过切断两条平行补给线中的一条来阻止一支军队。
同样的选择原则也解释了免疫疗法的挑战。如果我们训练患者的T细胞识别并杀死表达“黑色素瘤抗原A”的癌细胞,那么这种疗法将对任何因纯粹的随机变异而恰好不表达该特定抗原的癌细胞视而不见。这些抗原阴性的细胞逃脱了免疫攻击,存活下来,并构成了复发肿瘤的基础。
这场博弈可能变得更加错综复杂。像PD-1抑制剂这样的检查点抑制剂通过“松开”免疫系统的“刹车”来发挥作用,让患者的T细胞攻击肿瘤。这释放了一股强大的选择力量。T细胞有效地追捕并杀死它们能“看到”的任何癌细胞——也就是任何通过MHC I类蛋白复合物在其表面呈递肿瘤抗原的细胞。但如果最初的肿瘤包含一个带有B2M基因突变的亚克隆呢?这种蛋白质对于在细胞表面展示任何抗原都至关重要。这些细胞对T细胞来说实际上是隐形的。当它们的抗原呈递同伴被消灭时,B2M突变的细胞却存活并增殖。另一个预先存在的亚克隆可能其JAK1基因存在缺陷,这使其对T细胞释放的关键警报信号——γ-干扰素——充耳不闻。这个克隆也不易被“看见”,同样具有生存优势。通过这种方式,成功的免疫治疗行为本身就选择了预先存在的“逃逸者”克隆的生长,从而导致获得性耐药。
理解异质性是一回事,征服它又是另一回事。在这里,癌症的故事变成了技术和概念创新的故事,吸收了系统生物学、生物信息学乃至物理学的思想。
要对抗一个你看不见的敌人,你必须首先创建一张地图。革命性的单细胞RNA测序 (scRNA-seq) 技术正是为此而生。通过测量单个肿瘤活检中成千上万个单个细胞的全基因表达谱,我们可以超越模糊的、批量的平均值。我们可以构建一个全面的“细胞图谱”,不仅识别出所有不同的癌症亚克隆,还对构成肿瘤微环境的每种免疫细胞和基质细胞进行分类。这就像知道一个城市的平均意见与能够单独调查每一个市民之间的区别。
然而,单次组织活检仍然只是时间长河中的一个瞬间。肿瘤在演化。要追踪这种演化,特别是耐药性的出现,我们需要一种可重复且非侵入性的方法。这就是“液体活检”的前景——分析从肿瘤脱落到血液中的循环肿瘤DNA (ctDNA) 片段。这项技术面临着源于异质性的自身深刻挑战。耐药突变可能仅存在于一个小的亚克隆中,这意味着其DNA在血液中本已微弱的肿瘤信号中只占极小的一部分。漏检的可能性很高。假阴性可能源于两种不同的失败:“覆盖失败”,即我们的搜索列表(测序面板)上没有特定的耐药基因;或“取样失败”,即突变在血液样本中如此罕见,以至于我们测序的分子数量不足以可靠地检测到它。克服这一点需要多管齐下的策略:增加抽血量,设计更广泛、更智能的基因面板,并进行重复的纵向取样以追踪克隆动态。这将癌症监测转变为一个信号处理和统计检测理论的问题。
展望更远的未来,科学家们正在训练人工智能来识别人眼无法看到的异质性。像CT扫描或数字化的病理切片这样的医学图像富含信息。CT扫描中像素强度的细微变化或切片上细胞核的空间排列都包含着模式。影像组学和计算病理学等领域使用从物理学和空间统计学借鉴来的数学工具——如灰度共生矩阵或Ripley's 函数——来量化这种“纹理”。一个具有高异质性的肿瘤在这些数学术语中可能显得更“混乱”或“无序”。通过将这些定量影像特征与潜在的遗传多样性联系起来,并最终与患者预后联系起来,我们希望有一天能从标准的扫描中预测肿瘤的行为,为其隐藏的多样性提供一个强大的、非侵入性的窗口。
从病人的床边到数据科学的前沿,贯穿一切的线索是瘤内异质性那美丽而又令人抓狂的复杂性。它是癌症韧性的引擎,也是我们研究的主要对象。理解它,就是理解这种疾病的本质。而在理解它的过程中,我们找到了最终智胜它的最有希望的道路。