
要理解像癌症这样极其复杂的现象,仅靠直接观察是远远不够的。我们不能在患者的肿瘤上随意进行实验,因此我们必须建立模型:一种简化的、可控的现实表征,作为我们的思想实验室。这些模型对于检验假说、揭示隐藏的规律以及理解肿瘤生长和演化的混乱至关重要。本文将探索肿瘤建模的世界,这是一个生物学与数学、物理学和进化论交汇的繁忙十字路口。
以下章节将引导您领略这一领域的概貌。在“原理与机制”一章中,我们将深入探讨这些基础模型本身。我们将从基因工程小鼠和自组织类器官等生命系统,走向优雅的数学和计算语言,揭示每种模型如何为癌症生物学提供独特的观察窗口。随后,在“应用与跨学科联系”一章中,我们将看到这些模型的实际应用。我们将发现它们如何像水晶球一样预测未来,像罗塞塔石碑一样解读复杂数据,又如何作为框架将癌症与生态学和进化的深刻原理联系起来,最终促成对该疾病更深入、更具操作性的理解。
我们的旅程始于最切实的模型:由活体组织构成的模型。我们如何检验一个特定基因负责预防癌症这一基本观点?我们不能简单地从人体中删除它。取而代之的是,我们求助于生物医学领域一位不知疲倦的盟友:小鼠。
想象一下,我们怀疑某个基因扮演着细胞生长的“刹车”角色——一个抑癌基因。这个被称为二次打击假说的理论提出,只要细胞至少有一个该基因的正常拷贝,它就受到保护。要失去控制,它需要遭受两次“打击”:一次使第一个拷贝失活,第二次使另一个拷贝失活。为了亲眼看到这一过程,科学家们可以进行一项巧妙的基因工程操作。他们创造出一种基因敲除小鼠,在这种小鼠中,我们怀疑的那个基因的两个拷贝之一从其出生起就在每个细胞中被灭活了。这种小鼠完全健康,但它的生存状态岌岌可危。它只剩下一个刹车。其体内的每一个细胞都只差一次随机突变——即第二次打击——就会完全失去刹车。通过观察这些小鼠,我们可以看它们是否比正常小鼠更快地长出肿瘤。如果确实如此,我们就找到了强有力的证据,证明我们的基因确实是抑癌基因。这种设置完美地模拟了人类遗传性癌症综合征,在这些综合征中,个体遗传了一个有缺陷的基因,因此终生患癌风险更高。
但肿瘤不只是一辆失去刹车的失控汽车,它也是一辆被追赶的汽车。免疫系统在体内不断巡逻,试图清除异常细胞。这又增加了一个极其复杂的层面。小鼠的免疫系统终究是小鼠的。它识别人类细胞的方式与人类免疫系统不尽相同。那么,我们如何模拟人类肿瘤与人类免疫反应之间错综复杂的博弈呢?
为了攀登这一复杂性的阶梯,科学家们开发了一系列引人入胜的小鼠模型层次结构。
尽管动物模型很强大,但它们缓慢、昂贵且复杂。对于许多问题,我们需要更快、更简单、更可控的方法。几十年来,这意味着在塑料培养皿平坦的底部培养癌细胞。但这种“二维培养”就像通过观察只能在地上爬行的人来研究一个社会。我们体内的细胞生活在一个丰富的三维世界中,不断与四面八方的邻居细胞进行交流。
一个革命性的飞跃来自于采纳自然界最深刻的原理之一:自组织。如果你为干细胞——身体的主要构建细胞——提供合适的营养液和柔软的凝胶状支架供其生长,它们会做出神奇的事情。它们会利用自身的内部遗传程序,即在子宫内构建我们器官的同一套程序,自发地组装成微型的三维结构,其外观和功能都与微小器官惊人地相似。这些被称为类器官。
类器官不仅仅是像更简单的球状体那样一团随机的细胞。它是一种“自下而上”的创造,再现了亲代组织的结构和多样的细胞类型。这与“自上而下”的工程组织形成鲜明对比,在后者中,科学家可能使用3D打印的支架来迫使细胞形成特定形状。类器官是自我构建的。这种利用细胞自身内在智能的能力,对于建模来说是颠覆性的。
但这提出了一个关键问题。如果我们用患者的细胞创建一个类器官,我们真的能称之为“患者化身”吗?它能预测患者对药物的反应吗?事实证明,答案是一个微妙的“视情况而定”。患者的表型()——我们能观察和测量的特征——不仅仅是其基因型()的产物。它是基因型、表观遗传状态(,DNA上的化学标记,充当细胞记忆)以及细胞所处环境()的复杂函数。我们可以将这种关系写为 。
一个类器官模型的优劣,取决于它复制对我们所关心的表型至关重要的G、M和E的能力。
生物模型至关重要,但它们很杂乱。为了找到简洁的、潜在的原理,我们有时需要剥离复杂性,将问题转化为数学语言。
想象一个肿瘤是一个单一的体积 ,随时间增长。我们可以写一个简单的微分方程来描述它的命运。肿瘤有内在的生长趋势,我们可以用像 (指数增长)或 (协同增长)这样的项来表示。同时,一种疗法正试图杀死它,其效果在肿瘤体积较大时可能达到饱和,可以用 这样的项来描述。体积的总体变化是这场拉锯战的结果: 这样一个简单的方程能告诉我们什么?一些真正深刻的东西。通过分析这两种力量之间的平衡,我们可以找到一个缓解阈值——一个临界的肿瘤体积。如果肿瘤起始体积低于这个阈值,治疗就会获胜,肿瘤体积将缩小至零。如果起始体积高于这个阈值,生长就会获胜,肿瘤将不受控制地扩张。这个临界点是系统的一个涌现属性,一种不从单个部分显而易见、但由它们的相互作用产生的戏剧性行为。这就是数学的力量:从简单的定量规则中揭示深刻的定性真理。
当然,肿瘤并非一个均匀的团块,它是由单个细胞组成的。我们也可以从这种“基于智能体”的视角来构建模型。元胞自动机(CA)是一个模型世界,一个由网格单元组成的世界,每个单元都遵循一套非常简单的规则。例如:如果一个空格的邻居是肿瘤细胞,那么这个空格就会变成一个肿瘤细胞。从单个肿瘤细胞开始,让这个规则在计算机上运行,我们可以观察到肿瘤一次一个细胞地生长。最终涌现出的全局形状——在本例中是一个菱形——是其简单的局部规则的结果。然后,我们可以测量这个模拟肿瘤的属性,比如其边界的不规则性,并将其与真实肿瘤的形状进行比较,从而为我们提供有关其潜在生长规则的线索。
然而,这些模型很快就会变成一堆错综复杂的参数——扩散率、增长率、吸收率等等。面对如此混乱的局面,物理学家会采用一个强大的技巧:量纲分析。其思想是,任何单个参数的绝对值都不如相互竞争过程之间的比率重要。通过对复杂模型的方程进行无量纲化,我们可以将系统简化为几个关键的无量纲数,这些数告诉我们系统处于何种状态。例如,丹柯勒数 ,比较了营养物质消耗速率与营养物质扩散速率。如果这个数值很大,意味着肿瘤消耗营养的速度远快于供应速度,从而导致一个饥饿的坏死核心。如果这个数值很小,肿瘤则营养充足。这些数字是肿瘤物理学的通用语言,告诉我们一个肿瘤是受限于食物、自身的增殖速率,还是它所产生的压力。
近几十年来,我们对癌症理解的最深刻转变,或许是认识到肿瘤并非一个静态实体,而是一个繁荣、不断演化的生态系统。这是达尔文进化论在我们身体内部,在数月乃至数年的时间里上演。每一次细胞分裂都为新突变的产生提供了机会。大多数突变毫无意义,但有些可能会使细胞分裂得更快、更好地在治疗中存活,或逃避免疫系统。这些“更适应”的细胞将被选择出来,它们的后代将逐渐主导整个群体。
这种体细胞进化过程可以采取不同形式。
但一切都是由这种无情的自然选择所驱动的吗?或者,我们在肿瘤中看到的惊人遗传多样性,是否可能仅仅是随机机会的结果?这就是中性进化模型所要解决的问题。它作为一个科学的零假设——即在没有选择发生的情况下,肿瘤会是什么样子的基线。这个模型做出了一个惊人精确的预测。在一个中性进化、指数增长的群体中,频率至少为 的突变数量应与 成正比。这在测序数据中形成了一个由许多稀有突变组成的特征性“长尾”。如果来自真实肿瘤的数据符合这个 模式,这表明其生长可能在很大程度上是非适应性的。如果数据显著偏离——例如,在特定频率显示出一个大的突变峰——这就是选择性清除的确凿证据。
最后,我们必须将免疫系统带回到这场进化大戏中。免疫系统不是一个被动的旁观者;它是肿瘤环境的关键组成部分和一种强大的选择压力。肿瘤与免疫系统之间的动态相互作用被称为癌症免疫编辑,这个过程分为三幕:
这个抽象的框架在肿瘤微环境中有具体、可观察的后果。一个免疫浸润型或“热”肿瘤,充满了杀伤性T细胞,很可能处于平衡阶段——一场激烈的战斗正在进行。一个免疫沙漠型或“冷”肿瘤,看不到任何免疫细胞,很可能已经达到了逃逸阶段,使自己变得“隐形”。而一个免疫排斥型肿瘤,其中T细胞存在但被困在肿瘤边界,被物理屏障阻挡,代表了另一种形式的逃逸——肿瘤建立了一座堡垒。
从老鼠到微芯片,从类器官到方程式,每个模型都为这个谜题提供了独特而不可或缺的一块拼图。它们向我们展示,肿瘤不仅仅是一种基因疾病,更是一种系统、生态和进化的疾病。通过将所有这些不同思维方式的见解编织在一起,我们开始看到支配肿瘤生命周期的原理中那美丽而可怕的统一性。
我们已经花了一些时间来了解我们故事中的角色:癌细胞、它的邻居,以及它们遵循的生长和变化规则。我们已经学会了它们语言的语法,这种语言是用变化与概率的数学写成的。但是学习一门语言本身并不是目的;真正的乐趣在于阅读它所能讲述的诗歌和故事。那么,我们能用我们的模型做些什么呢?它们开启了哪些新世界?
你会发现,一个好的模型不是一套僵硬的方程,而是一双新的眼睛。它是一个工具,让我们能够穿透生物复杂性的迷雾,看到其下的简洁与美丽。肿瘤建模不是一个狭隘的专门学科;它是一个繁忙的十字路口,医生、生物学家在这里与物理学家、生态学家、进化理论家和计算机科学家相遇。在本章中,我们将游览这个十字路口,看看能找到什么宝藏。
也许模型最古老、最引人注目的用途就是预测未来。我们根据行星的运动预测日食;我们根据流体动力学方程预测天气。我们能为肿瘤的病程做同样的事情吗?
答案是肯定的,而且我们可以从一个惊人简单的想法开始。假设我们在实验室环境中测量了一批肿瘤在初始时间的大小,然后在一段固定的时间后再次测量。我们可能会注意到一个规律:平均而言,起始时较大的肿瘤生长得也更多。这并非一个非常深刻的观察,但我们能让它变得精确吗?我们确实可以。我们可以建立一个简单的线性模型来捕捉这种关系,就像在一张散点图上画出“最佳拟合”直线一样。这样一个模型虽然初级,却为我们提供了预测的第一个立足点。它为肿瘤在没有治疗的情况下如何生长建立了一个定量的基线,使我们能够仅根据其初始大小来预测它在未来某个日期的可能大小。这是从被动观察到主动预测的第一步。
但肿瘤并非总是沿着一条直线路径那么简单。它们的故事有章节、情节转折和转折点。肿瘤生命中最具戏剧性的转折点之一是“血管生成转换”。早期肿瘤就像一个偏僻的小村庄;它必须通过从周围环境中进行简单的扩散来获取所有食物和氧气。这严重限制了它的大小。在某个时刻,如果它要生存和生长,就必须向身体发出信号,诱使身体建立新的血管来直接供应肿瘤。这就是血管生成。一旦血管到达,肿瘤就不再是一个安静的村庄;它是一个拥有自己高速公路的繁华都市,其生长速度会爆炸式增长。
我们能模拟这个戏剧性的事件吗?当然可以。我们可以写下两种不同的生长定律。第一种,针对无血管的“村庄”阶段,描述了一种缓慢的生长,随着扩散成为瓶颈而饱和。第二种,针对有血管的“城市”阶段,描述了一种快速的指数级扩张。通过仔细测量肿瘤半径随时间的变化,我们看到了一个不符合任何单一简单曲线的模式。但是,如果我们尝试拟合我们这个由两部分组成的故事——一个缓慢生长的章节后跟一个快速生长的章节——我们不仅可以完美地描述整个历史,还可以精确定位转换发生的那个确切时刻。我们的模型让我们能够推断出一个对我们肉眼完全不可见的、关键的、微观的生物学事件,仅仅通过观察其宏观后果。这就是机理模型的力量:它不仅预测将要发生什么,还帮助我们理解行为改变的原因和时间。
预测固然强大,但科学的日常工作更多的是关于阐释。一个现代生物学实验可以产生海量数据——来自基因测序仪的数千兆字节的数字,或来自代谢分析仪的一连串波动的测量值。这些数据就像一门我们不懂的语言。模型可以成为我们的罗塞塔石碑,将这些神秘的数字翻译成我们能理解的故事。
思考一下癌细胞的能量经济学。细胞主要有两种方式产生ATP,即生命的能量货币。它们可以在线粒体中利用氧气进行高效的“呼吸”,这个过程称为氧化磷酸化。或者,它们可以非常快速但低效地“发酵”糖,这个过程称为糖酵解。许多癌细胞以其对这种快速而猛烈的发酵的依赖而闻名,即使在有氧的情况下也是如此。现在,想象我们有一台机器,可以从培养皿中的癌细胞群体中测量两样东西:它们的耗氧率(OCR)和胞外酸化率(ECAR),后者是它们在发酵过程中排出的乳酸的代表指标。
我们有两个数字。它们意味着什么?细胞的能量有多少来自呼吸,多少来自发酵?在这里,一个定量模型变得不可或缺。通过利用我们对生物化学计量学的知识——每分子乳酸产生多少质子,每分子氧气产生多少ATP——我们可以建立一个作为翻译器的方程组。我们输入原始的OCR和ECAR测量值,模型就会计算出每个来源的ATP生产速率。突然之间,抽象的数字有了清晰的生物学意义。我们可以定量地看到,某个特定的癌细胞系大约有0.6的能量来自糖酵解。我们可以添加一种抑制糖酵解的药物,并通过我们的模型观察细胞的能量经济如何实时变化,或许通过增加呼吸来补偿。模型使细胞经济学这个无形的世界变得有形且可解释。
这种从静态数据中解读历史的想法,在我们审视肿瘤的遗传学时达到了顶峰。单细胞测序仪可以给我们一个巨大的二元矩阵,其中行是单个细胞,列是突变。'1'表示细胞有该突变,'0'表示没有。看着这片0和1的海洋令人困惑。但如果我们应用一个进化模型,我们就能把这个模式变成一个故事。我们使用的模型是系统发育树,进化生物学家用同样的工具,根据不同物种的DNA来重建生命家族树。通过将癌症框定为一个进化过程,我们可以使用贝叶斯系统发育方法来找到最能解释观察到的突变模式的树,甚至考虑到我们测量中不可避免的噪音和错误。从这个重建的历史中,我们可以回答一些深刻的问题:扩散到肝脏的转移灶是源于单个冒险的细胞,还是由来自原发肿瘤的多个远亲细胞家族协同入侵的?模型让我们能够阅读癌症征服的历史,这段历史写在每个细胞的基因组中。
将癌症比作一个进化过程不仅仅是一个比喻;它是现代科学中最富有成果的跨学科桥梁之一。肿瘤不是一个由相同细胞组成的均质袋子。它是一个多样化、不断演化的群体,一个充满竞争、合作和自然选择的真实生态系统。生态学家和进化生物学家为理解雨林和岛屿动物群而开发的工具和概念,可以惊人地成功应用于肿瘤内部的宇宙。
思考一下免疫系统与癌症之间的战斗。我们现在可以对患者自己的T细胞进行工程改造,使其能够识别和攻击他们的肿瘤。这些被称为CAR-T细胞。当我们将它们注入患者体内时,接下来发生的是一场生死攸关的大戏,看起来就像捕食者-猎物动态。CAR-T细胞是捕食者,肿瘤细胞是猎物。我们可以写下一个简单的微分方程组,其形式与用于模拟狐狸和兔子种群的Lotka-Volterra方程相同,来描述它们的相互作用。肿瘤细胞()自行生长,并在遇到CAR-T细胞()时被杀死。相互作用项看起来像 ,这是质量作用定律的直接应用。这种生态学视角使我们能够以新的方式思考这个系统。如果捕食者“疲惫”并死亡(一种称为T细胞耗竭的现象),会发生什么?我们可以用一个针对的损失项来模拟这一点。一种名为检查点封锁的现代免疫疗法通过“重振”这些疲惫的T细胞来起作用。在我们的模型中,这直接对应于降低控制它们死亡率的参数,从而为我们提供一个关于该疗法如何使生态平衡向有利于患者的方向倾斜的定量假设。
癌症通过转移扩散也是一个根本上的进化过程。当肿瘤转移时,少数细胞从原发肿瘤脱离,通过血流旅行,并试图在远处器官建立一个新的菌落。这是群体遗传学中“种群瓶颈”或“奠基者效应”的经典例子。想象原发肿瘤在遗传上是多样化的,就像一个有许多不同族群的大陆。转移菌落是由恰好搭上船的少数几个个体建立的。纯粹由于偶然,新的“岛屿”菌落的遗传构成可能与大陆种群大相径庭。我们为此建立的模型,仅使用基本概率,就可以计算这种情况发生的几率。它可以告诉我们,在同一位患者体内的两个不同转移灶由完全不同的细胞类型建立的概率。这个简单的模型解释了一个令人心碎的常见临床问题:一种能缩小原发肿瘤的药物可能对其转移灶毫无效果。从进化角度看,它们现在是不同的“物种”,需要不同的策略来控制。
进化漂变也可能在表观遗传层面发生。经过许多次细胞分裂,复制DNA上甲基化模式的细胞机制——即告诉基因应该开启还是关闭的表观遗传标签——并非完美无缺。它会犯微小的错误。一个简单的概率模型显示,如果这个过程的保真度略有降低,比如说由于患者特有的突变,一个关键抑癌基因的甲基化水平可能会在细胞分裂的世代中缓慢而随机地被侵蚀。最终,甲基化水平可能会降到一个临界阈值以下,基因可能会被重新激活,从而增加患癌风险。这是由成千上万次微小、随机的切割所带来的进化,一个简单的模型清楚地揭示了这一微妙过程的长期后果。
最后,模型不仅仅是计算的工具;它也是思考的工具。它迫使我们对自己的假设保持精确。这也引出了一个优秀科学家最重要的品质:谦逊。一个模型的好坏取决于它所基于的假设,我们必须对这些假设保持绝对的诚实。
想象一下,我们正在模拟肿瘤中突变的积累与患者年龄的关系。从生物学上讲,一个人在出生时(零岁)没有这些与癌症相关的体细胞突变,这是合理的。因此,建立一个迫使回归线通过原点的模型——将这个美好的想法融入我们的数学中——是很诱人的。但是,如果我们的数据集只包括30岁到85岁的成年患者呢?我们的数据远离原点。强迫回归线通过一个我们没有数据的点,会严重扭曲模型对我们确实拥有的数据的拟合,导致对成年人突变率的理解产生偏见和错误。这是一个至关重要的教训:我们必须区分我们理论假设的完美世界和我们数据凌乱、有限的现实。模型应是向导,而非紧身衣。
这就引出了科学的最终目标:寻找原因,而不仅仅是相关性。我们可能在医院数据中观察到,具有某种肠道菌群组成的患者对免疫疗法的反应要好得多。这是一种相关性。但是,是细菌导致了良好的反应,还是它只是一个旁观者,与某个其他未知因素相关?要回答这个问题,我们需要从一个观察性模型转向一个因果模型,然后通过实验来检验它。检验“微生物群导致反应”这一假说的最佳方法是设计一个严谨的实验。我们可以取无菌小鼠(它们没有自己的微生物群),给它们植入相同的肿瘤,然后分别移植来自对治疗有反应或无反应的人类患者的粪便微生物群。通过控制所有其他变量——饮食、居住环境、遗传——只操纵微生物群,我们可以清晰地检验因果联系。这样一个实验的设计是一个清晰因果模型的物理体现。它代表了科学过程的顶峰:一个观察激发了一个相关性发现,这启发了一个因果模型,然后这个模型通过一个关键实验得到最终检验,最终导向真正的理解。
从简单的预测到基因组的解读,从生态戏剧到进化的宏大画卷,肿瘤建模是一个充满活力和统一性的领域。它是一种思维方式,使我们能够提出精确的问题,连接不同的想法,并将模式转化为故事,将故事转化为理解。征途远未结束,但手握这些工具,我们比以往任何时候都更有能力探索癌症这个复杂的宇宙。