
数十年来,癌症治疗的成功与否通常通过一个简单的指标来判断:肿瘤是否缩小?这种治疗前后的快照虽然重要,但却忽略了肿瘤在治疗期间丰富而动态的响应过程。它未能捕捉到肿瘤生态系统中那些微妙的内部变化,而这些变化往往先于尺寸变化发生,并能预测治疗的最终成败。本文旨在探讨一种为解读这一过程而设计的强大技术:Δ-放射组学。
Δ-放射组学超越了静态测量,转而分析一系列医学影像中所捕捉到的肿瘤特征的演变。通过量化纹理、形状和强度随时间的变化,它为评估治疗效果提供了更细致、更及时的视角。本文将对这一变革性方法进行全面介绍。在“原理与机制”一章中,我们将深入探讨Δ-放射组学的基本概念,探索它如何量化变化以及为确保测量可靠性而必须克服的关键技术挑战。随后,在“应用与跨学科联系”一章中,我们将踏入更广阔的科学领域,发现Δ-放射组学如何与物理学、生物统计学和机器学习相结合,以构建稳健的预测模型并指导临床决策。
想象一下,你试图只通过两张照片——一张来自开头,一张来自结尾——来理解一部伟大电影的情节。你可能会看到一个角色在第一张照片中出现,在第二张中消失,但你将错过整个故事——挣扎、转变和高潮。长期以来,我们评估癌症治疗的方式常常与此类似。我们在治疗前进行一次扫描,几周或几个月后再进行一次,然后问一个简单的问题:“肿瘤缩小了吗?” 这个问题虽然至关重要,但却忽略了治疗期间发生的丰富而动态的故事。Δ-放射组学正是我们观看这部电影的尝试。
肿瘤并非一个单一、静止的肿块,而是一个熙攘、演变的生态系统。在其边界内,不同的细胞群落——一些具有高度侵袭性,一些缺氧,一些对药物有抗性,一些则已濒临死亡——为资源和空间而竞争。当我们采用一种疗法时,我们不仅仅是打击一个单一目标,而是在扰动整个生态系统。Δ-放射组学的核心假设是,这种扰动的迹象,即肿瘤反应的戏剧性过程,远在肿瘤整体尺寸发生变化之前就已显现。
要看到这些迹象,我们首先需要一种超越简单直径或体积测量的语言来描述肿瘤的外观。这种语言就是放射组学。你可以将放射组学特征想象成一个用于量化图像外观的复杂工具包。它们不仅测量肿瘤的平均亮度——即其平均强度——还测量强度的多样性和空间排列。肿瘤是均匀平坦的灰色,还是由明暗斑块构成的复杂织锦?像熵这样的特征可以量化强度分布的随机性或复杂性,而源自灰度共生矩阵 (GLCM) 等方法的纹理特征则测量局部对比度和均匀性等属性。从本质上讲,它们是对视觉纹理的数学描述。
有了这个工具包,Δ-放射组学的定义就变得异常简单:它是对这些放射组学特征随时间的变化——即“delta”()——的分析。我们可以计算绝对变化 ,或相对变化 ,其中 是像熵这样的特征,而 和 是治疗期间的两个时间点。
为什么这些特征会改变?让我们将肿瘤想象成不同组织类型或“生境”的复杂混合体:一个灌注良好、活跃的核心区;一个灌注不良、细胞密集的区域;以及由治疗引起的坏死(死亡组织)斑块。成功的治疗可能会选择性地杀死活跃的核心区,导致坏死生境扩大。而失败的治疗可能会看到具有抗性的、灌注不良的生境茁壮成长,而其他细胞类型则死亡。
考虑一个源自临床研究的真实场景。一个肿瘤在一次治疗周期前后分别进行了成像。总体积缩小了 ,表面上听起来是不错的反应。但使用Δ-放射组学进行更深入的观察,则揭示了一个更微妙的故事。通过基于图像体素的属性对其进行聚类,我们识别出两个生境:,一个灌注不良且细胞密集的区域,和 ,一个灌注较好的区域。起初,肿瘤是均匀分裂的, 的 和 的 。治疗后,尽管整个肿瘤缩小了,但具有抗性的 生境的比例却增长到了 。肿瘤正在巩固其防御。这一剧烈的内部转变被Δ-放射组学捕捉到了:全肿瘤熵和GLCM对比度均增加,表明肿瘤的纹理变得更加复杂和异质。一个简单的体积测量会错过故事中这关键的一部分。
Δ-放射组学的威力不仅在于生物学层面,还在于统计学层面。医学中的一个根本挑战是每位患者都是独一无二的。如果我们选择一个放射组学特征,比如“纹理对比度”,并在一个群体中进行测量,我们会看到一个巨大的数值范围。这种受试者间变异反映了患者在遗传、肿瘤生物学和许多其他因素上的内在差异。如果我们试图通过比较一组接受治疗的患者和一组未接受治疗的患者来观察治疗效果,这种巨大的自然变异性就像试图在拥挤的房间里听到耳语一样;信号很容易被噪声淹没。
纵向分析是Δ-放射组学的核心,它提供了一个优雅的解决方案:将每位患者作为其自身的对照。我们不再问“这位接受治疗的患者的对比度与平均未治疗患者有何不同?”,而是问“这位特定患者的对比度与其自身的基线值相比发生了怎样的变化?”。通过关注受试者内变化,我们有效地减去了每个个体稳定且独特的特征。
统计学家使用线性混合效应模型等工具将此概念形式化。虽然数学可能错综复杂,但其核心思想却异常简单。我们可以将患者 在时间 的任何特征测量值 看作由几个部分组成:一个群体平均值、一个代表患者 与平均值持续差异的项(其独特的基线)、一个代表患者 随时间变化的项,以及随机噪声。
Δ-放射组学使我们能够分离和测量“随时间变化”这一项,而这正是治疗反应故事的所在。通过关注这些受试者内轨迹,我们极大地提高了检测真实、有意义的治疗效果的统计功效。
然而,这种强大的方法充满了技术风险。为了确信我们测量的“delta”值确实是生物学上的,我们必须首先面对并纠正这样一个事实:我们是通过一个不完美且不一致的镜头来观察肿瘤的。这涉及解决两个主要问题。
患者绝不可能两次都以完全相同的位置躺在扫描仪中。头部倾斜的角度可能不同,呼吸可能使躯干移位。如果我们简单地将时间 的扫描与时间 的扫描叠加,一个在生物学上没有移动的肿瘤会因为患者位置的改变而显得移动了。如果我们在一个固定的坐标框内计算一个特征,我们可能在第一次扫描中测量的是肿瘤,而在第二次扫描中测量的是肿瘤和健康肝脏的混合物。由此产生的“delta”值将是一个毫无意义的伪影。
解决方案是图像配准,这是一个计算过程,通过寻找空间变换(平移、旋转,有时还包括拉伸或扭曲的组合)来将一幅图像中的解剖结构与另一幅图像中的解剖结构对齐。其目标是确保当我们比较两个扫描中坐标为 的体素时,我们看到的是同一块组织。在此过程中,对于Δ-放射组学而言,一个关键的微妙之处在于,我们应该基于稳定的解剖标志物——如脑部扫描中的颅骨或胸部扫描中的脊柱——来对齐图像,同时明确不强迫肿瘤与自身对齐。毕竟,肿瘤形状和大小的变化是我们想要测量的生物学信号的一部分。
为什么即使是微小的未对准也如此关键?通过一个优美的推理,我们可以证明,由微小配准位移 引起的简单平均强度特征的误差或偏倚,约等于图像梯度 与位移向量 的点积在感兴趣区域上的平均值。
其物理意义非常直观:如果你的测量区域位于图像强度景观中的一个陡峭“山坡”上(一个高梯度区域,通常见于异质性肿瘤),即使是微小的位移也可能导致你采样到一组非常不同的强度值,从而导致巨大误差。在平坦、均匀的区域,微小位移的影响则较小。这就是为什么在分析复杂纹理时,准确性至关重要。
即使有完美的对齐,扫描仪本身也不是一个完美的测量设备。它是一面“扭曲的镜子”。磁线圈的灵敏度可能会漂移,软件可能会更新,扫描过程中的运动可能会引入模糊。这些技术伪影可能在图像中产生变化,模仿或掩盖了真实的生物学效应。
考虑一个来自精心建模场景的警示故事。在一项纵向研究中,观察到病灶的原始平均强度增加了 ,这表明肿瘤进展。然而,独立的测量显示,扫描仪的偏置场——一种平滑的、乘性的阴影伪影——发生了漂移,其在病灶区域的强度增加了 。当这种伪影被数学方法去除后,分析显示真实的生物学信号实际上减少了 。伪影不仅增加了噪声;它完全将临床解释从“进展”翻转为“反应”。在同一项研究中,第二次扫描中增加的运动导致了模糊,这是观察到强度标准差下降 的主要原因,这是一种看似纹理上的变化,但几乎完全是技术性的,而非生物学上的。
这就是为什么一个严格的处理流程不是可有可无的附加项;它是可靠的Δ-放射组学的绝对基础。这样的流程通常包括:
只有经过这个细致的“清洁镜头”过程,我们才能确信我们测量的时序变化反映了肿瘤内部正在展开的故事,一个Δ-放射组学赋予我们独特权限去阅读的故事。
既然我们已经探讨了Δ-放射组学的基本原理——即量化医学影像中变化的科学——我们便面临一个激动人心的问题:我们能用它做什么?它的用途何在?看到事物的变化是一回事;理解它为何变化,预测其未来,并基于这些知识采取行动则是另一回事。正是在这里,Δ-放射组学不再仅仅是一种测量技术,而成为一个强大的透镜,将医学影像的世界与众多其他科学学科连接起来。它是一座桥梁,连接着屏幕上的像素与患者的生命。
在本章中,我们将穿梭于这些联系之间,探索“随时间追踪特征”这一简单理念如何迫使我们去应对物理学、统计学、因果推断和计算机科学中的深层问题。我们将看到,要做好Δ-放射组学,不仅仅是运行一个算法,而是要同时像物理学家、统计学家和临床科学家一样思考。
在我们分析变化之前,必须首先捕捉到它。而捕捉变化的能力受到成像模态本身基本物理原理的制约。一幅图像并非现实的瞬时、完美快照;它是在一段时间内进行的观察,受制于信号、噪声和速度之间的权衡。当我们希望研究的生物过程本身是快速的时,这一点变得至关重要。
考虑使用超声测量肿瘤内血流的挑战。我们可以追踪图像中被称为“散斑”的微小、自然形成的模式的运动。随着血液流动,它会使组织移位,散斑模式发生去相关,即发生变化。这种去相关的速度是血流速度的直接代理指标。为了测量这一点,我们需要一个帧率足够快的成像系统,以便在去相关过程完成之前对其进行采样。
在这里,我们面临一个经典的工程权衡。传统的超声通过逐行聚焦声束来构建图像,可能以每秒50帧的速度采集图像。如果散斑模式在帧与帧之间变化太大,我们的测量将是粗糙且有偏倚的。但如果我们使用“超快”平面波超声,它能以每秒数千帧的速度采集图像呢?现在,我们可以以极高的时间精度对去相关过程进行采样。帧之间的位移变得极小,我们可以高保真地追踪散斑相关性的平滑衰减。
但是,正如物理学中常有的情况,没有免费的午餐。超快平面波图像通过用一个非聚焦波照亮整个视场来实现其速度,从而使其能量被稀释。由此产生的单帧图像的信噪比低于其聚焦、较慢的对应图像。此外,如果我们使用注射的微泡造影剂研究灌注,超快成像的高脉冲重复频率实际上可能会破坏我们试图追踪的微泡,从而破坏我们希望测量的信号。
教训是明确的:Δ-放射组学研究的设计始于扫描仪本身,而非分析软件。成像参数的选择必须与生物学问题的时间尺度相匹配。要研究造影剂在数十秒内缓慢的灌注过程,常规帧率可能非常完美。要研究血流或组织运动的毫秒级动态,则必须进入超快成像的领域,并驾驭其独特的物理权衡。Δ-放射组学促使数据科学家与医学物理学家之间展开对话。
一旦我们获得了一系列图像,我们的旅程才刚刚开始。分析随时间收集的数据是一个充满统计陷阱和悖论的雷区。幼稚的方法可能导致不仅错误,而且是危险错误的结论。因此,Δ-放射组学的世界与生物统计学和因果推断的严谨学科密不可分。
Δ-放射组学的一个主要目标是利用肿瘤特征的变化来预测患者的生存期。一个常用的工具是Cox比例风险模型,它估计协变量如何影响事件(如疾病进展)的瞬时风险。当协变量不是一个静态的基线特征,而是一个随时间变化的动态放射组学评分时,我们必须极其小心地定义它。基本规则是可预测性:时间 的特征值只能由时间 之前可用的信息确定。我们不能用未来预测现在。标准的、有效的方法是“末次观测值结转”(LOCF),创建一个放射组学特征的阶梯函数,该函数始终由其最近的过去值定义。
当我们试图从预测转向估计治疗的因果效应时,这一原则变得更加关键。想象一项研究,其中监测一个放射组学评分,如果它超过某个阈值,则加强患者的治疗。我们想知道:这种加强治疗有帮助吗?
一个诱人但存在灾难性缺陷的分析方法是,将患者分为两组——那些曾经接受过加强治疗的患者和那些没有接受过的患者——然后从研究开始时比较他们的生存期。这引入了不朽时间偏倚。一个患者要进入“加强治疗”组,根据定义,他必须在没有进展的情况下存活足够长的时间以接受加强治疗。从研究开始到他们治疗改变的这段时间是“不朽”时间,在此期间他们不可能失败。这段无风险时间被人为地归功于加强治疗,使其看起来比实际效果好得多。
情况因时间依赖性混杂而进一步复杂化。假设一个肿瘤负荷的放射组学标记 随时间测量。高肿瘤负荷可能会促使医生加强治疗。但肿瘤负荷本身受过去治疗的影响,也是未来进展的强预测因子。这就形成了一个反馈循环。我们不能简单地在标准模型中“调整” ,因为这样做可能会无意中阻断治疗真实效应的一部分,而这部分效应正是通过其对肿瘤负荷的影响来介导的。
为了解开这些因果之结,Δ-放射组学必须借鉴流行病学中的强大工具。一种方法是界标法,即我们仅从一个固定的时间点(“界标”)开始分析生存期,并使用截至该时间点的治疗状态。一种更复杂的方法是构建一个边际结构模型。这些模型使用一种称为逆治疗概率加权(IPTW)的技术,来创建一个“伪人群”,在这个人群中,混杂因素()与治疗决策之间的联系被打破,从而可以无偏倚地估计治疗的真实因果效应。即使是扫描本身的时间安排也可能提供信息;医生安排一次计划外的扫描通常是患者病情恶化的迹象,这一事实必须在模型中加以考虑。
另一种偏倚源于一个简单的事实:并非所有患者都能完成一项纵向研究。谁最有可能退出?通常是病情越来越重的患者。如果我们只对那些留在研究中的患者的“完整”数据进行分析,我们看到的是一个经过筛选的、比平均水平更健康的亚组。这被称为信息性删失。
假设一个高风险的放射组学特征不仅与较高的疾病进展概率相关,还与较高的研究退出概率相关。对剩余参与者中观察到的事件率进行幼稚分析,将会低估原始人群中的真实风险,因为不成比例的大量高风险个体已从数据集中消失。
同样,生物统计学提供了一个优雅的解决方案:逆删失概率加权(IPCW)。如果我们能够根据患者的放射组学特征来模拟其被删失(即退出)的概率,我们就可以纠正这种偏倚。我们为每个留在研究中的患者分配一个权重,该权重是他们留下概率的倒数。来自高风险组(有很高被删失风险)但仍留在研究中的患者会获得更大的权重。从本质上讲,他们被要求“代表”他们缺失的同伴。这种重新加权的方案重建了一个无偏的伪人群,使我们能够估计真实的风险,就好像没有人因失访而丢失一样。
应用Δ-放射组学不仅仅是避免统计偏倚的问题;它也是一项稳健工程的实践。构建一个可信、可重现且真正具有泛化能力的模型,需要一种有纪律的方法,这种方法与机器学习和数据工程的最佳实践相连接。
当我们建立一个预测模型时,我们需要一种诚实的方法来评估它在新的、未见过的患者身上的表现。交叉验证是实现这一目标的标准工具。然而,对于纵向数据,幼稚地应用交叉验证可能会产生极大的误导。来自单个患者在不同时间点的测量值不是独立的数据点;它们是一个相关的序列,是该患者临床故事中的一个自传章节。
如果我们将所有患者的所有时间点测量值汇集在一起,并随机地将它们分成训练集和测试集,我们就会犯下一个大错。我们不可避免地会将来自同一位患者的某些时间点数据放入训练集,而将同一位患者的其他时间点数据放入测试集。模型可能会学会识别该患者的特有特征,而不是疾病的可泛化模式。这种“数据泄露”将导致对性能的极度乐观和有偏倚的估计。
正确的方法是分块或分组交叉验证。我们必须将每位患者视为一个不可分割的单元。划分折叠是在患者层面进行的。特定患者的所有图像、所有时间点和所有测量值都被分配到同一个折叠中,要么全部在训练集中,要么全部在测试集中。这尊重了数据的结构,并模拟了将模型应用于一个全新患者的真实世界任务。由此得到的性能估计更诚实、更可信,即使它通常比有偏倚的替代方案要低得令人清醒。
一个放射组学特征的旅程远在任何算法运行之前就开始了。它始于医院的图像存档与通信系统(PACS),这是一个巨大的医学影像数字图书馆。对于一项纵向研究,我们必须能够检索特定患者的一系列研究,这些研究可能相隔数月或数年。实现这种连接的关键是嵌入在DICOM文件格式中的唯一标识符(UID)集,它们就像每项研究、每个序列和每幅图像的数字指纹。
在为研究导出这些数据时,我们必须对其进行去识别化以保护患者隐私。但这产生了一个矛盾。最激进的去识别化配置可能会删除或随机替换所有UID,这实际上破坏了我们连接患者不同时间点扫描所需要的联系。一项Δ-放射组学研究可能在开始之前就变得不可能。
这正是医学信息学提供解决方案的地方。专门的去识别化配置,例如“保留纵向UID”选项,旨在解决这一权衡。例如,它们可以用新的、一致的假名UID替换原始UID,从而切断与患者真实身份的联系,但保留了连接属于同一研究对象的所有匿名化扫描的能力。在去识别化流程中做出正确的选择是至关重要的一步,它为所有后续的纵向分析奠定了基础。
或许Δ-放射组学的最终应用是在实时中指导临床决策。但是,要证明一个由放射组学引导的治疗策略真正有益,它必须在一个前瞻性、随机化的临床试验中得到检验。而正是在这里,临床科学的纪律施加了其最重要的约束:干预措施必须是明确定义且固定不变的。
在试验期间通过对累积的数据重新训练来“改进”放射组学模型,这种想法很诱人。但从因果角度来看,这是一个致命的错误。临床试验旨在估计特定干预措施的因果效应。如果“干预措施”(放射组学模型及其决策规则)不断变化,我们最终测量的是什么效应?结果是模棱两可的。这就像一个药物试验,化学家在试验中途不断改变药物的配方。
正确的科学方法要求模型、其参数以及决策阈值在第一位患者入组之前就必须被完全指定并在时间上锁定。然后,随机化允许在固定的放射组学引导组和标准治疗组之间进行清晰、无偏倚的比较。这使我们能够对那一个特定策略的效应做出有效的因果声明。从一个探索性的预测模型转向一个具有因果解释力的临床工具,需要这关键的一步——锁定罗盘,并在整个旅程中保持稳定。
我们已经看到了Δ-放射组学如何与物理学、统计学和工程学相联系。最后,让我们看一个优美的数学抽象,它试图统一对空间和时间变化的分析:时空图。
想象一个肿瘤,不是作为一个简单的特征列表,而是一个复杂的、结构化的对象。我们可以将每个时间点的肿瘤分割成一组小的“超体素”。这些超体素是我们图的节点。然后我们在它们之间画边。一些边连接单个时间点内空间上相邻的节点。其他边连接相邻时间点之间的节点,将时间 的一个超体素与其在时间 的相应位置联系起来。
我们构建的是一个宏伟的数学对象,一个编码了肿瘤演变完整时空结构的图。在这个图上,我们可以使用谱图论的强大工具。图拉普拉斯算子 成为一个“平滑度”算子。定义在节点上的放射组学特征场 的平滑度可以通过二次型 来评估。如果相连节点的特征值相似,这个值就低;如果它们不同,这个值就高。
通过创建一个由空间分量和时间分量相加得到的权重矩阵 ,我们可以用参数 来控制空间平滑度与时间平滑度的相对重要性。增加 就像让时间连接变得“更硬”,迫使特征随时间更加稳定。这个优雅的框架使我们能够将肿瘤演变建模为一个统一的过程,在一个时空画布上展开,而不是一组独立的特征变化,从而弥合了成像与图论数学之间的鸿沟。
我们看到,Δ-放射组学的旅程是一场穿越现代科学的壮游。它始于图像形成的物理学,驾驭偏倚与因果关系的统计学险滩,拥抱稳健工程的纪律,并以数学的语言找到其优雅的表达。它证明了理解变化——宇宙中最基本的过程——需要我们超越任何单一领域的界限,拥抱一个统一的世界观。