try ai
科普
编辑
分享
反馈
  • 影像组学

影像组学

SciencePedia玻尔百科
核心要点
  • 影像组学系统地从医学图像中提取高维定量数据,将其转化为可用于挖掘临床见解的数据集。
  • 获得可靠且可重复的结果,取决于一个严格、标准化的工作流程,该流程能控制图像采集、分割和预处理中的变异性。
  • Delta-影像组学分析特征随时间的变化,为监测治疗反应和检测肿瘤耐药性的演变提供了有力工具。
  • 影像基因组学旨在通过识别影像组学特征与遗传活动之间的相关性,弥合宏观影像特征与底层分子生物学之间的鸿沟。
  • 联邦学习等先进技术正在促成跨多个机构开发大规模影像组学模型,而无需牺牲患者隐私。

引言

医学图像中蕴含着丰富的信息,这些信息往往超出了人类视觉感知的极限。虽然放射科医生是识别定性模式的专家,但大量的隐藏数据仍存在于像素的纹理和统计特性之中。影像组学(Radiomics)正是致力于揭示这一隐藏世界的学科,它系统地将医学图像转化为高维定量数据,以便挖掘深层的生物学见解。这种方法解决了主观图像解读与指导临床决策所需的客观、可重复生物标志物之间的关键差距。本文将引导您深入了解这个变革性的领域。首先,“原理与机制”一章将详细阐述构建稳定且有意义的影像组学特征所需的严谨测量科学。随后,“应用与跨学科联系”一章将探讨如何利用这些特征来预测患者结局、监测治疗效果,并建立与其他科学领域(如基因组学)的联系。

原理与机制

探寻无形模式

医学图像,如同遥远星系的照片,蕴含着远超我们肉眼所能即时领会的秘密。一位训练有素的放射科医生能够看到那些暗示诊断的微妙形状和阴影。但是,如果图像中包含的信息并非隐藏于形状本身,而是隐藏于像素的微妙统计纹理中——一种组织的定量“指纹”,那该怎么办?如果我们能教会机器看懂这个无形的世界呢?这正是 ​​影像组学​​ 的核心承诺:系统地从医学图像中提取海量定量数据,将它们从单纯的图片转变为深刻、可挖掘的数据集。

影像组学的征程,是搭建一座从像素到预后、从图像强度到生物学见解的桥梁。但要建造一座坚固的桥梁,我们必须首先以最严谨的态度理解我们的材料和工具。这不仅仅是应用花哨算法的问题,更是测量科学本身的一项深刻挑战。

我们究竟在测量什么?

在我们测量任何事物之前,我们必须就测量的内容和方式达成一致。这就像说“今天感觉很暖和”与陈述“温度为 32.5∘C32.5^{\circ}\text{C}32.5∘C,由避开阳光直射的校准温度计测得”之间的区别。前者是定性感觉,后者是科学测量。

在影像组学中,我们力求创造 ​​定量影像生物标志物 (Quantitative Imaging Biomarkers, QIBs)​​。一个真正的 QIB 不仅仅是从图像中提取的任何数字。它是一个精确定义的可测量对象,包括其单位、确切的计算方法,以及其有效的具体条件。思考一下其中的差异:

  • 定性发现:“乳腺中的毛刺状肿块。”这是放射科医生的专业视觉解读,虽然宝贵但主观。
  • 通用影像组学特征:“肺结节的 GLCM 熵为 2.7。”这是定量的,但如果不了解图像是如何采集的,强度是如何处理的,或者灰度共生矩阵 (GLCM) 是如何配置的,这个数字就毫无意义,也无法与另一个数字进行比较。
  • 定量影像生物标志物:正如测量肝脏脂肪的详尽示例中所述,一个合格的 QIB 会明确规定所有细节:CT 扫描仪的设置(120 kVp120 \ \mathrm{kVp}120 kVp,软组织重建核)、患者准备(对比剂期相、屏气)、精确的分割方案(Couinaud 分段 II–VIII),以及特征的精确数学定义(Hounsfield 单位下体素强度的算术平均值)。

只有达到这种近乎偏执的细节水平,测量才能变得可重复、可在不同医院和患者之间进行比较,并最终值得信赖,足以指导临床决策。任何低于此标准的做法都只是计算炼金术。

测量的剖析

为何需要如此严谨?因为我们进行的每一次测量都是一件脆弱的事情,容易受到多种因素的影响,从而导致我们误入歧途。想象我们正在测量一个特征 XXX。一个形式化的测量模型为我们提供了一个简单而有力的思考方式:

Xmeasured=True Biological Value+Session Error+Scanner Error+Processing Error+NoiseX_{\text{measured}} = \text{True Biological Value} + \text{Session Error} + \text{Scanner Error} + \text{Processing Error} + \text{Noise}Xmeasured​=True Biological Value+Session Error+Scanner Error+Processing Error+Noise

这个方程讲述了一个故事。我们得到的值不仅仅是我们所追求的真实生物学量(在形式化模型中为 αi\alpha_iαi​)。它被一系列“误差”项所污染:

  • ​​会话误差 (βj\beta_jβj​):​​ 扫描仪今天的“状态”与昨天略有不同。
  • ​​扫描仪误差 (γs\gamma_sγs​):​​ A 医院的扫描仪与 B 医院的扫描仪具有不同的“个性”。
  • ​​处理误差 (δp\delta_pδp​):​​ 我们作为分析者所做的选择——我们如何处理图像——可能会改变结果。
  • ​​噪声 (ϵijsp\epsilon_{ijsp}ϵijsp​):​​ 任何物理测量中都不可避免的、固有的随机干扰。

这个框架使我们能够精确地定义特征的稳定性:

  • ​​测试-再测试可重复性 (Test-retest repeatability)​​ 是指在完全相同的条件下,在同一台扫描仪上测量同一个人时,我们获得相同答案的能力。它衡量的是会话误差和随机噪声的综合影响。
  • ​​可再现性 (Reproducibility)​​ 是指当条件改变时——例如,当我们使用不同的扫描仪时——我们获得相同答案的能力。它告诉我们“扫描仪误差”有多大。
  • ​​稳健性 (Robustness)​​ 是指特征对我们自身分析选择的不敏感性。它告诉我们“处理误差”有多大。

一个好的影像组学研究的目标是理解并最小化所有这些误差项,从而使“真实生物学价值”得以凸显。

打造稳定测量:影像组学工作流程

为了控制这些变异源,影像组学采用了一个标准化的工作流程,其中包含一系列步骤,每个步骤都旨在控制特定类型的误差。

图像的源头:始于物理

在计算任何一个特征之前,在 CT 或 MRI 控制台上做出的一个选择就从根本上改变了图像的特性:​​重建核​​。可以把它想象成在为录音选择麦克风。一个“软”重建核就像一个能平滑尖锐声音的麦克风,产生温暖、干净的录音,但会丢失一些高频细节。而一个“锐利”的重建核则相反,它增强高频以使每个细节都清晰可见,但同时也会放大任何背景嘶声或噪声。

这个选择对纹理特征有直接影响。锐利的重建核增加了图像的高频成分,这会增加那些旨在捕捉精细纹理的特征的测量值。但因为它也放大了噪声,这些特征变得不那么稳定,重复性也较差。软重建核产生更平滑的图像和更稳定的特征,但代价是丢失了一些我们可能想要测量的纹理。没有哪个重建核是“最好”的;关键在于了解使用了哪种重建核并保持一致。

定义“何处”:分割的艺术与科学

我们分析的第一步是在我们关心的区域——肿瘤、器官、病灶——周围画一条线。这就是 ​​分割​​。但边界到底在哪里?即使是两位专家放射科医生看同一张图像,他们的分割也绝不会完全相同。这是许多影像组学研究中最大的变异来源。

我们无法消除这种变异性,但我们必须测量它。我们使用指标来量化两个分割 AAA 和 BBB 的一致程度:

  • ​​Dice 相似系数 (DSC)​​,D(A,B)=2∣A∩B∣∣A∣+∣B∣D(A,B) = \frac{2|A \cap B|}{|A| + |B|}D(A,B)=∣A∣+∣B∣2∣A∩B∣​,测量体积重叠度。得分为 1 表示完全一致,而 0 表示完全没有重叠。它就像一个复杂的维恩图。
  • ​​豪斯多夫距离 (HD95HD_{95}HD95​)​​ 测量两个形状边界之间的最大距离。它告诉我们沿边界最差情况下的不一致程度。

通过报告这些指标,我们坦诚地承认了我们第一个也是最关键步骤中的不确定性。一项研究要想具有可重复性,不仅必须详细描述分割方案,还必须提供最终的分割掩码供他人检查和重用。

创建通用语言:标准化与预处理

为了比较来自不同扫描仪和不同患者的图像,我们必须让它们说同一种语言。这涉及到几个关键的预处理步骤:

  1. ​​重采样到通用网格​​:图像是像素(或称 ​​体素​​)的网格,每个体素都有物理尺寸。一台扫描仪可能产生体素大小为 0.5×0.5×5.00.5 \times 0.5 \times 5.00.5×0.5×5.0 mm 的图像,而另一台则产生 0.9×0.9×1.00.9 \times 0.9 \times 1.00.9×0.9×1.0 mm 的图像。在它们之间比较特征,就像不进行转换就比较以英寸和厘米为单位的长度。我们必须将所有图像 ​​重采样​​ 到一个标准化的、各向同性(等边)的体素大小,例如 1×1×11 \times 1 \times 11×1×1 mm。这确保了当我们测量一个与“距离”相关的特征时,它在任何地方都意味着同样的事情。
  2. ​​强度归一化​​:由于扫描仪校准、患者体型和其他因素,图像中的原始强度值可能会有很大差异。​​强度归一化​​ 旨在将所有图像置于一个共同的强度尺度上。一种常见的方法是在感兴趣区域内对强度进行标准化(例如,通过 z-score),这有助于消除特定于会话的偏倚。
  3. ​​强度离散化​​:为了计算纹理特征,我们通常将图像中成千上万的灰度级简化为数量更少、更易于管理的组(例如,32 或 64 组)。这就是 ​​离散化​​。如何执行此操作的选择——使用固定的组数还是固定的组距——至关重要。如一项测试-再测试实验所示,更粗的离散化(更宽的组距)可以通过平滑随机噪声使特征更稳定,从而提高其由 ​​组内相关系数 (ICC)​​ 衡量的可重复性。ICC 是一个出色的指标,它告诉我们测量的总方差中,有多少比例来自受试者之间的真实差异,又有多少来自恼人的测量误差。一个好的预处理选择是那些减少误差方差多于减少真实生物学方差的选择。

特征大观

一旦图像被标准化,我们终于可以释放我们的算法来计算特征。这些特征分为几个家族,每个家族探究感兴趣区域的不同方面:

  • ​​一阶特征​​:这些是最简单的特征。它们描述了区域内强度的分布,忽略了其空间排列。可以把它们看作是图像的基本调色板:平均强度(平均亮度)、方差(对比度)、偏度和峰度。
  • ​​形状特征​​:这些特征描述了分割区域的几何形状,与其强度内容无关。肿瘤是一个完美的球体还是一个带刺的不规则物体?它是紧凑的还是拉长的?在分割固定的受控环境中,这些特征是完全稳定的,因为它们只取决于掩码。
  • ​​纹理特征​​:这才是奇妙之处。这些特征量化了体素之间的空间关系,为我们提供了组织异质性的度量。它们由各种矩阵计算得出:
    • ​​灰度共生矩阵 (GLCM)​​:捕捉强度值对在固定距离和方向上出现的频率。
    • ​​灰度行程矩阵 (GLRLM)​​:捕捉具有相同强度的连续体素“行程”的长度。
    • ​​灰度区域大小矩阵 (GLSZM)​​:捕捉相似强度的连通三维“区域”的大小。
  • ​​小波特征​​:这些特征使用数学变换将图像分解为不同的频率尺度,使我们能够在粗糙或精细的层面上测量纹理。

这些特征中哪些最可靠?在“真实”物体是均匀的体模研究中,我们测量的任何纹理都只是扫描仪噪声的印记。在较大空间区域上进行平均的特征(如 GLSZM)比局部算子(如 GLCM)对这种随机噪声更具稳健性。源自高频小波带的特征是所有特征中最不稳定的,因为它们专门设计用来测量我们通常试图忽略的细粒度噪声。

从数字到知识:生物标志物的作用

我们费了很大功夫才产生了一个稳定的、定量的特征。但它有什么用呢?一个影像组学标志物可以扮演三种不同的临床角色,每种角色都有其严苛的验证要求:

  1. ​​诊断性​​:诊断性标志物有助于确定 当前 是否存在某种疾病或状况。要验证它,我们必须将其性能(使用敏感性、特异性和 ROC 曲线下面积,即 AUC\mathrm{AUC}AUC 等指标)与组织活检等“金标准”进行比较。
  2. ​​预后性​​:预后性标志物预测患者疾病未来可能的进程,而与他们接受的治疗无关。它回答了这样一个问题:“考虑到您的疾病,您是处于高风险还是低风险?”要验证它,我们需要长期的随访数据,并且必须证明该标志物即使在考虑了所给予的治疗后,仍能预测结局(使用 Cox 风险模型和一致性指数等工具)。
  3. ​​预测性​​:这是最令人向往也最难实现的角色。预测性标志物告诉我们谁将从 特定治疗 中受益。它回答了这样一个问题:“这位特定患者应该接受药物 A 还是药物 B?”要证明这一点,仅仅显示该标志物具有预后性是不够的。我们必须证明(理想情况下是在随机对照试验中)生物标志物与治疗之间存在统计学上的 ​​交互作用​​。这表明治疗的效果 取决于 患者的生物标志物状态。

为新科学建立统一战线

从 DICOM 文件中的一个原始像素到经过验证、具有临床价值的生物标志物的路径充满艰险。大量的选择——重建核、分割方法、重采样算法、归一化方案、特征定义——创造了一个“方法的荒野”,使得比较不同研究的结果几乎不可能。

为了解决这个问题,科学界已经联合起来制定标准。像 ​​影像生物标志物标准化倡议 (IBSI)​​ 这样的组织致力于创建一个词典——为每个影像组学特征提供精确、无数学歧义的定义。与此同时,像 ​​定量影像生物标志物联盟 (QIBA)​​ 这样的组织则致力于创建一种语法——即标准化图像采集过程本身的规程。

通过拥抱这些标准,通过一丝不苟地报告我们的方法,并通过坦诚面对我们测量中的不确定性来源,我们将影像组学从一系列孤立的发现,推向一门真正的、可重复的科学。我们不再将从像素到预后的桥梁建在沙滩上,而是建在严谨测量的基石之上。

应用与跨学科联系:从像素到预言

走过了影像组学的基础原理之旅,我们现在站在一个激动人心的门槛上。我们已经学会了如何从医学图像中一丝不苟地提取定量特征,但这好比学会了一门新语言的字母。这门语言真正的力量和美丽,并非体现在字母本身,而在于它们所讲述的故事和它们让我们得以探索的世界。本章讲述的正是这段旅程——从特征提取的抽象原理到正在重塑医学、并在不同科学学科间建立意外联系的具体、足以改变人生的应用。

我们将看到影像组学如何成为一种预言,让我们得以窥见患者的未来。我们将见证它成为实时观察演化的工具,看肿瘤如何与治疗抗争。我们将追随它的足迹,看它如何跨越从图像的宏观世界到基因的微观领域的巨大鸿沟。最后,我们将探索现代科学的前沿,看影像组学如何应对全球协作、数据多样性和患者隐私神圣信任的宏大挑战。

窥探未来:预后与风险分层

影像组学给医学带来的最深刻的转变之一,是能够超越简单的诊断——即为患者所患疾病贴上标签——而达到细致的预后——即预测将要发生什么。识别肿瘤是一回事;而预测它的侵袭性行为或患者在疾病进展前可能有多长时间,则完全是另一回事。

这就是生存分析的领域。在这里,问题不仅仅是事件“是否”会发生,而是何时发生。影像组学为像 Cox 比例风险模型这样的模型提供了强大的输入,该模型是现代生物统计学的基石。想象一个模型,它为每位患者获取其独特的影像组学特征——一个高维特征向量——并计算他们在任何给定时刻发生事件的瞬时风险。这种方法的精妙之处在于,它量化了由肿瘤影像组学特征捕捉到的患者风险状况与另一位患者的比较,而无需知道该疾病的绝对基线风险。它让我们能够说:“根据其纹理和形状,这个肿瘤的风险是另一个的两倍”,这对于定制随访和治疗方案来说是一项强有力的声明。

让我们将其具体化。考虑一种骨软骨瘤,这是一种良性软骨帽骨肿瘤,有很小的风险会转变为致命的软骨肉瘤。几十年来,决定是否进行有风险的活检或手术,一直依赖于 MRI 扫描中的一个单一、粗略的测量值:软骨帽的厚度。如果超过某个阈值,比如说 222 厘米,警报就会响起。但这就像仅凭书的厚度来评判一本书。影像组学让我们能够阅读书页。通过构建一个不仅包含厚度,还包含描述软骨帽纹理、形状和强度变化的数十个特征的签名,我们可以创建一个更精细、更连续的风险度量。这个复杂的模型或许能自信地将一个软骨帽厚度为 2.12.12.1 厘米的肿瘤归为低风险,从而使患者免于不必要且具侵入性的手术。它将一个粗糙的决策工具转变为一个精密仪器。

但我们如何知道这些新的、复杂的模型确实更好呢?科学需要证据。我们不能仅仅被模型的复杂性所折服;我们必须证明其效用。这就是附加预后价值概念变得至关重要的地方。假设我们有一个标准模型,用于预测高血压患者的肾衰竭,该模型使用血压和肾功能测试等临床数据。然后,我们开发一个扩展模型,增加了来自肾脏超声的影像组学特征。它真的改善了我们的预测吗?我们可以用净重分类改善指数 (NRI) 等统计工具来衡量这一点,该指数可以量化新模型正确地将多少患者移入更高或更低风险类别。通过显示一个显著为正的 NRI,我们提供了确凿的证据,证明影像组学不仅仅是一项花哨的技术实践;它提供了新的、独立的信息,真正地提升了我们预测患者结局的能力。

观察变化的艺术:监测治疗与肿瘤演化

单次医学影像提供了一个快照,是疾病生命中的一个凝固瞬间。但真正的戏剧是随时间展开的。肿瘤并非静态实体;它是一个动态、演化的生态系统。追踪其对治疗反应的变化,正是影像组学真正开始让人感觉像在观察生物学发生的地方。这就是 ​​Delta-影像组学​​ 的世界。

其核心思想简单而深刻:两个时间点之间影像组学特征的变化本身就是一个强大的新特征。我们不再仅仅比较肿瘤的“治疗前”和“治疗后”图片,而是计算其数百个特征中每一个的定量差异——即 delta。肿瘤的体积可能是一个特征,其体积的变化就是一个 delta-影像组学特征——它构成了许多经典治疗反应标准的基础。但影像组学让我们能够走得更远。我们可以追踪纹理、形状和强度的变化,揭示出远比单纯大小更深的见解。

想象一个正在接受化疗的肿瘤。它不是一个均匀的细胞袋;它是一个异质性的亚群集合,或称“生境”,每个亚群都有自己的特征和弱点。一些生境可能对药物敏感,而另一些则具有耐药性。对肿瘤体积的简单测量可能显示治疗正在起效——肿瘤正在缩小。但 delta-影像组学分析可能揭示一个更复杂、更令人不安的真相。

当药物消灭敏感细胞时,那些耐药的生境,尽管微小,却被留了下来。肿瘤整体缩小了,但耐药细胞的比例却增加了。这种肿瘤内部构成的戏剧性转变肉眼不可见,但在影像组学数据中却表现得淋漓尽致。衡量异质性的特征,如熵(像素强度随机性的度量)和纹理对比度,可能在肿瘤缩小的同时,反而会增加。这是一个肿瘤在选择性压力下演化的定量特征——这是一幅实时上演的自然选择图景。Delta-影像组学为肿瘤学家提供了一个窥视这些隐藏动态的窗口,可能使他们能够在耐药群体开始显现的瞬间就切换疗法,远在肿瘤再次开始生长之前。

跨越鸿沟:从宏观影像到微观生物学

医学中最终的“为什么”常常追溯到生命的蓝图:我们的基因。一个影像组学特征可能是一个强大的预测因子,但在我们能将其与底层的分子机制联系起来之前,它仍然是一个现象学的观察。为什么某种肿瘤纹理与较差的生存率相关?答案可能在于控制细胞增殖、侵袭或代谢的特定基因的活动。在影像的宏观世界和基因组学的微观世界之间建立这些桥梁的探索,催生了一个激动人心的新学科:​​影像基因组学​​。

影像基因组学的核心挑战是信号与噪声的博弈。我们有成千上万的影像组学特征和数以万计的基因。我们如何在这个天文数字般的搜索空间中找到真实、有意义的关联?此外,我们如何利用从不同医院拼凑而来的数据来做到这一点,每家医院都有自己的扫描仪、患者群体和方案?

答案在于严谨的统计建模。要将一个影像组学特征与单个基因的表达水平联系起来,我们必须建立一个模型,细致地考虑所有可能迷惑我们的其他变量。我们必须控制患者年龄和性别等临床因素。最重要的是,我们必须控制医院地点的“批次效应”,因为扫描仪的差异可能导致与生物学无关的图像特征变化。一种有原则的方法是使用正则化回归模型,我们对大量的影像组学特征系数施加惩罚以防止过拟合。至关重要的是,我们不对我们的混杂因素(年龄、性别、地点)的系数进行惩罚。我们让它们发挥作用:在统计上解释其影响,这样我们发现的影像组学与基因之间的任何剩余关联就更有可能是真实的生物学联系。这种谨慎、系统的方法是良好科学的基石,使我们能够开始构建一本将图像语言翻译成基因语言的词典。

前沿:统一多样化数据与保护隐私

为了释放影像组学的全部潜力,我们需要数据——海量的、多样化的、全球性的数据集。这一雄心将我们推向了数据科学的最前沿,我们面临两大挑战:首先,如何让来自不同来源的数据说同一种语言(协调);其次,如何在不损害患者隐私的情况下大规模地实现这一点。

协调问题非常严峻。CT 扫描仪和 MRI 扫描仪测量的是根本不同的物理特性;它们的像素值就像苹果和橙子。试图通过例如将它们缩放到相同范围来天真地组合它们,在科学上是毫无意义的。即使是来自不同制造商的两台 CT 扫描仪,对同一患者也会产生不同的影像组学特征值。有原则的策略必须尊重每种成像模态的物理原理。对于有物理尺度(Hounsfield 单位)的 CT,我们使用固定的组距。对于强度是相对值的 MRI,我们必须在每次扫描内部进行标准化。当我们结合它们的预测能力时,我们通过“后期融合”来实现——为每种模态建立一个单独的模型,然后结合它们的最终预测,而不是混合它们的原始数据 [@problem_seci:4545077]。为了协调来自同一模态但不同扫描仪的数据,我们可以从基因组学领域借鉴像 ComBat 这样的强大统计工具。但在这里,我们必须警惕机器学习的一大原罪:数据泄露。当我们构建和测试模型时,协调参数必须仅从我们验证的每一步中的训练数据中学习。否则,就等于让模型通过偷看答案来作弊,导致虚假乐观的结果。

第二个前沿是隐私。当患者隐私法规常常禁止数据离开医院时,我们如何能在来自全球数百家医院的数据上训练模型?革命性的答案是​​联邦学习​​。我们不是将数据带到模型这里,而是将模型带到数据那里。每家医院使用其本地数据训练模型的副本,只有数学更新——即梯度——被发送到中央服务器进行聚合。没有任何患者数据会离开机构的防火墙。

然而,即使是这个优雅的解决方案也并非万能药。研究表明,这些梯度更新虽然抽象,但并非完全匿名。它们是在医院本地数据上计算出的平均值,因此,它们带有该数据的统计回声。一个足够聪明的对手通过观察这些梯度,可能能够推断出医院患者群体的汇总属性,例如某种扫描仪类型的普遍性或高级别肿瘤的比例。这一发现开启了一场引人入胜的新猫鼠游戏,促使研究人员整合密码学方法和差分隐私,以使这些梯度更加安全。

从预测患者的旅程到绘制其疾病演化图谱,从将图像与基因联系起来到建立全球性的、保护隐私的研究网络,影像组学的应用既多样又深刻。这是一个需要融合物理学、计算机科学、统计学和临床医学等多方面专业知识的领域。这些模式一直存在,隐藏在医学图像的灰度织锦中。借助影像组学,我们终于学会了如何解读它们。