科学成像中的运动校正技术

玻尔百科

定义

科学成像中的运动校正技术是指一套用于减少成像过程中因受检者或传感器运动而导致的模糊、伪影及定量误差的专门方法。该技术领域涵盖了事后计算修复、实时前瞻性调整以及基于事件的数据重排三种主要策略。有效的运动校正必须结合特定成像模态的物理原理，以确保从微观冷冻电镜到宏观卫星成像等不同领域的科学结论的准确性。

核心要点

成像过程中的运动不仅会导致模糊；它还会产生复杂的伪影，如鬼影和扭曲，并引入系统性的定量误差，可能使科学结论失效。
校正策略主要分为三类：回溯性（通过计算修复已采集的数据）、前瞻性（实时调整扫描以适应运动）和基于事件的（在图像形成前重新对齐基本数据点）。
有效的运动校正必须是感知物理学的，即考虑到特定成像模态的原理，例如 MRI 中的 k 空间轨迹或 PET/CT 中的衰减图。
运动校正的原理是普适的，适用于从微观的冷冻电镜到行星卫星成像等截然不同的尺度和领域。

引言

在任何形式的高精度成像中，从绘制人脑图谱到解析单个蛋白质，运动都是一个不可避免且严峻的挑战。就像用慢速快门拍摄清晰照片一样，对移动的物体进行成像不可避免地会导致失真。然而，其后果远比简单的模糊更为复杂和隐蔽。运动会产生幻影信号、扭曲几何形状，并系统性地破坏定量测量，可能导致错误的科学结论或临床诊断。因此，理解并校正这种运动对于获得准确可靠的结果至关重要。

为应对这一挑战，本文对运动校正技术进行了全面概述。第一章 “原理与机制” 深入探讨了运动（从患者的呼吸到显微镜下的束流诱导漂移）如何破坏图像数据的基本物理原理。该章节解释了由此产生的伪影，并介绍了主要的校正策略类别。第二章 “应用与跨学科联系” 展示了这些原理在从临床 MRI 和 PET 扫描到卫星遥感等广泛领域的实际应用，揭示了这一关键成像问题的普适性。

原理与机制

想象一下，试图为一名躁动的孩子拍摄一张清晰的长曝光照片。正如任何父母所知，结果会是一片模糊。在旨在解析精细如大脑回路乃至单个蛋白质结构的高精度医学和科学成像领域，这个简单的运动问题变成了一个严峻的挑战。我们的成像对象，无论是人类患者还是微观样本，都在进行着持续且不可避免的舞动。理解并校正这种运动不仅仅是一项技术杂务，它更是一场深入探索图像生成基本物理原理的旅程，揭示了生物学、物理学和计算之间美妙的相互作用。

成像中不可避免的舞动

我们必须应对的运动并非单一类型。它是一场由多个表演者参与的复杂芭蕾。有患者在 MRI 扫描仪中头部的明显运动，这种缓慢的漂移或突然的急动可能毁掉一次长达数分钟的扫描。但还有更微妙、更隐蔽的“舞者”。在一个完全静止的人体内，心脏在跳动，肺部在扩张和收缩。这不仅是心脏和肺部自身的运动；这些节律性周期会向全身发送压力波，导致大脑轻微搏动。它们还会移动胸壁，通过扰动 MRI 中使用的强磁场，在整个图像中产生伪影，即使在大脑静止的情况下也是如此。要校正这些生理节律，需要复杂的模型，将它们的影响与整体头部运动以及我们想要测量的实际大脑活动区分开来。

这种舞动一直延续到微观尺度。在冷冻电子显微镜（cryo-EM）中，我们对冰冻在薄冰层中的蛋白质进行成像，用于成像的强电子束会将能量沉积到样本中。这些能量导致冰层弯曲变形，使得嵌入的蛋白质分子在曝光期间抖动和漂移。这种“束流诱导的运动”是实现原子分辨率图像的主要障碍。无论是在整个人体尺度还是单个蛋白质尺度，我们的目标从来都不是真正静止的。

伪影：运动的鬼魅足迹

如果运动只是造成均匀的模糊，问题会简单得多。但其影响要复杂和奇异得多，具体取决于图像构建的特定方式。这些伪影就像鬼魅般的足迹，讲述着运动如何干扰测量的故事。

模糊、鬼影和扭曲

在许多成像技术中，如磁共振成像（MRI），图像并非单次快照捕获。相反，它是在一个被称为 k 空间 的数学空间中逐部分构建起来的，k 空间代表了物体的空间频率。扫描仪在 k 空间中进行“扫描”，最终通过一种称为傅里叶变换的数学运算重建出图像。

现在，想象一下成像对象在扫描期间移动。k 空间的不同部分是在物体处于不同位置时测量的。傅里叶变换在不知情的情况下，试图从这些不一致的数据中组合出单个图像。结果不仅是模糊，而且常常是主图像的“鬼影”，沿一个方向位移并重复出现。这是因为周期性运动在 k 空间数据中引入了周期性调制，而傅里叶变换将其解释为一个新的、重复的物体。

在其他情况下，运动可能导致图像拉伸、压缩或剪切，就像透过哈哈镜观看一样。这是弥散张量成像（DTI）中的一个常见问题，其中强磁场梯度的快速切换会在扫描仪硬件中感应出二次电流——即涡流。这些电流产生自身的瞬态磁场，从而扭曲图像的几何形状。这种失真取决于所进行的特定弥散测量，意味着数据集中的每张图像都有轻微的不同扭曲。同样，静态磁场的不均匀性，尤其是在鼻窦等空气-组织界面附近，会在某些类型的快速 MRI 扫描中引起剧烈的拉伸和信号损失，而头部运动会加剧这种效应。

数字的欺骗：定量偏差

也许运动最危险的后果不是让图像变得难看，而是让它们说谎。现代成像大多是定量的；我们不仅想要一张图片，我们还想测量一种物理特性，例如葡萄糖代谢率、神经受体密度或组织的弛豫时间。运动会系统性地使这些数值产生偏差，导致错误的科学结论或临床诊断。

以用于测量大脑受体密度的正电子发射断层扫描（PET）为例。我们划定一个感兴趣区域，并随时间测量放射性示踪剂的浓度，从而生成一条时间-活性曲线（TAC）。如果头部移动，固定感兴趣区域内的像素可能会突然采样到不同的大脑结构——例如，将高信号的目标区域与低信号的参考区域混合在一起。

假设我们目标区域中测得的信号 $M_T(t)$ 成为真实目标信号 $C_T(t)$ 和参考信号 $C_R(t)$ 的混合物，即 $M_T(t) = (1-\alpha) C_T(t) + \alpha C_R(t)$ ，其中 $\alpha$ 是污染分数。一个关键的结果指标，即非特异性结合势 $\mathrm{BP}_{ND}$ ，是根据这些曲线计算得出的。简单的分析表明，测得的结合势 $\mathrm{BP}_{ND, \text{meas}}$ 会被系统性地低估： $\mathrm{BP}_{ND, \text{meas}} \approx (1-\alpha) \mathrm{BP}_{ND}^{\text{true}}$ 如果真实的结合势为 $2.0$ ，而运动导致了 $20\%$ 的污染（ $\alpha=0.2$ ），那么测量值将仅为 $1.6$ ——一个纯粹由运动引起的 $20\%$ 的误差。

这个问题普遍存在。在定量 MRI 中，运动可以巧妙地改变用于检测信号的接收线圈的表观灵敏度。在像 $T_1$ 映射这样的多图像实验中，这表现为数据上一个未知的、时变的乘法增益 $g(t_j)$ 。即使图像的空间对齐看起来很完美，将简单的指数模型拟合到这个被破坏的信号上，也可能导致估算的 $T_1$ 值出现显著偏差。运动不仅模糊了图像，它还破坏了数字。

驯服舞动：校正的编排

面对这场充满挑战的运动之舞，我们如何才能希望能得到一幅清晰的图像？解决方案是一种新的编排：校正的编排。这涉及一系列策略，从后期清理图像到教会扫描仪与被试同步舞动。

回溯性校正：派对结束后的整理

最常见的方法是回溯性校正：我们承认原始数据是混乱的，并使用计算算法来修复它。最简单的版本是刚体配准，即通过计算将时间序列中的每个独立图像或体积进行旋转和平移，以与参考体积对齐，从而消除整体头部运动。

然而，这种“校正”是有代价的。为了对齐图像，我们必须将其重采样到一个新的网格上，这个过程需要插值。插值本质上是一种复杂的平均形式，它根据旧位置的强度值来估计新位置的强度值。这个过程不可避免地会引入少量模糊。我们甚至可以量化它。例如，标准的三线性插值会用一个有效的模糊核来平滑图像，对于一个典型的 $3\,\text{mm}$ fMRI 体素，这相当于一个半峰全宽（FWHM）接近 $3\,\text{mm}$ 的高斯模糊。这并非微不足道，如果应用了多个重采样步骤（例如，一次用于运动校正，另一次用于失真校正），模糊会累积，从而降低我们希望看到的细节。

因此，回溯性校正的艺术在于智能地执行它。例如，一个先进的 fMRI 处理流程首先会估算所有必要的空间变换——用于扫描仪引起的失真、被试运动、与解剖扫描的对齐——然后通过数学方法将它们合成为一个单一的变换。这个复合扭曲随后只对原始数据应用一次，从而最大限度地减少因重复插值造成的模糊。

此外，真正的校正必须与底层的物理原理相结合。在弥散张量成像（DTI）中，信号取决于施加的弥散梯度相对于组织微观结构的方向。如果头部旋转了一个矩阵 $\mathbf{R}$ ，仅仅将图像旋转回去是不够的。弥散张量本身也随头部旋转了。为了保持物理模型的一致性，我们必须将逆旋转应用于我们模型中使用的梯度向量（ $\mathbf{g}' = \mathbf{R}^\top \mathbf{g}$ ）。这确保了我们在一个稳定的解剖框架中正确地将测量信号与组织的特性联系起来，这是一个校正必须尊重测量物理学原理的绝佳范例。

前瞻性校正：同步共舞

一种更优雅但技术要求更高的方法是前瞻性校正。与其事后收拾残局，为何不从一开始就防止混乱的发生？这包括实时追踪被试的头部位置（例如，使用小型摄像头或导航回波），并将此信息反馈给扫描仪。扫描仪随后可以立即更新其成像坐标系——即其视场——以跟随运动。本质上，扫描仪学会了与被试同步共舞。

其主要好处显而易见：如果扫描仪的坐标系跟随物体的坐标系，采集到的图像就已经对齐。对回溯性空间重采样及其相关的插值模糊的需求可以被完全消除。但好处不止于此。在使用接收线圈阵列的先进并行成像技术中，重建算法依赖于每个线圈精确的“灵敏度图”。运动会使这张图失效，从而导致伪影。前瞻性系统可以利用实时追踪信息，在重建过程中应用正确的、感知运动的灵敏度图，从源头上减轻这些伪影。

基于事件的重建：从第一性原理改写历史

对于像 PET 和冷冻电镜这样的一些模态，甚至可以进行更根本的校正。这些技术可以以“列表模式”或“电影模式”记录数据，将每个探测到的光子或电子作为一个带有精确时间戳的独立事件保存下来。这提供了一个非凡的机会。

我们可以不重建模糊的时间帧然后再尝试对齐它们，而是回到这个原始事件列表中。如果我们同时拥有头部的连续位置测量，我们就可以单独校正每个事件。对于 PET 扫描中探测到的每一个光子对，我们可以利用其被探测到的那一毫秒的头部姿态，通过计算将该事件放置在它在静止参考系中本应在的位置。这使我们能够校正发生在单个重建帧内部的运动，这是基于帧的方法无法完成的壮举。这种“基于事件的”运动校正极大地减少了模糊，同样重要的是，它修复了同样会破坏数据的衰减不匹配问题，从而得到更准确的定量结果。这种在求和之前重新对齐图像基本构建块的原理，也正是冷冻电镜能够克服束流诱导运动并实现其惊人分辨率的原理。

最终谢幕：我们如何知道自己成功了？

在所有这些复杂的编排之后，我们如何能确定我们已经真正消除了运动的影响？仅仅查看校正后的图像是不够的，尤其是在事关定量准确性时。我们需要进行最终的质量检查。

一个有力的想法是检查我们科学模型的“残差”——即模型未能解释的那部分数据。然后我们可以问：这个无法解释的误差是否与被试的运动相关？例如，我们可以将头部速度的时间序列与 PET 动力学模型拟合的残差时间序列进行比较。如果我们看到显著的相关性——即当头部移动得更快时，模型的一致性失败得更频繁——这就是一个警示信号。它告诉我们，我们的运动校正，无论多么先进，都是不完整的，我们的最终测量结果可能仍然受到运动偏差的污染。这最后的检查体现了科学严谨的精神，提醒我们在测量与运动之间错综复杂的舞动中，我们必须始终保持警惕，质疑我们的假设并检验我们的结果。

应用与跨学科联系

在我们之前的讨论中，我们阐述了成像的一个基本事实：每一次测量都需要时间。就像一台快门速度很慢的相机一样，试图捕捉移动主体的成像系统不可避免地会产生一幅失真的图像。但简单地说图像“模糊”或“一团糟”，就错过了其中一个充满美妙而微妙物理学的世界。运动不仅仅导致一个问题；它是一位顽皮的艺术家，描绘出一系列多样的伪影，每一种都有其自身的特点和解决方法。

我们在本章的旅程就是漫步于这个画廊。我们将看到同样的运动校正基本原理如何应用于从窥探活体人脑到从轨道上绘制地球表面等一系列惊人的科学探索中。我们将发现，运动的挑战推动科学家们设计出极其巧妙的解决方案，将一个纯粹的麻烦事转变为一堂关于物理学与工程学统一的深刻课程。

模糊、扭曲与撕裂：运动的几何学

最直观的伪影是简单的模糊。想象一下用锥形束 CT (CBCT) 机进行牙科扫描。机器围绕你的头部转一整圈，拍摄数百张快照，然后重建为三维图像。那么，如果你在中途抽搐了一下会怎样？可以预见，最终的图像会是一片模糊。该系统实质上是试图将你的两个略有不同的视图——“抽搐前”的你和“抽搐后”的你——叠加在一起。我们甚至可以计算出损害程度。一个仅 $1.5\,\text{mm}$ 的微小突变位移，就可以使图像分辨率下降近八倍，将一个清晰的点涂抹成一个宽度近 $1.8\,\text{mm}$ 的污迹。精细的细节，比如牙齿脆弱的根管，会完全被抹去。

这同一个原理——在“曝光时间”内的运动——在行星尺度上同样上演。以像 Landsat 这样的卫星为例，它在超过 $700\,\text{km}$ 的高度轨道上运行，以 $7.5\,\text{km/s}$ 的速度掠过地面。它使用一种“推扫式”成像仪，该成像仪有一长排探测器，通过卫星的轨道运动向前扫描，逐行构建图像。读出一行探测器所需的时间就是其积分时间。在这短暂的间隔内，卫星向前移动。这种移动会在沿轨方向上造成拖影，拖影的距离由一个简单而普适的公式给出： $\text{smear} = \text{velocity} \times \text{integration time}$ 。对于典型的推扫式成像仪，这个拖影可能超过 $8\,\text{meters}$ ，在其像素分辨率的尺度上是显著的模糊。相比之下，像 MODIS 这样的“摆扫式”扫描仪使用旋转镜将一个小探测器扫过地面。它在任何给定点的“驻留时间”都极其短暂——仅几微秒。因此，其沿轨拖影最多只有几厘米，完全可以忽略不计。无论是 CT 扫描仪中患者的头部，还是从太空中看到的亚马逊雨林，运动拖影的物理原理都是相同的。解决方案在概念上也是一样的：缩短曝光时间，或者如果做不到，就想办法在曝光期间考虑运动的影响。

但并非所有运动都只产生简单的模糊。伪影的特征关键取决于运动时序与扫描时序之间的关系。让我们用光学相干断层扫描（OCT）来看看人眼，这是一种逐层（称为 B 扫描）构建视网膜高分辨率三维图像的技术。眼睛从不完全静止。它会经历持续的、缓慢的漂移；微小而快速的急动，称为微眼跳；甚至随着每次心跳而有微妙的内外搏动。这些运动中的每一种都会描绘出不同的伪影。

在单次 B 扫描采集中缓慢而持续的漂移会导致视网膜发生剪切，就像推动一副扑克牌的顶部一样。
微眼跳，即在 B 扫描期间发生的快速跳动，会在图像数据中造成撕裂或局部压缩。
心跳引起的缓慢、搏动性的轴向运动，导致一个体积中连续的每个 B 扫描都处于略微不同的深度，从而在最终的三维重建中产生波浪状的波纹外观。

同样的挑战也出现在医生试图为幼儿心脏成像时。一个 6 岁儿童的心率可能为每分钟 120 次，呼吸频率为每分钟 30 次。一台试图制作跳动心脏“电影”的 MRI 机器需要在多个心跳周期内采集数据。如果孩子自由呼吸，心脏的位置会在每次心跳之间发生巨大变化，导致图像拼图的不同部分（k 空间的分段）从不同的空间位置采集。结果是一幅混乱、充满鬼影的图像，对诊断毫无用处。这迫使医生做出选择：要么尝试让孩子屏住呼吸 8-10 秒——这是一个苛刻的要求——要么使用更复杂的、感知运动的采集策略。在所有这些案例中，我们看到了一个更深层次的原理：理解物体动力学与扫描仪动力学之间的相互作用，是诊断和修复由此产生的伪影的关键。

超越几何学：运动的更深层破坏

到目前为止，我们一直将运动视为一个几何问题。但其影响可能要隐蔽得多，它会破坏测量的物理原理本身，甚至无中生有地创造出幻影信号。

考虑一台现代混合式扫描仪，如用于心脏成像的 PET/CT。PET 扫描仪通过探测示踪剂的辐射来观察代谢活动，而 CT 扫描仪则提供解剖图。但 CT 还有另一个关键任务：它测量不同组织如何吸收辐射，从而创建一张“衰减图”。这张图用于校正 PET 数据，因为来自身体深处的信号比来自表面的信号衰减得更厉害（更弱）。问题在于，CT 扫描非常快，并且通常是在患者吸满气并屏住呼吸时进行的。而 PET 扫描则要长得多，期间患者自由呼吸。由于呼吸运动，心脏在时间平均的 PET 扫描中的位置与在屏气 CT 扫描中的位置不同。结果如何？应用了错误的衰减校正。在 PET 扫描期间本应是软组织的心脏区域，可能会在基于 CT 的衰减图中被错误地标记为肺。由于肺组织的衰减远小于软组织，校正算法对该区域信号的“增强”会不足。最终重建的活性将是假性偏低——在典型情况下，信号可能被低估高达 $18\%$ 或更多。这不是模糊，而是一种根本性的定量偏差。同样的问题也出现在用于手术规划的颈部 SPECT/CT 成像中，在 SPECT 和 CT 采集之间的一次简单吞咽就可能导致衰减图错位，并引发类似错误，可能误导外科医生的操作。

运动甚至可以在没有信号的地方创造出信号。这在 MRI 引导的热疗中得到了生动的展示，该疗法使用激光消融组织，例如治疗癫痫。手术过程通过 MR 测温进行实时监控，其原理是水中质子的共振频率随温度发生微小变化。这种频率变化在 MRI 信号中被检测为相位偏移 $\Delta \phi$ 。不幸的是，温度并不是唯一能引起相位偏移的因素。扫描仪内部的磁场并非完全均匀，尤其是在组织、骨骼和空气的交界处。如果患者移动，哪怕只有一毫米，其组织就会经历不同的背景磁场，从而引起一个与温度无关的相位偏移。这种由运动引起的相位误差可能达到 $1.25\,^{\circ}\text{C}$ 的量级，而来自磁体漂移的信号可能只有 $0.08\,^{\circ}\text{C}$ 。在这种生死攸关的应用中，运动可以创造出虚假的加热（或冷却）信号，可能导致外科医生对目标治疗不足或过度治疗。

也许最微妙的物理破坏形式发生在功能性磁共振成像（fMRI）中。来自大脑体素的信号不仅取决于其当前状态，还取决于其近期历史——特别是它所经历的射频（RF）脉冲序列。在快速成像序列中，这些脉冲以固定的时间间隔 $TR$ 到来。如果微小的头部运动导致大脑的一个切片移出扫描仪的视野一个脉冲的时间，那么该切片实际上就“错过了一轮”。当它在下一个脉冲时移回视野，其磁化强度将不像其邻近体素那样被饱和，因而会产生一个异常明亮的信号。这是一种“自旋历史”伪影。它不是一个可以通过简单图像配准来修复的几何误差，而是信号生成物理过程本身的错误。校正它需要一种更先进、感知物理学的方法，该方法对磁化历史进行建模，并相应地调整信号幅度。

校正的交响乐

面对这系列复杂的伪影，很明显“运动校正”不可能是单一的灵丹妙药。在实践中，它是一系列精心编排的步骤，一个旨在解决问题不同方面的处理流程。一个绝佳的例子是用于绘制大脑内源性网络的静息态 fMRI 数据分析。一个典型的处理流程可能包括：

时间层校正： 用于校正一个体积内不同切片在略有不同的时间被采集的事实。
刚体重新对齐： 用于校正不同体积之间的整体头部运动。
干扰回归： 一种统计技术，用于去除与运动估计或与白质和脑脊液等非神经组织信号相关的伪影信号变化。
空间平滑： 有意地对图像进行轻微模糊，以提高信噪比并解释微小的残余未对准。
时间滤波： 用于分离出感兴趣的低频波动。

每个步骤都扮演着至关重要的角色，但每个步骤也都伴随着权衡。例如，空间平滑会人为地夸大邻近大脑区域之间的表观连接性。时间滤波在清除噪声的同时，可能会改变时间序列的统计特性，需要在统计推断过程中小心处理。要做到恰到好处，是一门微妙的平衡艺术。

然而，运动校正的巅峰之作来自于混合成像系统的协同作用。在一台同步 PET/MRI 扫描仪中，我们拥有了终极工具。MRI 速度快且功能极其多样，可以在较慢的 PET 扫描进行时，用来“监视”身体的运动。利用快速导航回波或在组织上放置临时网格的“标记”序列等技术，MRI 可以在每一时刻生成组织运动场的高分辨率图 $\mathbf{T}_t$ 。这个运动场随后可用于校正 PET 数据。有两种绝妙的方法可以实现这一点。一种是取每个被探测到的 PET 事件（在扫描仪的固定坐标系中记录为一条响应线 LOR），并使用逆运动图 $\mathbf{T}_t^{-1}$ 将该 LOR 变换回一个共同的、静止的参考系中。一种更优雅且更强大的方法是将运动模型 $\mathbf{T}_t$ 直接构建到 PET 图像重建本身的数学方程中。这就是运动补偿图像重建（MCIR），这项技术不仅仅是事后“修复”运动，而是将其作为图像形成过程的一个组成部分来考虑。

从牙科 X 光片上的简单模糊，到 fMRI 中微妙的自旋历史伪影，再到 PET/MRI 的优雅协同，我们看到运动问题一直是创新的强大驱动力。它迫使我们超越单纯的几何学，更深入地探究我们测量工具的基本物理原理。由此产生的解决方案是科学创造力的证明，揭示了一套统一的原则，使我们能够捕捉到一个永远处于运动中的世界的清晰画面。