成像系统：从原理到应用的统一框架

玻尔百科

核心要点

点扩散函数 (PSF) 是定义成像系统分辨率的基本模糊单元。
任何图像都是真实物体与系统 PSF 卷积的结果，这一过程通过光学传递函数 (OTF) 在频域中被简化为乘法。
光学传递函数 (OTF) 表征系统如何传递空间频率，其幅值（调制传递函数，MTF）衡量对比度损失，其相位（相位传递函数，PTF）衡量空间位移。
级联系统（例如镜头、传感器和软件组成的系统）的性能由其各组件各自 MTF 的乘积决定。
这些核心原理统一了从工程、生物学到医学诊断和量子鬼成像等不同领域的应用。

引言

从绘制遥远星系图谱的哈勃太空望远镜，到揭示细胞内部运作的生物学显微镜，成像系统是我们窥探不可见世界的主要窗口。尽管这些仪器的规模和复杂性千差万别，但它们都遵循着将物体转换为图像的相同基本物理定律。然而，我们如何能以一种既精确又普遍适用的方式来描述这种转换呢？本文将通过引入一个源自线性系统理论的强大而优美的框架来回答这个问题。

我们将开启一段分为两部分的旅程。首先，在“原理与机制”部分，我们将解构定义所有成像系统性能的核心概念，从点扩散函数的基本模糊到光学传递函数的频域视角。您将了解到光作为相干波或非相干波的双重性质如何塑造了成像过程。其次，在“应用与跨学科联系”部分，我们将看到这些原理的实际应用，探索工程师、物理学家、生物学家和临床医生如何使用这种通用语言来量化性能、挑战分辨率的极限，甚至发明新的观察方式。让我们从探索将一个光点变成一幅图像的基本原理开始。

原理与机制

相机、显微镜或望远镜究竟是如何工作的？我们知道它能形成图像，但是从真实世界的物体到传感器上的图像，这种转换背后的深层原理是什么？答案出人意料地优美，它建立在几个核心理念之上。一旦掌握了这些理念，就能统一从哈勃太空望远镜到您手机摄像头的每一种成像系统的性能。让我们开启一段旅程，去理解这套机制——不是将其看作一堆零件的集合，而是看作一个由优美的物理定律支配的系统。

系统的“指纹”：点扩散函数

想象一下，您想了解一个音乐厅的声学特性。一个简单而深刻的方法是站在舞台上，响亮地拍一次手。那个单一、尖锐的声音——一个脉冲——向外传播，经墙壁、天花板、座椅反射，最终以一种复杂而拖长的混响形式到达听众的耳朵。这种混响就是音乐厅的“脉冲响应”。它是一个“指纹”，包含了您需要了解的关于音乐厅如何转换声音的一切信息。

成像系统也有这样的指纹。它的脉冲是一个无限小、无限亮的光点——一个理论上的理想点光源。系统对这个单一点光源所成的像就是它的点扩散函数（Point Spread Function，简称PSF）。

在一个假设的完美世界里，一个点的像会是一个完美的点。从数学上讲，PSF 会是一个极其尖锐的峰，即一个狄拉克δ函数。但在现实世界中，没有完美的系统。光波会发生衍射，透镜存在像差，大气湍流也可能扭曲视野。这些不完美之处导致来自单个点的光扩散成一个模糊的小光斑。这个光斑就是PSF。它是系统对其所观察到的一切物体施加的基本模糊单元。

PSF 的形状和大小是衡量成像系统质量的最直接标准。一个紧凑、窄小的 PSF 表明这是一个高质量、图像模糊程度很小的系统。而一个宽大、分散的 PSF 则意味着更多的模糊。这直接关系到系统的分辨本领——即其区分精细细节的能力。如果您有两个系统，一个具有窄高斯 PSF，另一个具有宽高斯 PSF，那么具有较窄 PSF 的系统总能分辨出更小的特征。这就像用细尖笔和粗头笔写字一样；细笔尖（窄 PSF）可以完成更精细的工作。

从点到图：卷积的艺术

知道了系统对单个点的响应已经很强大了，但我们如何用它来预测一个复杂物体（如人脸或星系）的图像呢？技巧在于，将任何物体都看作是由大量独立的点光源组成的集合，每个点光源都有自己的亮度和颜色。

如果我们假设系统是线性且位移不变的（这对于大多数成像系统来说是一个极好的近似），那么两件奇妙的事情就会发生。线性意味着亮度可以相加；两个点在一起的图像就是每个点单独成像的图像之和（至少对于我们稍后将讨论的非相干光是这样）。位移不变性意味着无论点位于物体的哪个位置，其模糊（即 PSF）都是相同的。视场中心的恒星与视场边缘的恒星被模糊的方式完全相同。基于这两个假设，形成图像就变成了一个优美而简单（尽管计算量可能很大）的操作：用 PSF 的一个副本替换物体中的每一个点，并按该点的亮度进行缩放，然后将它们全部相加。这个数学过程被称为卷积。图像就是真实物体与系统点扩散函数的卷积。

想象一位天文学家正在观测一个由两颗亮度相等、距离很近的恒星组成的双星系统。“真实”的物体是两个清晰的光点。而成像系统，以其高斯 PSF，将这两个点都模糊成一个小的高斯形光斑。您最终看到的图像就是这两个相同但轻微位移的光斑之和。如果两颗恒星相距足够远，您会看到两个明显的峰。但当它们越来越近时，它们模糊的 PSF 开始重叠，最终合并成一个拉长的光斑。这就是“分辨”一个物体的核心意义。

光的两种特性：相干与非相干成像

到目前为止，我们主要考虑的是来自恒星或灯泡的光，这些光源发出的光波在不同点之间是完全混乱的，没有固定的相位关系。这被称为非相干光。对于非相干成像，规则很简单：强度相加。这就是为什么我们的卷积论证能如此完美地运作。系统在强度上是线性的。

但还有另一种光：相干光，即激光产生的光。在激光束中，所有的波都步调一致，具有明确的相位关系。这改变了一切。当相干波叠加时，我们不能直接将它们的强度相加；我们必须先将它们的复振幅（同时包含振幅和相位信息）相加，然后再计算最终的强度。这就是经典的光学干涉图样的来源，两束光可以叠加产生明亮区域（相长干涉）和完全黑暗的区域（相消干涉）。

这意味着相干成像系统不是在强度上线性，而是在复振幅上线性。因此，它的基本脉冲响应不是 PSF，而是振幅扩散函数 (Amplitude Spread Function, ASF)，它描述了点光源成像后波的复振幅。两者之间的关系是基础性的：强度是振幅的幅值平方。因此，PSF 就是 ASF 幅值的平方：

\text{PSF}(x, y) = |\text{ASF}(x, y)|^2

这个看似微小的数学步骤代表了深刻的物理差异。非相干系统叠加的是模糊的光斑，而相干系统叠加的是复杂的波形，这些波形会以复杂的方式干涉，有时会导致在非相干图像中不会出现的伪影，例如锐利边缘周围的振铃效应。这种区别在显微学和全息成像等领域至关重要。

新视角：空间频率的世界

用点和模糊来描述图像很直观，但还有另一种同样强大的方式：用空间频率。就像一个复杂的和弦可以被分解为一系列不同频率的纯音一样，任何图像也可以被分解为一系列不同“空间频率”的简单波浪状图样——正弦波。低空间频率对应于大范围、缓慢变化的特征，如光滑的墙面。高空间频率则对应于精细、快速变化的细节，如织物的纹理或页面上的字母。

由于傅里叶变换提供的深刻数学联系，这种视角的转变是革命性的。空间域中繁琐的卷积运算在频域中变成了简单的乘法！

如果我们对 PSF 进行傅里叶变换，我们会得到一个新函数，称为光学传递函数 (Optical Transfer Function, OTF)。为了找出图像的频率成分，我们不再需要进行卷积。我们只需获取物体的频率成分，然后逐个频率地乘以系统的 OTF。

OTF 精确地告诉我们系统如何将每个空间频率从物体“传递”到图像。想象一下，将一系列正弦图样通过系统。OTF 会告诉你，对于每个频率，对比度降低了多少，图样位移了多少。它是系统在频域中性能的最终表征。一个“完美”成像系统的 OTF 会是什么样子？一个完美的系统，其 PSF 是一个理想的点，它会完美地传递所有空间频率，而不会有任何对比度损失或位置偏移。因此，它的 OTF 对所有频率都应为常数值 1。这是我们衡量完美的基准。任何真实系统的 OTF 都会在零频率处为 1，然后下降，最终在某个截止频率处降至零。这种衰减表明系统在传递越来越精细的细节方面表现得越来越差。

解构性能：MTF 与 PTF

OTF 是一个复值函数，这意味着它既有幅值又有相位。每个部分都有其独特而重要的物理意义。

OTF 的幅值被称为调制传递函数 (Modulation Transfer Function, MTF)。MTF 是一个纯粹衡量每个空间频率对比度损失程度的指标。它是镜头和成像系统最广泛使用的规格之一。如果一个系统在 50 cycles/mm 处的 MTF 为 0.5，这意味着具有该频率的正弦图样在最终图像中的对比度将被削减一半。

如果您尝试对一个空间频率对应于 MTF 为零的点的图样进行成像，会发生什么？系统对这个频率是完全“盲目”的。对比度传递为零，意味着正弦变化被完全抹去，只留下一个平坦、均匀的平均灰色区域。该特定尺度的细节被完全丢失了。

所有无源成像系统都有一个有趣的特性，即在零空间频率处的 MTF 始终为 1。零频率不是细节；它是图像的整体平均亮度，通常被称为直流分量。 $\text{MTF}(0) = 1$ 这个事实是能量守恒的体现。它意味着，虽然系统可能会模糊细节（降低较高频率下的 MTF），但它总体上不会创造或消灭光。它只是重新分配了物体提供的光。

OTF 的另一部分，即其相位，是相位传递函数 (Phase Transfer Function, PTF)。它描述了每个正弦分量在图像中发生了多大的空间位移。对于一个完全对称的 PSF（如完美的高斯分布或衍射极限透镜的艾里斑），PTF 为零。像彗差这样的像差会引入非零的 PTF，这可能导致图像中出现非对称畸变。

工程现实：级联系统与光瞳

这些概念不仅仅是理论上的奇闻异事；它们是光学工程师的日常工具。一个现实世界的成像系统，比如卫星上的成像系统，是由一系列组件级联而成的：一个望远镜镜头、一个 CCD 传感器和数字处理软件。这些组件中的每一个都有自己的 MTF。频域视角的巨大实用性在于，整个系统的总 MTF 就是其各个组件 MTF 的简单乘积。

M_{\text{sys}} = M_{\text{opt}} \times M_{\text{ccd}} \times M_{\text{proc}}

这个级联原理同样适用于相干系统，其总的相干传递函数 (Coherent Transfer Function, CTF) 是各个 CTF 的乘积。这使得工程师可以创建一个性能“预算”。如果望远镜光学系统的已知 MTF 为 0.75，并且应用了一个有效 MTF 为 1.2 的数字锐化滤波器，工程师就可以精确计算出 CCD 传感器所需的最小 MTF，以达到例如 0.35 的整体系统性能目标。

最后，OTF 或 CTF 是从哪里来的？这一切都追溯到系统的孔径，即光瞳。光瞳是光线通过的开口，其大小、形状以及任何不完美之处（像差）都由光瞳函数来描述。它们之间的联系非常直接和优美：

对于相干系统，CTF 就是光瞳函数本身。
对于非相干系统，OTF 是光瞳函数的自相关。

这揭示了一种深刻的统一性。成像系统的所有性能特征——其分辨率、对比度和畸变——都编码在穿过其光瞳的光的几何结构中。通过理解这些原理，我们将对成像系统的看法从一个黑箱转变为一台透明的机器，它受制于优美且可预测的波动物理学。

应用与跨学科联系

在回顾了成像系统的基本原理之后，人们可能会倾向于将点扩散函数和光学传递函数等概念视为优美但抽象的数学形式。事实远非如此。这些理念并非仅仅是学术上的奇谈；它们是物理学家、工程师、生物学家和医生的工作语言。它们构成了一个强大而统一的工具包，使我们能够理解我们所能看到的极限，设计出挑战这些极限的仪器，并创造出全新的方式来窥探我们周围以及我们身体内部的未知世界。这个框架的真正美妙之处在于其应用的非凡广度，从你口袋里的相机到量子力学的前沿。

工程师的工具箱：量化与预测性能

让我们从最实际的地方开始：工程师的工作室。如何认证一个新设计的镜头或数码相机是否合格？难道只是拍一张猫的照片，然后判断它“看起来是否锐利”吗？现代方法要定量得多，并且直接依赖于调制传递函数 (MTF)。工程师可以使用一个带有简单、完美的明暗相间正弦条纹图样的测试靶。该物体的对比度（或调制）是已知的。成像系统不可避免地会模糊这个图样，从而降低其在最终图像中的对比度。图像对比度与原始物体对比度的比率，恰好就是该特定空间频率下的 MTF 值。通过使用更精细的图样（更高的空间频率）重复此测量，就可以绘制出整个 MTF 曲线。这条曲线就是系统的“成绩单”。它完整地讲述了系统如何忠实地传递粗糙细节（在低频处），以及如何逐渐无法传递精细细节（在高频处），直到达到一个截止频率，超过该频率所有信息都将丢失。

这种方法比初看起来更为强大。大多数场景并非简单的正弦波；它们复杂多变，充满了锐利的边缘和复杂的纹理。考虑一个标准的条形图，它本质上是一个方波图样。系统将如何对其成像？在这里，继承自 Joseph Fourier 的线性系统方法的魔力就发挥了作用。方波在数学上可以分解为一系列正弦波之和：一个强的基频和一系列无穷的、较弱的、赋予波“方形”特征的高频谐波。成像系统通过根据 MTF 过滤其每个正弦分量来作用于此物体。系统可能会以很小的衰减通过低频基频，但严重抑制高频谐波。通过了解 MTF，工程师不仅可以预测图像会变得模糊，甚至可以在启动系统之前就精确预测出最终图像中基频分量的对比度将是多少。复杂的输入被分解，每个简单的部分由 MTF 处理，结果就是对最终改变后图像的预测。这就是以频率思考的力量。

物理学家的游乐场：从孔径到图像

如果说 MTF 是系统的成绩单，那么是谁来打分呢？答案在于衍射的物理学以及仪器本身的物理结构。光学系统中信息的最终守门人是光瞳函数。这个函数简单地描述了孔径——光线通过的开口，如你眼中的虹膜或相机镜头中的光圈——的形状和透射特性。在一个深刻而优美的联系中，系统的脉冲响应（PSF）就是这个光瞳函数的傅里叶变换。这意味着，通过控制光瞳平面上发生的事情，人们可以直接设计图像的属性。

想象一个具有非传统光瞳的成像系统：一个透明的圆形开口，正中央有一个不透明的小点。这会产生什么效果？通过计算这个形状的傅里叶变换，可以找到由此产生的相干脉冲响应的确切形式。这种技术，被称为*变迹*或空间滤波，不仅仅是奇闻异事；它是一种在望远镜和显微镜中用来抑制恒星周围不必要的衍射环或增强特定特征对比度的强大方法。

光瞳与系统性能之间的这种联系揭示了分辨率最终的、不可逾越的极限。对于一个非相干成像系统，如荧光显微镜，OTF 是光瞳函数的自相关。在几何上，这是光瞳与其自身在频率空间中平移时重叠的区域。OTF 延伸到两个副本刚好不再重叠的频率。对于一个由数值孔径 ( $NA$ ) 和波长 ( $\lambda$ ) 决定的半径的圆形光瞳，这导致了著名的分辨率衍射极限：截止空间频率恰好是 $k_c = \frac{2\text{NA}}{\lambda}$ 。这个简单的公式是光学的支柱之一。它告诉我们，要看到更小的东西，你需要一个能够从更宽角度收集光线的镜头（更高的 NA），或者你需要使用更短波长的光。没有办法绕过它；这是一个根植于光的波动性的基本限制。

生物学家的窗口：看见不可见之物

成像的挑战与成就在生物学领域表现得最为明显，该领域的目标是观察生命精细、通常是透明的机器。许多活细胞就像玻璃雕像；它们不吸收太多光，这使得它们在标准显微镜下几乎不可见。它们是“相位物体”，这意味着它们会改变通过它们的光的相位，但不会改变其振幅。我们如何能看到相位的变化呢？

一个完美的、聚焦准确的成像系统实际上对弱相位物体是“盲目”的。但一个很久以前被偶然发现的巧妙技巧提供了解决方案：将显微镜轻微散焦。这个看似违反直觉的举动可以使不可见之物变得清晰可见。为什么？光在空间中传播的过程，即使是很小的距离如散焦量 $\Delta z$ ，也有一个传递函数。这个“传播算子”在每个空间频率分量上施加一个相位移动，该移动取决于频率的平方。对于一个相位物体，这种传播将原始的、未散射的光与相位移动了的、散射的光以恰当的方式混合，从而从原始的相位变化中产生强度变化。人们可以推导出最终图像的确切对比度，结果发现它是一个关于散焦量、波长和物体空间频率的正弦函数。这就是相衬成像的原理，一项获得诺贝尔奖的发现，它为直接观察活细胞的世界打开了大门。

现代生物学进一步发展到三维领域。一台 3D 宽场显微镜可以拍摄一系列不同深度的图像，但结果往往令人失望。图像受到来自焦平面上方和下方层面的离焦模糊的困扰。这是 3D OTF 的直接体现。显微镜的 OTF 是高度各向异性的；它传递横向（x-y）信息的能力远胜于传递轴向（z）信息的能力。这导致频域中出现一个信息的“缺失锥”，使得轴向分辨率比横向分辨率差好几倍。解决方案是什么？计算成像。如果我们知道 OTF（我们可以测量它），我们就可以应用反卷积算法。该算法本质上是一个逆滤波器，它在计算上增强了被显微镜抑制的频率，将模糊的、离焦的光“重新分配”回其起源点。这种光学与计算的强大协同作用使我们能够恢复 3D 图像，其清晰度接近由 OTF 设定的基本的、各向异性的极限。

同样的原理甚至可以延伸到单分子水平。使用像 SEP-GluA1 这样的荧光蛋白技术，神经科学家可以实时观察携带神经递质受体的单个囊泡与神经元膜融合的过程。每个融合事件都表现为荧光的突然、阶梯式增加。这个阶跃的大小并非随机；其期望值是囊泡递送的荧光分子数量与整个成像系统检测效率的乘积。系统性能的宏大原理在这里找到了其应用，即精确计数突触处的分子数量。

临床医生的洞察与数字暗房

成像系统的影响在医学领域急剧扩展，在医学领域，无创地观察人体内部是现代诊断的基石。以用于定位肿瘤的正电子发射断层扫描 (PET) 为例。这需要跨学科工程的奇迹。首先，制造出一种单克隆抗体，这是一种经过设计的蛋白质，能以极高的特异性与仅在癌细胞上发现的蛋白质结合。这种抗体本身是一个完美的“智能探针”，但 PET 扫描仪无法看到它。另外，放射性同位素是一个能发射正电子的微小原子，其产生的信号可以被 PET 扫描仪以毫米级精度进行三角定位。但它本身会扩散到全身，产生无用的、均匀的模糊信号。当两者通过化学方法结合时，奇迹发生了。抗体充当递送载体，将放射性载荷直接运送到目标。而放射性同位素的唯一工作就是成为可检测的信标。这里的“成像系统”是分子生物学和核物理学的美妙结合。

此外，医学图像很少是完美的。像超声和合成孔径雷达 (SAR) 这样的相干成像技术常常受到一种称为“斑点噪声”的颗粒状、椒盐模式的干扰。这是一种乘性噪声，源于许多小散射体的相干干涉。如何去除它？一个粗暴的平滑滤波器会在去除噪声的同时模糊掉重要的细节。解决方案在于一种更复杂的信号处理技术，称为*同态滤波*。通过对图像取对数，乘性噪声被转换为加性噪声。然后，这种加性噪声可以用一个简单的均值滤波器有效减少。最后，应用指数函数（对数的反函数）来恢复图像强度，此时斑点噪声已显著减少 [@problem_-id:1729815]。这是一个将问题转移到解决方案更简单的领域中的典型例子，这也是科学和工程中反复出现的主题。

量子前沿：用“鬼”光成像

成像系统的终极极限是什么？你能用从未接触过物体的光来形成该物体的图像吗？惊人的是，答案是肯定的，通过量子力学的镜中世界可以实现。在一项称为“鬼成像”的技术中，一个特殊晶体产生纠缠光子对。这些光子在量子力学上是相互关联的；一个光子的性质与另一个光子的性质内在地相关，无论它们相距多远。

在一个典型装置中，每对光子中的一个——信号光子——被射向我们想要成像的物体。在穿过物体后，它被一个“桶探测器”收集，该探测器在每次接收到光子时仅发出一次点击信号，完全没有空间信息。它的孪生光子——闲置光子——沿着一条完全不同的路径传播，从不与物体相互作用。它直接飞入一个高分辨率相机。如果你只看相机，你只会看到一个随机的、雪花般的噪点图案。但是，如果你只记录那些其*孪生信号光子*穿过物体并到达桶探测器的闲置光子的位置，一个物体的“鬼”像就会奇迹般地从噪声中浮现出来。这个图像是由从未见过物体的光子形成的。

这不是魔法，而是光子在诞生时被赋予的强动量和位置相关性的直接结果。这些相关性是如此完美，以至于系统的性能，包括纵向景深等特性，可以直接从纠缠对的量子波函数中推导出来。鬼成像表明，“成像系统”可以是“非局域”的，它依赖于相关性，而不是从物体到图像的直接物理路径。这是一个惊人的提醒，表明成像的原理在不断演化，在物理学的最前沿找到了新的、深刻的表达方式。

从设计更好的相机镜头到可视化活体大脑中分子的舞蹈，从诊断疾病到用从未见过物体的光捕捉图像，线性系统和傅里叶光学的核心概念提供了一种通用、统一的语言。它们是阅读和书写视觉世界故事的基本语法。