最小二乘偏移

玻尔百科

定义

最小二乘偏移是地球物理领域一种先进的地震成像技术，它将成像视为正式的反演问题，旨在校正标准偏移中固有的畸变。该方法通过反演正规算子来解卷积成像系统的点扩散函数，从而获得高分辨率且具有真实振幅的地下图像。在实际应用中，最小二乘偏移框架常结合稳健统计、信号处理和压缩感知技术，以处理噪声数据或进行波速与震源特征的联合反演。

核心要点

最小二乘偏移（LSM）是一种先进的地震成像技术，它将成像视为一个形式化的反问题，以校正标准偏移中固有的畸变。
通过旨在反演法线算子（ $A^T A$ ），LSM 对成像系统的点扩散函数进行反褶积，从而获得分辨率更高、振幅更真实的地下图像。
实用的 LSM 应用融合了稳健统计学、信号处理和压缩感知的技术，以处理含噪数据和多次波，并通过正则化注入地质真实性。
灵活的 LSM 框架可以超越简单的反射率成像，扩展到联合反演其他模型参数，如速度或震源特征。

引言

对地球深部进行成像是地球物理学中的一个根本性挑战，类似于透过坚硬的岩石看清物体。几十年来，地震偏移一直是完成这项任务的主要工具，它将声波的回声转化为地质图。然而，这种标准方法产生的图像本质上是模糊和失真的——如同地下真实情况在“哈哈镜”中的反射。这一局限性造成了关键的认知鸿沟，阻碍了我们获得清晰、定量和可靠图像的能力。本文深入探讨最小二乘偏移（LSM），这是一个强大的反问题框架，旨在擦亮这面镜子，揭示更真实的地球面貌。

在接下来的章节中，我们将踏上一段从理论到实践的旅程。第一章“原理与机制”将解构地震成像背后的数学原理，解释为什么标准偏移存在不足，以及 LSM 如何从形式上校正这些畸变以实现卓越的分辨率和振幅保真度。随后的“应用与跨学科联系”将探讨 LSM 如何适应混乱的现实世界，融合统计学、信号处理和优化领域的先进技术，以处理不完美的数据，将“噪声”转化为信号，并在成像过程中注入地质智慧。我们首先探索定义地震成像为一个宏大反问题的基本物理学和数学原理。

原理与机制

要理解最小二乘偏移，我们首先要思考“看见”某物意味着什么。当您看着一个物体时，光线从其表面反弹，进入您的眼睛，然后您的大脑处理这些信号以形成图像。整个过程如此轻松，以至于我们忘记了其中涉及的惊人物理学和计算。地震成像旨在为地球内部做类似的事情，但我们使用的不是光，而是声波；我们使用的不是大脑，而是超级计算机。这是一个宏大的反问题：我们观察到的是效应——在地面记录到的声波回声——而我们想推断出原因——深藏在地下的地质结构。

追求完美的镜子：作为反问题的成像

想象一下，我们可以写出一个完美的数学描述，来说明声波在地球中传播的物理过程。我们可以用一个正演模型来表示，这是一个我们称之为 $A$ 的算子。该算子接收地球地下的描述——其反射率，我们称之为模型 $m$ ——并预测我们将在地表记录到的地震数据 $d$ 。最简单的形式是，我们将其写成一个线性方程：

d = Am

这个方程陈述了因果关系。它表明，我们测量到的数据 $d$ 是物理算子 $A$ 作用于地球模型 $m$ 的结果。算子 $A$ 是波动方程的数学体现，它决定了声波如何传播、散射以及从不同岩层反射。我们的任务，如果我们选择接受，就是将这个过程反向进行。我们拥有数据 $d$ ，并且我们想找出模型 $m$ 。我们想要求解 $m$ ：

m = A^{-1}d

要是真有那么简单就好了！算子 $A$ 极其复杂。直接对其求逆，在所有实际应用中都是不可能的。这就像试图将打散的鸡蛋复原一样。信息都在那里，但它们以一种极难完美解开的方式纠缠在一起。因此，地球物理学家们，作为聪明而务实的人，想出了另一种方法。

“足够好”的图像：标准偏移及其缺陷

几十年来，地震成像的主力方法并非尝试不可能的直接反演，而是一个称为偏移的过程。其背后的直觉非常美妙。想象你记录到的一个回声。它必然来自某个地方。一个简单的偏移算法接收记录到的数据，并本质上将其在时间上进行“反投影”。在检波器上记录的每个数据点都被视为一个新的微型震源，将能量送回地下。当所有这些反投影震源的能量发生相长干涉时——即它们都“达成一致”的地方——我们就在图像中放置一个反射体。

这个优雅的反投影过程不仅仅是一个聪明的技巧；它有一个严格的数学身份。它是正演算子的伴随算子，记为 $A^T$ 。因此，标准偏移图像，我们称之为 $m_{mig}$ ，可以简单地表示为：

m_{mig} = A^T d

现在，关键问题来了，这个问题为最小二乘偏移打开了大门。伴随过程真正给了我们什么样的图像？让我们做一个思想实验。假设我们拥有真实的地球模型 $m_{true}$ 。我们可以使用我们的正演算子 $A$ 生成一个完美的、无噪声的数据集： $d_{true} = A m_{true}$ 。现在，让我们对这个完美的数据进行偏移。我们会得到什么样的图像？

m_{mig} = A^T d_{true} = A^T (A m_{true}) = (A^T A) m_{true}

这是一个深刻的结果。标准偏移过程并不能恢复真实的地球。相反，它恢复的是透过法线算子 $N = A^T A$ 这个畸变透镜看到的地球。偏移图像并非现实，而是现实的一个“拖影”版本。伴随算子 $A^T$ 是我们在单一步骤中能做到的最好结果，但它并不是逆算子。它只是一个近亲，并不能完全撤销正演传播过程。

哈哈镜：理解模糊和伪影

法线算子 $A^T A$ 这个“畸变透镜”实际上对我们的图像做了什么？为了找出答案，我们可以问另一个简单的问题：单个无限小点反射体的图像是什么？在一个完美的成像系统中，一个点的图像应该是一个点。但是，当通过我们的系统对其成像时，我们得到的是 $A^T A$ 作用于该点的结果。结果不是一个清晰的点，而是一个模糊的、通常形状奇特的图案。这个图案被称为点扩散函数（PSF）。

最终的偏移图像，本质上是真实地球的反射率与这个 PSF 的卷积。地下中的每一个点都以同样的方式被模糊化。因此，我们看到的图像是真相的一个根本上模糊和失真的版本，就像在哈哈镜中看自己的倒影一样。形状可以辨认，但比例是错误的，精细的细节也丢失了。这种模糊和失真源于基本的物理和实际限制：

有限孔径：在地震勘探中，我们只能在有限数量的位置放置震源和检波器，通常是在地表。我们试图从一个二维表面去照亮一个三维体。这种不完整的照明就像在黑暗的房间里，试图通过几束狭窄的手电筒光束来猜测一个物体的形状。有些部分会被照亮，其他部分则处于阴影之中，我们对物体形状的感知将是有偏见和不完整的。这导致了各向异性（方向相关）的分辨率和图像中强烈的伪影。
限带震源：我们使用的声源（如海洋气枪）并非一个完美的瞬时“爆炸”。它们产生的是一个震源子波，一个频率范围有限的声音脉冲。要创建一个无限清晰的图像，我们需要一个具有无限带宽的震源。因为我们的震源是限带的，它起到了一个模糊滤波器的作用，抹去了地下的清晰细节。结果是，我们的偏移图像不仅因采集几何而产生几何畸变，还被我们输入地下的声波特性所滤波。

擦亮镜子：最小二乘解

如果标准偏移给我们一个失真的图像 $m_{mig} = (A^T A) m_{true}$ ，那么通往更好图像的路径就变得清晰了。我们需要找到一种方法来消除 $A^T A$ 算子的影响。我们需要解这个方程：

(A^T A) m = A^T d

这就是法线方程，求解 $m$ 正是最小二乘偏移（LSM）的精髓所在。LSM 寻求找到一个模型 $m$ ，当它通过整个成像系统时，能够最好地解释我们实际测量到的数据。这等同于找到一个模型 $m$ ，使得观测数据 $d$ 与模型预测的数据 $Am$ 之间的平方差最小。

通过尝试反演 $A^T A$ 的模糊和照明效应，LSM 从图像中“反褶积”了点扩散函数。其结果是图像的空间分辨率显著提高，伪影减少，振幅更加均衡。这种“真振幅”恢复是一个关键优势，因为最终图像中反射的亮度可以更直接地与岩石的物理性质联系起来，不仅提供了一张地图，还提供了对地下的定量表征。我们甚至可以通过引入一个数据加权矩阵 $W$ 来改进这个过程，告诉我们的算法哪些数据点更可靠，从而得到加权法线方程 $(A^T W A) m = A^T W d$ 。

擦拭的挑战：为何如此困难

如果 LSM 能产生如此出色的图像，为什么不总是使用它呢？答案很简单：计算成本。求解法线方程是一项艰巨的任务。算子 $A^T W A$ 非常庞大，我们无法简单地计算它的逆。相反，我们必须使用迭代方法（如共轭梯度算法）来求解 $m$ 。

这些方法的每次迭代都需要计算算子 $A^T W A$ 作用于一个模型向量。想一想这意味着什么。对于每一次地震“炮集”（一次使用一个震源的实验），我们必须：

使用我们当前的模型猜测进行一次完整的正演波场模拟 ( $A$ )。
对得到的合成数据进行加权 ( $W$ )。
对加权后的数据进行一次完整的时间反向偏移 ( $A^T$ )。

这整个序列的工作量大约是标准偏移的两倍。而且我们必须对所有炮集和许多次迭代重复这个过程，才能收敛到一个解。

此外，法线算子通常是病态的。这意味着系统对微小的变化极为敏感。模型的某些方面只受到数据的微弱约束（想象一下深部“阴影区”，那里几乎没有声波能量穿透）。试图求解这些照明不良的部分，就像试图从一英里外拍摄的模糊照片中辨认一个人的脸。数据中任何微小的噪声都可能导致解中出现巨大的、不符合物理规律的伪影。这种病态性，由一个称为条件数的指标来量化，意味着迭代求解器可能需要非常长的时间才能收敛到一个合理的结果。

因此，最小二乘偏移代表了一个巨大的权衡。它是擦亮哈哈镜的计算体现。这个过程缓慢、艰苦且昂贵。但是，通过努力应对我们成像系统的完整物理过程，通过承认其缺陷并系统地加以修正，我们可以将一幅扭曲、模糊的地球内部图像，转变为一幅清晰度惊人且具有定量真实性的反射图像。

应用与跨学科联系

在上一章中，我们看到了最小二乘偏移（LSM）优美的核心思想：通过将成像视为一个形式化的反问题，我们可以创建一幅更清晰、更定量的地球内部图像。我们想象了一个世界，其中我们的物理模型是完美的，数据是纯净的。这种理想化让我们清楚地理解了其原理。现在，我们必须离开那个干净、明亮的房间，步入混乱、复杂且有趣得多的现实世界。

当我们的地震数据充满噪声时会发生什么？如果我们的物理模型只是对现实的不完整描述怎么办？我们对地球的结构有哪些先验知识，可以悄悄告诉我们的算法，引导它走向一个地质上合理的答案？本章将带领我们深入探索使 LSM 成为一个真正强大而实用工具的艺术与科学。我们将看到来自统计学、信号处理、优化理论乃至图像处理领域的思想如何汇聚在一起，解决现实世界的挑战，揭示不同科学学科之间惊人的一致性。

处理不完美数据的艺术

我们的第一个挑战是数据本身。地震记录从来都不是完全干净的。它包含随机背景噪声，有时，由于设备故障或采集限制，数据的整个部分都不可信。一个幼稚的最小二乘方法对每个数据点都同等敬畏，但如果部分数据是垃圾，这可能会导致灾难。

一个简单而强大的想法是引入一个数据加权算子。把它想象成暗房里一位熟练的摄影师，有选择地对照片进行“减淡和加深”，以强调重要特征并抑制干扰。我们可以设计一个加权函数，告诉我们的反演算法：“密切关注这些高质量的数据，但不必太在意这部分含噪数据。”在数学上，这涉及到在我们的目标函数中引入一个加权算子。当然，天下没有免费的午餐。当我们选择忽略或降低某些数据的权重时，我们正在丢弃信息。这不可避免地会影响最终图像的分辨率，特别是对于那些反射主要记录在被静音的数据区域的地下区域。这些区域的“焦点”，由所谓的 Hessian 算子控制，将会变得更柔和，我们区分精细细节的能力也会降低。

但如果“噪声”不是随机的呢？如果它由巨大的、虚假的尖峰——异常值——组成，这些异常值可以完全劫持反演过程怎么办？标准最小二乘法通过最小化误差的平方，存在一个致命缺陷：它极其惧怕大误差。一个巨大的异常值可以像暴君一样，为了迁就它而将整个解远远地拉离真相。

在这里，我们可以从稳健统计学领域借用一个绝妙而优雅的思想。我们可以使用不同于二次 ( $L_2$ ) 惩罚的失配函数，一个对大误差更宽容的函数。一个绝佳的选择是源自学生 t 分布的代价函数。这种分布具有“重尾”，这是一个非常形象的术语，意味着它认为大的偏差比高斯分布认为的更可能发生。一个异常值仍然被识别为误差，但其影响被优雅地削减了。它再也没有能力主导整个结果。为了实现这一点，我们可以使用一个名为迭代重加权最小二乘（IRLS）的巧妙迭代算法，该算法在每一步识别当前残差中的异常值，并在下一次更新时为它们分配较小的权重。地球物理成像和稳健统计学之间的这种联系是跨学科思维如何解决深刻实际问题的一个典型例子。

多次波的物理学：噪声还是信号？

地震数据中最主要的“相干噪声”来源之一是多次波现象。这些是回声——在到达我们的检波器之前，波在例如海面上反弹一次或多次。它们比一次反射波晚到，并产生“鬼影”，这些鬼影很容易被误认为是真实的地质结构。我们如何处理这些多次波是现代地震处理中的一个核心主题。

一种策略是将多次波视为必须去除的污染。我们可以在数据域中设计复杂的滤波器来专门完成这项任务。例如，我们可以设计一个数学投影算子，它能分离出数据的“一次波子空间”，从而在反演开始前就有效地消除与多次波对应的能量。这种方法将 LSM 与信号处理和子空间方法的丰富世界联系起来。

一个更深刻，也许更优美的策略是质疑多次波是噪声这一前提。毕竟，这些回声也穿过了地球并与其结构发生了相互作用。它们携带着信息！为什么不利用它们呢？要做到这一点，我们必须建立一个更完整的正演模型——一个能正确预测多次波作为物理过程一部分的模型。例如，在海洋环境中，我们可以将海面的压力释放边界条件纳入我们的波动方程格林函数中。然后，我们的正演算子 $A$ 自然地将给定的反射率模型 $m$ 映射到一个既包含一次波又包含与表面相关的多次波的合成数据集中。

当我们在 LSM 中使用这个更完整的算子时，会发生一些非凡的事情。反演过程通过试图同时拟合一次波和多次波，可以利用多次波作为对地下的额外照明源，通常来自不同的角度。这可以打破模糊性，改善问题的条件，并最终产生一个更清晰、更可靠、伪影更少的图像 [@problem_-id:3606456]。LSM Hessian 算子的非对角块现在代表了不同类型事件之间的“串扰”，而反演的任务就是解开这种串扰，以正确地放置能量。这是视角上的一个深刻转变：问题本身成为了解决方案的一部分。

将这种物理方法推向极致，我们可以求助于更先进的理论，如 Marchenko 数据重构。这是一个惊人的数学框架，它使我们能够通过计算来恢复介质内部的波场，就好像复杂的上覆地层及其所有产生多次波的结构都不存在一样。通过使用这些“重构的”格林函数来构建我们的 LSM 正演算子，我们创建了一个本质上没有这些复杂内多次波的模型。这种强大的协同作用可以极大地简化反问题，可能减少对我们之前讨论的稳健统计方法的需求，因为最大的相干建模误差源已经从物理上得到了解决。

先验的艺术：我们认为我们对地球了解什么

反问题就像一个侦探试图用不完整的证据来破案。通常，许多不同的情景（模型）都可以解释现有的线索（数据）。为了找到最可信的答案，侦探会利用关于世界如何运作的先验知识。在 LSM 中，我们做同样的事情。我们通过正则化注入关于地球地质的“先验信息”。

一个强有力的先验知识是，地质在某种意义上通常是“简单的”。例如，许多地质结构是由分隔相对均匀地层的清晰边界定义的。这意味着，仅在这些边界上非零的反射率模型应该是稀疏的。这个想法是现代压缩感知领域的核心，我们可以将其直接构建到 LSM 中。

我们不再仅仅惩罚模型的总能量（吉洪诺夫正则化），而是可以惩罚其非稀疏性的度量，比如 $\ell_1$ 范数。我们可以在不同的变换域中做到这一点，每个变换域都针对一种不同类型的地质简单性。

曲波 (Curvelets)： 反射体通常是连续的、弯曲的特征。曲波变换是一种数学显微镜，非常适合用极少数系数来表示这类对象。通过用模型曲波系数的 $\ell_1$ 范数来正则化我们的 LSM 目标函数，我们鼓励解是由少量平滑、类曲线元素构成的。这在抑制标准偏移可能产生的嘈杂、振荡伪影方面非常有效。
全变分 (Total Variation, TV)： 如果我们相信我们的地质是“块状的”——由分段常数区域组成——我们可以使用全变分（TV）惩罚。这种正则化项惩罚模型梯度的 $\ell_1$ 范数，鼓励解具有平坦的区域和清晰的、阶梯状的边缘。这是直接从图像处理世界引进的，著名地用于 Rudin-Osher-Fatemi（ROF）模型的图像去噪。它在平滑层内噪声的同时，优美地保留了清晰的地质边界。

解决这些稀疏促进问题所需的算法，如 ISTA、ADMM 或原始-对偶方法，在地球物理成像与凸优化和大规模数据科学的前沿之间建立了深刻的联系。

扩展视野：超越简单的反射率

LSM 的框架远比仅仅成像反射率要灵活得多。它是反演物理模型任何参数的通用方法。

有时，最大的误差来源不是数据中的噪声，而是我们对正演模型本身知识的缺陷。例如，我们假设的速度模型可能是错误的，或者我们可能不知道地震震源和检波器的确切方向灵敏度（波束模式）。LSM 的一个强大扩展是进行联合反演，我们不仅求解反射率 $m$ ，还求解这些“辅助”参数。例如，我们可以设置一个目标函数，在对地下成像的同时，校准参数化波束模式的系数。问题变得非线性，但解决它会产生一个物理上更准确的模型和一个更定量的最终图像。

我们还可以利用数据的结构作为一种正则化形式。在地震采集中，我们从许多不同的震源-检波器偏移距记录了同一块地球的响应。如果我们的速度模型是正确的，一个反射体的图像在所有这些“共成像道集”中应该看起来是平坦的并且在同一深度。我们可以将这种运动学一致性原则直接构建到 LSM 目标函数中，增加一个惩罚项来衡量图像在偏移距维度上的方差或“能量团（semblance）”。这鼓励反演找到一个不仅与数据一致，而且在内部也与波传播定律一致的反射率模型，从而推动解向一个更平坦、更连贯的图像发展。

统一的视角

我们的旅程从最小二乘拟合的简单优雅，走向了一幅由相互关联的思想构成的丰富画卷。为了让 LSM 在现实世界中发挥作用，我们借鉴了稳健统计学的工具来驯服异常值，拥抱了复杂的波传播物理学将多次波从噪声转变为信号，并引进了现代信号处理和压缩感知的概念来注入地质真实性。我们已经看到，LSM 框架足够灵活，可以解决的不仅仅是反射率问题，为校准整个物理模型打开了大门。

最终呈现的图景是，这个领域并非孤立存在，而是与广泛的科学和数学学科深度相连。最小二乘偏移的美妙之处不仅在于其基本原理，还在于它能够吸收和统一这些多样化的思想，形成一个单一、强大的框架，以理解我们脚下的世界。