
全波形反演(FWI)代表了地球物理成像的一个高峰,为创建地球地下前所未有详尽的图谱提供了可能。它旨在解决一个艰巨的挑战:从地表记录的完整地震波场中,重建地质结构的高分辨率模型。其核心任务是一个复杂的反问题,我们必须从结果(记录到的声波)推断原因(地下介质属性)。这个过程充满了数学上的困难,很容易导致错误的结果。
本文将带领读者探索 FWI 的复杂世界,全面概述其面临的挑战和精妙的解决方案。第一章 “原理与机制” 深入探讨了问题的核心,解释了为何 FWI 是一个出了名的非凸和不适定的问题,介绍了“周波跳跃”这一棘手难题,并阐述了其基本物理原理。紧接着,“应用与跨学科联系” 一章将探讨用于驾驭这种复杂性的强大工具箱。该章揭示了数值优化、信号处理乃至信息论中的概念是如何被综合起来,以创建出能够成功穿越 FWI 崎岖目标函数曲面、揭示我们脚下清晰世界的稳健算法。
想象一下,你身处一个完全黑暗的房间,中央有一个未知的物体。你不能触摸它,但你有一套可以从不同位置敲响的铃铛。你的任务是仅凭听到的回声,重建出这个物体的完美三维图像。简而言之,这就是全波形反演(FWI)所面临的挑战。地球的地下就是我们所处的黑暗房间,那个物体就是其复杂的地质结构(如盐丘或油气藏),而“铃铛”则是我们在地表激发的震源。“回声”则是由一系列麦克风(即检波器)记录下来的地震波。
我们的目标是创建一个地下介质模型,我们称之为 。这个模型是物理属性的分布图,其中最重要的是地震波的传播速度。物理学以波动方程的形式,为我们提供了一个“正演算子”,我们可以称之为函数 。这个算子接收任何一个假设的模型 ,并预测该模型将产生的地震数据(即回声):。我们在这个反问题中的任务,就是通过比较预测数据 与实际观测数据 ,来找出真实模型 。
我们如何找到最佳模型呢?我们需要一种方法来衡量当前猜测的“错误”程度。最自然的方式是计算预测回声与真实回声之间的差异。我们将残差函数(或称目标函数)定义为这些差异在所有时间和所有接收点上的平方和:
这个函数 给我们一个单一的数值,量化了我们的模型 的“糟糕”程度。一个完美的模型将得到 。我们的任务现在就成了一个优化问题:找到使 最小化的模型 。
为了将其可视化,想象一个广阔的“地形图”,其中每个可能的模型 都在地面上有一个位置,而目标函数 的值是该位置的海拔高度。我们的任务就是找到这整个地形图上的最低点——即全局最小值。
对于一些更简单的地球物理问题,这个地形图是一个漂亮、光滑的碗状。当正演算子 是线性(或近似线性)的,并且我们对模型施加一个简单的平滑惩罚时,情况就是如此。这样的地形图被称为凸的 (convex)。找到碗底轻而易举:只需在斜坡上的任何地方释放一个球,它就会径直滚向唯一的全局最小值。
然而,FWI 的目标函数地形图完全不像一个简单的碗。由波动方程控制的波传播物理过程,使得从模型 到数据 的映射具有强烈的非线性。这种非线性将我们美丽的碗状地形扭曲成一个险峻的山脉,布满了无数的峡谷、陷阱和假谷底。这是一个非凸 (non-convex) 的地形图,在一片局部极小值的海洋中找到真正的全局最小值是一项巨大的挑战。
为什么 FWI 的目标函数地形图如此崎岖?原因在于波的本质:它们是振荡的。让我们将问题简化到其最本质的形式。想象一下,我们的观测信号是一个简单的正弦波,,而我们从模型得到的预测信号是同一个正弦波,但在时间上移动了 ,。我们想要寻找的模型参数就是这个时间偏移 。
在这个玩具问题中,目标函数 的形式非常简单:
其中 只是一个与信号长度相关的常数。函数 呈现出优美的波浪形状。当 时,它达到绝对最小值零,这正是我们的正确答案。然而,每当 是 的整数倍时,即时间偏移 是波的周期 的整数倍时,它也会出现相同的极小值。
FWI 的“恶魔”就潜藏于此:周波跳跃 (cycle skipping)。如果我们对时间偏移的初始猜测偏差超过半个周期,一个简单的优化算法(只沿着斜坡向下走)就会轻易地陷入最近的“山谷”。它找到了一个局部极小值,但却是错误的。算法将预测波形的第一个波谷与观测波形的第二个波谷匹配,或者将第三个与第四个匹配。它“跳过”了一个周期。
这个简单的例子给了我们一个 FWI 的关键经验法则:为了有希望收敛到正确答案,我们的初始模型必须足够准确,以使其产生的走时误差小于数据中最高频率()的半个周期。也就是说,我们必须满足 。这是一个非常严格的条件,也解释了为什么一个好的初始模型至关重要。
仿佛一个充满陷阱的地形图还不够,FWI 问题还受到一个更深层、更根本的困难所困扰。这就是数学家所称的不适定问题 (ill-posed problem)。一个问题如果满足解存在、唯一且连续依赖于数据(意味着数据中的微小噪声只会导致解的微小误差),则被称为“适定的”。FWI 在这三个方面都存在问题。
解不存在的诅咒: 我们的地球数学模型永远只是一个近似,而我们记录的数据总是被噪声污染。这意味着我们的观测数据 几乎肯定不在我们完美的、无噪声的正演算子 的值域内。很可能没有任何模型 能够完美地再现我们的观测结果。我们寻找的东西甚至可能不存在。
解不唯一的诅咒: 在真实的地震勘探中,我们只能在有限的区域(例如地表)放置震源和接收器,而且我们的震源频率范围有限。这意味着地下某些部分可能照明不足,或者某些类型的地质特征可能产生我们无法记录到的回声。因此,两个截然不同的地质模型完全有可能在我们的接收器上产生几乎相同的数据。这就是问题的非唯一性。这就像只从一个角度看物体的影子,就想识别整个物体一样。
解不稳定的诅咒: 波传播的物理过程是一个平滑过程。当波穿过地球时,尖锐的细节会被模糊掉。FWI 试图做相反的事情:从模糊、平滑的数据中重建原始模型的清晰细节。这种“去平滑”本质上是一个不稳定的过程。想想看,这就像试图把炒熟的鸡蛋复原。数据中一个微小的扰动——一丝噪声——都可能被剧烈放大,导致重建出的模型完全错误且毫无意义。从数学上讲,对物理过程求逆的算子是无界的,这是不稳定性的一个标志。
面对一个非凸、不适定的问题,我们如何才能成功呢?解决方案需要两个神来之笔:一个用于高效地在目标函数地形图上导航,另一个用于简化地形图本身。
为了在我们的目标函数地形图上导航,我们需要知道从任何给定点出发,哪个方向是“下坡”。这意味着我们需要计算目标函数的梯度 。考虑到波动方程的复杂性,这似乎是一项计算上不可能完成的任务。
伴随状态法提供了一个极其优雅且高效的解决方案。它分两步进行:
首先,对于给定的模型 ,我们计算正传波场()。这是一个标准的模拟过程,我们在模型地球中引爆一个震源,让波在时间上正向传播。
接下来,我们比较接收器上的预测数据和观测数据。其差值为“残差”。然后,我们将这些残差作为新的震源,放置在接收器位置,再次运行波动模拟,但这次是沿时间反向传播。这会产生伴随波场()。
当我们将这两个场结合起来时,奇迹就发生了。目标函数的梯度——即最速下降方向——由正传场的二阶时间导数与伴随场的互相关给出:
这个非凡的公式精确地告诉我们如何在每个点 处更新我们的模型以减小残差。它源于一种被称为玻恩近似 (Born approximation) 的物理过程线性化,该近似假设波与模型微小变化之间的相互作用只发生一次。有了这个强大的工具,我们就可以在目标函数地形图的任何位置高效地计算出“下坡”方向。
即使有了能指向下坡的指南针,我们仍然很可能被困在某个局部的山谷里。解决方案是不要试图一次性征服所有崎岖的山峰,而是先简化地形图。
关键的洞见在于,地形图的崎岖程度取决于频率。高频波波长短,振荡迅速,会产生一个具有许多密集局部极小值的目标函数。而具有长波长的低频波,则会产生一个平滑得多的地形图,其山谷宽阔而平缓。
这启发了一种多尺度策略,通常称为频率延拓:
从低频开始: 我们仅使用数据中存在的最低频率开始反演。相应的目标函数地形图是平滑的,全局最小值周围的吸引盆巨大,周波跳跃的风险很低。这使我们能够找到一个粗糙、模糊但在运动学上正确的地下版本。
走向高频: 然后,我们将这个模糊的模型作为新一轮反演的起点,这次反演包含了稍高的频率。因为我们现在是从正确的吸引盆内部开始的,我们的局部优化算法可以安全地找到更精细的解。增加频率扩大了我们能够解析的空间波数范围,从而有效地改善了解的唯一性。
我们重复这个过程,逐步引入越来越高的频率,每一次都对模型进行提炼并增加更多细节。这就像一位画家,在细致地添加精细的纹理和阴影之前,首先勾勒出肖像的粗略轮廓。这种同伦方法小心翼翼地引导解从一个简单、性质良好的问题过渡到完整的、复杂的问题,成功地穿越险峻的地形,找到梦寐以求的全局最小值。
然而,天下没有免费的午餐。低频波对模型细节不那么敏感,使得反演问题更加不适定(雅可比矩阵的 缩放意味着小扰动产生的信号非常微弱)。高频波提供了我们渴望的分辨率,但它们缩小了吸引盆,并且对噪声和我们实验几何的局限性高度敏感 [@problem_id:3618864, @problem_id:3612240]。FWI 的艺术和科学就在于巧妙地平衡这些权衡,将一个不可能的问题转化为一个可解的问题,并揭示出我们脚下世界惊人清晰的图像。
在了解了全波形反演的基本原理之后,我们现在来到了探索中最激动人心的部分。在这里,我们将看到这项卓越的技术并非一座孤立的科学孤岛,而是一个繁华的都市,一个物理学、数学和计算机科学交汇、融合并创造出远超其各部分之和的强大力量的充满活力的十字路口。对地球内部进行成像的追求,迫使我们从一系列令人眼花缭乱的学科中借鉴、改造甚至发明深奥的思想。要真正欣赏 FWI,就要欣赏这种宏大的综合。
从本质上讲,全波形反演是一个搜索过程——寻找那个能够最好地解释我们记录的地震数据的地球模型。想象一个广阔、无形的地形,其中每一点代表一个可能的地球模型,该点的海拔代表“残差”,即该模型的预测数据与我们真实观测数据匹配的糟糕程度。我们的目标是找到这片地形中的最低点,即对应于真实地球的山谷。这是一个经典的优化问题。
但这片“风景”并非平缓的田园。FWI 的目标函数地形图是出了名的险恶,如同一个崎岖的山脉,充满了无数的峡谷、山脊和假山谷(数学家称之为局部极小值)。如果我们简单地决定总是沿着最陡的下坡方向走——一种称为梯度下降法的方法——我们几乎肯定会陷入附近的一个小沟壑中,并误以为它就是我们所寻求的宏伟山谷。
那么,我们如何在这片地形中导航呢?我们需要一种更复杂的策略。我们不仅要决定迈出一步,还必须决定要迈多远。步子太小效率低下;步子太大则可能越过山谷,落到对面更高的山坡上。选择这个步长的艺术被称为“线搜索”。像回溯法这样的简单策略,即我们尝试迈出一大步,如果它没有导致残差的充分下降,就系统地缩短步长,构成了这门艺术的基础。但要进行一次真正稳健的寻优旅程,我们需要依赖一对被称为 Wolfe 条件的优美约束。这些条件就像我们的向导,确保我们迈出的每一步都有意义的进展。第一个条件保证了我们的目标函数有足够的下降,防止我们采取过长的步子。第二个更微妙的条件关注地形的斜率,确保我们的步长足够长,以使我们进入一个曲率更平缓的区域。这就像确保我们不会停在陡峭的悬崖边,而是前进到一个更平坦的休息点,这为我们的下一步行动提供了更多信息。
这引出了一个更深层次的想法。在一个漫长而曲折的峡谷中,一个只指向下坡方向(梯度)的简单罗盘是不够的。我们会不断地在两壁之间来回曲折前进。我们真正需要的是对山谷形状或曲率的感觉。这就是所谓的“二阶”优化方法的领域。终极工具将是牛顿法,它使用地形的精确曲率(编码在一个称为海森矩阵的数学对象中),直接指向局部山谷的底部。然而,对于像 FWI 这样拥有数百万甚至数十亿模型参数的庞大问题,计算和存储这个海森矩阵在计算上是不可能的。这就像试图绘制山脉中的每一块卵石。
这正是像著名的 L-BFGS 算法这类拟牛顿法的精妙之处。L-BFGS 并不试图绘制整个地形图。相反,它建立了一个关于其近期旅程的“记忆”——它所走的步子以及下坡斜率在此过程中的变化。根据这段有限的历史,它构建了一个地形曲率的近似图像。与没有记忆的更简单方法(如非线性共轭梯度法)相比,这使得它能够采取更智能、更直接的步骤走向最小值。更值得注意的是,我们可以采用源于伴随状态法的深奥计算技术,这些技术使我们能够计算真实海森矩阵在任何我们选择的方向上的作用,而无需真正构建那个庞大的矩阵本身。这在数学上等同于能够感知脚下任何方向地面的曲率,从而在没有完整地图的情况下完美地感知局部地形。这些从数值优化世界借鉴而来的强大思想,构成了现代 FWI 的核心引擎。
优化引擎需要处理对象:残差。但我们应该如何衡量两个波形之间的差异呢?最显而易见的方法是逐点比较它们的时间序列,并将差异的平方相加。这就是经典的 $L_2$ 残差。但这种简单的方法隐藏着一个被称为“周波跳跃”的恶魔陷阱。如果我们的初始模型很差,我们的预测波可能会比真实波晚一个完整的波长或“周期”到达。逐点比较可能会看到一个波峰与另一个波峰对齐,并报告一个很小的残差,从而引导优化算法认为它接近正确答案,而实际上它错得离谱。
解决方案既优雅又直观:不要试图一次看清所有细节。这就是多尺度反演的精髓。我们首先对数据进行滤波,只保留最低的频率——那些波长长、变化缓慢的波。这些波不太容易发生周波跳跃,使我们能够恢复地球模型的大尺度、“模糊”特征。一旦我们有了这个粗略的图像,我们再逐步引入越来越高的频率,使地下的精细细节逐渐清晰。这个过程与多重网格法(一种用于求解偏微分方程的强大数值分析技术)有着优美而直接的类比,在多重网格法中,问题在粗细不一的网格层次上被求解,以高效地消除所有尺度上的误差。
但我们可以更聪明。逐点比较的残差在思维上是“局部的”。如果我们采用更“全局”的视角会怎样?这时,一个名为最优输运理论的深奥而优美的数学分支向我们伸出了援手。我们不再问“在每个时间点上,波形有多大不同?”,而是问“将一个波形的能量分布变换成另一个波形的能量分布,所需的最小‘努力’是多少?”这种“努力”由 Wasserstein 距离来量化。基于此距离的残差函数要智能得多;它关心波能量的整体形状和位置。对于简单的时间偏移,Wasserstein 距离的平方随偏移量呈二次方增长,形成一个光滑的、碗状的山谷,直接导向正确答案,完全避免了 $L_2$ 范数的周波跳跃陷阱。这种从简单差异到衡量输运努力的视角转变,将 FWI 与现代数学和统计学的前沿联系起来。
我们甚至可以定制我们的残差函数来应对特定挑战。例如,由于震源或检波器附近的效应,地震波的精确强度或振幅可能难以完美建模。而波的到达时间或相位通常更可靠。我们可以设计一个只关注预测数据和观测数据之间相位差的残差函数,使我们的反演对这些讨厌的振幅误差具有鲁棒性。这展示了底层变分框架令人难以置信的灵活性,使我们能够量身定制我们向数据提出的问题。
即使拥有最复杂的数学引擎,FWI 仍然面临着巨大的计算障碍。一个实际的三维勘探可能涉及数千个炮点位置,而反演的每一步都需要为每一个炮点进行一次完整的波场模拟。其成本可能是天文数字。
为了驯服这只计算“野兽”,我们转向了随机算法和统计学的世界。与其一次模拟一个炮点,不如将它们全部同时激发?结果将是一片混乱的、相互干涉的波场。但是,如果在激发它们之前,我们为每个炮点分配一个独特的、随机的“编码”——例如,通过随时间巧妙地调制其相位呢?然后我们可以记录下由这一个“超级炮”模拟产生的单一、混乱的地震记录。之后,我们利用对这些秘密编码的了解,在数学上“解开”这个混乱的结果,并恢复出梯度的估计值。这种震源编码技术带来了巨大的计算加速。我们用少量可控的统计噪声换取了几个数量级的运行时间缩减,将一个棘手的问题变成了一个可行的问题。
最后,我们必须承认我们并非在真空中工作。我们通常对地下介质有先验的地质知识。我们可能期望看到清晰、分明的层状结构,而不是平滑变化的属性。我们如何将这种期望“教给”我们的算法?这就是正则化的作用,这是一个从统计学和机器学习中借鉴的概念。通过在我们的目标函数中添加一个特殊的惩罚项,我们可以引导解朝着符合我们先验信念的模型发展。一个特别强大的选择是 范数,它能促进“稀疏性”——即模型由少数简单的、块状的特征组成。这项技术是压缩感知革命的核心,它通过一个称为近端算子的优雅数学工具得以实现,该算子就像一个“收缩”或“阈值”函数,将小的模型特征推向零,同时保留大的、重要的特征。
从数值优化的核心到最优输运的前沿,从信号处理的实用性到统计正则化的智慧,全波形反演是科学统一性的一个明证。在这个领域,抽象的数学之美找到了一个强大而具体的目标:照亮我们脚下那个黑暗、沉寂的世界。这段旅程远未结束,但拥有如此丰富的工具集,未来的发现前景无疑是光明的。