try ai
科普
编辑
分享
反馈
  • 地震反演

地震反演

SciencePedia玻尔百科
核心要点
  • 地震反演旨在绘制地球的地下结构,但它本质上是一个不适定问题,有限的数据会导致无限多种可能的解。
  • 正则化技术引入了先验假设,如模型的简单性或平滑性,以选择一个唯一且地质上合理的解。
  • 像全波形反演(FWI)这样的先进方法使用全波动方程和伴随状态法,从低频开始迭代地优化模型。
  • 成功的反演需要巨大的计算能力和复杂的数值算法来处理数十亿个参数和太字节(TB)级别的数据。
  • 地震反演的结果提供了定量的物理属性图,这些图为地球动力学和岩石物理学等其他领域提供了关键数据。

引言

地震反演是一门将来自地球内部的微弱回声转化为其隐藏地质的详细地图的科学。这类似于仅通过聆听掌声在复杂建筑大厅中的回响来推断整个建筑的布局。这一过程是现代地球物理学的核心,它解决了反问题的根本挑战:我们如何从间接和不完美的测量中推断出系统的属性?这项任务远非简单,因为我们收集的数据往往不足以产生唯一的答案,从而创造了一个有无限多种可能解的谜题。

本文将探讨这项强大技术的理论基础和实际应用。在“原理与机制”一章中,我们将剖析地震反演的数学核心,探索正演问题和反问题、不适定性这个“反派”以及正则化提供的巧妙解决方案。我们还将揭示全波形反演及其伴随状态法的优雅之处。随后,“应用与跨学科联系”一章将展示地震反演的实际应用,揭示它如何被用于描绘从整个地幔到潜在油气藏的一切事物,以及其核心思想如何与更广泛的计算科学领域相联系。

原理与机制

想象一下,你正试图弄清楚一个完全黑暗、复杂的建筑的布局,但你所能做的只是站在外面,拍拍手,然后听回声。你听到的回声是你的数据。建筑的布局——墙壁、家具、材料——是你想要发现的模型。简而言之,这就是地震反演的挑战:我们聆听地球的回声来绘制其看不见的内部。但是,我们如何将这些回声变成一幅图画呢?从声波到详细地质图的旅程,是物理学、数学和一些巧妙侦探工作的集大成之作。

十亿像素的图像:正演问题

首先,我们需要一种语言来连接我们的模型和数据。让我们简化一下。与其将地球看作一个连续、无限复杂的整体,我们可以想象将其划分为一个由小方块组成的网格,就像数字图像中的像素一样。对于每个方块,我们都想知道一个属性,例如它的​​慢度​​——地震波行进一公里所需的时间。所有这些未知慢度值的集合构成了我们的模型向量,我们称之为 m\mathbf{m}m。

现在,如果我们知道每个方块的慢度,我们就可以预测我们的测量值会是什么。这被称为​​正演问题​​。例如,如果我们追踪一条从震源到接收器的地震波(一条“射线”),它的总走时就是它在所经过的每个方块中花费的时间之和。在方块 jjj 中花费的时间是穿过该方块的路径长度 GijG_{ij}Gij​ 乘以其慢度 mjm_jmj​。对所有方块求和,射线 iii 的总走时,我们称之为 did_idi​,是:

di=Gi1m1+Gi2m2+…d_i = G_{i1}m_1 + G_{i2}m_2 + \dotsdi​=Gi1​m1​+Gi2​m2​+…

如果我们有许多来自不同震源-接收器对的此类测量,我们可以使用优雅的线性代数语言一次性写出它们之间的关系:

d=Gm\mathbf{d} = G \mathbf{m}d=Gm

这里,d\mathbf{d}d 是我们所有走时测量的向量,m\mathbf{m}m 是我们地球模型中所有未知慢度值的向量,而 GGG 是宏伟的​​正演算子​​。这个矩阵包含了我们实验的所有几何信息——它是将地球结构(m\mathbf{m}m)转化为我们可以测量的数据(d\mathbf{d}d)的蓝图。这似乎很简单!为了找到地球模型 m\mathbf{m}m,我们难道不能直接“求逆”矩阵 GGG 并计算 m=G−1d\mathbf{m} = G^{-1}\mathbf{d}m=G−1d 吗?

幽灵的困扰:为何反演如此困难

唉,大自然并没有那么合作。问题在于,我们现实世界中的实验几乎总是不完美的,这使得矩阵 GGG 极难求逆。这种困难就是数学家所说的​​不适定性​​,它是我们故事中的核心反派。它源于一个简单而实际的真相:我们无法看到一切。

想象一下,你试图通过让两个人沿着几乎相同、平行的路径穿过两个相邻的房间来区分它们的属性。你收到的报告将几乎完全相同。如果出现了延迟,是由第一个房间里的东西引起的,还是第二个?这几乎无法判断。你的测量是冗余的。在地震层析成像中,这种情况时常发生。由于震源和接收器的位置有限,我们的许多地震射线都沿着相似的路径传播。这使得我们的矩阵 GGG 的列几乎相同,或者更正式地说,几乎是线性相关的。一个列几乎相关的矩阵被称为​​病态​​矩阵。它正处于完全不可逆的边缘。试图对其求逆就像试图将铅笔立在笔尖上;最微小的风吹草动——我们数据中的少量噪声——都可能导致解飞向一个完全无稽的结果。

其物理后果甚至更为引人入胜。它意味着存在一个​​零空间​​——一组我们的实验完全看不见的地球中的“幽灵”模式。根据定义,零空间中的模式在我们的接收器上产生的信号为零。你可以将这些幽灵模式中的任何一个添加到提议的地球模型中,新模型仍然会预测完全相同的数据!。这意味着不存在唯一的解;存在无限多个解,所有这些解都能完美地解释我们的测量结果。单凭数据是不足够的。

合理猜测的艺术:用正则化驯服反演

我们如何击败这些幽灵并找到唯一的真实模型?我们无法从数据中获取更多信息,所以我们必须自己添加信息。我们必须提供一些先验信息——一个关于地球应该是什么样子的合理猜测。这个过程被称为​​正则化​​,它是一门做出有根据的猜测的艺术。

最简单的猜测是,在所有符合我们数据的无限解中,“最简单”的那个可能是最好的。我们可以将“最简单”定义为在某种意义上“最小”的模型。这引出了一种称为​​吉洪诺夫正则化​​的技术。我们不再仅仅试图最小化数据残差 ∥Gm−d∥22\|G \mathbf{m} - \mathbf{d}\|_2^2∥Gm−d∥22​,而是添加一个惩罚项来抑制我们模型中的大值。我们现在寻求最小化一个组合目标:

J(m)=∥Gm−d∥22+λ2∥m∥22J(\mathbf{m}) = \|G \mathbf{m} - \mathbf{d}\|_2^2 + \lambda^2 \|\mathbf{m}\|_2^2J(m)=∥Gm−d∥22​+λ2∥m∥22​

第二项 λ2∥m∥22\lambda^2 \|\mathbf{m}\|_2^2λ2∥m∥22​ 是我们的惩罚项。它表示,“拟合数据,但要保持你的模型参数小。” 正则化参数 λ\lambdaλ 是一个我们可以调节的旋钮。一个小的 λ\lambdaλ 更相信数据,而一个大的 λ\lambdaλ 则强制一个更小、“更简单”的模型。这一个简单的添加创造了奇迹:它稳定了问题,并保证即使在原始问题毫无希望地不适定时,我们也能找到一个唯一、稳定的解。

我们可以变得更复杂。与其假设地球模型是“小”的,我们可以假设它大部分是“平滑”的。毕竟,地质属性通常不会从一点到下一点发生剧烈变化。我们可以通过改变我们的惩罚项来构建这个假设。与其惩罚模型的大小 ∥m∥22\|\mathbf{m}\|_2^2∥m∥22​,我们可以惩罚其梯度(它变化的速度)的大小,即 ∥∇m∥22\|\nabla \mathbf{m}\|_2^2∥∇m∥22​。这鼓励了平滑的解,过滤掉噪声和振荡伪影。

但地质并非总是平滑的。它通常由具有清晰边界的不同层组成。我们能找到看起来像那样的解吗?可以!这需要一个微妙但强大的改变。我们不再使用标准的平方 L2L_2L2​-范数 ∥⋅∥22\|\cdot\|_2^2∥⋅∥22​ 作为我们的惩罚项,而是使用 L1L_1L1​-范数 ∥⋅∥1\|\cdot\|_1∥⋅∥1​。目标函数变为:

J1(m)=12∥Gm−d∥22+λ∥Dm∥1J_1(\mathbf{m}) = \frac{1}{2}\|G \mathbf{m} - \mathbf{d}\|_2^2 + \lambda \|D \mathbf{m}\|_1J1​(m)=21​∥Gm−d∥22​+λ∥Dm∥1​

其中 DmD\mathbf{m}Dm 代表模型的离散梯度。L1L_1L1​-范数有一个看似神奇的特性:它促进​​稀疏性​​,意味着它喜欢许多分量恰好为零的解。当我们将它应用于梯度时,它会找到一个梯度几乎处处为零的模型。零梯度意味着模型是常数。结果是一个​​分段常数​​或“块状”的解,在平坦区域之间有急剧的跳跃——这是沉积层的完美写照!。

我们甚至可以将这种思想应用于数据本身。如果我们的测量被偶尔的“尖峰”噪声污染——比如来自雷击或故障传感器——标准的平方 L2L_2L2​ 残差会过度反应,不惜一切代价试图拟合这个坏数据点。但是如果我们使用 L1L_1L1​ 残差 ∥d−Gm∥1\|\mathbf{d} - G\mathbf{m}\|_1∥d−Gm∥1​,那个异常值的惩罚只会线性增长,而不是二次方。反演变得更加稳健,有效地学会忽略那些不合理的数据点。

聆听误差的回响:全波形反演

到目前为止,我们主要讨论了简化的物理学。地震成像的前沿是​​全波形反演(FWI)​​,它使用波动方程的完整物理学。在这里,正演问题涉及模拟完整的、复杂的地震波场,因为它在我们提出的地球模型中传播和散射。

FWI的核心问题是找到梯度:我们如何更新我们的模型以更好地拟合数据?答案源于​​伴随状态法​​,是计算物理学中最优美的概念之一。

这个过程分三步展开:

  1. ​​正演步骤​​:通过你当前最佳猜测的模型 m\mathbf{m}m,模拟从震源发出的波的传播,以在你的接收器处产生合成地震记录 dsyn\mathbf{d}_{\text{syn}}dsyn​。

  2. ​​计算误差​​:将你的合成数据与真实的、观测到的数据 dobs\mathbf{d}_{\text{obs}}dobs​ 进行比较,以找到残差或误差信号:r=dsyn−dobs\mathbf{r} = \mathbf{d}_{\text{syn}} - \mathbf{d}_{\text{obs}}r=dsyn​−dobs​。

  3. ​​伴随步骤​​:现在是见证奇迹的时刻。取你的误差信号,​​将其时间反转​​,并从接收器位置将其反向传播回模型中。想象一下,接收器现在是扬声器,正在倒着播放误差记录。这会产生一个新的波场,即“伴随场”,它在时间上向后传播。

这个伴随场是一个“误差回声”。它沿着原始波所走的路径返回,并且奇迹般地,它将其能量精确地集中在模型中不正确的部分——也就是最初导致误差的地方。

最终的梯度——告诉你如何更新模型的地图——是通过将这个向后传播的误差场与原始向前传播的波场进行互相关而形成的。高相关性的区域就是最需要改变的区域。当残差为零时,伴随场为零,梯度为零,你就找到了一个完美解释数据的模型。这是一种惊人优雅的方式,利用波动方程的时间可逆性,让误差告诉你它们究竟来自何方。

从一组简单的线性方程到正演波和伴随波的优美舞蹈,地震反演是一场解决根本性不适定问题的探索。通过巧妙地将物理定律与数学正则化相结合,我们可以将微弱、嘈杂的回声变成我们脚下世界惊人详细的图景。

应用与跨学科联系

现在我们已经探索了地震反演的原理,让我们踏上一段旅程,看看这门非凡的科学在实践中的应用。我们已经确定,反演是一门从观测到的效应推断其隐藏原因的艺术。对于地球物理学家来说,“效应”是地震图上的弯曲线条,是地震或受控爆炸在地球中传播后留下的微弱回声。而“原因”则是地球内部错综复杂的三维地图。但是,我们究竟如何将这些微弱的低语转化为详细的地质图集呢?答案不是一颗神奇的子弹,而是一曲由统计学、计算机科学、数学和物理学思想谱写的美丽交响乐。这正是地震反演真正力量和优雅之所在——在于它与更广阔的科学思想世界的联系。

看见不可见之物的艺术:层析成像实践

想象一下,你试图通过只聆听低语和回声在其中如何反弹来理解一座巨大而复杂的大教堂的结构。每一次回声都是一个微小的线索,但单独来看,它是模糊的,并被其他声音所混淆。这正是地震层析成像面临的挑战。一条从地震源传播到地震检波器的地震射线给了我们总走时的测量值,但这对于其路径上任何一个单点的信息都知之甚少。更糟糕的是,测量值不可避免地被无数来源的噪声所污染。我们如何能从如此脆弱的证据中构建一幅可靠的图像呢?

答案在于一个在统计学和地球物理学中同样强大的概念:大数定律。虽然一次测量是不可靠的,但许多独立测量的平均值却可以惊人地精确。全球地震学将这一思想铭记于心。地球被一张由数百万次地震、数千个台站数十年记录下来的地震射线组成的密集网络所覆盖。对于地幔的任何给定一块——我们3D模型中的一个“体素”——我们可能有成千上万条射线穿过它,每条射线都携带一个略有不同、带有噪声的属性测量值。通过对这众多射线的信息进行平均,随机噪声相互抵消,一个关于该体素内真实地震速度的清晰、稳定的估计便浮现出来。就像一张数码照片是由数百万像素构成一样,一幅地球的层析图像也是通过从海量的地震数据中逐个体素地精心构建而成。这证明了收集和组合大量不完美线索以揭示隐藏真相的力量。

反演引擎:优化之旅

所以,我们有了数据。但我们实际上如何创建这张地图呢?这个过程不是直接计算,而是一段引导性的发现之旅——这个过程在数学中被称为优化。我们几乎从不预先知道答案,所以我们从一个猜测开始。我们对地球的第一个模型可能简单得可笑:一个完全均匀的球体。然后,我们利用物理定律来计算,如果地球如此简单,地震数据应该是什么样子。我们将这些合成数据与我们的真实记录进行比较。它们不会匹配。这种不匹配,或称“残差”,是至关重要的信息。正是这个误差信号告诉我们如何改进我们的模型。

将我们地图的质量想象成一个广阔的高维景观,其中任何一点的海拔都代表了合成数据和真实数据之间的不匹配程度。我们的目标是找到这个景观中的最低点——那个能最好地解释我们观测结果的模型。反演的艺术就是驾驭这个景观的艺术。利用微积分,我们可以计算出景观的梯度,它指向最陡峭的上升方向。要下山,我们只需朝着相反的方向迈出一步。我们稍微更新一下我们的地球模型,计算新的不匹配度,然后重复这个过程。每一步都让我们更接近山谷的底部,我们的模型也变得越来越能忠实地代表真实的地球。这种迭代优化,被称为基于梯度的优化,是驱动大多数现代反问题的引擎,从医学成像到机器学习。

当然,为了进行这些计算,我们对地球的模型必须以计算机能够理解的方式来描述。我们无法存储无限数量的点。相反,我们通常使用一组数学构建块来定义地球的属性,比如地震速度。例如,我们可能使用一组平滑的多项式来局部表示速度场,这使我们能够有效地追踪地震射线穿过我们的模型并计算必要的梯度。这是与数学领域中的逼近理论的美妙连接,提醒我们即使我们对地球的“图像”,其核心也是复杂的数学构造。

挑战的规模:超级计算机与高等数学

这段迭代之旅听起来很直接,但问题的规模之大令人难以置信。一个高分辨率的地球地壳模型可能被划分为数十亿个体素。数据集可能包含来自数千次地震炮点的太字节(TB)级别的记录。我们必须驾驭的“不匹配景观”拥有数十亿个维度。

在我们优化之旅的每一步,我们都必须执行惊人数量的计算。构建计算下一步所需的矩阵和向量所涉及的操作,其成本会随着模型参数数量(NNN)和数据点数量(MMM)的增加而惊人地增长。在许多常见的公式中,单次迭代的计算成本大约与 K(2MN2+13N3)K(2MN^2 + \frac{1}{3}N^3)K(2MN2+31​N3) 成比例,这是一个可怕的多项式,清楚地说明了为什么地震反演是世界上最大的超级计算机的工作。一次为石油和天然气勘探生成一张详细图像的反演,可能会在一个大型计算机集群上消耗数月的处理时间。

这种巨大的计算负担意味着蛮力是行不通的。我们需要巧妙的方法。现代反演中的一个关键步骤是求解波动方程本身:波在我们当前的地球模型中实际上是如何传播的?这转化为求解一个巨大的线性方程组。对于一个真实模型,代表这个系统的矩阵大到甚至无法存储在计算机内存中,更不用说直接求逆了。在这里,我们转向了现代数值线性代数的优雅世界。我们不直接处理矩阵,而是使用迭代的“克雷洛夫子空间(Krylov subspace)”方法,通过生成一系列近似解来巧妙地找到解决方案,这只需要知道矩阵如何作用于一个向量。这就像通过探测并观察其响应来了解一个复杂机器的属性,而不是拆开它。这些将地球物理学与计算数学前沿联系起来的算法,正是使大规模反演成为可能的关键。

宏大策略:从模糊斑块到清晰图像

也许地震反演中最大的挑战是一种称为非线性的特性。我们的不匹配景观不是一个只有一个最低点的简单碗状。它是一个崎岖、险峻的地形,布满了无数较小的山谷,即“局部极小值”。如果我们从错误的地方开始搜索,或者过早地使用太多细节,我们几乎肯定会陷入其中一个陷阱,导致最终的地图虽然能较好地拟合数据,但在地质上却是完全错误的。

解决这个深刻问题的方法是计算科学中最优美的策略之一,在地球物理学中被称为全波形反演(FWI)。这个策略很简单:先从问题的简单部分开始。我们仅使用地震数据中的最低频分量——那些长而缓慢的波——来开始我们的反演。这些波对小细节是“盲目”的;它们只能“看到”地球的大尺度、平滑的结构。在我们的景观比喻中,这就像从很高的高度看地形,只有最大的山脉和山谷是可见的。在这个平滑的景观上,很容易找到主盆地。

一旦我们找到了最好的大尺度模型,我们便逐渐向数据中引入更高的频率。每个新的频率都会为景观增添更精细的细节,创造出更多的波纹和更小的山谷。但由于我们已经处于正确的盆地中,我们可以随着真实最小值的细化而跟进,避免陷入附近局部极小值的陷阱。这种“从粗到精”或“从低频到高频”的延拓策略是许多领域中出现的深刻原则。它与数值分析中的多重网格方法直接类似,后者通过在粗细计算网格之间循环来解决难题。这是一个强有力的例证,说明了驾驭复杂性的普适方法:先解决大局,再操心细节。

超越图像:模糊性与发现的物理学

一旦我们有了地图,我们该做什么呢?地震图像不仅仅是一张图片;它是一张物理属性的定量图。最终目标不仅仅是知道地震速度,而是要推断岩石类型、温度以及是否存在水或石油等流体。这要求我们同时反演多个参数:密度(ρ\rhoρ)和描述岩石抗压缩和抗剪切能力的弹性拉梅参数(λ\lambdaλ 和 μ\muμ)。

然而,在这里,我们面临着反演的一个根本限制:模糊性。事实证明,不同的物理属性组合可以产生几乎相同的地震数据。例如,当我们只使用P波(压缩波)且数据仅限于以近垂直角度到达的波时,要区分参数 λ\lambdaλ 的变化和密度 ρ\rhoρ 的变化变得极其困难。从数据的角度来看,这些不同的物理模型位于一个“零空间”中——一个数据无法区分它们的模糊区域。

我们如何解决这个问题?我们必须引入更多的信息,而最强大的信息就是物理学。从实验室实验和理论——即岩石物理学领域——我们知道,对于大多数岩石来说,弹性参数并非独立的。例如,λ\lambdaλ 与 μ\muμ 的比值通常是受约束的。通过将这种物理知识作为一种“正则化”形式构建到我们的反演中,我们增加了一个约束,帮助算法从可能拟合数据的无限多个解中选择最符合物理规律的解。这就是反演超越单纯的曲线拟合,成为一门真正的物理科学的地方,它将数据与基础知识融为一体。

当我们成功时,得到的地图就成为新科学的发射台。地球地幔中地震速度的3D模型,在第一近似下,是一张温度图。地球动力学家有理论预测像地幔这样的对流流体内部的温度应该如何变化。这些理论对温度场的统计特性,如其功率谱,做出了具体的预测。我们可以拿出我们的地震图,将其转换为温度图,并计算其功率谱。它与理论匹配吗?利用强大的贝叶斯推断框架,我们可以严格地用我们的反演结果来检验这些物理理论,估计地幔对流的基本参数,并且同样重要的是,量化我们对这些估计的不确定性。地震模型不再是终点;它已成为地球科学一个完全不同分支的新数据集。

统一原理与知识前沿

地震反演核心的深刻思想——从系统的可观测响应推断其隐藏属性——在许多科学领域中都引起共鸣。这引出了一个引人入胜的问题:一个领域的反演逻辑能否转移到另一个领域?

考虑一个来自截然不同世界的类比:量子化学。著名的密度泛函理论(DFT)的Hohenberg-Kohn定理证明,对于一个电子系统,基态电子密度——一个可观测量——唯一地决定了电子运动于其中的外势。乍一看,这听起来与我们的地球物理问题惊人地相似。我们能否提出,我们从地震数据中推断出的地球质量密度 ρ(r)\rho(\mathbf{r})ρ(r) 唯一地决定了一个“引力-成分势”?

探索这个类比揭示了科学领域之间微妙而深刻的差异。这个类比失败有几个深层次的原因。首先,地球的引力势是由其自身质量自生的,而不是施加于其上的外势,而后者是HK定理的一个关键前提。其次,地球是一个经典的、多组分的系统。与量子情况不同,从密度到成分的映射不是唯一的;许多不同的矿物和流体组合可以产生相同的体密度。思考为什么这个类比会失败是极具启发性的。它加深了我们对支撑我们理论的具体物理假设的理解,并突显了地球物理学的独特挑战:我们研究的是一个复杂的、自引力的、化学成分多样的物体。

从层析成像的统计基础到波形反演的超级计算挑战,从模糊性的物理微妙之处到与其他科学的哲学联系,地震反演是一个极其丰富且充满智慧之美的领域。它是我们探索我们星球内部广阔、隐藏大陆的最强大工具,证明了当我们将微弱的回声与科学推理的全部力量结合起来时,我们所能取得的成就。