try ai
科普
编辑
分享
反馈
  • 数值海洋学

数值海洋学

SciencePedia玻尔百科
核心要点
  • 数值海洋模型利用泰勒级数推导出的有限差分等方法,将连续的物理定律转化为在网格上的离散计算。
  • 关键的物理简化(如布辛涅斯克近似)对于滤除声波等计算成本高昂的现象,同时保留浮力等关键动力学至关重要。
  • 模式必须使用基于物理规律的规则,对未解析的次网格尺度过程(如湍流和摩擦)的影响进行参数化。
  • 数据同化利用伴随模式和优化算法,巧妙地将稀疏的真实世界观测数据与模式物理机制相融合,从而创建出尽可能精确的海洋状态图像。
  • 该领域的未来指向混合模式,其在一个确保基本定律守恒的、稳健的物理框架内,集成机器学习以改进复杂的参数化方案。

引言

模拟海洋是计算科学最宏大的挑战之一:将自然界中错综复杂的流动现实捕捉到计算机的刚性数字世界中。世界海洋是地球气候系统的关键组成部分,但其浩瀚与复杂使其难以观测和预测。这造成了一个巨大的知识鸿沟,只有通过在机器内部创建基于物理的虚拟海洋副本才能弥合。但是,我们如何将支配流体运动的优雅微积分语言,转化为计算机所理解的离散算术呢?

本文阐明了数值海洋学的艺术与科学,探索了从抽象物理定律到鲜活的预测模式的历程。文章探讨了离散化这一根本问题,以及构建一个既计算可行又物理 realistic 的模式所需的巧妙折衷。在接下来的章节中,您将学习让计算机像海洋一样“思考”的基本原理。第一章“原理与机制”深入探讨了核心构建模块:我们如何在网格上表示海洋,如何近似运动定律,以及如何处理这种数字转换中不可避免地产生的误差。随后,“应用与跨学科联系”一章将探讨这些模式如何投入使用、与现实进行比对验证、与观测数据融合,并用于设计海洋科学本身的未来。

原理与机制

构建海洋模拟是一场宏大的翻译之旅。我们必须将自然界无缝流动的现实——由优雅的微积分语言所支配——转录为计算机刚性的离散算术。这不仅仅是转录行为,更是一种融合了深刻物理直觉、巧妙近似和对潜在陷阱时刻警惕的艺术。那么,我们如何教会机器像海洋一样思考呢?

从连续世界到数字海洋

物理定律,如支配热量或盐分运动的平流-扩散方程,是以导数的形式写成的——即在无穷小的时空点上的变化率。然而,计算机对无穷小一无所知。它在一个由离散点组成的网格上运行,就像一张由像素组成的数码照片。首要且最根本的挑战便是弥合这一差距。如果我们只知道几个路标处的高度,我们如何计算一座山的坡度?

答案在于数学中一个优美的工具:​​泰勒级数​​。如果我们知道一个场(比如温度)在单一点 x0x_0x0​ 的属性,泰勒级数使我们能够预测它在邻近点 xxx 的值。它通过累加一系列基于 x0x_0x0​ 处导数的项来实现:值本身、变化率(一阶导数)、变化率的变化率(二阶导数)等等。

在数值模拟中,我们反其道而行之。我们不知道导数,但我们知道相邻网格点上的值。通过排列这些点的泰勒级数展开式,我们可以反解出导数本身。例如,两点之间的温差除以它们之间的距离,就得到了温度梯度(一阶导数)的一个近似值。这就是​​有限差分法​​的核心。其神奇之处在于,通过仔细选择使用哪些点,我们可以推导出我们需要的任何阶导数的近似值。这种近似的精度并非事后才考虑的;它是泰勒级数的直接结果。例如,当我们使用中心差分时,级数中我们忽略的第一个项与 (Δx)2(\Delta x)^2(Δx)2 成正比,其中 Δx\Delta xΔx 是网格间距。这使得局部截断误差为 (Δx)2(\Delta x)^2(Δx)2 阶,从而得到所谓的二阶精度格式。这种用离散近似连续的行為,是所有数值模式赖以建立的基石。

勾勒海洋:网格的艺术

一旦我们知道了如何在网格上计算导数,我们就必须决定网格应该是什么样子。最简单的选择是​​笛卡尔网格​​,一个由具有恒定间距 Δx,Δy,Δz\Delta x, \Delta y, \Delta zΔx,Δy,Δz 的正方形或立方体组成的完美棋盘格。对于理想化问题——例如,在一个矩形盆地中模拟一个环流的形成——这种网格是模拟者的梦想。其几何形状统一,数学处理简洁,计算成本低。

但地球不是一个矩形盒子。它是一个拥有锯齿状大陆和复杂水下山脉的球体。为了捕捉这一现实,海洋学家转向​​正交曲线网格​​。想象一下,拉伸和弯曲一个橡胶网格,使其贴合海岸线和水深测绘的复杂形状。网格线彼此保持垂直,但它们之间的物理距离随位置而变。这使我们能够在感兴趣的区域(如狭窄的沿海水道)使用高分辨率,而在开阔的海洋中使用较粗的分辨率。

这种灵活性是有代价的。在曲线网格上,每个网格单元的体积和每个面的面积不再是恒定的。为了正确计算通量的散度——衡量有多少物质离开一个网格单元——我们必须考虑这些变化的​​度量因子​​。忘记它们不是一个小错误;它是一个灾难性的错误。这违反了一个称为​​几何守恒律 (GCL)​​ 的基本原则,该原则规定数值计算必须尊重几何形状。忽略度量因子就像计算人口密度时不考虑某些街区比其他街区大一样;它会导致虚假的源和汇,无中生有地创造质量,又毫无理由地销毁质量。

全球模式面临一个独特的几何挑战:两极。在标准的经纬度网格上,所有经线都在两极汇合,将网格单元挤压成不可能的细条。这将迫使一个显式模式采取无穷小的时间步长以保持稳定。为了规避这一点,模拟者使用了巧妙的曲线网格,如​​三极网格​​,它将三个“极点”放置在陆地上(例如,在北美、西伯利亚和南极洲),从而使北冰洋没有奇点,并由一个更均匀的网格覆盖。

另外,对于全球问题,人们可以完全放弃网格,使用​​谱方法​​。我们不再用网格点上的值来表示像海面高度这样的场,而是将其表示为一系列平滑的、全球定义的数学函数——​​球谐函数​​的和。这些函数是球体上的自然振动模式,就像正弦波是小提琴弦的自然模式一样。每个函数都有一个特征空间尺度,从行星尺度到非常小的尺度。这种方法的美妙之处在于它完美地适应了球体,没有极点问题,并且可以极其精确地计算导数。

運動定律:近似與優雅

在勾勒出我们的数字海洋之后,我们必须将物理定律注入其中。对于大尺度海洋来说,除了重力之外,最具决定性的影响是地球的自转。这表现为​​科里奥利效应​​。在我们的方程中,这种效应由​​科里奥利参数​​ fff 捕獲。其值 f=2Ωsin⁡ϕf = 2\Omega \sin\phif=2Ωsinϕ 优雅地取决于行星的自转速率 Ω\OmegaΩ 和纬度 ϕ\phiϕ 的正弦值。这个简单的公式讲述了一个深刻的故事:科里奥利效应在赤道处为零(sin⁡(0)=0\sin(0) = 0sin(0)=0),那里的局部垂直方向与地球自转轴垂直;而在两极处最强(sin⁡(±90∘)=±1\sin(\pm 90^\circ) = \pm 1sin(±90∘)=±1),那里的局部垂直方向与自转轴平行。它甚至通过其符号捕捉了两个半球相反的旋转方向。

然而,完整的流体运动方程是笨拙的。它们包含声波,其传播速度约为 1500 m/s1500 \text{ m/s}1500 m/s。为了解析这些波,模式将需要一个荒谬的小时间步长。但对于海洋环流在数天或数年内的演变来说,声波重要吗?对大多数目的而言,不重要。因此,海洋学家做出了一个优美而强大的简化:​​布辛涅斯克近似​​。

诀窍在于:我们承认海洋中的密度变化非常微小,从顶部到底部通常小于百分之几。为了质量守恒的目的,我们决定忽略这些微小的变化,将海洋视为具有恒定的体积。这导致了简单而强大的​​不可压缩条件​​:∇⋅u=0\nabla \cdot \mathbf{u} = 0∇⋅u=0。这个约束表明速度场是无散度的——流入任何一个盒子的水量必须等于流出的水量。这个假设有效地将声速设置为无穷大,滤掉了快速的声波,并允许使用大得多的时间步长。

但这个近似的天才之处在于:虽然我们在考虑体积时忽略了密度变化,但我们却在它们最重要的地方——重力项中——保留了它们。一个微小的密度变化 ρ′\rho'ρ′ 会产生一个浮力 −gρ′/ρ0-g \rho' / \rho_0−gρ′/ρ0​,这正是海洋层化的驱动引擎,导致暖的、淡的水上升,而冷的、咸的水下沉。因此,布辛涅斯克近似是物理推理的杰作:它倒掉了洗澡水(声波),却保留了婴儿(浮力)[@problemid:3813997]。它允许密度演变并驱动运动,即使速度场本身保持体积守恒。

时间的推进:两种格式的故事

在空间中定义了我们的游戏规则后,我们现在必须让它在时间中展开。这是通过​​时间步进格式​​来完成的,这些算法将解从一个时刻推进到下一个时刻。

一种简单、直观且计算成本低廉的方法是​​显式​​格式。​​蛙跳法​​是一个经典的例子。为了找到下一个时间步 (n+1n+1n+1) 的状态,它“跳过”当前步 (nnn),使用前一个时间步 (n−1n-1n−1) 的状态和当前步 (nnn) 的变化率。公式非常简单:yn+1=yn−1+2ΔtF(yn)y^{n+1} = y^{n-1} + 2 \Delta t F(y^n)yn+1=yn−1+2ΔtF(yn)。这种时间上居中的方法使得该格式具有二阶精度——这是一个非常理想的属性。然而,它有其阴暗面。因为它涉及三个时间层次,它在每一步都允许多个解。一个是我們想要的物理真实的解。另一个是虚假的​​计算模态​​,一个机器中的幽灵。这种模态通常表现为在每个时间步都改变符号的振荡,并不断增长,直到污染并摧毁解。这是一个有力的教训,即最简单的路径并不总是最安全的。

为了抑制这种不稳定性,我们可以转向​​隐式​​格式。一个著名且稳健的例子是​​Crank-Nicolson方法​​。它通过平均时间步开始 (nnn) 和结束 (n+1n+1n+1) 时的变化率来近似该时间步内的变化:yn+1=yn+Δt2(F(yn)+F(yn+1))y^{n+1} = y^n + \frac{\Delta t}{2}(F(y^n) + F(y^{n+1}))yn+1=yn+2Δt​(F(yn)+F(yn+1))。请注意,未知的未来状态 yn+1y^{n+1}yn+1 出现在方程的两边。这意味着我们不能直接计算它;我们必须在每个时间步求解一个方程,这在计算上更加昂贵。这项额外工作的回报是巨大的稳定性。对于像扩散这样的问题,这种方法是​​无条件稳定​​(或A稳定)的,意味着无论时间步长有多大,它都不会崩溃。这说明了数值方法中的一个基本权衡:显式格式的速度和简单性与隐式格式的稳定性和稳健性之间的权衡。

定义域:世界的边缘

我们的模式海洋不能存在于真空中;它有边界。我们必须告诉模式在其世界边缘如何行为——在海岸线、海底,以及在它连接到更广阔、看不见的海洋的“开放”边界处。这些指令被称为​​边界条件​​。

三种典型的边界条件在海洋中找到了优美的物理对应物。

  • ​​狄利克雷条件​​指定了边界上一个变量的值。这就像模拟一条河流流入我们的沿海区域;我们知道河流中污染物的浓度,所以我们只需将该部分边界上的浓度设置为已知值,C=CriverC = C_{\text{river}}C=Criver​。
  • ​​诺伊曼条件​​指定了边界上一个变量的梯度。最常见的情况是零梯度条件,对应于无通量边界。对于一个被动示踪剂在不可渗透的墙壁(如海岸线)处,这是自然的选择。由于没有水可以穿过墙壁,示踪剂的总通量必须为零。这意味着其扩散通量必须为零,即 ∂C/∂n=0\partial C/\partial n = 0∂C/∂n=0。
  • ​​罗宾条件​​指定了值与其梯度之间的关系。这听起来可能很抽象,但它代表了诸如与大气进行热交换等物理过程。从海洋流出的热通量与海洋表面温度和空气温度之间的差异成正比。这就产生了一个将温度梯度(通量)与温度值本身联系起来的条件,这是罗宾条件的一个完美例子。

机器中的幽灵:离散化的危险

也许数值模拟最深刻和微妙的方面是,离散化这个行为本身就可以创造出人为的物理现象。即使我们在模式中关闭了所有显式的混合,模式仍然可以混合。这被称为​​伪混合​​。

在真实、稳定分层的海洋中,等密度面(​​isopycnals​​)起着强大的、几乎不可渗透的混合屏障的作用。将稠密的水向上混合或将轻的水向下混合需要大量的能量。在我们理想的连续方程中,一个水团永远不会穿过等密度面。然而,在我们的数值模式中,这种情况时有发生。为什么?

一个罪魁禍首是​​气壓梯度力 (PGF)​​。在使用地形追隨坐标的模式中,PGF被计算为两个大数之间的一个小差值。在陡峭倾斜的地形上,即使在静止的海洋中,微小的离散化误差也会阻止这两个项完美地抵消。这会产生一个虚假的气压梯度,从而驱动虚假的洋流,然后将水输运穿过等密度面——这是一个纯粹的人为混合事件。

另一个来源是平流格式本身。虽然我们力求准确,但大多数格式都具有表现得像扩散项的主阶截断误差。这种​​数值扩散​​会平滑掉尖锐的梯度。虽然这对于稳定性可能是有益的,但这是一个 искусственный过程。当这种数值扩散作用于密度场时,它会驱动密度沿其梯度方向产生通量,而这个方向通常不与等密度面对齐。结果是水跨越密度面的非物理的、虚假的通量——​​伪跨等密度面混合​​。这是一个 humbling 的提醒,我们的数字海洋永远只是一个近似,它的误差可以伪装成物理现象。

参数化:承认未知

最后,我们必须面对一个根本的局限:我们永远无法解析所有事物。海洋在从毫米到数千公里的所有尺度上都是湍流的。我们的网格单元可能有几公里宽。那些单元格内的湍流会发生什么?我们无法模拟它,所以我们必须对其进行​​参数化​​——我们必须用一个基于我们确实知道的大尺度场的简化规则来表示它对已解析流动的净效应。

这就是​​涡粘性与涡扩散率​​概念的由来。我们将未解析的涡旋效应建模为一个扩散过程,其中动量和示踪剂沿着其大尺度梯度被混合。但是这种混合应该有多强呢?物理学告诉我们,这取决于流动的状态。在强分层区域,垂直湍流被抑制。在强垂直切变区域,湍流被产生。

这两种效应之间的斗争被一个单一的无量纲数所捕捉:​​梯度理查森数​​,Rig=N2/(∂zuˉ)2Ri_g = N^2 / (\partial_z \bar{u})^2Rig​=N2/(∂z​uˉ)2。这个数字比较了分层的强度(N2N^2N2,即Brunt-Väisälä频率的平方)与速度切变平方的强度((∂zuˉ)2(\partial_z \bar{u})^2(∂z​uˉ)2)。当 RigRi_gRig​ 很小时,切变获胜,湍流产生。当 RigRi_gRig​ 很大时(通常大于约 0.250.250.25),分层获胜,湍流被抑制。我们的湍流参数化方案必须反映这一点。它们的设计使得涡粘性和涡扩散系数是 RigRi_gRig​ 的函数,当水体变得过于稳定时,自动“调低”混合的旋钮。这不是承认失败,而是对我们自身无知的明智承认,用一个基于物理的、对其效应的近似来取代对未知的完整模拟。

从第一个泰勒展开到最后的湍流闭合,构建一个海洋数值模式是人类智慧的證明。它是连续与离散、精确与近似、已解析与参数化之间的一场精妙舞蹈,揭示了关于模拟本质的奥秘,就像它揭示了关于海洋本身的奥秘一样。

应用与跨学科联系

好了,我们已经掌握了支配海洋之舞的基本原理和方程。但是一套方程,无论多么优雅,都不是一个水晶球。将这些抽象定律转化为一个关于我们世界海洋的、活生生的、可预测的模式本身就是一场冒险——一场物理学、数学和计算机科学的宏伟综合。这就是那段旅程的故事,探索如何使我们的数值模式不仅能工作,而且能优美而真实地工作。这是一个关于巧妙折衷、用冷酷的现实事实 confronting our models以及用它们来设计那些将教会我们更多的仪器的故事。

构建更好的模式:离散化的艺术

海洋是一个复杂得惊人的生物,一幅由旋转的涡旋、壮丽的洋流和错综复杂的海岸线织成的挂毯,所有这一切都在广阔的尺度范围内上演。我们的第一个挑战是在计算机的有限世界中捕捉这种复杂的几何形状。一个简单的、均匀的网格是一种蛮力方法,就像试图用油漆滚筒画一幅杰作一样。它既笨拙又低效。我们必须更聪明。我们必须教会我们的数字画布尊重它旨在代表的物理。

现代建模中最优美的思想之一是“特征对齐”。想象一下,你正试图模拟一个尖锐的海洋锋面,比如墨西哥湾流的边界,那里的温度和速度会突然变化。如果你的网格是一个粗糙的棋盘格,它的单元会粗暴地切碎锋面,而格式固有的数值平均会人为地将其抹平——我们称之为数值扩散的效应。解决方案是设计一个“知道”锋面存在的网格。使用非结构化的三角形网格,我们可以创建长而薄的单元,并使它们的方向与洋流平行。通过将我们网格的结构与流动对齐,我们最小化了虚假的跨流混合,并保持了锋面的锐度。这是一个形式服从功能的深刻例子。

但对于那些不是静态的特征呢?涡旋和细丝诞生、演变并消亡。我们需要一个能够实时反应的网格。这就是​​自适应网格加密 (AMR)​​ 的魔力。想象一下,我们的计算机里有一队勤奋的、微小的制图师。每当有趣的事情开始发生时——比如说,一个涡旋开始从主洋流中分离出来——他们就会冲到那个区域,并即时绘制一张更详细的地图。当活动平息时,他们会收起详细的地图,留下一个更粗糙的表示。这正是AMR所做的,它只在需要的地方和时间覆盖高分辨率的补丁或细化单个网格单元。这是计算效率的巔峰,使我们能够放大转瞬即逝的剧烈活动时刻,而无需承担全球精细网格的无法承受的成本。

世界不是平的,海底也不是。这让我们在选择垂直坐标系时陷入了一个可怕的两难境地。我们可以使用“地形追随”或 σ\sigmaσ-坐标系,它会拉伸和挤压以贴合底部地形。这对于解析大陆架上关键的底部边界层物理现象非常棒。然而,在海底陡峭的地方,这些倾斜的坐标面可能会与模式的数值计算共谋产生幽灵般的洋流,这是一个臭名昭著的“气压梯度误差”,会污染解。另一种选择,一个固定层或 zzz-坐标系,避免了这个问题,但将倾斜的海底表示为一个粗糙的楼梯,搞砸了流-地形相互作用。一个模拟者该怎么办?答案是一个巧妙的折衷:​​混合坐标系​​。这些系统在浅水陆架区域从地形追随坐标平滑地过渡到深层、分层的海洋中干净的水平坐标。这是一个美丽的数值工程杰作,一个体现了两全其美的奇美拉,它诞生于对相互竞争的物理和数值需求的深刻理解。

参数化:未见的科学

即使有了我们巧妙的自适应网格,我们也无法希望能解析所有事物。海洋的能量从全球尺度级联到毫米尺度,最终在那里被粘性耗散。我们的模式,即使是最高精度的,也只能捕捉到这个级联的顶端。那么湍流混合、内波的摇摆、或者一束阳光穿过海冰的旅程呢?我们不能忽略这些“次网格尺度”的过程,因为它们有着深远的集体效应。解决方案是*参数化它们:我们用一个更简单的、近似的规则来取代详细的、无法解析的物理,这个规则捕捉了它对我们模式能*看到的尺度的净效应。

考虑海底对上覆水体施加的摩擦力。这个底部边界层的动力学由摩擦力、气压梯度和地球自转之间的平衡所支配,形成一个称为埃克曼层的结构。这个层可以有几十米厚。然而,产生摩擦力的沙质或粉砂质海床的物理粗糙度是以毫米来衡量的。这里存在巨大的尺度分离。没有任何全球模式可能同时解析边界层的全部厚度和无处不在的海底上的微小凸起。所以,我们做物理学家最擅长的事:我们利用我们对主导物理的理解来弥合差距。我们发展出一个“拖曳定律”,它将未解析的边界层施加的总应力参数化为我们模式可以解析的大尺度流动的函数。这是对我们局限性的承认,但却是极其明智的承认。

同样的哲学延伸到无数其他过程中。想想驱动我们气候系统的阳光,照射在一块北极海冰上。我们会追踪每个光子散射和被吸收的路径吗?当然不会。相反,我们基于像比尔-朗伯衰减定律这样的基本原理创建一个参数化方案 [@problem_t:3789166]。我们可能会将入射辐射建模为两个或多个光谱带——一个在表面附近迅速被吸收,另一个穿透到冰层更深处。这个简单的模型准确地将太阳能分配到被反射的部分、被冰内吸收(使其变暖)的部分,以及透射到下方海洋的部分。这不是完整的、微观的故事,但它是一个足够好的故事,可以正确计算能量收支,而这对于气候来说至关重要。参数化就是讲一个足够好的故事的艺术。

直面现实:数据同化与模式验证

我们已经建立了我们的模式,它拥有优雅的网格和巧妙的参数化。但它好用吗?它反映了现实吗?为了找出答案,我们必须用观测来 confronting it。然而,这种 confrontación 是一件微妙而有原则的事情,对计算科学的完整性至关重要。

首先,我们必须对自己诚实,我们正在测试什么。模式评估的问题迫使我们必须精确。我们必须区分三种活动。​​代码验证 (Verification)​​ 旨在回答:“我们是否正确地求解了方程?” 这是一个检查我们的代码是否与已知解一致的数学和软件工程任务。​​模式确认 (Validation)​​ 旨在回答:“我们求解的方程是否正确?” 这是一个将模式输出与真实世界观测进行比较,以判断它是否是自然界的准确表示的科学过程。而​​校准 (calibration)​​ 是调整模式中的旋钮——参数——使其与一组数据一致的过程。

模式构建者的一个大忌是混淆这些概念。如果你调整你的模式以拟合一个数据集,然后宣称你的模式“已通过确认”,因为它拟合了那个数据集,你只是在自欺欺人。你调整你的模式不仅仅是为了拟合物理信号,还为了拟合那组特定观测中的随机噪声。真正的确认需要一个独立的数据集——一场针对模式从未见过的数据的烈火考验。这是获得其预测技能无偏估计的唯一方法。

但我们能做的远不止简单地测试我们的模式。我们可以将它们与观测融合,以创造出关于海洋状态的最佳可能图像。这就是​​数据同化​​的现代奇迹。海洋是广阔的,而我们的观测却极其稀疏——零星的卫星轨迹、漂流浮标和研究航次。模式提供了关键的联系,即支配海洋在这些空间和时间上分散的点之间演化的物理定律。数据同化以最优的方式结合两者,找到那个与物理定律和我们拥有的宝贵观测最一致的海洋历史。

在最强大的同化技术(如四维变分同化,4D-Var)的核心,是​​伴随模式​​。如果一个常规模式向前运行时间,告诉你一个原因(初始状态)如何产生一个结果(最终状态),那么伴随模式做的事情近乎神奇:它向后运行时间,并告诉你如何改变初始原因以达到一个期望的最终结果。对我们来说,“期望的结果”是与观测更好的匹配。伴随模式高效地计算出模式与所有可用观测之间的不匹配程度相对于模式初始状态中每一个变量的敏感性——这是一项规模惊人的敏感性分析壮举。

这种敏感性或梯度告诉我们应该朝哪个方向“轻推”我们的初始状态以改善拟合。但是,所有可能的海洋初始状态的空间是天文数字般的,其维度轻易就能达到数十亿 (n∼109n \sim 10^9n∼109)。我们正试图在一个十亿维的空间中找到一个山谷的底部。为了在这个景观中导航,我们需要像有限内存BFGS (L-BFGS)方法这样极其复杂的优化算法。该算法巧妙地近似这个高维山谷的曲率,以智能地向下坡迈步,而这一切都无需写下那个大到不可能的二阶导数矩阵。这是一个数值上的胜利,支撑着每一个现代天气和海洋预报。

设计未来:模拟与新前沿

我们的模式已變得如此强大,以至于它们不仅能预测未来,还能帮助我们设计那些我们将用来更清晰地看到未来的工具。

假设工程师们提出了一个新的、价值数十亿美元的卫星任务,从太空测量洋流。我们如何能在建造和发射它之前知道它的潜在价值?我们无法在真实世界中测试它,但我们可以在一个模式世界中测试它!这就是​​观测系统模拟实验 (OSSE)​​ 的巧妙概念。首先,我们创建一个“自然运行”——一个超高分辨率、逼真的模拟,为了实验的目的,我们假装它是“真实”的海洋。然后,我们让我们的虚拟卫星飞越这个数字海洋,像真实仪器一样对其进行采样,我们甚至添加逼真的噪声来创建一组合成观测数据。最后,我们将这些合成观测数据输入一个独立的、普通质量的预报模式,看看它的预报改进了多少。因为我们对“真实”的自然运行有完美的了解,所以我们可以精确地量化我们提议的观测系统的影响和价值。这是对现实的一次彩排,让我们能够在我们的未来工具离开地面之前就进行试驾。

那么,建模本身的未来又将如何?机器学习 (ML) 的革命已经到来,为计算科学提供了一个 fascinating 的岔路口。一条路是“黑箱模拟器”之路,人们可能试图训练一个深度神经网络来完全取代基于物理的模式,学习一个从今天的天气到明天的天气的直接映射。这是一条诱人的道路,但也是一条危险的道路。一个通用的黑箱模式没有内在的物理知识,除非被明确强制,否则它不保证遵守像质量、动量或能量守恒这样的基本原则。在长时间的模拟中,这些小错误会累积起来,导致极其不物理和不稳定的结果。

一条更有希望,也许也更美丽的道路是​​混合建模​​之路。在这里,我们不丢弃编码在我们方程中几个世纪的物理理解。相反,我们使用机器学习来攻击我们模式中最薄弱的环节:参数化。例如,我们可以训练一个神经网络来学习一个更复杂、更准确的关于由未解析湍流引起的次网格尺度应力的规则。通过将这个智能的、学习的组件嵌入到传统的基于物理的求解器中,我们得到了两全其美的效果。物理方程的总体结构确保了基本守恒定律得到遵守,为模拟提供了一个稳健的支架。同时,嵌入的ML组件提供了一种灵活且数据驱动的方式来表示我们以前只能粗略近似的复杂物理。例如,通过设计ML的输出以表示一个非负的涡粘性,我们可以保证学习到的闭合是耗散的,并且不会虚假地产生能量。这并不是要取代物理学家;而是要给物理学家一个强大的新工具。正是这种知识驱动和数据驱动方法的综合,代表了我们寻求理解和预测海洋的激动人心的新前沿。