机器学习与湍流

玻尔百科

核心要点

模拟湍流的主要挑战是“闭合问题”，即未解析的小尺度涡对大尺度流动的影响必须通过模型来近似。
为了使湍流的机器学习模型在科学上有效，它们必须遵循基本的物理定律，包括坐标系无关性和可实现性。
诸如张量基神经网络（TBNN）和物理信息神经网络（PINN）等先进方法，将物理约束直接整合到模型的架构和训练过程中。
物理信息机器学习正在改变工程设计、气候预测、燃烧分析以及聚变反应堆中等离子体湍流控制等领域的应用。

引言

湍流是经典物理学最后几个重大的未解难题之一，它是一场混乱的涡旋之舞，主导着从天气模式到我们动脉中的血液流动等一切现象。一个多世纪以来，科学家和工程师们一直在努力使用计算方法准确预测其行为。核心困难在于“闭合问题”，这是控制方程纳维-斯托克斯方程中的一个根本性难题。当我们无法模拟每一个流体运动时，这个问题就会出现，迫使我们去近似未解析尺度的影响。传统上，这个鸿沟由简化的模型来弥合，这些模型虽然有用，但常常无法捕捉复杂流动的丰富物理特性。

本文探讨了一种正在弥合这一知识鸿沟的革命性方法：将机器学习与基本物理原理相结合。我们不再将机器学习视为仅仅模仿数据的“黑箱”，而是将其作为一种精密的工具，用于构建既高度准确又符合物理原理的模型。本文将首先深入探讨这一新范式的原理与机制，解释我们如何教会机器流体动力学中不可违背的规则。然后，我们将遍览其卓越的应用与跨学科联系，展示这些智能模型将如何解决工程、气候科学以及对聚变能源的探索中的长期挑战。

原理与机制

要理解机器学习为湍流研究带来的革命，我们必须首先认识到它所要解决的问题的巨大难度。这是一个源于控制空气和水流动的方程本身的挑战，一个困扰了物理学家和工程师一个多世纪的难题。

无法闭合的鸿沟：为何湍流如此困难

想象一下，你试图创建一个完全准确的天气预报。控制大气的基本定律——纳维-斯托克斯方程——是众所周知的。那么，为什么我们不能简单地将它们输入超级计算机，然后得到完美的预测呢？答案在于尺度问题。大气中包含了从横跨大陆的天气系统到微风扬起的微小涡旋的一切。一个完整的模拟需要追踪每一个涡旋，这是一项不可能完成的任务，需要一台比地球还大的计算机。

在实践中，科学家和工程师必须做出妥协。无论是模拟全球气候还是流经喷气式飞机机翼的空气，他们都将世界划分为一个离散点的网格。然后，计算机在每个网格单元内求解流体的平均状态——平均速度、压力和温度。这个平均或滤波的过程，正是问题的开端。

当我们对非线性的纳维-斯托克斯方程进行平均时，一个“反派”出现了：子网格尺度应力。该项代表了我们网格单元内所有微小的、未解析的涡旋对我们试图预测的大尺度平均流的净效应。我们用于解析的大尺度运动的方程，现在依赖于这些未知的小尺度运动。我们的未知数多于方程数。这个根本性的僵局被称为闭合问题。这是我们知识中一个无法闭合的鸿沟。为了继续下去，我们必须在这道鸿沟上架起一座桥梁；我们必须创建一个模型——一种参数化——它仅使用来自已解析尺度的信息来近似子网格尺度的影响。

有根据的猜测：经典方法及其缺陷

几十年来，最常见的桥梁是一个异常简单的想法，即涡粘模型。其推理过程如下：小尺度湍流涡旋的主要作用是混合物质——动量、热量和污染物——其效率远超分子运动。这种增强的混合感觉很像粘度的增加。因此，该模型只是假定流体比实际情况“粘稠”得多，并假设湍流应力与大尺度流动的拉伸和剪切速率成正比。

这个有根据的猜测效果出奇地好。它正确地捕捉了许多湍流中能量级串的主要方向：大的、高能量的涡旋分解成较小的涡旋，后者再进一步分解，直到能量最终在分子水平上以热的形式耗散掉。涡粘模型充当了已解析能量的耗散项，模仿了这一级串过程，并确保模拟不会因无中生有地创造能量而“崩溃”。

然而，这个模型的优雅之处也是它的致命弱点。湍流远不止是增强的粘度。考虑一个既有剪切（就像从顶部推动一副纸牌）又有旋转的简单流体流动。一个简单的涡粘模型预测的湍流应力仅取决于剪切。它完全忽略了旋转。然而，实验和高保真模拟表明，旋转可以深刻地改变湍流，通常会抑制它。经典模型完全忽略了这一点，因为其简单的假设没有考虑到旋转所编排的复杂涡旋之舞。这就像试图仅通过测量总音量来理解一部交响乐；你听到了声音，却错过了音乐。为了捕捉真实的物理，我们需要一个更智能的模型。

游戏规则：物理是最高仲裁者

在我们构建更智能的模型之前，我们必须首先定下规则——字面意义上的规则。任何湍流模型，无论是由人构思还是由机器习得，都不能随心所欲。它必须是物理世界中一个遵纪守法的“公民”，尊重一套不可违背的原则。

首要原则是坐标系无关性，或称客观性。物理定律不依赖于观察者。流动河流中的湍流，无论你是从岸边观察，还是从一艘匀速行驶的船上观察（伽利略不变性），都是一样的。无论你的地图是北方朝上还是朝向侧面（旋转不变性），它也是一样的。这对我们的模型产生了深远的影响：模型对湍流应力的预测不能依赖于原始速度或坐标系的方向。它必须只依赖于那些本身就是坐标系无关的量，例如流体的局部应变率和旋转率。

其次，模型不能创造出物理上不可能的状态。雷诺应力张量 $R_{ij}$ 是由速度脉动的相关性 $\overline{u_i' u_j'}$ 构建的。其对角线分量，如 $\overline{u_x' u_x'}$ ，代表方差，永远不能为负。这个被称为可实现性的数学性质，要求应力张量是半正定的——这个约束严重限制了其可能的形式。这一点也适用于其他物理定律。例如，模型不能被允许预测湍流会自发地从混沌中产生秩序，这违反了热力学第二定律。它必须确保其预测导致非负的熵产生。

这些规则不仅仅是建议。它们是物理一致性的基石。一个违反这些规则的模型不仅仅是不准确的，它在根本上就是错误的。

一种新的猜测：教会机器规则

这就是机器学习闪亮登场的地方，它不是一个仅仅模仿数据的盲目“黑箱”，而是一个强大的工具，用于构建既具高表达能力又符合物理原理的模型。

智能输入与智能架构

为了遵循坐标系无关性原则，我们不向神经网络输入原始的、依赖于坐标系的特征，如速度分量。相反，我们进行一种“数据炼金术”，将原始的速度梯度转换成一组标量不变量——这些纯数字不受坐标系旋转的影响。例如，我们可以使用应变率张量量值的平方 $\operatorname{tr}(S^2)$ 作为输入。

此外，我们设计的网络架构本身就能强制实现客观性。一个绝佳的例子是张量基神经网络（TBNN）。在这里，网络的任务被一分为二。它将标量不变量作为输入，学习一组标量“配方系数”。然后，这些系数被用来组合一个预定义的张量基——这些数学构建模块保证在旋转下能正确变换。通过将学习分为标量部分和张量部分，模型在架构上就能保证产生坐标系无关的预测。

智能训练与强制执行

物理约束的强制执行也可以通过设计来实现。我们可以在我们的网络中添加一个可实现性层。该层就像“物理警察”，接收网络对雷诺应力张量的原始预测，并将其投影到最近的、物理上可能的对称半正定张量上。这通常可以在特征值空间中优雅地完成，确保它们都是非负的，并且它们的和等于正确的总湍动能。

训练过程本身也充满了物理学。我们不只是训练网络去匹配高保真模拟的数据，而是采用一个复合损失函数。该函数同时对模型的三件事进行惩罚：

数据不匹配：模型的预测与训练数据中的“真实”应力相差多远？这是标准的数据驱动项， $J_{\text{data}}$ 。
偏微分方程（PDE）违背：如果我们将模型预测的应力代回到完整的 RANS 方程中，方程是否平衡？任何剩余的不平衡量都是一个“残差”。该项 $J_{\text{PDE}}$ 惩罚模型对流体动力学控制定律的违背。
约束违背：预测的应力张量是否满足所有其他已知约束，如对称性和可实现性？该项 $J_{\text{cons}}$ 强制实现物理一致性。

通过最小化这个复合损失，我们引导机器找到一个不仅准确，而且与物理学基本原理一致的模型。

知道你所不知道的：信任的前沿

最后，这个谜题的一个关键部分是谦逊。一个机器学习模型是其所见过的数据的专家，但对其他一切都是新手。一个专门针对汽车上空气流进行训练的模型，在预测聚变反应堆内部的湍流时是不可靠的。这就是外推问题。

为了在科学和工程中负责任地使用这些模型，我们必须建立一个“信任度计”。我们可以将训练数据描述为高维特征空间中的一个点云。当我们遇到一个新问题时，我们可以测量其特征与这个训练云中心的距离。一个强大的度量标准是马氏距离（Mahalanobis distance），这是一种考虑了特征之间相关性的统计度量。

通过在验证期间将此距离与模型误差相关联，我们可以使模型不仅能做出预测，还能报告其置信度。它可以告诉我们，“你所询问的流动条件与我训练时的情况非常相似；你很可能可以信任这个结果”，或者更重要的是，“警告！这是未知领域。我的预测是一个胡乱的猜测。” 这种量化不确定性的能力，是将机器学习从一个引人入胜的学术练习转变为一个稳健且值得信赖的科学工具的最后、也是最关键的一步。

应用与跨学科联系

在了解了如何教会机器学习流体动力学语言的原理之后，你可能会想：“这一切都很巧妙，但它能带我们去向何方？它打开了哪些新的大门？”答案很简单：在任何有流体流动和旋转的地方。这种物理定律与数据驱动推理之间的新型伙伴关系不是一个小众的学术好奇心；它是一场正在整个科学和工程领域展开的革命。它让我们不仅能构建更好的模型，还能建立一种新的计算直觉。让我们开始探索这个新世界，从我们日常生活中的熟悉挑战到我们时代最宏伟的科学探索。

日常工程：从管道到飞机

现代工程的很大一部分是与湍流摩擦作斗争，以及对高效传热的追求。一个多世纪以来，我们一直依赖像雷诺平均纳维-斯托克斯（RANS）方程这样的主力模型。这些模型是出色的近似，但它们包含我们知道并不完美的临时组件或“闭合项”。在这里，机器学习不是作为替代品介入，而是作为一个非常智能的合作者。

考虑冷却剂流经热管，或空气冲刷过涡轮叶片。我们预测壁面附近传热的能力对安全和效率至关重要。传统模型通常为一个称为湍流普朗特数 $Pr_t$ 的量假定一个恒定值。我们知道这是一种简化。然而，一个机器学习模型可以在高保真模拟数据上进行训练，以学习对这个数的修正，使其成为局部流动条件的函数。但要成为一个有用的工具，机器学习模型必须尊重基本的“壁面律”。它必须使用无量纲输入，如归一化距离 $y^+$ 和温度 $T^+$ ，以确保其预测与问题的具体单位或尺度无关。此外，它必须知道，在紧贴壁面的粘性子层中，湍流消失，分子传导占主导地位，其预测必须在该极限下优雅地让位于已知的物理学。

同样的原理也适用于预测阻力。船体或风化管道内的摩擦力取决于表面粗糙度。经典理论为我们提供了速度剖面的对数律，但考虑粗糙度涉及到该剖面中一个棘手的“向下位移”。位移多少？这取决于无量纲粗糙度高度 $k_s^+$ 。通过相似性理论和渐近分析的推理，我们可以引导机器学习模型学习这个粗糙度函数，确保它在近光滑表面和完全粗糙表面上都能正确表现。机器不仅仅学习一堆杂乱的数据，而是学习连接粗糙度与阻力的普适函数。

当我们加速时，新的物理学登上了舞台。对于亚音速客机，空气几乎是不可压缩的。但对于超音速喷气机，空气的密度会发生巨大变化。这是可压缩湍流的领域，由 Morkovin 假说所支配，该假说表明可压缩性的主要影响来自平均性质的变化。要构建一个既适用于直升机又适用于火箭的雷诺应力机器学习模型，必须向模型输入能捕捉这种新物理的特征。这些特征必须仍然是无量纲和坐标系无关的。它们包括湍流马赫数 $M_t = \sqrt{2k}/a$ （它将特征湍流速度与声速进行比较），以及一个无量纲膨胀率（它测量流体膨胀速率相对于其变形速率的比值）。通过向我们的模型输入正确的物理量，我们使其能够学习高速飞行的物理学。

模拟地球引擎：天气与气候

让我们从一架飞机放大到整个地球。大气是在巨大尺度上的湍流流体。全球天气和气候模型是计算的壮举，但即使是最强大的超级计算机也无法解析每一阵风或热羽流。相反，它们依赖于“参数化”——代表未解析湍流平均效应的简化公式。这些参数化是天气预报和气候预测中不确定性的主要来源。

我们能做得更好吗？想象一下，在来自极其详细的小尺度大气模拟数据上训练一个机器学习模型。模型的任务是成为一个“参数化模拟器”：给定来自全球模型的大尺度状态（如地转风、温度和湿度），它能即时预测湍流混合剖面，由涡扩散系数 $K(z,t)$ 表示。为了成功，模型必须知道是什么驱动了动力学过程。例如，为了捕捉夜间低空急流——夜间形成的快速移动气流带，对风能至关重要——的形成，模型必须被赋予关键的物理要素：大尺度压力梯度（通过地转风 $\mathbf{U}_g$ ）、地球自转（通过科里奥利参数 $f$ ）、地表稳定性（通过热通量 $H_s$ ）和地表粗糙度 ( $z_0$ )。通过学习这些输入与最终的湍流混合之间复杂的关系，机器学习模型可以提供更快、更准确的参数化方案，为更准确的极端天气预报和更可靠的地球未来气候预测带来希望。

问题的核心：燃烧与聚变

在一些最具挑战性和最重要的技术中，湍流不仅仅是一种流体现象——它与其他复杂的物理过程交织在一起。

考虑燃烧。喷气发动机或燃气轮机中的火焰是一个大漩涡，其中湍流涡旋拉伸和褶皱反应区，极大地改变了燃烧速率。化学反应是高度非线性的，并且对温度敏感。预测这种“湍流-化学相互作用”是工程学中最困难的问题之一。在这里，一个强大的新思想脱颖而出：物理信息神经网络（PINN）。当使用大涡模拟（LES）等技术模拟燃烧时，我们会留下一个未闭合的项，即滤波后的化学反应速率 $\overline{\dot{\omega}_k}$ 。可以通过在数据上直接强制执行滤波后的组分守恒方程来训练 PINN 预测该项。网络的损失函数不仅仅是匹配数据点；它还包括一个惩罚任何违反物理控制定律的项。网络学习到的闭合模型使整个模拟在物理上保持一致。

一个更宏大的挑战在于对聚变能源的探索。在托卡马克（tokamak）——一种设计用于容纳一亿度等离子体的环形磁约束装置——中，湍流是头号反派。它无情地导致热量和粒子泄漏，威胁到聚变反应的熄灭。这种等离子体湍流的物理学由复杂的回旋动理学方程描述。即使是模拟一小块等离子体零点几秒的时间，也可能需要一台超级计算机花费数周。这对于设计和控制反应堆来说太慢了。

解决方案？机器学习代理模型。通过运行一套精心设计的回旋动理学模拟，我们可以训练一个神经网络来几乎即时地预测湍流热通量和粒子通量。但同样，这只有在教会网络正确的语言时才有效。输入不是原始的温度和密度，而是控制回旋动理学理论的无量纲参数：归一化回旋半径 $\rho^\ast$ 、等离子体比压 $\beta$ 、磁安全因子 $q$ 和磁剪切 $\hat{s}$ 、碰撞率 $\nu^\ast$ 以及归一化梯度驱动 $R/L_X$ 。这些参数是物理学的“旋钮”。一个在这些参数上训练的模型可以泛化到不同的装置和条件下。

此外，等离子体湍流是出了名的“刚性”——它经常表现出一个临界阈值。例如，作为湍流关键驱动因素的离子温度梯度（ITG）模，仅当温度梯度 $R/L_{T_i}$ 超过一个临界值时才会开启。低于这个阈值，输运为零；高于它，输运迅速增长。一个机器学习代理模型必须捕捉到这种急剧的“开关”行为。它不能只是一个平滑的拟合；它必须学习到物理过程依赖于超临界度——即梯度超过阈值的程度。这是一个深刻的挑战，需要模型能够学习物理不稳定性的根本结构。

一种新的建模哲学

这些应用的广泛性表明，这不仅仅是我们工具的转变，也是我们建模哲学的转变。

湍流本质上是非局域的。一个点的行为受到其整个邻域内流体状态的影响，这是通过大尺度涡旋的作用实现的。传统的 RANS 模型大多是局域的。我们能创建一个“非局域思考”的机器学习模型吗？答案在于算子学习这个激动人心的领域。在这里，目标是学习一个映射，不是在数字之间，而是在整个函数或场之间。例如，傅立叶神经算子（FNO）学习在频域中操作。它参数化一个非局域卷积核，可以捕捉整个域内的依赖关系，并在此过程中尊重像平移等变性这样的基本对称性。这是向更整体、基于场的物理表示迈出的一步。

最后，这种不可思议的力量伴随着深远的责任。一个机器学习模型不是神谕；它是一个由数据锻造的工具，其知识受限于该数据。“域漂移”——在一个流类型（例如，中等雷诺数）上训练模型并将其应用于另一个类型（高雷诺数）——的危险是始终存在的。一个在其舒适区内完美工作的模型，当它进行外推时，可能会产生极其不符合物理规律的结果。

这使我们触及了新科学实践的核心。我们必须使用标准化的基准问题来严格定义和测试我们的模型，就像我们校准任何实验室仪器一样。最重要的是，我们必须仔细记录每个模型的“有效域”：所做的物理假设、训练数据覆盖的无量纲参数范围以及已知的失效模式。一个在静电模拟上训练的聚变输运机器学习代理模型，对于电磁效应变得重要的高 $\beta$ 等离子体来说，根本就是错误的工具。一个伟大的科学家不仅知道他们工具的力量，也知道它们的局限性。

将机器学习与湍流物理学相结合的旅程才刚刚开始。这是一条既需要计算创造力又需要坚定不移的科学严谨性的道路。但通过遵循这条道路，我们不仅仅是在寻找更快获得答案的方法；我们正在发展一种更深刻、更细致、最终也更强大的方式来理解我们周围这个美丽复杂、充满湍流的世界。