前向-后向随机微分方程

玻尔百科

定义

前向-后向随机微分方程是一种通过耦合前向演化的状态过程与关联未来目标的后向演化价值过程来构建系统的数学模型。在随机控制和数学金融领域，该方程的解包含表示系统价值的过程以及量化系统对随机噪声反应的敏感性过程。此类方程与确定性偏微分方程有着深层联系，在现代研究中常利用深度学习方法求解高维问题。

核心要点

FBSDEs通过耦合一个前向演化的状态过程和一个与未来目标相关联的后向演化的价值过程，来对系统进行数学建模。
其解包含一个代表系统价值的价值过程（Y）和一个量化系统对随机噪声响应的敏感性或对冲过程（Z）。
FBSDEs与确定性偏微分方程（PDEs），如哈密顿-雅可比-贝尔曼方程，有着深刻的联系，从而统一了随机控制和动态规划。
该框架在最优控制、数学金融、平均场博弈论等领域有广泛应用，并可利用现代深度学习方法在高维空间中求解。

引言

在许多现实场景中，从财务规划到航天器导航，我们当前的行为都由一个未来的目标所驱动，同时我们还在一个充满不确定性的世界中航行。我们如何用数学方法捕捉这种从过去展开的路径与位于未来的目的地之间错综复杂的相互作用？这一挑战是许多复杂决策问题的核心。答案在于一个强大而优雅的数学框架：前向-后向随机微分方程（FBSDEs）。这些方程为那些当前演化与未来条件密不可分的系统提供了一种描述语言。

本文深入探讨FBSDEs的世界，对其结构和重要性进行全面探索。我们将首先揭开定义这类独特方程的核心概念。第一章“原理与机制”将剖析FBSDEs的双重性质，解释前向漂移的状态和后向传播的价值过程如何被锁定在一场精妙的博弈中，以及这个看似矛盾的系统如何通过随机分析的视角得以解决。随后，第二章“应用与跨学科联系”将带领读者遍览FBSDEs作为基础工具的广阔领域，从工程学和经济学中的最优控制艺术，到平均场博弈中对集体行为的前沿分析，再到使解决这些问题成为可能的人工智能驱动方法。

原理与机制

想象一下，你正驾车踏上一段漫长的旅程。你的车所走的路径，会受到随机的交通堵塞和意外天气的影响，这是一个“前向”过程。它从现在开始，走向未来。但你的旅程并非漫无目的。你有一个目标：在特定时间到达目的地，或许还剩下一定量的燃料。这个位于未来的目标，决定了你现在的决策——你开多快，走哪条路。这是一个“后向”过程。你当前的行为与一个未来的目标耦合在一起。

这正是前向-后向随机微分方程（FBSDE）的核心所在。它是由两个在时间中精妙共舞的方程组成的系统。一个方程，即前向SDE，描述了一个从过去演化到未来、受随机噪声影响的状态。另一个方程，即后向SDE（BSDE），描述了一个锚定在最终时刻某个条件上并向现在演化的价值。其神奇之处和挑战在于它们的耦合：前向的旅程影响后向的目标，而后向的目标也影响前向的旅程。

过去与未来的共舞

让我们更正式地审视这场共舞。我们有一个状态，称之为 $X_t$ ，它可以是我们汽车的位置、股票的价格或房间的温度。它根据一个常见的SDE在时间上向前演化：

dX_t = b(t, X_t) dt + \sigma(t, X_t) dW_t

这个方程告诉我们， $X_t$ 在一个微小的时间间隔 $dt$ 内的变化，由一个由函数 $b$ 决定的可预测漂移部分和一个由函数 $\sigma$ 及布朗运动的“无穷小抛硬币” $dW_t$ 决定的随机扰动部分组成。这个过程从一个已知的初值 $X_0$ 开始，向前推进。

现在，我们来看后向部分，一对过程 $(Y_t, Z_t)$ 。它们由旅程终点时刻 $T$ 的一个条件所定义。它们的演化由一个如下所示的方程描述：

-dY_t = f(t, X_t, Y_t, Z_t) dt - Z_t dW_t

注意 $dY_t$ 前面的负号。它表示我们是从一个已知的终点向后思考这个过程。这个方程更常见的写法是积分形式，这使得其后向性质更加明确：对于任何在终点 $T$ 之前的时刻 $t$ ，价值 $Y_t$ 由下式给出：

Y_t = Y_T + \int_t^T f(s, X_s, Y_s, Z_s) ds - \int_t^T Z_s dW_s

当后向方程依赖于前向方程时，系统才真正变得耦合。这通常发生在两个地方： $Y$ 的终端值依赖于 $X$ 的最终状态，即 $Y_T = g(X_T)$ ；以及后向方程的“驱动项”函数 $f$ 依赖于 $X_s$ 的路径。这就是我们公路旅行例子的数学表述：最终结果 $g(X_T)$ 是我们关心的，而我们对旅程的评估 $Y_t$ 则根据我们沿途所处的位置 $X_s$ 不断更新。

一个适应解的谜题

在这里，我们遇到了一个美妙的悖论。后向方程由未来时刻 $T$ 的条件 $g(X_T)$ 定义。然而，宇宙——以及随机分析——的一个基本法则是，你无法预知未来。一个解 $(Y_t, Z_t)$ 必须适应于信息流；也就是说，在任何时刻 $t$ ，它的值只能依赖于 $s \le t$ 的布朗运动 $W_s$ 的历史。

一个由未来决定的过程，如何能对未来保持无知？

答案在于条件期望的微妙力量。可以将其想象为基于当下所有可用信息对未来做出最好的猜测。过程 $Y_t$ 本质上是最终结果的条件期望，并根据沿途累积的任何“成本”或“收益”（由函数 $f$ 表示）进行调整。例如，在最简单的情况 $f=0$ 下，解就是 $Y_t = \mathbb{E}[g(X_T) | \mathcal{F}_t]$ ，其中 $\mathcal{F}_t$ 代表截至时刻 $t$ 已知的所有信息。BSDE是动态计算这个演化期望的引擎。这与前向SDE有着深刻的区别，后者的解是从过去一步步构造出来的，就像一块接一块地砌砖。而在这里，整个蓝图由最终的殿堂决定，但每一块砖都必须在看不到未来砖块的情况下铺设。

角色阵容：价值（ $Y$ ）与敏感性（ $Z$ ）

那么，这些神秘的过程 $Y_t$ 和 $Z_t$ 究竟是什么？

过程 $Y_t$ 最直观的理解是一个价值函数。在数学金融中，它可以是在到期时支付 $g(X_T)$ 的金融衍生品的价格。在控制论中，它可以是从状态 $X_t$ 出发的最优未来成本。在我们公路旅行的比喻中，它是在给定我们当前位置的情况下，预计的到达时间。它是时刻 $t$ 时“博弈”的价值。

过程 $Z_t$ 则更为微妙，并且在许多方面更有趣。它是管理随机性的关键。为了感受它，让我们再次审视 $Y_t$ 的动态： $dY_t = \dots + Z_t dW_t$ 。这个方程告诉我们， $Z_t$ 是乘以随机扰动 $dW_t$ 的系数。它精确地告诉我们，价值 $Y_t$ 如何响应来自底层噪声源的无穷小冲击。

因此， $Z_t$ 代表了价值对噪声的敏感性。它是风险，是敞口。在金融领域，如果 $Y_t$ 是标的资产为 $X_t$ 的期权价格，那么 $Z_t$ 恰恰是对冲策略：它告诉你为了完美复制期权的价值并消除所有风险，在时刻 $t$ 需要持有多少份标的资产。它是驯服随机性的秘诀。

解耦的魅力：寻找更简单的现实

坦率地说，求解一个耦合的FBSDE系统是困难的。但在许多重要情况下，会出现一个显著的简化。我们可能会猜测，复杂的价值过程 $Y_t$ 并非某个抽象的实体，而仅仅是当前状态和时间的确定性函数：

Y_t = u(t, X_t)

这个函数 $u(t,x)$ 如果存在，被称为解耦场 (decoupling field)。它打破了反馈循环，使我们只需观察当前状态 $X_t$ 就能确定价值 $Y_t$ 。问题随之而来：我们如何找到这个神奇的函数 $u$ ？

答案是随机分析中最优雅的结果之一。我们有两种描述 $Y_t$ 动态的方式：

根据BSDE的定义： $dY_t = -f(t, X_t, Y_t, Z_t) dt + Z_t dW_t$ 。
对我们的猜测 $Y_t = u(t, X_t)$ 应用伊藤公式（随机过程的链式法则）。

应用伊藤公式，我们得到了一个用 $u$ 的偏导数和 $X_t$ 的动态表示的 $dY_t$ 新表达式。当我们令这两个 $dY_t$ 的表达式相等时，我们可以分别比较漂移项（ $dt$ 项）和扩散项（ $dW_t$ 项）。

匹配扩散项，我们得到了一个关于 $Z_t$ 性质的惊人洞见：

Z_t = \sigma(t, X_t)^\top \nabla_x u(t, X_t)

这是一个优美的公式。它表明，抽象的“敏感性” $Z_t$ 不过是价值函数的梯度 $\nabla_x u$ ，通过波动率矩阵 $\sigma^\top$ “投影”得到。梯度 $\nabla_x u$ 告诉我们价值 $u$ 如何随空间位置的变化而变化。波动率 $\sigma$ 告诉我们哪些空间方向受到噪声 $W_t$ 的影响。该公式表明， $Z_t$ 只衡量价值在实际存在噪声的方向上的变化。如果某个方向没有噪声（该分量的 $\sigma$ 为零），那么无论 $u$ 的梯度有多陡峭， $Z_t$ 都对此“视而不见”。

现在，匹配漂移项并代入我们新发现的 $Z_t$ 表达式，整个随机系统就会坍缩成一个关于函数 $u(t,x)$ 的、纯粹确定性的偏微分方程（PDE）。这个PDE是著名的费曼-卡茨公式的推广，它在随机过程世界和确定性分析世界之间架起了一座桥梁。为了求解FBSDE，我们可以转而求解这个PDE（通常是数值求解），然后利用其解 $u(t,x)$ 来构造 $Y_t$ 和 $Z_t$ 。

一次具体的旅程：奥恩斯坦-乌伦贝克过程

让我们通过一个例子来具体说明。假设前向过程 $X_t$ 是一个奥恩斯坦-乌伦贝克过程，它常被用来模拟均值回归的量，如温度或利率：

dX_t = \kappa(\theta - X_t) dt + \sigma dW_t

在这里， $X_t$ 以速率 $\kappa$ 不断被拉向一个长期均值 $\theta$ ，同时受到大小为 $\sigma$ 的噪声的随机扰动。

假设我们对一份金融合约感兴趣，它在未来某个时刻 $T$ 支付该过程的平方， $X_T^2$ 。我们还假设有一个贴现率 $r$ 。该合约价值 $Y_t$ 对应的BSDE是：

-dY_t = -r Y_t dt - Z_t dW_t \quad \text{with} \quad Y_T = X_T^2

按照上一节的步骤，我们假设 $Y_t = u(t, X_t)$ 。伊藤公式的魔力将这个问题转化为求解以下关于 $u(t,x)$ 的PDE：

\frac{\partial u}{\partial t} + \kappa(\theta - x)\frac{\partial u}{\partial x} + \frac{1}{2}\sigma^2\frac{\partial^2 u}{\partial x^2} - r u = 0 \quad \text{with} \quad u(T,x) = x^2

这是布莱克-斯科尔斯方程的一个变体。虽然解析求解它是一个微积分练习，但其解具有一个由费曼-卡茨公式给出的、极其直观的概率意义：

u(t, x) = \mathbb{E}[\exp(-r(T-t)) X_T^2 | X_t = x]

合约今天的价值，就是未来期望回报贴现到今天的值。因为奥恩斯坦-乌伦贝克过程是一个高斯过程，我们可以显式地计算这个期望。给定 $X_t=x$ ，未来的值 $X_T$ 是一个正态随机变量，其均值和方差我们可以计算出来。 $X_T^2$ 的期望值就是其均值的平方加上其方差。代入这些，我们就能得到 $u(t,x)$ 的封闭解，从而也得到了 $Y_t$ 和 $Z_t$ 的解。例如，在时刻 $t=0$ 的价值是：

Y_0 = \exp(-rT) \left[ \left( \theta + (x_{0} - \theta) \exp(-\kappa T) \right)^{2} + \frac{\sigma^{2}}{2\kappa} \left( 1 - \exp(-2\kappa T) \right) \right]

这展示了整个工作流程：从一个耦合的随机系统出发，我们将其转化为一个确定性的PDE，其解给出了答案，而这个答案本身又具有清晰的概率解释。

终极反馈回路

到目前为止，我们主要考虑的是后向方程依赖于前向方程的情况。但如果前向方程也依赖于后向方程呢？

dX_t = b(t, X_t, Y_t, Z_t) dt + \sigma(t, X_t, Y_t) dW_t

这是一个完全耦合的FBSDE。在我们的公路旅行比喻中，这意味着你的驾驶速度 $b$ 可能依赖于你剩余的预期旅行时间 $Y_t$ （如果你迟到了，你就会加速）和当前的道路风险 $Z_t$ 。这创造了一个真正的反馈回路。

同样的原理依然适用。解耦假设 $Y_t = u(t, X_t)$ 仍然可以使用，但现在得到的PDE变得更加复杂——一个拟线性PDE，其系数本身依赖于解 $u$ 及其梯度 $\nabla_x u$ 。这些方程处理起来要困难得多。事实上，这种反馈可能非常强，以至于解可能只在很短的时间范围 $T$ 内存在。如果你计划得太远，你的行动与你对未来的评估之间的反馈回路可能会变得不稳定并“爆炸”。

这种丰富的结构，其中过去与未来交织在一起，随机性通过理解敏感性而被驯服，复杂的随机系统被确定性偏微分方程所镜像，正是FBSDE理论成为理解从金融、经济到工程、物理等问题的深刻而强大工具的原因。它证明了数学统一之美。

应用与跨学科联系

在领略了前向-后向随机微分方程（FBSDE）错综复杂的机制之后，你可能心生赞叹，但也会提出一个实际问题：这一切究竟有什么用？这是一个合理的问题。数学世界里充满了在期刊页面上诞生和消亡的美丽而精巧的结构。但FBSDEs不同。它们不仅仅是抽象的构造；它们是一种语言，一种强大且出人意料地普适的语言，用以描述任何智能系统所面临的最基本挑战之一：在不确定的世界中做出最优决策。

一旦你学会用FBSDEs的视角看世界，你就会开始发现它们无处不在。它们是惊人广泛的现象背后隐藏的蓝图，从驾驶航天器到为金融衍生品定价，从理解人群的涌现行为到训练下一代人工智能。在本章中，我们将探索这片广阔的领域，看看前向漂移的状态与其后向传播的“影子”之间的优雅共舞，如何为我们提供一种理解、预测和控制世界的新方式。

控制的总蓝图：从火箭到投资组合

让我们从最直接、最深刻的应用开始：控制的艺术。想象一下，你正试图让一辆火星车在火星上着陆。火星车有一个状态——它的位置和速度——它根据物理定律演化，但同时也受到随机大气湍流的冲击。这是你的前向过程， $X_t$ 。你的目标是在特定时间到达特定着陆区，并且希望使用最少的燃料。这是一个最优控制问题。

在任何时刻，你如何决定推进器的推力大小？你需要一个策略。随机最大值原理（SMP）给出了答案，其数学核心就是一个FBSDE。该原理告诉我们，伴随着前向演化的物理状态 $X_t$ ，存在一个后向演化的“伴随”过程，我们称之为 $p_t$ 。这个伴随过程不是你能用传感器测量的物理量；它是一个“影子价格”或敏感性的度量。它回答了这个关键问题：“在此时此刻，对我的状态施加一个微小的推动，会对我的最终结果产生多大影响？”

FBSDE耦合了这两个视角。 $X_t$ 的前向方程简单描述了物理情境：当前状态 + 控制动作 + [随机噪声](/sciencepedia/feynman/keyword/stochastic_noise) -> 下一状态。 $p_t$ 的后向方程则计算敏感性，从你的最终目标开始，在时间上向后传播。后向方程的终端条件 $p_T$ 正是你的最终成本对最终状态的敏感性。神奇之处在于将它们联系起来：在任何时刻 $t$ 的最优控制动作，是使一个称为哈密顿量的特殊函数最小化的动作，该函数平衡了动作的即时成本与由 $p_t$ 衡量的未来收益。本质上，你总是在做出从其对未来的影响来看是最佳的选择。

这个框架非常通用。但为了使其具体化，我们可以看看它的“谐振子”：线性二次（LQ）调节器问题。在这里，我们假设系统的物理特性是线性的（你的控制效果与其大小成正比），成本是二次的（与理想路径的微小偏差代价很小，但大的偏差代价会变得非常昂贵）。对于从工程到经济的大量现实世界系统来说，这是一个非常好的近似。在这种特殊的LQ情况下，复杂的FBSDE系统通常可以被显式求解，从而得到构成现代工程基石的优雅而实用的控制律。

该理论甚至强大到可以处理你的控制动作不仅影响系统方向，还影响其随机性的情况。想象一下，你正带领一家公司穿越动荡的市场。一些商业决策可能不仅影响你的预期利润（漂移），还可能影响你未来收益的风险性（扩散）。这在FBSDE中通过第二个伴随过程，即神秘的 $Z_t$ 来体现，它量化了结果对噪声本身的敏感性。因此，最优策略不仅必须平衡成本和方向，还必须平衡风险。这就是现代金融对冲的数学基础。

最后，我们如何确定这个过程能找到最佳策略，而不仅仅是一个好的策略？一个被称为验证定理的美妙结果给了我们答案。它指出，如果问题具有某种结构——具体来说，如果哈密顿量在控制变量上是“凸”的，你可以把它想象成一个没有任何棘手的局部最小值让你陷入其中的地形——那么FBSDE的解不仅是最优的必要条件，也是充分条件。这是一个数学上的保证，确保你已经找到了那条唯一真正的最优路径。

两种视角的故事：FBSDEs与PDEs的统一

随机控制的故事有两位伟大的主角：安德烈·柯尔莫哥洛夫（Andrey Kolmogorov）（建立在诺伯特·维纳（Norbert Wiener）等人的工作之上），他给了我们随机过程的语言；以及列夫·庞特里亚金（Lev Pontryagin），他阐述了我们刚刚讨论过的最大值原理。但还有另一位巨人：理查德·贝尔曼（Richard Bellman），他发展了一种完全不同的方法，称为动态规划。

贝尔曼的思想，导出了哈密顿-雅可比-贝尔曼（HJB）方程，非常直观。他没有专注于一条最优路径，而是问：“从任何可能的初始状态 $x$ 在任何可能的时刻 $t$ 出发，我能取得的最好结果或‘价值’是什么？”这定义了一个“价值函数”， $V(x,t)$ 。如果你能构造出这个函数，找到最优路径就会像在由 $V$ 定义的地形上滑雪下山一样简单。HJB方程是这个价值函数必须满足的一个偏微分方程（PDE）。

几十年来，最大值原理（导致FBSDEs）和动态规划（导致PDEs）被视为两个并行、强大但截然不同的理论。它们之间的联系揭示了数学中深刻而美丽的统一性。在适当的条件下，庞特里亚金世界中的伴随过程 $p_t$ 正是贝尔曼价值函数的梯度（斜率），并沿着最优路径进行评估。

p_t = \nabla_x V(X_t, t)

这是一个启示。抽象的“影子价格” $p_t$ 突然有了具体的几何意义：它是系统当前位置处价值地形的陡峭程度。FBSDE提供了一个“局部”视角，一个利用瞬时敏感性来导航一条最优路径的配方。HJB方程提供了一个“全局”视角，一张描绘所有可能情况价值的完整地图。它们如此紧密相关的事实表明，它们只是描述同一个潜在真理的两种不同语言。这种联系是现代数学的基石，将随机分析的路径世界与偏微分方程的空间世界联系起来。

群体的智慧：平均场博弈

现在让我们将视角从单个决策者放大到一个庞大的人群。想象一下股票市场中的交易员、城市中的司机，甚至是鱼群中的鱼。每个个体都在试图优化自己的目标，但他们的最佳策略取决于其他所有人的行为。如果其他所有人都在抛售一只股票，其价格就会下跌，从而影响你的决策。如果其他所有人都走高速公路，高速公路就会堵塞，从而影响你对路线的选择。这就是博弈论的范畴。

平均场博弈（MFG）是一个用于分析此类拥有近乎无限参与者场景的卓越数学框架。将它与物理学中更简单的“平均场”模型区分开来至关重要，后者通常由麦基恩-弗拉索夫方程（McKean-Vlasov equations）描述，其中粒子被动地与集体相互作用（就像磁体中的原子）。在MFG中，每个粒子都是一个理性代理人，一场宏大博弈中的玩家。

这种博弈的均衡是一个优美的、自洽的循环，被FBSDEs完美地捕捉。其工作原理如下：

假设一个群体行为： 我们首先推测一个“平均场”，即一个描述整个群体如何随时间分布的概率分布流 $m_t$ 。
解决个体问题： 然后我们选择一个代表性的代理人。对于这个代理人来说，群体的行为 $m_t$ 是给定的。他们的问题是找到最优控制策略来最小化其个人成本，该成本取决于他们自己的状态和这个外部平均场。这是一个标准的随机控制问题，其解由一个FBSDE刻画。
检查一致性： 通过FBSDE找到的代理人的最优策略，将反过来产生某种生命周期行为。最后一步是看，由所有遵循此最优策略的代理人组成的群体的分布是否重新创造了我们最初假设的那个平均场 $m_t$ 。

如果确实如此，我们就找到了一个纳什均衡。这是一种集体理性的状态，在给定群体行为的情况下，没有单个个体有动机偏离。这种前向-后向结构是MFG的标志。一个前向方程（福克-普朗克方程）描述了群体分布如何演化，而一个后向方程（HJB方程，或者在单个代理人层面上是BSDE）描述了驱动个体选择的优化过程。在一些非常易于处理的情况下，比如线性二次MFG，这整个复杂的系统可以被求解，并且可以通过求解一组看起来很熟悉的黎卡提常微分方程来找到均衡。

破解密码：深度学习如何解决不可解问题

尽管FBSDEs（及其PDE表亲，HJB方程）在理论上很美，但它们有一个不为人知的秘密：它们在数值上极难求解，尤其是在高维空间中。这一直是一个主要的瓶颈，限制了它们的实际应用。一个有（比如说）100个变量的问题——这在金融或经济学中是常见情景——曾被认为是完全无法处理的。这种困难被称为“维度灾难”。

传统方法通常需要在状态空间上创建一个网格。如果你对100个维度中的每一个维度使用10个网格点，你将需要 $10^{100}$ 个点——这个数字比可观测宇宙中估计的原子数量还要大。问题似乎毫无希望。

这时，人工智能的现代革命登场了。一类被称为深度BSDE方法的新算法取得了惊人的突破。其核心思想既简单又巧妙。求解BSDE的主要困难在于它在时间上是逆向的，并且依赖于未知过程 $Z_t$ 。如果我们能“猜出” $Z_t$ 的函数形式呢？

这正是神经网络所做的事情。我们假设未知函数 $Z_t$ 可以被一个深度神经网络逼近，该网络将时间 $t$ 和状态 $X_t$ 作为输入。然后，我们为 $X_t$ 模拟大量随机的前向路径。在每条路径上，我们使用我们的神经网络在每一步生成对 $Z_t$ 的猜测。利用BSDE的规则，这使我们能够计算出对最终值 $Y_T$ 的猜测。但我们已经知道 $Y_T$ 应该是什么——它由终端条件 $g(X_T)$ 给出。我们网络的计算结果与真实答案之间的差异就是一个误差。然后我们可以利用深度学习的标准机制来调整网络的参数以最小化这个误差。

这种方法之所以效果如此之好，是因为它是一种“无网格”方法。它不构建网格，而是依赖于蒙特卡洛抽样——从一系列随机样本中学习。获得准确估计所需的样本数量随维度的增加而增长的趋势，比基于网格的方法要温和得多。虽然维度灾难并未完全消除（复杂度仍然随维度呈多项式增长），但它已从一场指数级的灾难“缓解”为一个可控的挑战。这是一个游戏规则的改变者，为解决金融风险管理、分子动力学和经济建模中出现的高维FBSDEs打开了大门，而这些问题在十年前还仅限于理论领域。

从最优规划的深刻原理，到数学中的统一概念，再到描述集体行为的语言，以及现在成为一类被人工智能驯服的问题，前向-后向随机微分方程的旅程证明了科学思想的力量和相互关联性。它是一种为描述变化世界而锻造的语言，而我们才刚刚开始理解它所能表达的一切。

前向-后向随机微分方程

引言

原理与机制

过去与未来的共舞

一个适应解的谜题

角色阵容：价值（YYY）与敏感性（ZZZ）

解耦的魅力：寻找更简单的现实

一次具体的旅程：奥恩斯坦-乌伦贝克过程

终极反馈回路

应用与跨学科联系

控制的总蓝图：从火箭到投资组合

两种视角的故事：FBSDEs与PDEs的统一

群体的智慧：平均场博弈

破解密码：深度学习如何解决不可解问题

前向-后向随机微分方程

引言

原理与机制

过去与未来的共舞

一个适应解的谜题

角色阵容：价值（YYY）与敏感性（ZZZ）

解耦的魅力：寻找更简单的现实

一次具体的旅程：奥恩斯坦-乌伦贝克过程

终极反馈回路

应用与跨学科联系

控制的总蓝图：从火箭到投资组合

两种视角的故事：FBSDEs与PDEs的统一

群体的智慧：平均场博弈

破解密码：深度学习如何解决不可解问题

角色阵容：价值（ $Y$ ）与敏感性（ $Z$ ）

角色阵容：价值（ $Y$ ）与敏感性（ $Z$ ）