try ai
科普
编辑
分享
反馈
  • 前向-后向随机微分方程

前向-后向随机微分方程

SciencePedia玻尔百科
核心要点
  • FBSDEs通过耦合一个前向演化的状态过程和一个与未来目标相关联的后向演化的价值过程,来对系统进行数学建模。
  • 其解包含一个代表系统价值的价值过程(Y)和一个量化系统对随机噪声响应的敏感性或对冲过程(Z)。
  • FBSDEs与确定性偏微分方程(PDEs),如哈密顿-雅可比-贝尔曼方程,有着深刻的联系,从而统一了随机控制和动态规划。
  • 该框架在最优控制、数学金融、平均场博弈论等领域有广泛应用,并可利用现代深度学习方法在高维空间中求解。

引言

在许多现实场景中,从财务规划到航天器导航,我们当前的行为都由一个未来的目标所驱动,同时我们还在一个充满不确定性的世界中航行。我们如何用数学方法捕捉这种从过去展开的路径与位于未来的目的地之间错综复杂的相互作用?这一挑战是许多复杂决策问题的核心。答案在于一个强大而优雅的数学框架:前向-后向随机微分方程(FBSDEs)。这些方程为那些当前演化与未来条件密不可分的系统提供了一种描述语言。

本文深入探讨FBSDEs的世界,对其结构和重要性进行全面探索。我们将首先揭开定义这类独特方程的核心概念。第一章“原理与机制”将剖析FBSDEs的双重性质,解释前向漂移的状态和后向传播的价值过程如何被锁定在一场精妙的博弈中,以及这个看似矛盾的系统如何通过随机分析的视角得以解决。随后,第二章“应用与跨学科联系”将带领读者遍览FBSDEs作为基础工具的广阔领域,从工程学和经济学中的最优控制艺术,到平均场博弈中对集体行为的前沿分析,再到使解决这些问题成为可能的人工智能驱动方法。

原理与机制

想象一下,你正驾车踏上一段漫长的旅程。你的车所走的路径,会受到随机的交通堵塞和意外天气的影响,这是一个“前向”过程。它从现在开始,走向未来。但你的旅程并非漫无目的。你有一个目标:在特定时间到达目的地,或许还剩下一定量的燃料。这个位于未来的目标,决定了你现在的决策——你开多快,走哪条路。这是一个“后向”过程。你当前的行为与一个未来的目标耦合在一起。

这正是​​前向-后向随机微分方程(FBSDE)​​的核心所在。它是由两个在时间中精妙共舞的方程组成的系统。一个方程,即​​前向SDE​​,描述了一个从过去演化到未来、受随机噪声影响的状态。另一个方程,即​​后向SDE(BSDE)​​,描述了一个锚定在最终时刻某个条件上并向现在演化的价值。其神奇之处和挑战在于它们的耦合:前向的旅程影响后向的目标,而后向的目标也影响前向的旅程。

过去与未来的共舞

让我们更正式地审视这场共舞。我们有一个状态,称之为XtX_tXt​,它可以是我们汽车的位置、股票的价格或房间的温度。它根据一个常见的SDE在时间上向前演化:

dXt=b(t,Xt)dt+σ(t,Xt)dWtdX_t = b(t, X_t) dt + \sigma(t, X_t) dW_tdXt​=b(t,Xt​)dt+σ(t,Xt​)dWt​

这个方程告诉我们,XtX_tXt​在一个微小的时间间隔dtdtdt内的变化,由一个由函数bbb决定的可预测漂移部分和一个由函数σ\sigmaσ及布朗运动的“无穷小抛硬币”dWtdW_tdWt​决定的随机扰动部分组成。这个过程从一个已知的初值X0X_0X0​开始,向前推进。

现在,我们来看后向部分,一对过程(Yt,Zt)(Y_t, Z_t)(Yt​,Zt​)。它们由旅程终点时刻TTT的一个条件所定义。它们的演化由一个如下所示的方程描述:

−dYt=f(t,Xt,Yt,Zt)dt−ZtdWt-dY_t = f(t, X_t, Y_t, Z_t) dt - Z_t dW_t−dYt​=f(t,Xt​,Yt​,Zt​)dt−Zt​dWt​

注意dYtdY_tdYt​前面的负号。它表示我们是从一个已知的终点向后思考这个过程。这个方程更常见的写法是积分形式,这使得其后向性质更加明确:对于任何在终点TTT之前的时刻ttt,价值YtY_tYt​由下式给出:

Yt=YT+∫tTf(s,Xs,Ys,Zs)ds−∫tTZsdWsY_t = Y_T + \int_t^T f(s, X_s, Y_s, Z_s) ds - \int_t^T Z_s dW_sYt​=YT​+∫tT​f(s,Xs​,Ys​,Zs​)ds−∫tT​Zs​dWs​

当后向方程依赖于前向方程时,系统才真正变得耦合。这通常发生在两个地方:YYY的终端值依赖于XXX的最终状态,即YT=g(XT)Y_T = g(X_T)YT​=g(XT​);以及后向方程的“驱动项”函数fff依赖于XsX_sXs​的路径。这就是我们公路旅行例子的数学表述:最终结果g(XT)g(X_T)g(XT​)是我们关心的,而我们对旅程的评估YtY_tYt​则根据我们沿途所处的位置XsX_sXs​不断更新。

一个适应解的谜题

在这里,我们遇到了一个美妙的悖论。后向方程由未来时刻TTT的条件g(XT)g(X_T)g(XT​)定义。然而,宇宙——以及随机分析——的一个基本法则是,你无法预知未来。一个解(Yt,Zt)(Y_t, Z_t)(Yt​,Zt​)必须​​适应于​​信息流;也就是说,在任何时刻ttt,它的值只能依赖于s≤ts \le ts≤t的布朗运动WsW_sWs​的历史。

一个由未来决定的过程,如何能对未来保持无知?

答案在于​​条件期望​​的微妙力量。可以将其想象为基于当下所有可用信息对未来做出最好的猜测。过程YtY_tYt​本质上是最终结果的条件期望,并根据沿途累积的任何“成本”或“收益”(由函数fff表示)进行调整。例如,在最简单的情况f=0f=0f=0下,解就是Yt=E[g(XT)∣Ft]Y_t = \mathbb{E}[g(X_T) | \mathcal{F}_t]Yt​=E[g(XT​)∣Ft​],其中Ft\mathcal{F}_tFt​代表截至时刻ttt已知的所有信息。BSDE是动态计算这个演化期望的引擎。这与前向SDE有着深刻的区别,后者的解是从过去一步步构造出来的,就像一块接一块地砌砖。而在这里,整个蓝图由最终的殿堂决定,但每一块砖都必须在看不到未来砖块的情况下铺设。

角色阵容:价值(YYY)与敏感性(ZZZ)

那么,这些神秘的过程YtY_tYt​和ZtZ_tZt​究竟是什么?

过程YtY_tYt​最直观的理解是一个​​价值函数​​。在数学金融中,它可以是在到期时支付g(XT)g(X_T)g(XT​)的金融衍生品的价格。在控制论中,它可以是从状态XtX_tXt​出发的最优未来成本。在我们公路旅行的比喻中,它是在给定我们当前位置的情况下,预计的到达时间。它是时刻ttt时“博弈”的价值。

过程ZtZ_tZt​则更为微妙,并且在许多方面更有趣。它是管理随机性的关键。为了感受它,让我们再次审视YtY_tYt​的动态:dYt=⋯+ZtdWtdY_t = \dots + Z_t dW_tdYt​=⋯+Zt​dWt​。这个方程告诉我们,ZtZ_tZt​是乘以随机扰动dWtdW_tdWt​的系数。它精确地告诉我们,价值YtY_tYt​如何响应来自底层噪声源的无穷小冲击。

因此,ZtZ_tZt​代表了​​价值对噪声的敏感性​​。它是风险,是敞口。在金融领域,如果YtY_tYt​是标的资产为XtX_tXt​的期权价格,那么ZtZ_tZt​恰恰是​​对冲策略​​:它告诉你为了完美复制期权的价值并消除所有风险,在时刻ttt需要持有多少份标的资产。它是驯服随机性的秘诀。

解耦的魅力:寻找更简单的现实

坦率地说,求解一个耦合的FBSDE系统是困难的。但在许多重要情况下,会出现一个显著的简化。我们可能会猜测,复杂的价值过程YtY_tYt​并非某个抽象的实体,而仅仅是当前状态和时间的确定性函数:

Yt=u(t,Xt)Y_t = u(t, X_t)Yt​=u(t,Xt​)

这个函数u(t,x)u(t,x)u(t,x)如果存在,被称为​​解耦场​​ (decoupling field)。它打破了反馈循环,使我们只需观察当前状态XtX_tXt​就能确定价值YtY_tYt​。问题随之而来:我们如何找到这个神奇的函数uuu?

答案是随机分析中最优雅的结果之一。我们有两种描述YtY_tYt​动态的方式:

  1. 根据BSDE的定义:dYt=−f(t,Xt,Yt,Zt)dt+ZtdWtdY_t = -f(t, X_t, Y_t, Z_t) dt + Z_t dW_tdYt​=−f(t,Xt​,Yt​,Zt​)dt+Zt​dWt​。
  2. 对我们的猜测Yt=u(t,Xt)Y_t = u(t, X_t)Yt​=u(t,Xt​)应用​​伊藤公式​​(随机过程的链式法则)。

应用伊藤公式,我们得到了一个用uuu的偏导数和XtX_tXt​的动态表示的dYtdY_tdYt​新表达式。当我们令这两个dYtdY_tdYt​的表达式相等时,我们可以分别比较漂移项(dtdtdt项)和扩散项(dWtdW_tdWt​项)。

匹配扩散项,我们得到了一个关于ZtZ_tZt​性质的惊人洞见:

Zt=σ(t,Xt)⊤∇xu(t,Xt)Z_t = \sigma(t, X_t)^\top \nabla_x u(t, X_t)Zt​=σ(t,Xt​)⊤∇x​u(t,Xt​)

这是一个优美的公式。它表明,抽象的“敏感性”ZtZ_tZt​不过是价值函数的​​梯度​​∇xu\nabla_x u∇x​u,通过波动率矩阵σ⊤\sigma^\topσ⊤“投影”得到。梯度∇xu\nabla_x u∇x​u告诉我们价值uuu如何随空间位置的变化而变化。波动率σ\sigmaσ告诉我们哪些空间方向受到噪声WtW_tWt​的影响。该公式表明,ZtZ_tZt​只衡量价值在实际存在噪声的方向上的变化。如果某个方向没有噪声(该分量的σ\sigmaσ为零),那么无论uuu的梯度有多陡峭,ZtZ_tZt​都对此“视而不见”。

现在,匹配漂移项并代入我们新发现的ZtZ_tZt​表达式,整个随机系统就会坍缩成一个关于函数u(t,x)u(t,x)u(t,x)的、纯粹确定性的​​偏微分方程(PDE)​​。这个PDE是著名的费曼-卡茨公式的推广,它在随机过程世界和确定性分析世界之间架起了一座桥梁。为了求解FBSDE,我们可以转而求解这个PDE(通常是数值求解),然后利用其解u(t,x)u(t,x)u(t,x)来构造YtY_tYt​和ZtZ_tZt​。

一次具体的旅程:奥恩斯坦-乌伦贝克过程

让我们通过一个例子来具体说明。假设前向过程XtX_tXt​是一个​​奥恩斯坦-乌伦贝克过程​​,它常被用来模拟均值回归的量,如温度或利率:

dXt=κ(θ−Xt)dt+σdWtdX_t = \kappa(\theta - X_t) dt + \sigma dW_tdXt​=κ(θ−Xt​)dt+σdWt​

在这里,XtX_tXt​以速率κ\kappaκ不断被拉向一个长期均值θ\thetaθ,同时受到大小为σ\sigmaσ的噪声的随机扰动。

假设我们对一份金融合约感兴趣,它在未来某个时刻TTT支付该过程的平方,XT2X_T^2XT2​。我们还假设有一个贴现率rrr。该合约价值YtY_tYt​对应的BSDE是:

−dYt=−rYtdt−ZtdWtwithYT=XT2-dY_t = -r Y_t dt - Z_t dW_t \quad \text{with} \quad Y_T = X_T^2−dYt​=−rYt​dt−Zt​dWt​withYT​=XT2​

按照上一节的步骤,我们假设Yt=u(t,Xt)Y_t = u(t, X_t)Yt​=u(t,Xt​)。伊藤公式的魔力将这个问题转化为求解以下关于u(t,x)u(t,x)u(t,x)的PDE:

∂u∂t+κ(θ−x)∂u∂x+12σ2∂2u∂x2−ru=0withu(T,x)=x2\frac{\partial u}{\partial t} + \kappa(\theta - x)\frac{\partial u}{\partial x} + \frac{1}{2}\sigma^2\frac{\partial^2 u}{\partial x^2} - r u = 0 \quad \text{with} \quad u(T,x) = x^2∂t∂u​+κ(θ−x)∂x∂u​+21​σ2∂x2∂2u​−ru=0withu(T,x)=x2

这是布莱克-斯科尔斯方程的一个变体。虽然解析求解它是一个微积分练习,但其解具有一个由费曼-卡茨公式给出的、极其直观的概率意义:

u(t,x)=E[exp⁡(−r(T−t))XT2∣Xt=x]u(t, x) = \mathbb{E}[\exp(-r(T-t)) X_T^2 | X_t = x]u(t,x)=E[exp(−r(T−t))XT2​∣Xt​=x]

合约今天的价值,就是未来期望回报贴现到今天的值。因为奥恩斯坦-乌伦贝克过程是一个高斯过程,我们可以显式地计算这个期望。给定Xt=xX_t=xXt​=x,未来的值XTX_TXT​是一个正态随机变量,其均值和方差我们可以计算出来。XT2X_T^2XT2​的期望值就是其均值的平方加上其方差。代入这些,我们就能得到u(t,x)u(t,x)u(t,x)的封闭解,从而也得到了YtY_tYt​和ZtZ_tZt​的解。例如,在时刻t=0t=0t=0的价值是:

Y0=exp⁡(−rT)[(θ+(x0−θ)exp⁡(−κT))2+σ22κ(1−exp⁡(−2κT))]Y_0 = \exp(-rT) \left[ \left( \theta + (x_{0} - \theta) \exp(-\kappa T) \right)^{2} + \frac{\sigma^{2}}{2\kappa} \left( 1 - \exp(-2\kappa T) \right) \right]Y0​=exp(−rT)[(θ+(x0​−θ)exp(−κT))2+2κσ2​(1−exp(−2κT))]

这展示了整个工作流程:从一个耦合的随机系统出发,我们将其转化为一个确定性的PDE,其解给出了答案,而这个答案本身又具有清晰的概率解释。

终极反馈回路

到目前为止,我们主要考虑的是后向方程依赖于前向方程的情况。但如果前向方程也依赖于后向方程呢?

dXt=b(t,Xt,Yt,Zt)dt+σ(t,Xt,Yt)dWtdX_t = b(t, X_t, Y_t, Z_t) dt + \sigma(t, X_t, Y_t) dW_tdXt​=b(t,Xt​,Yt​,Zt​)dt+σ(t,Xt​,Yt​)dWt​

这是一个​​完全耦合的FBSDE​​。在我们的公路旅行比喻中,这意味着你的驾驶速度bbb可能依赖于你剩余的预期旅行时间YtY_tYt​(如果你迟到了,你就会加速)和当前的道路风险ZtZ_tZt​。这创造了一个真正的反馈回路。

同样的原理依然适用。解耦假设Yt=u(t,Xt)Y_t = u(t, X_t)Yt​=u(t,Xt​)仍然可以使用,但现在得到的PDE变得更加复杂——一个​​拟线性PDE​​,其系数本身依赖于解uuu及其梯度∇xu\nabla_x u∇x​u。这些方程处理起来要困难得多。事实上,这种反馈可能非常强,以至于解可能只在很短的时间范围TTT内存在。如果你计划得太远,你的行动与你对未来的评估之间的反馈回路可能会变得不稳定并“爆炸”。

这种丰富的结构,其中过去与未来交织在一起,随机性通过理解敏感性而被驯服,复杂的随机系统被确定性偏微分方程所镜像,正是FBSDE理论成为理解从金融、经济到工程、物理等问题的深刻而强大工具的原因。它证明了数学统一之美。

应用与跨学科联系

在领略了前向-后向随机微分方程(FBSDE)错综复杂的机制之后,你可能心生赞叹,但也会提出一个实际问题:这一切究竟有什么用?这是一个合理的问题。数学世界里充满了在期刊页面上诞生和消亡的美丽而精巧的结构。但FBSDEs不同。它们不仅仅是抽象的构造;它们是一种语言,一种强大且出人意料地普适的语言,用以描述任何智能系统所面临的最基本挑战之一:在不确定的世界中做出最优决策。

一旦你学会用FBSDEs的视角看世界,你就会开始发现它们无处不在。它们是惊人广泛的现象背后隐藏的蓝图,从驾驶航天器到为金融衍生品定价,从理解人群的涌现行为到训练下一代人工智能。在本章中,我们将探索这片广阔的领域,看看前向漂移的状态与其后向传播的“影子”之间的优雅共舞,如何为我们提供一种理解、预测和控制世界的新方式。

控制的总蓝图:从火箭到投资组合

让我们从最直接、最深刻的应用开始:控制的艺术。想象一下,你正试图让一辆火星车在火星上着陆。火星车有一个状态——它的位置和速度——它根据物理定律演化,但同时也受到随机大气湍流的冲击。这是你的前向过程,XtX_tXt​。你的目标是在特定时间到达特定着陆区,并且希望使用最少的燃料。这是一个最优控制问题。

在任何时刻,你如何决定推进器的推力大小?你需要一个策略。​​随机最大值原理(SMP)​​给出了答案,其数学核心就是一个FBSDE。该原理告诉我们,伴随着前向演化的物理状态XtX_tXt​,存在一个后向演化的“伴随”过程,我们称之为ptp_tpt​。这个伴随过程不是你能用传感器测量的物理量;它是一个“影子价格”或敏感性的度量。它回答了这个关键问题:“在此时此刻,对我的状态施加一个微小的推动,会对我的最终结果产生多大影响?”

FBSDE耦合了这两个视角。XtX_tXt​的前向方程简单描述了物理情境:当前状态 + 控制动作 + [随机噪声](/sciencepedia/feynman/keyword/stochastic_noise) -> 下一状态。ptp_tpt​的后向方程则计算敏感性,从你的最终目标开始,在时间上向后传播。后向方程的终端条件pTp_TpT​正是你的最终成本对最终状态的敏感性。神奇之处在于将它们联系起来:在任何时刻ttt的最优控制动作,是使一个称为哈密顿量的特殊函数最小化的动作,该函数平衡了动作的即时成本与由ptp_tpt​衡量的未来收益。本质上,你总是在做出从其对未来的影响来看是最佳的选择。

这个框架非常通用。但为了使其具体化,我们可以看看它的“谐振子”:​​线性二次(LQ)调节器​​问题。在这里,我们假设系统的物理特性是线性的(你的控制效果与其大小成正比),成本是二次的(与理想路径的微小偏差代价很小,但大的偏差代价会变得非常昂贵)。对于从工程到经济的大量现实世界系统来说,这是一个非常好的近似。在这种特殊的LQ情况下,复杂的FBSDE系统通常可以被显式求解,从而得到构成现代工程基石的优雅而实用的控制律。

该理论甚至强大到可以处理你的控制动作不仅影响系统方向,还影响其随机性的情况。想象一下,你正带领一家公司穿越动荡的市场。一些商业决策可能不仅影响你的预期利润(漂移),还可能影响你未来收益的风险性(扩散)。这在FBSDE中通过第二个伴随过程,即神秘的ZtZ_tZt​来体现,它量化了结果对噪声本身的敏感性。因此,最优策略不仅必须平衡成本和方向,还必须平衡风险。这就是现代金融对冲的数学基础。

最后,我们如何确定这个过程能找到最佳策略,而不仅仅是一个好的策略?一个被称为​​验证定理​​的美妙结果给了我们答案。它指出,如果问题具有某种结构——具体来说,如果哈密顿量在控制变量上是“凸”的,你可以把它想象成一个没有任何棘手的局部最小值让你陷入其中的地形——那么FBSDE的解不仅是最优的必要条件,也是充分条件。这是一个数学上的保证,确保你已经找到了那条唯一真正的最优路径。

两种视角的故事:FBSDEs与PDEs的统一

随机控制的故事有两位伟大的主角:安德烈·柯尔莫哥洛夫(Andrey Kolmogorov)(建立在诺伯特·维纳(Norbert Wiener)等人的工作之上),他给了我们随机过程的语言;以及列夫·庞特里亚金(Lev Pontryagin),他阐述了我们刚刚讨论过的最大值原理。但还有另一位巨人:理查德·贝尔曼(Richard Bellman),他发展了一种完全不同的方法,称为动态规划。

贝尔曼的思想,导出了​​哈密顿-雅可比-贝尔曼(HJB)方程​​,非常直观。他没有专注于一条最优路径,而是问:“从任何可能的初始状态xxx在任何可能的时刻ttt出发,我能取得的最好结果或‘价值’是什么?”这定义了一个“价值函数”,V(x,t)V(x,t)V(x,t)。如果你能构造出这个函数,找到最优路径就会像在由VVV定义的地形上滑雪下山一样简单。HJB方程是这个价值函数必须满足的一个偏微分方程(PDE)。

几十年来,最大值原理(导致FBSDEs)和动态规划(导致PDEs)被视为两个并行、强大但截然不同的理论。它们之间的联系揭示了数学中深刻而美丽的统一性。在适当的条件下,庞特里亚金世界中的伴随过程ptp_tpt​正是贝尔曼价值函数的梯度(斜率),并沿着最优路径进行评估。

pt=∇xV(Xt,t)p_t = \nabla_x V(X_t, t)pt​=∇x​V(Xt​,t)

这是一个启示。抽象的“影子价格”ptp_tpt​突然有了具体的几何意义:它是系统当前位置处价值地形的陡峭程度。FBSDE提供了一个“局部”视角,一个利用瞬时敏感性来导航一条最优路径的配方。HJB方程提供了一个“全局”视角,一张描绘所有可能情况价值的完整地图。它们如此紧密相关的事实表明,它们只是描述同一个潜在真理的两种不同语言。这种联系是现代数学的基石,将随机分析的路径世界与偏微分方程的空间世界联系起来。

群体的智慧:平均场博弈

现在让我们将视角从单个决策者放大到一个庞大的人群。想象一下股票市场中的交易员、城市中的司机,甚至是鱼群中的鱼。每个个体都在试图优化自己的目标,但他们的最佳策略取决于其他所有人的行为。如果其他所有人都在抛售一只股票,其价格就会下跌,从而影响你的决策。如果其他所有人都走高速公路,高速公路就会堵塞,从而影响你对路线的选择。这就是博弈论的范畴。

​​平均场博弈(MFG)​​是一个用于分析此类拥有近乎无限参与者场景的卓越数学框架。将它与物理学中更简单的“平均场”模型区分开来至关重要,后者通常由麦基恩-弗拉索夫方程(McKean-Vlasov equations)描述,其中粒子被动地与集体相互作用(就像磁体中的原子)。在MFG中,每个粒子都是一个理性代理人,一场宏大博弈中的玩家。

这种博弈的均衡是一个优美的、自洽的循环,被FBSDEs完美地捕捉。其工作原理如下:

  1. ​​假设一个群体行为:​​ 我们首先推测一个“平均场”,即一个描述整个群体如何随时间分布的概率分布流mtm_tmt​。
  2. ​​解决个体问题:​​ 然后我们选择一个代表性的代理人。对于这个代理人来说,群体的行为mtm_tmt​是给定的。他们的问题是找到最优控制策略来最小化其个人成本,该成本取决于他们自己的状态和这个外部平均场。这是一个标准的随机控制问题,其解由一个FBSDE刻画。
  3. ​​检查一致性:​​ 通过FBSDE找到的代理人的最优策略,将反过来产生某种生命周期行为。最后一步是看,由所有遵循此最优策略的代理人组成的群体的分布是否重新创造了我们最初假设的那个平均场mtm_tmt​。

如果确实如此,我们就找到了一个纳什均衡。这是一种集体理性的状态,在给定群体行为的情况下,没有单个个体有动机偏离。这种前向-后向结构是MFG的标志。一个前向方程(福克-普朗克方程)描述了群体分布如何演化,而一个后向方程(HJB方程,或者在单个代理人层面上是BSDE)描述了驱动个体选择的优化过程。在一些非常易于处理的情况下,比如线性二次MFG,这整个复杂的系统可以被求解,并且可以通过求解一组看起来很熟悉的黎卡提常微分方程来找到均衡。

破解密码:深度学习如何解决不可解问题

尽管FBSDEs(及其PDE表亲,HJB方程)在理论上很美,但它们有一个不为人知的秘密:它们在数值上极难求解,尤其是在高维空间中。这一直是一个主要的瓶颈,限制了它们的实际应用。一个有(比如说)100个变量的问题——这在金融或经济学中是常见情景——曾被认为是完全无法处理的。这种困难被称为​​“维度灾难”​​。

传统方法通常需要在状态空间上创建一个网格。如果你对100个维度中的每一个维度使用10个网格点,你将需要1010010^{100}10100个点——这个数字比可观测宇宙中估计的原子数量还要大。问题似乎毫无希望。

这时,人工智能的现代革命登场了。一类被称为​​深度BSDE方法​​的新算法取得了惊人的突破。其核心思想既简单又巧妙。求解BSDE的主要困难在于它在时间上是逆向的,并且依赖于未知过程ZtZ_tZt​。如果我们能“猜出”ZtZ_tZt​的函数形式呢?

这正是神经网络所做的事情。我们假设未知函数ZtZ_tZt​可以被一个深度神经网络逼近,该网络将时间ttt和状态XtX_tXt​作为输入。然后,我们为XtX_tXt​模拟大量随机的前向路径。在每条路径上,我们使用我们的神经网络在每一步生成对ZtZ_tZt​的猜测。利用BSDE的规则,这使我们能够计算出对最终值YTY_TYT​的猜测。但我们已经知道YTY_TYT​应该是什么——它由终端条件g(XT)g(X_T)g(XT​)给出。我们网络的计算结果与真实答案之间的差异就是一个误差。然后我们可以利用深度学习的标准机制来调整网络的参数以最小化这个误差。

这种方法之所以效果如此之好,是因为它是一种“无网格”方法。它不构建网格,而是依赖于蒙特卡洛抽样——从一系列随机样本中学习。获得准确估计所需的样本数量随维度的增加而增长的趋势,比基于网格的方法要温和得多。虽然维度灾难并未完全消除(复杂度仍然随维度呈多项式增长),但它已从一场指数级的灾难“缓解”为一个可控的挑战。这是一个游戏规则的改变者,为解决金融风险管理、分子动力学和经济建模中出现的高维FBSDEs打开了大门,而这些问题在十年前还仅限于理论领域。

从最优规划的深刻原理,到数学中的统一概念,再到描述集体行为的语言,以及现在成为一类被人工智能驯服的问题,前向-后向随机微分方程的旅程证明了科学思想的力量和相互关联性。它是一种为描述变化世界而锻造的语言,而我们才刚刚开始理解它所能表达的一切。