try ai
科普
编辑
分享
反馈
  • 连续函数逼近:一把数学万能钥匙

连续函数逼近:一把数学万能钥匙

SciencePedia玻尔百科
核心要点
  • Weierstrass 逼近定理指出,闭区间上的任意连续函数都可以被一个简单的多项式一致逼近。
  • Stone-Weierstrass 定理将这一强大概念推广到抽象空间,为傅里叶级数等工具提供了理论基础。
  • Bernstein 多项式提供了一种构造这些逼近的有效方法,并且是计算机图形学中贝塞尔曲线等技术的核心。
  • 逼近理论的原理不仅是抽象的,它更是解决物理学、工程学、人工智能和信号处理中实际问题的一把万能钥匙。

引言

我们如何才能把握无限的复杂性?是否有可能用简单、性质良好的数学工具来描述一个锯齿状、不可预测的自然现象?这个问题是分析学及其应用的核心。我们经常会遇到一些连续但过于“狂野”以至于无法用简单公式描述的函数。本文旨在应对这一根本性挑战,揭示一个深刻的数学真理:复杂可以通过简单来理解和驾驭。文章将证明,在广泛的条件下,即便是最错综复杂的连续函数,也可以用多项式以任意精度进行模仿。

本次探索的结构旨在帮助您从零开始建立理解。在第一部分“原理与机制”中,我们将深入探讨 Weierstrass 和 Stone 的基本定理,揭示逼近背后的理论保证。我们将考察像 Bernstein 多项式这样的构造性方法,并通过考虑不连续性和复分析中独特的局限性来探索该理论的边界。紧接着,“应用与跨学科联系”部分将展示这些抽象思想如何成为一把万能钥匙,为从物理学、信号处理到人工智能和理论计算机科学等不同领域解锁解决方案。准备好见证简单的逼近行为如何成为贯穿现代科学的一条主线。

原理与机制

想象一下,你正试图仅用一组简单的、光滑的、预制好的曲线来描述一条复杂蜿蜒的海岸线。这似乎是一项不可能完成的任务。海岸线有锯齿状的岩石、急转弯和不可预测的曲折。相比之下,你的光滑曲线则温和且性质良好。然而,我们故事的核心主题是一个深刻的数学真理:在出人意料的普遍条件下,这项“不可能”的任务不仅是可能的,而且是有保证的。自然界中那些“狂野”的连续函数,可以被我们所知的最“温和”的函数——多项式——以任意期望的精度进行模仿。

多项式出人意料的无处不在

让我们从 19 世纪 Karl Weierstrass 发现的一个优美且基础性的结果开始。​​Weierstrass 逼近定理​​指出,定义在闭有界区间(如 [0,1][0,1][0,1] 或 [−10,10][-10, 10][−10,10])上的任何连续函数都可以被多项式一致逼近。“一致逼近”是一种强形式的接近;它意味着我们可以找到一个多项式,在区间内的每一个点上,都与我们的目标函数保持在一个微小的、预先设定的距离(比如 ϵ\epsilonϵ)之内。

为了感受这一定理的力量,我们来考虑区间 [−1,1][-1, 1][−1,1] 上的一个简单却棘手的函数 f(x)=∣x∣f(x) = |x|f(x)=∣x∣。这个函数是完全连续的——你可以一笔画出它的图像。但它在 x=0x=0x=0 处有一个尖点,在该点上函数不可微。这个“扭结”意味着你无法在原点附近为 ∣x∣|x|∣x∣ 写出泰勒级数,而泰勒级数是我们创建多项式逼近的常用工具。泰勒级数要求函数无限可微,这是一个非常严格的要求。

那么,一个光滑流畅的多项式怎么可能模仿那个尖角呢?Weierstrass 定理向我们保证,这是可以的。它不承诺存在一个就是 ∣x∣|x|∣x∣ 的单一多项式(那是不可能的),但它保证存在一个多项式序列,比如 p1(x),p2(x),…p_1(x), p_2(x), \dotsp1​(x),p2​(x),…,在 [−1,1][-1, 1][−1,1] 上的每一点都逐渐逼近 ∣x∣|x|∣x∣。对于你指定的任何微小误差 ϵ\epsilonϵ,我们的序列中总会存在一个点,比如说 pN(x)p_N(x)pN​(x),在此之后序列中所有的多项式都完全位于 ∣x∣|x|∣x∣ 图像周围一个宽度为 ϵ\epsilonϵ 的走廊内。这些多项式在原点附近会变得越来越陡峭,使其“转弯”愈发尖锐,从而更紧密地模仿 ∣x∣|x|∣x∣ 的扭结。这里的核心要点是深刻的:​​在这种情况下,连续性,而非光滑性,是多项式逼近的唯一先决条件。​​

逼近蓝图:Bernstein 机器

Weierstrass 定理是一个“存在性定理”——它就像一张藏宝图,告诉你黄金存在,但没有给你一把铲子。在 20 世纪初,Sergei Bernstein 提供了一把铲子。他发现了一种构造性方法,可以为 [0,1][0,1][0,1] 上的任何连续函数 f(x)f(x)f(x) 实际构建这些逼近多项式。

第 nnn 个 ​​Bernstein 多项式​​ 由一个非凡的公式给出: Bn(f;x)=∑k=0nf(kn)(nk)xk(1−x)n−kB_n(f; x) = \sum_{k=0}^{n} f\left(\frac{k}{n}\right) \binom{n}{k} x^k (1-x)^{n-k}Bn​(f;x)=∑k=0n​f(nk​)(kn​)xk(1−x)n−k 这个公式可能看起来令人生畏,但其核心却非常直观。它是一个​​加权平均​​。(nk)xk(1−x)n−k\binom{n}{k} x^k (1-x)^{n-k}(kn​)xk(1−x)n−k 这一项是在 nnn 次独立试验中,如果成功概率为 xxx,则获得 kkk 次成功的概率。对于一个固定的 nnn,当 kkk 从 000 到 nnn 变化时,这一项会产生一系列在不同位置达到峰值的钟形曲线。该公式取函数在 n+1n+1n+1 个等距点 f(k/n)f(k/n)f(k/n) 处的值,并使用这些概率曲线对每个值进行加权。因此,多项式 Bn(f;x)B_n(f;x)Bn​(f;x) 是函数值的混合体,其中靠近 xxx 的点被赋予了更大的权重。

例如,我们可以为一个肯定不是多项式的函数(如在 [0,1][0,1][0,1] 上的 f(t)=exp⁡(t)f(t) = \exp(t)f(t)=exp(t))构建多项式逼近。即使是二次 Bernstein 多项式 B2(f;x)B_2(f;x)B2​(f;x),它仅在 t=0,1/2,1t=0, 1/2, 1t=0,1/2,1 处对函数进行采样,也已经开始捕捉其本质。随着 nnn 的增加,你在更多的点上对函数进行采样,多项式逼近也越来越紧密地贴近原始函数。正是这些多项式构成了​​贝塞尔曲线​​的数学核心,贝塞尔曲线在计算机图形和设计中被广泛用于创建光滑、可缩放的形状。

压力下的优雅:处理不连续性

一位优秀的科学家在学习了一条规则后,会立刻问:如果我打破它会发生什么?Weierstrass 定理要求连续性。如果我们的函数有一个跳跃,即一个​​不连续点​​,会怎么样?

让我们考虑一个函数,它在一个点 ccc 之前等于常数 AAA,然后突然跳跃到值 BBB。值得注意的是,Bernstein 多项式序列并不会爆炸或混乱地失效。在跳跃点 x=cx=cx=c 处,多项式序列 Bn(f;c)B_n(f;c)Bn​(f;c) 收敛到一个单一、确定的值:A+B2\frac{A+B}{2}2A+B​。它收敛到跳跃的中点!

为什么?Bernstein 多项式的概率解释给了我们答案。Bn(f;c)B_n(f;c)Bn​(f;c) 的值是 f(Xn/n)f(X_n/n)f(Xn​/n) 的期望值,其中 XnX_nXn​ 是一个随机变量,表示在成功概率为 ccc 的 nnn 次试验中成功的次数。中心极限定理告诉我们,当 nnn 变大时,这个二项分布在其均值 ncncnc 周围变得对称。这意味着在极限情况下,我们以相等的概率在 ccc 的左侧(其中 fff 是 AAA)和右侧(其中 fff 是 BBB)采样点。结果就是平均值。面对一个不可能的跳跃,多项式逼近优雅地取了中间值。

从线到世界:Stone-Weierstrass 的推广

数学是一个不断拓展视野的故事。Weierstrass 定理在线性区间上有效。我们能否逼近一个定义在二维正方形、球面或任何其他相当“好”的形状上的连续函数?答案是肯定的,这要归功于 ​​Stone-Weierstrass 定理​​,这是一个宏大的推广,也是现代分析学的基石。

该定理指出,一个函数“工具箱”(形式上称为​​子代数​​ A\mathcal{A}A)可以逼近一个“好的”空间(​​紧​​空间 KKK)上的任何连续实值函数,只要它满足两个简单条件:

  1. ​​它分离点:​​ 对于空间中任意两个不同的点,比如 p1p_1p1​ 和 p2p_2p2​,你的工具箱中必须有一个函数 ggg,使得 g(p1)≠g(p2)g(p_1) \neq g(p_2)g(p1​)=g(p2​)。你的工具必须能够区分点。
  2. ​​它在任何点都不为零:​​ 对于每个点 ppp,你的工具箱中必须有一个函数 hhh,在 ppp 点不为零。你的工具箱不能有共同的盲点。(一个简单的方法是,如果常数函数 f(x)=1f(x)=1f(x)=1 在你的工具箱里)。

让我们看看实际应用。考虑单位正方形 K=[0,1]×[0,1]K = [0,1] \times [0,1]K=[0,1]×[0,1] 上的函数 f(x,y)=x2+y2f(x,y) = \sqrt{x^2+y^2}f(x,y)=x2+y2​。这个函数是 ∣x∣|x|∣x∣ 的二维模拟;它是连续的,但在原点有一个“尖锐”的锥顶点。我们的工具箱是所有二元多项式的代数,比如 p(x,y)=c00+c10x+c01y+c20x2+…p(x,y) = c_{00} + c_{10}x + c_{01}y + c_{20}x^2 + \dotsp(x,y)=c00​+c10​x+c01​y+c20​x2+…。 我们的工具箱够好吗?单位正方形是紧的。多项式 g(x,y)=xg(x,y)=xg(x,y)=x 和 h(x,y)=yh(x,y)=yh(x,y)=y 可以分离任意两个不同的点。常数多项式 p(x,y)=1p(x,y)=1p(x,y)=1 在任何地方都不为零。条件满足!因此,Stone-Weierstrass 定理保证我们可以找到一个二元多项式序列,一致地逼近“锥形”函数 x2+y2\sqrt{x^2+y^2}x2+y2​。

“分离点”条件至关重要。假设我们将工具箱限制为仅包含对称多项式,即那些满足 p(x,y)=p(y,x)p(x,y) = p(y,x)p(x,y)=p(y,x) 的多项式。这个工具箱无法分离点 (2,3)(2,3)(2,3) 和 (3,2)(3,2)(3,2)。因此,我们用这个工具箱构建的任何函数也必须是对称的。我们可以逼近任何对称的连续函数,但我们永远无法逼近像 f(x,y)=xf(x,y)=xf(x,y)=x 这样的非对称函数。我们工具的局限性定义了我们能构建的世界。

宇宙点唱机:逼近波和振动

Stone-Weierstrass 定理最引人注目的应用之一揭示了多项式与波之间的深刻联系。这就是​​傅里叶级数​​理论,它声称任何“合理的”周期函数都可以表示为正弦和余弦的和。

这与多项式有何关系?诀窍在于改变视角。实直线上的一个 2π2\pi2π-周期函数可以被看作是复平面上单位圆 S1S^1S1 上的一个函数,其中圆上的一个点由 z=exp⁡(iθ)z = \exp(i\theta)z=exp(iθ) 给出。圆是一个紧空间。我们用于逼近的函数是​​三角多项式​​,它们是形如 ∑k=−NNckexp⁡(ikθ)\sum_{k=-N}^{N} c_k \exp(ik\theta)∑k=−NN​ck​exp(ikθ) 的有限和。利用欧拉公式 exp⁡(ikθ)=cos⁡(kθ)+isin⁡(kθ)\exp(ik\theta) = \cos(k\theta) + i\sin(k\theta)exp(ikθ)=cos(kθ)+isin(kθ),我们看到这些只是正弦和余弦的和。

用圆的语言来说,三角多项式只是一个关于 zzz 和 z−1z^{-1}z−1 的多项式(因为 zk=exp⁡(ikθ)z^k = \exp(ik\theta)zk=exp(ikθ) 和 z−k=exp⁡(−ikθ)z^{-k} = \exp(-ik\theta)z−k=exp(−ikθ))。我们可以验证圆上的这个三角多项式代数满足 Stone-Weierstrass 定理的条件(对于复函数,我们还需要一个额外条件:代数必须在复共轭下是封闭的,而它确实如此)。结论是里程碑式的:圆上的任何连续函数——因此也是直线上任何连续周期函数——都可以被三角多项式一致逼近。这个定理是信号处理、量子力学以及无数科学和工程领域的基石。

一道美丽的边界:复逼近的局限

到目前为止,这个故事一直是一个巨大的成功。似乎任何良好定义域上的任何连续函数都可以用多项式来逼近。但复数世界带来了一个惊喜。

首先,是简单的部分。如果我们有一个实数区间上的复值函数,f(t)=u(t)+iv(t)f(t) = u(t) + i v(t)f(t)=u(t)+iv(t),我们可以通过分别用实多项式 p(t)p(t)p(t) 和 q(t)q(t)q(t) 逼近它的实部 u(t)u(t)u(t) 和虚部 v(t)v(t)v(t),然后将它们组合成一个复多项式 P(t)=p(t)+iq(t)P(t) = p(t) + iq(t)P(t)=p(t)+iq(t) 来逼近它。

当我们考虑*复数域*上的复函数时,情况就变得复杂了,比如单位圆盘 D={z∈C:∣z∣≤1}D = \{z \in \mathbb{C} : |z| \le 1\}D={z∈C:∣z∣≤1}。考虑一个看似简单却具有欺骗性的连续函数 f(z)=zˉf(z) = \bar{z}f(z)=zˉ,即复共轭。我们能用变量 zzz 的多项式在圆盘上一致逼近这个函数吗?答案是令人震惊的​​“不”​​。

原因直击复分析与实分析区别的核心。关于 zzz 的多项式,如 P(z)=c0+c1z+c2z2+…P(z) = c_0 + c_1 z + c_2 z^2 + \dotsP(z)=c0​+c1​z+c2​z2+…,是​​解析​​函数。这是一种极度刚性的性质;它意味着,除其他事项外,这类函数在定义域内任何闭合回路上的积分都为零(柯西积分定理)。现在,让我们测试我们的目标函数 f(z)=zˉf(z) = \bar{z}f(z)=zˉ。如果我们在圆盘的边界(单位圆)上对它进行积分,我们会得到一个非零结果:∮∣z∣=1zˉ dz=2πi\oint_{|z|=1} \bar{z} \,dz = 2\pi i∮∣z∣=1​zˉdz=2πi。

这就是确凿的证据。如果 zˉ\bar{z}zˉ 可以被一个多项式序列 Pn(z)P_n(z)Pn​(z) 一致逼近,那么 zˉ\bar{z}zˉ 的积分必须是这些多项式积分的极限。但是每一个 Pn(z)P_n(z)Pn​(z) 的积分都是零!你无法通过一个零序列的极限得到一个非零数。函数 zˉ\bar{z}zˉ 具有一种基本的“非解析”特性,这种特性无法被解析函数消除或模仿。

衡量接近度并完善图景

最后,让我们放眼全局,思考我们一直在探索的领域。我们主要讨论了​​一致逼近​​,它对应于​​上确界范数​​ ∥f−p∥∞\|f-p\|_{\infty}∥f−p∥∞​,衡量的是最大误差。这是一种非常严格的接近形式。如果我们只关心平均误差,用 ​​L1L^1L1-范数​​ ∥f−p∥1=∫01∣f(x)−p(x)∣dx\|f-p\|_1 = \int_0^1 |f(x)-p(x)| dx∥f−p∥1​=∫01​∣f(x)−p(x)∣dx 来衡量,情况又会如何呢?一个简单但重要的事实是,一致收敛更强。如果你能使最大误差变小,那么平均误差也必然会变小。所以,Weierstrass 定理也保证了,在使用这种更宽容的接近度量时,多项式在连续函数空间中是稠密的。

这种稠密性的思想给了我们最后的洞见。Weierstrass 定理告诉我们,所有多项式的集合 P\mathcal{P}P 在连续函数空间 C[0,1]C[0,1]C[0,1] 中是​​稠密​​的。这意味着多项式就像散布在更大空间中的细尘;你总能找到一个在附近。然而,空间 P\mathcal{P}P 本身并不​​完备​​。它充满了“洞”。例如,exp⁡(x)\exp(x)exp(x) 的泰勒多项式序列是一个多项式序列,其极限 exp⁡(x)\exp(x)exp(x) 不是一个多项式。这是 P\mathcal{P}P 中的一个​​柯西序列​​,其极限在 P\mathcal{P}P 之外。

这类似于有理数 Q\mathbb{Q}Q 和实数 R\mathbb{R}R 之间的关系。有理数在实数中是稠密的,但有理数集是不完备的——它在像 2\sqrt{2}2​ 和 π\piπ 这样的数上有“洞”。连续函数空间 C[0,1]C[0,1]C[0,1] 是多项式空间的完备化,就像实数是有理数的完备化一样。它是一个完整、完备的舞台,分析学可以在这里恰当地进行,而多项式则是其基础、通用且出人意料地强大的构建模块。

应用与跨学科联系

我们花了一些时间欣赏逼近理论的理论机制,惊叹于像 Weierstrass 和 Stone 这样的巨匠如何证明,即便是最复杂的连续函数也可以被像多项式这样更简单的函数以任意精度模仿。这是一段优美的数学。但它仅仅是一件博物馆展品吗?一个优雅但孤立的想法?你会欣喜地发现,答案是响亮的*“不”*。这个思想——我们可以通过掌握简单来理解、操纵和计算复杂——并非一个纯粹的抽象概念。它是一把万能钥匙,在从最纯粹的数学到最实用的工程和前沿计算等各种领域中打开大门。在本章中,我们将进行一次巡览,看看这个原理如何发挥作用,见证它如何为看似无关的世界带来清晰和力量。

函数与物理的无形结构

让我们从数学和物理的抽象世界开始,在那里,我们的万能钥匙揭示了隐藏的结构。想象你有一个函数 f(x)f(x)f(x),定义在一个区间上,比如从 000 到 111。但你无法看到函数本身。相反,一个神秘的预言家告诉你一串数字:f(x)f(x)f(x) 乘以 x0x^0x0 的积分,然后是乘以 x1x^1x1,再乘以 x2x^2x2,依此类推,直到所有整数次幂 nnn。这些数,∫01xnf(x) dx\int_0^1 x^n f(x) \,dx∫01​xnf(x)dx,被称为函数的矩。问题是,这串数字是唯一的“指纹”吗?如果两个连续函数有完全相同的矩集,它们一定是同一个函数吗?

起初,这似乎无法回答。一个无限的平均值列表如何确定函数在每一个点上的值呢?答案在于 Weierstrass 逼近定理。如果我们有两个矩相同的函数 fff 和 ggg,那么它们的差 h(x)=f(x)−g(x)h(x) = f(x) - g(x)h(x)=f(x)−g(x) 具有性质 ∫01xnh(x) dx=0\int_0^1 x^n h(x) \,dx = 0∫01​xnh(x)dx=0 对所有 nnn 成立。根据线性性质,这意味着 h(x)h(x)h(x) 与任何多项式的积分都为零。现在,Weierstrass 定理告诉我们,可以找到一个多项式序列,它任意接近连续函数 h(x)h(x)h(x)。如果我们将 h(x)h(x)h(x) 与自身积分,我们发现 ∫01h(x)2 dx\int_0^1 h(x)^2 \,dx∫01​h(x)2dx 必须是全为零的积分序列的极限。由于 h(x)2h(x)^2h(x)2 是一个非负连续函数,其积分为零的唯一可能是函数本身处处为零。因此,f(x)f(x)f(x) 必须等于 g(x)g(x)g(x)。矩确实是唯一的指纹! 这个强大的结果,被称为矩问题,是逼近理论的一个直接而优美的推论。

同样是这个原理——将一个性质从简单函数(多项式)推广到所有连续函数——让我们能为物理和工程中一些看似无意义的操作赋予意义。考虑一个对称张量 T\mathbf{T}T,它可以代表材料内部的应力或应变。我们知道如何对张量进行加法,也可以定义 T2=TT\mathbf{T}^2 = \mathbf{T}\mathbf{T}T2=TT 的含义。由此,我们可以定义张量的任何多项式函数 p(T)p(\mathbf{T})p(T)。但像 T\sqrt{\mathbf{T}}T​ 或 ln⁡(T)\ln(\mathbf{T})ln(T) 这样的表达式可能意味着什么?这些对于现代材料变形理论至关重要。答案再次来自逼近理论。我们首先使用谱定理看到,对于一个多项式 ppp,张量 p(T)p(\mathbf{T})p(T) 的特征值为 p(λi)p(\lambda_i)p(λi​),其中 λi\lambda_iλi​ 是 T\mathbf{T}T 的特征值。现在,对于一个一般的连续函数 fff,比如平方根,Weierstrass 定理告诉我们,可以找到一个收敛于 fff 的多项式序列 pkp_kpk​。然后我们可以将 f(T)f(\mathbf{T})f(T) 定义为张量序列 pk(T)p_k(\mathbf{T})pk​(T) 的极限。这个极限保证存在,并且会产生一个新的张量,其特征值就是 f(λi)f(\lambda_i)f(λi​)。 因此,逼近理论提供了一种严谨且一致的方法来构建张量的泛函演算,将一个概念上的难题转变为一个定义明确且不可或缺的工具。

信号的交响曲与最优化的艺术

现在让我们转向一个充满波和信号的世界。这里的语言通常是正弦和余弦——傅里叶分析的构建模块。这些三角函数当然是三角变量中一种特殊的多项式,它们在描述周期性现象方面表现出色。然而,它们有一个关键的局限性。三角多项式本质上是周期性的。如果你试图用它们来逼近区间 [a,b][a, b][a,b] 上的非周期连续函数,你会发现只有当函数在两端的值相同时,即 f(a)=f(b)f(a) = f(b)f(a)=f(b),你才能成功。为什么?因为你的逼近工具,即三角多项式,都具有这个性质。它们被“困”在一个圆上,无法逼近不遵守这种圆形边界条件的函数。相比之下,代数多项式没有这样的限制,可以逼近区间上的任何连续函数,正如 Weierstrass 所保证的那样。 这凸显了任何逼近问题中的一个关键选择:为任务挑选正确的“基函数”。

这种选择具有深远的实际影响。考虑构建一个数字信号,比如一个从 −V0-V_0−V0​ 跳到 +V0+V_0+V0​ 的“方波”。我们可以尝试通过将其傅里叶级数中的光滑正弦波相加来构建这个边缘锐利的函数。当我们添加越来越多的项时,我们的逼近效果会越来越好……在大多数情况下是这样。在跳跃点附近,会出现一种奇特而顽固的“过冲”。即使有无限多项,逼近值也会比目标值 V0V_0V0​ 超出约占总跳跃高度 9%9\%9% 的固定量。这就是著名的吉布斯现象。 它完美地说明了傅里叶级数的收敛在不连续点处不是一致的。Weierstrass 定理只承诺对连续函数的一致收敛;对于不连续的函数,我们光滑的正弦波尽了最大努力,但留下了一个永久性的、振荡的瑕疵。

工程师们作为务实的人,并没有被吓倒。如果完美是不可能的,我们至少能做到最优的不完美吗?这是现代数字滤波器设计背后的核心思想。假设你想设计一个低通滤波器,它应该完美地通过某个截止频率以下的所有频率,并完美地阻断该频率以上的所有频率。这种理想的“砖墙式”滤波器是一个不连续函数,就像方波一样,无法完美实现。Parks-McClellan 算法将这一挑战重新表述为一个形式化的逼近问题。滤波器的响应由一个余弦多项式描述。目标是找到一个特定的多项式,使得在所需频带内与理想滤波器形状的最大偏差(“最坏情况误差”)最小化。这是一个切比雪夫逼近问题。绝妙的是,其解决方案是一个误差函数呈“等波纹”的滤波器——它上下摆动,触及最大误差边界特定次数,且从不超出。 与吉布斯现象中单一的有问题的过冲不同,误差完美地分布在各个频带上,实现了最佳的权衡。这是通过逼近理论的视角,将局限性转化为设计原则的一个惊人例子。

计算、智能与对真理的探寻

逼近理论的影响力延伸到了计算领域最现代和最抽象的范畴。考虑用神经网络构建人工智能的探索。神经网络的核心是一个函数逼近器。它通过调整内部参数来学习模仿一个目标函数,无论这个函数代表的是一张图片包含猫的概率,还是一个游戏中特定策略的价值。

一个引人入胜的应用出现在计算经济学中。经济模型通常涉及约束,比如一个人不能在资产为零以下借款。“价值函数”,代表一个主体的长期福祉,常常在借贷约束处出现一个“扭结”——一个其导数不连续的尖角。现在,如果我们想教一个神经网络来逼近这个价值函数,我们应该使用什么样的“神经元”(激活函数)?一个流行的选择是光滑的双曲正切函数 tanh⁡(x)\tanh(x)tanh(x)。但由 tanh⁡\tanhtanh 单元构建的网络总是光滑的。它可以尝试通过创建一个曲率非常高的区域来模仿扭结,但永远无法形成一个真正的角。另一种选择是修正线性单元(ReLU),由简单、不光滑的函数 f(x)=max⁡{0,x}f(x) = \max\{0,x\}f(x)=max{0,x} 定义。一个由 ReLU 单元组成的网络是一个分段线性函数。它天然就是带扭结的!它可以高效而精确地表示价值函数在约束附近的尖角。对于固定数量的参数,ReLU 网络在约束附近提供了对经济现实的更好逼近,从而能更准确地预测行为。 我们选择的逼近基不仅仅是一个技术细节;它关乎于使我们工具的结构与问题的结构相一致。

最后,支撑逼近理论的思想甚至在理论计算机科学的最高层级中产生共鸣。著名的 MIP∗=NEXPMIP^* = NEXPMIP∗=NEXP 定理将多证明者交互式证明与非确定性指数时间计算联系起来。该证明的一个关键部分涉及“低次检验”。验证者想要检查一个由两个不通信的证明者提供的大量数据表是否对应于一个低次多元多项式。读取整个表是不可能的。取而代之的是,验证者在高维空间中选择一条随机直线,并向证明者索取该直线上的值。神奇之处在于:一个低次多元多项式的一个基本性质是,它在任何直线上的限制都是一个低次单变量多项式。一个非低次多项式的函数极不可能在随机选择的直线上具有此性质。通过检查单条随机直线上几个点的一致性,验证者可以对整个函数的全局结构获得高度的置信度。 多项式的简单、刚性结构,正是我们用于逼近的函数,在这个抽象而深刻的背景下成为了一种强大的验证工具。

这条连接局部检验与全局性质的线索同样出现在数论中。我们如何判断一个数列是否在区间 [0,1)[0,1)[0,1) 中“随机”分布?Weyl 判据给出了答案:该序列是一致分布的,当且仅当指数函数 e2πikxne^{2\pi i k x_n}e2πikxn​ 的某些平均值趋于零。为什么是这些特定的函数?因为,根据 Stone-Weierstrass 定理,三角多项式在圆上的连续函数中是稠密的。通过对这个基集进行检验,我们实际上是在对所有连续函数进行检验,而这又等价于涉及区间的原始定义。

从通过矩来识别函数,到定义物理定律,到设计电子产品,到建模智能,再到探索证明的本质,用多项式及其同类进行逼近这个简单而优美的思想,是贯穿科学与数学核心的一个统一主题。它证明了一个事实:理解简单是征服复杂的最有力的方式。