try ai
科普
编辑
分享
反馈
  • 下和与上和

下和与上和

SciencePedia玻尔百科
核心要点
  • 下和与上和通过构建完全位于曲线下方或完全延伸到曲线上方的矩形,来创建面积的不足近似和过剩近似。
  • 如果通过不断细化区间分割,可以使下和与上和之间的差距被压缩至零,那么一个函数就被定义为可积的。
  • 这个框架证明了所有连续函数和单调函数都是可积的,保证了对于这些大类函数,“夹逼”过程必定会成功。
  • 和的理论验证了积分的基本性质,并通过提供一种严谨处理复杂或振荡函数的方式,为数值方法奠定了基础。

引言

求解曲线下面积的概念是微积分的基石,但我们如何为复杂的、任意的函数精确地定义和计算这个面积呢?虽然简单的几何公式足以应付矩形和三角形,但我们需要一种更强大、更普适的方法来处理科学和数学中遇到的广阔曲线世界。本文通过引入优美的下和与上和理论来弥补这一根本性缺口。它提供了一种积分的形式化定义,不是通过一个公式,而是通过一个近似和夹逼的过程。在第一章“原理与机制”中,您将学习如何使用分割来构造这些和,并看到它们如何包围真实面积,从而引出一个严谨的可积性判据。随后,“应用与跨学科联系”一章将探讨该理论的深远影响,展示它如何驾驭复杂函数,验证微积分的代数法则,并构成现代计算方法的理论基石。

原理与机制

所以,我们有了这个寻找曲线下面积的绝妙想法。但我们实际上该如何做到呢?如果形状是一个简单的矩形或三角形,你从小就知道该怎么做。但对于抛物线的优美曲线,或是圆的弧线呢?这类形状的面积没有简单的公式。我们需要的是一个通用策略,一台可靠的机器,它能接收(几乎)任何行为良好的函数,并输出其下方的面积。

事实证明,这个策略非常简单优美。这是一个“包围与夹逼”的游戏。我们将从两侧逼近真实面积。我们会构造一个我们知道偏小的近似值,以及另一个我们知道偏大的近似值。真实面积,如果存在的话,必然被夹在它们之间。然后,我们会把这个包围圈收得越来越紧,直到只剩下一个唯一可能的值作为面积。

包围一个难以捉摸的面积

想象一下函数 f(x)=x2f(x) = x^2f(x)=x2 从 x=0x=0x=0 到 x=2x=2x=2 所描绘的曲线,或者是由 f(x)=1−x2f(x) = \sqrt{1-x^2}f(x)=1−x2​ 在区间 [0,1][0, 1][0,1] 上给出的优雅四分之一圆。要开始我们的包围游戏,我们首先将 xxx 轴上的区间切成更小的片段。这组切分点被称为一个​​分割​​,我们可以用 P={x0,x1,…,xn}P = \{x_0, x_1, \ldots, x_n\}P={x0​,x1​,…,xn​} 来表示。每一个小片段,如 [xi−1,xi][x_{i-1}, x_i][xi−1​,xi​],就是一个​​子区间​​。

现在,对于每个子区间,让我们看看它上方那部分的曲线。函数在这个小段中达到的最低值是多少?我们称这个值为​​下确界​​,或 mim_imi​。最高值是多少?我们称之为​​上确界​​,或 MiM_iMi​。如果函数是连续的,这些值就是该段内的最小值和最大值。

利用这些值,我们可以在每个子区间上构建两种类型的矩形。一种的高度是 mim_imi​——“矮”矩形。它紧贴在曲线下方。另一种的高度是 MiM_iMi​——“高”矩形,它刚好高出一点以完全包含曲线。

下和与上和:构建地板与天花板

如果我们将所有矮矩形的面积相加,我们得到的就是所谓的​​下达布和​​,记为 L(f,P)L(f, P)L(f,P)。这个和是一个块状图形的面积,该图形完全包含在我们试图寻找的面积之内。这是我们保证的不足近似值。 L(f,P)=∑i=1nmi(xi−xi−1)L(f, P) = \sum_{i=1}^{n} m_i (x_i - x_{i-1})L(f,P)=∑i=1n​mi​(xi​−xi−1​)

类似地,将所有高矩形的面积相加,我们得到​​上达布和​​,U(f,P)U(f, P)U(f,P)。这是我们保证的过剩近似值;真实面积完全被它包含。 U(f,P)=∑i=1nMi(xi−xi−1)U(f, P) = \sum_{i=1}^{n} M_i (x_i - x_{i-1})U(f,P)=∑i=1n​Mi​(xi​−xi−1​)

所以,对于任何分割 PPP,我们都成功地将真实面积 AAA 包围了起来: L(f,P)≤A≤U(f,P)L(f, P) \leq A \leq U(f, P)L(f,P)≤A≤U(f,P)

让我们用最简单的情况来检验这台机器:一个常数函数 f(x)=kf(x)=kf(x)=k,在区间 [a,b][a, b][a,b] 上。在任何子区间上,函数值都不会改变。它的最低值是 kkk,最高值也是 kkk。所以,对所有的 iii 都有 mi=Mi=km_i = M_i = kmi​=Mi​=k。当我们计算这些和时,我们发现: L(f,P)=∑i=1nk(xi−xi−1)=k∑i=1n(xi−xi−1)=k(b−a)L(f, P) = \sum_{i=1}^{n} k (x_i - x_{i-1}) = k \sum_{i=1}^{n} (x_i - x_{i-1}) = k(b-a)L(f,P)=∑i=1n​k(xi​−xi−1​)=k∑i=1n​(xi​−xi−1​)=k(b−a) U(f,P)=∑i=1nk(xi−xi−1)=k∑i=1n(xi−xi−1)=k(b−a)U(f, P) = \sum_{i=1}^{n} k (x_i - x_{i-1}) = k \sum_{i=1}^{n} (x_i - x_{i-1}) = k(b-a)U(f,P)=∑i=1n​k(xi​−xi−1​)=k∑i=1n​(xi​−xi−1​)=k(b−a) 下和与上和是相同的,并且它们给出了显而易见的答案:一个宽为 (b−a)(b-a)(b−a) 高为 kkk 的矩形的面积。我们的机器在这个平凡的情况下完美运作。

对于一个更有趣的函数,比如在 [0,2][0, 2][0,2] 上的 f(x)=x2f(x) = x^2f(x)=x2,使用一个简单的分割 P={0,1,2}P = \{0, 1, 2\}P={0,1,2},函数是递增的。在第一个子区间 [0,1][0, 1][0,1],最低值是 f(0)=0f(0)=0f(0)=0,最高值是 f(1)=1f(1)=1f(1)=1。在第二个子区间 [1,2][1, 2][1,2],最低值是 f(1)=1f(1)=1f(1)=1,最高值是 f(2)=4f(2)=4f(2)=4。计算出的和为 L(f,P)=1L(f, P) = 1L(f,P)=1 和 U(f,P)=5U(f, P) = 5U(f,P)=5。真实面积被包围在1和5之间。这是一个很宽的包围圈,但这是一个开始!对于一个递减函数,如 f(x)=1/xf(x)=1/xf(x)=1/x,逻辑是相同的,但每个区间上的下确界和上确界分别在右端点和左端点取到。

夹逼:如何让你的猜测更精确

一个介于1和5之间的包围圈并不十分有用。我们如何改进它?我们可以让我们的分割更精细!想象一下,我们取一个现有的分割 PPP,并添加一个点来创建一个新的、​​更精细的​​分割 P′P'P′。比方说,我们在子区间 [xi−1,xi][x_{i-1}, x_i][xi−1​,xi​] 中添加一个点 ccc。这一个子区间就变成了两个:[xi−1,c][x_{i-1}, c][xi−1​,c] 和 [c,xi][c, x_i][c,xi​]。

这对和有什么影响呢?在这两个新的、更小的区间里,上确界(高点)只可能小于或等于原来较大区间的上确界。它们不可能更高!所以,上和要么保持不变,要么更有可能变得更小。对称地,新区间里的下确界(低点)只可能大于或等于原来的下确界。所以,下和要么保持不变,要么变得更大。

这是关键的洞见!每当我们细化分割,我们包围圈的地板(LLL)就会升高,天花板(UUU)就会降低。我们有这样一串优美的不等式链: L(f,P)≤L(f,P′)≤U(f,P′)≤U(f,P)L(f, P) \leq L(f, P') \leq U(f, P') \leq U(f, P)L(f,P)≤L(f,P′)≤U(f,P′)≤U(f,P) 包围圈只会越来越紧。那么,积分的过程,就是夹逼这个包围圈的过程。我们想象让分割越来越细,添加越来越多的点。如果下和与上和都收敛到同一个数,那么我们就成功了。我们已经将包围圈压缩到了一个点,而那个点必定是真实面积。一个能让这个夹逼过程成功的函数被称为​​可积的​​。

差距的剖析:振幅与可积性

我们方法能否成功,完全取决于我们是否能让上和与下和之间的差距 U(f,P)−L(f,P)U(f, P) - L(f, P)U(f,P)−L(f,P) 变得任意小。让我们更仔细地看看这个差距。对于每个子区间,对差距的贡献是一个小的“不确定性矩形”的面积,其宽度为 Δxk=xk−xk−1\Delta x_k = x_k - x_{k-1}Δxk​=xk​−xk−1​,高度为 Mk−mkM_k - m_kMk​−mk​。这个高度,即一个子区间上上确界与下确界之差,被称为函数的​​振幅​​,ωk\omega_kωk​。

总差距就是这些不确定性矩形面积的总和: U(f,P)−L(f,P)=∑k=1n(Mk−mk)Δxk=∑k=1nωkΔxkU(f, P) - L(f, P) = \sum_{k=1}^{n} (M_k - m_k)\Delta x_k = \sum_{k=1}^{n} \omega_k \Delta x_kU(f,P)−L(f,P)=∑k=1n​(Mk​−mk​)Δxk​=∑k=1n​ωk​Δxk​

所以,可积性的问题就变成了:我们能否找到一个足够精细的分割,使得这些振幅矩形的总面积任意小?对于某些函数,答案是响亮的“是”。对于另一些函数,则是令人沮丧的“否”。

函数群英(与恶棍)谱

让我们见识一下这个游戏中的一些角色。

​​英雄:可积函数​​

​​单调函数​​——那些在区间上始终递增或始终递减的函数——是一大类重要的英雄。对于这些函数,我们不仅可以证明差距会缩小,而且可以确切地说出它缩小的速度。 考虑将 [a,b][a,b][a,b] 均匀分割成 nnn 份,每份宽度为 b−an\frac{b-a}{n}nb−a​。对于一个递增函数,任何子区间 [xk−1,xk][x_{k-1}, x_k][xk−1​,xk​] 的下确界是 f(xk−1)f(x_{k-1})f(xk−1​),上确界是 f(xk)f(x_k)f(xk​)。差距 U−LU-LU−L 变成了一个令人愉快的​​伸缩求和​​: U(f,Pn)−L(f,Pn)=∑k=1n(f(xk)−f(xk−1))b−anU(f, P_n) - L(f, P_n) = \sum_{k=1}^{n} (f(x_k) - f(x_{k-1})) \frac{b-a}{n}U(f,Pn​)−L(f,Pn​)=∑k=1n​(f(xk​)−f(xk−1​))nb−a​ =b−an[(f(x1)−f(x0))+(f(x2)−f(x1))+⋯+(f(xn)−f(xn−1))]= \frac{b-a}{n} [ (f(x_1)-f(x_0)) + (f(x_2)-f(x_1)) + \dots + (f(x_n)-f(x_{n-1})) ]=nb−a​[(f(x1​)−f(x0​))+(f(x2​)−f(x1​))+⋯+(f(xn​)−f(xn−1​))] =b−an(f(xn)−f(x0))=b−an(f(b)−f(a))= \frac{b-a}{n} (f(x_n) - f(x_0)) = \frac{b-a}{n} (f(b) - f(a))=nb−a​(f(xn​)−f(x0​))=nb−a​(f(b)−f(a)) 这是一个了不起的结果。差距与 nnn 成反比。当我们通过增加 nnn 来使分割更精细时,差距必定趋向于零!这意味着任何单调函数都是可积的。这极其强大。甚至函数有跳跃也没关系,只要它保持大致一个方向。像 f(x)=x+⌊3x⌋f(x) = x + \lfloor 3x \rfloorf(x)=x+⌊3x⌋ 这样的函数,虽然有阶梯状的不连续点,但它仍然是单调的(非递减的),因此根据同样的论证是完全可积的。

当然,所有在闭区间上的​​连续函数​​也都是可积的。直观地说,连续性意味着我们可以通过简单地让子区间足够窄,来使任何子区间上的振幅 ωk\omega_kωk​ 变得任意小。

我们还可以看到,一些简单的操作不会破坏可积性。如果你取一个可积函数 f(x)f(x)f(x),然后将整个图像向上平移一个常数 CCC 得到 g(x)=f(x)+Cg(x) = f(x) + Cg(x)=f(x)+C,你所做的只是给你的和增加了一个面积为 C(b−a)C(b-a)C(b−a) 的大矩形。下和与上和都精确地增加了这个量,函数仍然是可积的。

​​恶棍:一个不可积函数​​

要真正欣赏英雄,我们必须见识一个恶棍。考虑一下奇怪而狂野的​​狄利克雷函数​​。假设它被定义为:如果 xxx 是有理数,则函数值为 c1c_1c1​;如果 xxx 是无理数,则为 c2c_2c2​,且 c1>c2c_1 > c_2c1​>c2​。 现在,试着包围这个怪物下方的面积。取任何子区间,无论多么微小。因为有理数和无理数都是处处稠密的,这个微小的区间将既包含函数值为 c1c_1c1​ 的点,也包含函数值为 c2c_2c2​ 的点。

这对我们的和有什么影响呢?在每一个子区间上,上确界 MkM_kMk​ 都是 c1c_1c1​,下确界 mkm_kmk​ 都是 c2c_2c2​。振幅 ωk\omega_kωk​ 始终是 c1−c2c_1 - c_2c1​−c2​。差距根本不依赖于分割! U(f,P)−L(f,P)=(c1−c2)∑i=1n(xi−xi−1)=(c1−c2)(b−a)U(f, P) - L(f, P) = (c_1 - c_2) \sum_{i=1}^{n} (x_i - x_{i-1}) = (c_1 - c_2)(b-a)U(f,P)−L(f,P)=(c1​−c2​)∑i=1n​(xi​−xi−1​)=(c1​−c2​)(b−a) 差距是一个固定的正常数。你可以将区间切分一百万次、十亿次、一万亿次,差距永远不会缩小。下和与上和永远不会相遇。包围圈永远无法闭合。这个函数是不可积函数的经典例子。它是一个美丽的怪物,因为它精确地向我们展示了可积性判据的意义所在——它是一个驯服混乱的条件,确保当我们放大时,函数的行为变得可控,而不是无限粗糙。

应用与跨学科联系

现在我们已经彻底考察了上和与下和——这个由高矮不一的矩形构成的优美机器——的内部运作,你可能会问:“这一切到底是为了什么?”这仅仅是为了满足数学家的迂腐练习,一种证明我们对面积的直觉早已知晓之事的途径吗?我希望你能逐渐看到,答案是一个响亮的“不”。这套机制远不止是寻找面积的工具;它是一种强大而精妙的思维方式,让我们能够理解一个混乱、复杂且连续的世界。它为整个积分学大厦提供了坚实的基础,其应用遍及科学、工程,甚至延伸到“测量某物究竟意味着什么”这类哲学问题。

让我们启动这台机器,看看它到底能做什么。

驯服复杂性的艺术

我们积分概念的第一个也是最明显的用途是处理那些不是简单直线或抛物线的函数。对于任何“良好”的连续函数,比如 f(x)=cx3f(x) = c x^3f(x)=cx3 的光滑曲线,证明当我们的分割越来越细时,上和与下和之间的差距 U(Pn,f)−L(Pn,f)U(P_n, f) - L(P_n, f)U(Pn​,f)−L(Pn​,f) 会缩小至零,这是一个直接的、近乎机械的过程。这是理想情况,就像测量一条笔直道路的长度。但真实世界很少如此干净。当我们的函数出现小故障、跳跃或其他奇怪行为时会发生什么?这正是我们定义的真正威力开始闪耀的地方。

想象你是一名信号处理工程师,正在分析一串数据。信号大部分是平滑的,但偶尔会出现一个突然的、瞬时的“尖峰”——一个单点误差。或者你是一位物理学家,正在为一个附有几个点状质量的细线建模。你描述密度的函数几乎处处为零,但在少数几个点上具有非零值。你还能找到一个有意义的平均值或总质量吗?我们的机制给出了一个自信的“能”。

让我们考虑一个除了在有限个点上跳升到某个值 α\alphaα 外,处处为零的函数。常识可能会认为这些尖峰会毁掉一切。但想想上和。这些尖峰只影响包含它们的矩形。由于只有有限数量的尖峰,我们可以选择一个足够精细的分割,将每个尖峰“困”在一个极其狭窄的矩形内。虽然这几个矩形的高度是 α\alphaα,但它们的总宽度可以做得任意小。因此,这些“尖峰矩形”的面积之和可以做得任意接近于零。与此同时,下和总是零,因为每个区间,无论多小,都包含函数值为零的点。随着我们的分割越来越精细,上和被向下挤压,向着下和靠近,它们最终在零点相遇。积分是零!积分以其智慧认识到,在连续的世界里,有限个孤立点没有“实体”。它们是机器中的幽灵。

如果函数更加狂野呢?考虑函数 f(x)=sin⁡(1/x2)f(x) = \sin(1/x^2)f(x)=sin(1/x2) 在原点附近的行为。那里简直是一片疯狂!当 xxx 越来越接近零时,函数振荡得越来越快,在 111 和 −1-1−1 之间无限次地摆动。这似乎无法被固定下来。但同样,我们的方法比混乱更聪明。我们可以不使用均匀分割,而是使用一个定制的分割。我们创建一个微小的区间,比如从 000 到 δ\deltaδ,将所有无限的疯狂隔离起来。在这个小区间内,振幅 Mi−miM_i - m_iMi​−mi​ 达到其最大值 222。但对总不确定性 U−LU-LU−L 的贡献是2×δ2 \times \delta2×δ。我们只需选择足够小的 δ\deltaδ,就可以使这个贡献任意小!在这个隔离区之外,从 δ\deltaδ到 111,函数是行为良好且连续的。我们可以用标准的精细分割覆盖那部分,并使其对不确定性的贡献也变得很小。通过这种“分而治之”的策略,我们可以证明该函数是可积的。我们驯服了一头无限的野兽,不是通过与之搏斗,而是通过巧妙地将其围堵起来。

现实的代数

科学不是关于孤立的事实,而是关于关系。我们不断地组合各种量——缩放它们、乘以它们、求它们的倒数。对任何数学工具的一个关键考验是它是否尊重这些关系。当我们在函数上进行代数运算时,我们的积分概念是否表现得合乎逻辑?

假设你有一个可积函数 fff,你通过简单地缩放它来创建一个新函数,g(x)=cf(x)g(x) = c f(x)g(x)=cf(x)。这可能像单位换算一样简单,从米到英尺。上和与下和立即给出了答案。当你用一个正常数 ccc 缩放一个函数时,你也用 ccc 缩放了上确界和下确界。新函数的差值 U−LU-LU−L 只是旧差值的 ccc 倍。如果你用一个负数 ccc,上确界和下确界的作用会互换,但差值的绝对值仍然按 ∣c∣|c|∣c∣ 缩放。所以,如果你能使 fff 的不确定性任意小,你也能对 cfcfcf 做到同样的事情。这就是为什么你可以把常数从积分中提出来,这是你从第一堂微积分课起就使用的规则。这不是一个随意的规则;它是近似矩形在拉伸下的行为的直接结果。

更深刻地,乘积呢?在物理学中,功率是电压和电流的乘积,P(t)=V(t)I(t)P(t) = V(t)I(t)P(t)=V(t)I(t)。在流体动力学中,动量通量是密度和速度平方的乘积。如果我们知道 fff 和 ggg是可积的,我们能确定它们的乘积 fgfgfg 也是吗?答案是肯定的,其证明是一个精妙的小论证,关键在于我们的和。乘积 fgfgfg 在一个小区间内的振幅可以被 fff 和 ggg 自身的振幅巧妙地界定。这个保证是基础,它让我们能自信地对无数物理量进行积分,而这些物理量本身就是其他更基本量的乘积。

或者考虑倒数。如果你有一个函数 R(t)R(t)R(t) 代表一个元件随时间变化的电阻,并且你知道它总是正的且远离零,你可能对它的电导 G(t)=1/R(t)G(t)=1/R(t)G(t)=1/R(t) 感兴趣。如果 R(t)R(t)R(t) 是可积的,G(t)G(t)G(t) 也是吗?是的!只要函数 fff 安全地保持在某个正值 δ\deltaδ 之上,意味着它永远不会太接近零,那么控制 fff 的振幅就足以控制 1/f1/f1/f 的振幅。这种在代数运算下的稳定性,使得黎曼积分成为建立复杂世界模型的实用且值得信赖的工具。

通往无限与数字世界的桥梁

也许最重要的联系之一,是这个抽象理论与计算世界之间的联系。我们经常遇到复杂到无法解析积分的函数。我们可能手头有来自实验的数据,或者一个由极其复杂公式定义的函数。通用的策略是用一系列更简单的函数来近似它,比如多项式或傅里叶级数(正弦和余弦的和)。这是数值积分的基础,是现代科学和工程的基石。

但整个事业都依赖于一个关键问题:如果我们的函数序列 fnf_nfn​ 越来越接近真实函数 fff,那么 fnf_nfn​ 的积分是否也越来越接近 fff 的积分?建立在我们上和与下和支架上的一致收敛理论给出了答案。如果近似是“一致的”——意味着在整个区间上的最坏情况误差缩小到零——那么积分的极限确实是极限的积分。这个定理是允许我们信任计算机的许可证。它保证了当一个模拟程序细化其网格并且数值解收敛时,它所计算的积分量(如总能量、阻力或金融风险)实际上正在收敛到真实值。

最后,当我们将我们的机器推向其绝对极限时会发生什么?它不能处理什么样的函数?这往往是物理学和数学中最有趣的地方。考虑一个真正奇异的函数,它源于我们数系的奇特性质。设 f(x)=1f(x)=1f(x)=1,如果 xxx 的十进制展开中包含数字 '7',否则 f(x)=0f(x)=0f(x)=0。现在,试着在 [0,1][0,1][0,1] 上对它积分。选择任何子区间,无论多么微小。我总能在其中找到一个展开式中有 '7' 的数,也能找到一个没有的。例如,在区间 [0.41,0.42][0.41, 0.42][0.41,0.42] 中,存在数字 0.417...0.417...0.417...,也存在 0.4111...0.4111...0.4111...。这意味着在任何分割的每一个子区间上,上确界 MiM_iMi​ 都是 1,下确界 mim_imi​ 都是 0。

想想这对我们的和意味着什么。上和,即所有 MiΔxiM_i \Delta x_iMi​Δxi​ 的总和,总是 111。下和,即所有 miΔxim_i \Delta x_imi​Δxi​ 的总和,总是 000。无论我们把分割做得多细,上和与下和都顽固地固定在 1 和 0。它们永远不会相遇。差距拒绝闭合。我们的机器失灵了。该函数不是黎曼可积的。

这不是数学的失败。这是一个深刻的发现。它告诉我们,黎曼积分,尽管功能强大,但它是为那些在某种意义上“大部分”是连续的函数设计的。它无法处理那些处处病态不连续的函数。这类函数的存在迫使像 Henri Lebesgue 这样的数学家发明出一种更强大、更精妙的积分理论——一种能够理解这种混沌行为的理论。将一个工具推向其断裂点,正是我们发现需要更好工具的方式。

从驯服狂野的振荡到为运行我们现代世界的算法提供依据,将一个函数夹在上、下矩形之间的简单想法,绽放成了一个丰富而强大的理论。它将抽象的数学严谨性与我们每天面临的实际和计算问题联系起来,揭示了我们如何推理与我们能构建什么之间深刻的、潜在的统一性。