立体数字图像相关法 (Stereo-DIC)

玻尔百科

核心要点

Stereo-DIC 使用两台相机解决了二维方法的关键缺陷，能够精确测量三维形状和变形，而不会被离面运动所误导。
该技术通过使用极线约束匹配两幅图像间的对应点，并通过三角测量法根据视差计算深度，从而重建三维表面。
它提供全场位移和应变云图，从而能够对裂纹尖端场、材料颈缩和应力集中等复杂局部行为进行详细研究。
立体三角测量的基本原理具有普适性，将其在固体力学中的应用与流体动力学（PIV）、计算机视觉和生物力学等不同领域联系起来。

引言

精确测量物体在载荷下的变形、扭曲和应变是工程学和物理科学的基石。多年来，二维数字图像相关法 (2D-DIC) 等光学方法通过单相机跟踪表面图案，为我们提供了宝贵的见解。然而，这种单视角方法存在一个致命缺陷：它无法区分真实的面内应变和简单的离面运动，常常报告“伪应变”，从而掩盖了材料的真实行为。这一知识上的空白，迫切需要一种能够感知和测量真实三维世界的方法。

本文介绍的立体数字图像相关法 (Stereo-DIC) 正是这样一种强大的技术，它通过使用第二台相机，模仿人类视觉的深度感知，解决了这一模糊性。通过从平面的二维投影转向稳健的三维重建，Stereo-DIC 为我们提供了远为完整和准确的力学行为图像。在接下来的章节中，您将学习该方法如何将两幅简单的图像转化为一个信息丰富、可定量的三维现实。第一章“原理与机制”将揭示使其成为可能的核心几何概念，从极线约束到三角测量的奥秘。在此基础上，第二章“应用与跨学科联系”将展示这种“超级视觉”如何被用于测试材料、理解失效，并建立起不同科学学科之间的联系。

原理与机制

单眼错觉

想象你是一个生活在二维世界中的扁平世界居民。对你而言，正方形就是正方形。但如果这个正方形倾斜，进入神秘的第三维度，你会看到什么？它在你世界中的投影将不再是一个完美的正方形，而会呈现为一个被压缩的矩形。单眼，或单台相机，也受制于这同一个根本性限制。它捕捉的是三维世界在二维平面上的投影，在此过程中，丢失了关于深度的关键信息。

这不仅是一个哲学问题，它对测量具有深远的影响。在一种称为二维数字图像相关法 (2D-DIC) 的技术中，我们通过追踪物体表面的图案来测量其变形。如果一个本应平坦的试件在测试中发生了微小的刚体倾斜——不是拉伸或压缩，仅仅是简单的离面旋转——二维 DIC 系统就会被欺骗。它会看到与我们扁平世界居民所见相同的透视畸变，并报告一个“伪应变”。一个角度为 $\theta$ 的纯刚体旋转可能会被误解为压缩，产生 $\varepsilon_{yy} = \cos\theta - 1$ 的表观应变。对于微小的倾斜，这似乎可以忽略不计，但在高精度工程中，这是一个灾难性的错误。这个测量结果是一个谎言，一个由受限视角产生的幽灵。

为了看清真实的三维世界，为了区分真实的拉伸与表观的拉伸，我们需要自然赋予我们的东西：第二只眼睛。

双眼几何学：在人群中寻找伙伴

于是，我们增加了第二台相机。现在我们有了同一场景的两幅图像，它们是从略微不同的位置拍摄的。我们的任务是找到对应点——在两张照片中识别出同一个物理散斑的图像。起初，这似乎是一场艰巨的“瓦尔多在哪里？”游戏。如果我们在左图中选择一个散斑，是否必须搜索整个右图才能找到它的伙伴？

幸运的是，不必如此。相机设置的几何结构以一种极为优雅的约束拯救了我们。想象一下两个相机中心和你正在观察的物体上的任意一个点。空间中的这三个点定义了一个平面，称为对极平面。现在，想象这个平面切割过你两台相机的图像传感器。该平面与每个图像传感器的交线便是一条直线。这些直线被称为对极线。

奇妙之处在于：如果你在左图中选择一个点，你就知道它在右图中的对应点必定位于相应的对极线上。搜索不再是大海捞针，而是沿着一条明确定义的路径进行。这种几何关系被称为对极约束，它极大地简化了匹配问题，是立体视觉的基础原理。两个视图之间的全部几何关系可以被封装在一个 $3 \times 3$ 的矩阵中，称为基础矩阵 $\boldsymbol{F}$ 。对于任意一对由齐次坐标 $\boldsymbol{x}_1$ 和 $\boldsymbol{x}_2$ 表示的对应点，它们必须满足这个简洁而优美的方程： $\boldsymbol{x}_{2}^{\top} \boldsymbol{F} \boldsymbol{x}_{1} = 0$ 。这个方程是判断两个点是否可能为空间同一点图像的数学试金石。

从图像到现实：视差的魔力

一旦我们成功地在左右图像之间匹配了一个点，我们就可以解锁第三维度。你可以亲身体验一下。将手指举在脸前，看着远处的物体。先闭上左眼，再闭上右眼，观察你的手指相对于背景似乎在“跳动”。这种位置上的表观移动被称为视差。

在经过校正的、相机完美对齐的立体相机设置中，视差 $d$ 就是该点在两幅图像中水平位置的差值。值得注意的是，这个简单的二维测量值与该点的三维深度 $Z$ 直接相关。其关系是一种优美的反比关系：

Z = \frac{b f_x}{d}

这里， $b$ 是基线距（两台相机之间的距离）， $f_x$ 是相机的像素焦距。一切尽在其中。正如你自己的双眼一样，远处的物体（ $Z$ 值大）视差很小（ $d$ 值小），而近处的物体（ $Z$ 值小）视差很大。通过测量带散斑表面上每个点的视差，我们可以通过三角测量法逐点重建其完整的三维形状。我们已经将两幅平面的图像变成了一个丰富多彩的三维现实。

测量深度：感知的极限

现在我们有了测量深度的公式。但这个测量的效果如何？我们新获得的三维视觉是完美的吗？当然不是。任何测量都有不确定度。我们在图像中精确定位一个散斑位置的能力受到像素分辨率、相机噪声和算法精度的限制。这导致我们的视差测量中存在一个微小的不确定度，我们可以称之为 $\sigma_d$ 。

这个微小的、像素级别的不确定度是如何传播到我们最终的三维测量中的呢？不确定度传播的法则给了我们一个清晰且极为直观的答案。我们深度测量的方差 $\sigma_Z^2$ 可以表示为：

\sigma_Z^2 = \frac{b^2 f_x^2 \sigma_d^2}{d^4}

这个公式看起来有点复杂，但如果我们记得深度 $Z$ 与 $1/d$ 成正比，我们就可以用一种更有启发性的方式重写这个关系：深度不确定度 $\sigma_Z$ 与距离的平方 $Z^2$ 成正比！。这意味着，如果你与物体的距离增加一倍，你距离估计的不确定度就会增大四倍。这与我们的日常经验完全吻合。我们可以很自信地判断房间另一头某个人的距离，但要估计地平线上山脉的距离就困难得多。

这个公式还告诉我们如何构建一个更好的立体系统。为了减小我们的深度不确定度，我们可以增加基线距 $b$ （就像双髻鲨一样，其宽阔的眼距使其具有出色的深度感知能力），或者增加焦距 $f_x$ （使用长焦镜头）。基于这种理解，一个设计精良的实验室立体 DIC 系统可以达到惊人的精度。对于一个典型设置，仅五十分之一像素的视差精度就能让我们检测到小至几微米的离面运动——比一根头发丝的宽度还要小。

集大成：寻找最佳现实

到目前为止，我们是通过逐点思考来建立我们的理解的。但实际上，一个立体 DIC 系统会同时计算整个点场的位移，将所有这些原理集于一身，进行宏大的综合。现代方法不仅仅是计算，更是优化。

想象我们对一个变形表面上某点的三维位移 $\boldsymbol{U}$ 做出了一个猜测。利用我们对相机几何的知识，我们可以精确预测该位移点应该出现在我们左右图像的哪个位置。我们的预测与相机实际观测到的位置之间的差异就是重投影误差。

那么，目标就是找到那个唯一的、真实的位移向量 $\boldsymbol{U}$ ，使得在两台相机上求和的总重投影误差最小。这是一个思维上的深刻转变。我们正在寻找能够最好地解释我们不完美测量的物理现实。这是一个典型的非线性最小二乘问题，通常使用像 Gauss-Newton 算法这样的迭代方法来解决。这个过程就像侦探完善理论一样：从一个猜测开始，检查它与证据的吻合程度（计算误差），找出能最好地改善吻合度的变化，然后更新你的猜测。这个过程不断重复，直到误差最小化，计算出的位移收敛到与所有视觉数据最一致的真实值。每一步的更新量 $\Delta \boldsymbol{U}$ ，都是通过一个严谨的公式找到的，该公式结合了当前误差、投影的几何结构（通过雅可比矩阵 $\boldsymbol{J}_i$ ）和已知的测量不确定度（ $\boldsymbol{W}_i$ ）：

\Delta \boldsymbol{U} = \left( \sum_{i=1}^{2} \boldsymbol{J}_{i}^{\top}\boldsymbol{W}_{i}\boldsymbol{J}_{i} \right)^{-1} \left( \sum_{i=1}^{2} \boldsymbol{J}_{i}^{\top}\boldsymbol{W}_{i}\boldsymbol{r}_{i} \right)

这个单一的表达式优美地将光学、几何学和统计学结合成一个强大的工具，用以发现隐藏在图像中的真相。

最后的合理性检查：宇宙法则

在这段从二维图像到三维现实的旅程中，数学是我们坚定的向导。但有时，它可能有点过于“有创造力”。在求解几何方程以确定我们两台相机的相对位置和方向时，数学常常给我们不止一个，而是四个可能的解。这四个解在数学上都成立，那么我们如何选择与现实对应的那一个呢？

我们应用一个简单而不可否认的物理事实：我们正在观察的物体必须位于两台相机的前方。这被称为手性约束。四个数学解中，任何将重建的三维点置于任一相机后方的解，在物理上都是不可能的。它是一个幽灵解，是代数运算的产物。通过检查这个简单的条件，我们可以排除三个伪解，从而确定我们系统的唯一真实几何配置。这是一个谦卑但至关重要的提醒：无论我们的方程多么优雅，它们最终都必须服从物理现实的法则。

应用与跨学科联系

现在我们已经深入了解了立体成像的几何核心，你可能会想：“这一切都非常优雅，但它到底有什么用？”这是一个极好的问题。一个科学原理真正的魅力不仅在于其自身的抽象之美，更在于它所开启的大门。而立体数字图像相关法 (Stereo-DIC) 正是打开了无数扇门。它赋予了我们一种类似新感官的能力，一种“超级视觉”，让我们能够观察材料和结构中通常完全不可见的、错综复杂的变形之舞。我们不再局限于测量一个物体在两点之间拉伸了多少，而是能够创建一张描绘其扭曲、缠绕和应变的完整地图。让我们踏上一段旅程，探索这个新视觉所揭示的一些世界。

工程师的工具箱：完善我们对材料的理解

从本质上讲，工程学就是理解材料的行为方式，以便我们能够建造不会损坏的物品（或者以可预测的方式损坏！）。几个世纪以来，这项工作的“主力军”一直是拉伸试验：你拉伸一个样品，并记录在给定作用力下它伸长了多少。这很简单、很有效，但它有一个关键的盲点。当你拉伸一根金属棒时，到某个点它会开始“颈缩”——一小段区域急剧变细，所有后续的变形都集中在那里。此时，测量整体伸长量的传统试验几乎变得毫无意义。变形不再是均匀的，简单的公式也失效了。而这正是 Stereo-DIC 改变游戏规则的地方。通过用其双“眼”观察颈缩区域，我们可以极其精确地测量其局部形状变化。这使我们能够计算出颈缩区域内部的真实应变和真实应力，甚至能够考虑到那里形成的复杂三维应力状态。因此，我们能够追踪材料的内在属性直至其濒临失效的边缘，这是用更简单的工具无法实现的壮举。

同样的原理也适用于扭转。想象一下，你正在测试一根金属杆的扭转性能。一种简单的方法是在机器的轴上安装一个光学编码器，它会告诉你总的扭转角度。这只提供了一个数字。但如果这根杆子并非完全均匀呢？如果它有薄弱点呢？Stereo-DIC 通过对杆的整个表面进行成像，为你讲述了完整的故事。它可以绘制出杆身每一点的扭转角度图，揭示扭转是否以及在何处集中。它提供了一幅全场图像，而编码器只提供一个空间平均的数据点。当然，两者之间存在权衡；一个高质量的编码器对于那个单一测量值可能有更低的噪声基底，但它永远无法提供 DIC 所能提供的空间细节。

这种看清全貌的能力使我们能够探索力学中一些最美妙、最反直觉的思想。考虑扭转一个非圆形截面梁，比如一个工字梁。你的直觉可能会告诉你，每个横截面只是简单地旋转。但自然要微妙得多！横截面实际上会以一种称为“翘曲”的复杂模式发生离面变形。这种翘曲由一个优雅的数学理论所描述，而借助 Stereo-DIC，我们终于可以亲眼看到它的发生。我们可以在梁上投影散斑图案，扭转它，然后观察到预测的翘曲位移从数据中浮现，从而验证了一个世纪以来的缜密思考。我们甚至可以更进一步：通过仅测量梁横截面外边界上的翘曲位移，我们可以将这些数据作为控制性数学方程——也就是拉普拉斯方程——的输入，来重建梁内部的整个翘曲场。这是实验与理论的惊人结合，边界的图像告诉了你关于内部的一切。

失效的艺术：观察世界如何分崩离析

理解事物如何断裂与理解它们如何保持完整同样重要。失效几乎总是一个局部现象，从一个微小的缺陷开始并扩展开来。这是 Stereo-DIC 提供无与伦比洞察力的另一个领域。

以材料中的裂纹问题为例。线性弹性断裂力学 (LEFM) 理论告诉我们一个非凡的事实：无论物体的形状或加载方式如何，裂纹尖端处的应力场都具有一种普适的形式。整个复杂情况被归结为几个称为应力强度因子 ( $K$ ) 的数字。这些因子告诉我们关于裂纹扩展迫在眉睫危险的一切信息。我们到底如何测量它们呢？裂纹尖端周围的位移场也具有一种普适的形状，它与距尖端距离的平方根 $\sqrt{r}$ 成比例。通过使用 Stereo-DIC 拍摄裂纹尖端周围微小区域位移的高分辨率图像，我们可以将我们的测量结果与理论方程进行拟合，从而直接提取出 $K$ 的值。我们甚至可以分解位移场，以判断裂纹是正在被拉开（I 型）还是被剪切开（II 型）。

如果裂纹正在移动，而且移动得非常快呢？在动态断裂事件中，裂纹可以以每秒数百甚至数千米的速度在材料中飞驰。为了捕捉这一过程，我们将 Stereo-DIC 与超高速相机结合，每秒拍摄数百万帧。挑战是巨大的。每一帧的曝光时间必须极短，以防止材料的剧烈运动模糊散斑图案。帧之间的时间间隔必须足够短，以解析在材料中传递变化的应力波。通过满足这些苛刻的要求，我们可以测量作为时间函数的应力强度因子 $K(t)$ ，并以慢动作观察失效物理学的演变。

这种对局部失效机制的关注延伸到了复合材料和粘合剂等现代材料。碳纤维层压板由嵌入聚合物基体中的硬质纤维层构成。当你拉伸它时，在自由边缘会发生一件奇怪的事情。由于各层的属性不同，它们侧向收缩的程度也不同，这会在层与层之间产生隐藏的应力——层间应力——可能导致它们剥离。这些应力是出了名的难以预测和测量。但是，通过抛光层压板的边缘并用 Stereo-DIC 进行观察，我们可以绘制出足够高分辨率的位移场，以看到逐层的变化，并由此计算出威胁材料完整性的险恶隐藏应力。同样，在测试薄膜的附着力时，实验者可能认为他们正在进行一个完美的90度剥离测试。实际上，轻微的未对准会在裂纹前沿造成剥离和扭转的复杂混合。Stereo-DIC 可以测量出作用点处的实际三维几何形状和作用力，从而能够更准确地理解是什么让物体粘合在一起。

一种普适的观察方式：跨学科联系

也许 Stereo-DIC 最深刻的一面在于其核心原理——从两个二维视图三角化三维空间中的点——并不仅限于固体力学。它是一个普适的几何思想。

思考一下流体动力学领域。你如何测量一个旋转、湍急流体的速度？一种领先的技术是粒子图像测速技术 (PIV)。你向流体中播撒微小的反射性粒子，并用片光照亮其中一个薄层。然后，你用一对相机快速连续拍摄两张照片。通过追踪帧间粒子图案的位移，你可以重建流体的三维速度矢量场。其立体重建的数学原理与 Stereo-DIC 完全相同。挑战也同样存在。例如，测量指向片光之外的速度分量（离面分量）的不确定度，关键取决于两台相机之间的夹角。更宽的夹角可以提供更好的离面精度，但可能会使整个测量体积难以保持聚焦。这种权衡是任何立体成像系统的基本几何事实，无论你是在观察固体还是流体。

这揭示了一种深层次的统一性。帮助工程师理解桥梁为何稳定的数学框架，同样能帮助物理学家理解龙卷风的结构。这种统一性甚至延伸得更远。驱动你手机上的人脸识别和自动驾驶汽车导航系统的计算机视觉领域，正是建立在这些完全相同的摄影测量学和立体三角测量原理之上。而在生物力学领域，研究人员使用 Stereo-DIC 来研究心肌组织跳动时的细微变形、我们行走时关节的力学原理，以及活细胞如何爬行并对其周围环境施加作用力。

从钢筋的静静拉伸到裂纹的剧烈扩展，从复合材料机翼的层层结构到湍流尾涡中的涡旋，Stereo-DIC 提供了一个窥视力学世界的窗口。它将矢量和张量的抽象语言转化为具体、可见的图像，让我们能够以前所未有的严谨性检验我们的理论，并发现我们从未预料到的现象。这证明了学会用一种新方式看待世界的力量。