冠层高度模型 (CHM)

冠层高度模型 (CHM) 是通过从顶部表面高程（数字表面模型）中减去地面高程（数字地形模型）而得出的，这些高程通常使用 LiDAR 技术测量。
CHM 的准确性取决于多种因素，如 LiDAR 点密度、数据聚合方法，以及为修正数据缺口而使用的无凹陷算法等专门技术。
CHM 能够对森林结构进行详细分析，包括识别单木、测量冠层纹理，以及为生物多样性研究量化生境异质性。
其应用范围延伸至监测长期变化、评估自然灾害造成的损害、模拟野火风险，以及为全球碳循环研究估算森林生物量。

引言

要测量广袤景观中森林的高度、结构和范围，是一项巨大的挑战。传统的野外方法虽然精确，但在规模上受到限制，无法捕捉森林冠层连续而复杂的结构。我们在三维视角下观察森林能力的这一欠缺，阻碍了从生态学研究到有效资源管理的方方面面。冠层高度模型 (CHM) 作为现代遥感的产物，为这一问题提供了强有力的解决方案。它提供了一份详尽的、空间明确的植被离地高度图，有效地为森林表面创建了一个数字模型。

本文深入探讨了冠层高度模型的科学原理和实用价值。在第一章 原理与机制 中，我们将探索 CHM 是如何被创建的，从 LiDAR 系统的初始激光脉冲，到将原始点云塑造成精确表面模型所需的复杂数据处理。我们将揭示 CHM 优雅而简单的数学基础，以及确保其准确性的关键考量。随后，关于 应用与跨学科联系 的章节将揭示该模型的变革性力量，展示它如何被用于进行森林普查、分析生态生境、监测扰动，甚至量化森林在全球碳循环中的作用。

原理与机制

想象一下，你想测量一片广阔而难以进入的森林的高度。你不能简单地拿着卷尺走进去。那么，你该怎么做呢？科学领域的答案常常是：巧妙地去做。我们不用手去触摸树木，而是用光来触摸它们。这就是 激光探测与测距 (LiDAR) 的精髓，这项技术彻底改变了我们看待世界的方式，它也是冠层高度模型构建的基础。

光之舞：从脉冲到点

LiDAR 的核心原理惊人地简单。它就像对着峡谷大喊，然后通过计算回声的时间来测量其宽度。一台 LiDAR 仪器，通常安装在飞机上，向地面发射一道短暂而强烈的激光脉冲。这个脉冲向下传播，击中某个物体——一片叶子、一根树枝，或是地面本身——然后一小部分光线散射回飞机上的探测器。

仪器精确测量光线往返所用的总时间，我们称之为 $\Delta t$ 。因为我们知道光在（大气中）以恒定速度 $c$ 传播，所以我们可以计算出到它所击中物体的单程距离，即测距 ( $R$ )。总距离是 $c \cdot \Delta t$ ，因此单程距离就是其一半。

R = \frac{c \cdot \Delta t}{2}

这个方程是 LiDAR 的心跳。因子 $2$ 至关重要；它解释了我们的测量是往返的，但我们只想知道到目标的距离。

当然，仅仅知道距离是不够的。如果你在一列行驶的火车上，用激光笔照射，只知道到被照亮点的距离并不能告诉你那个点在景观中的位置。你还需要精确地知道火车在哪里，它指向哪个方向，以及你瞄准激光的方向。LiDAR 系统也是如此：它使用全球导航卫星系统 (GNSS) 来确定其位置 ( $\mathbf{x}_s$ )，并使用惯性测量单元 (IMU) 来确定其姿态 ( $\mathbf{C}_{ws}$ )。通过将这些信息与激光精确的指向角 ( $\theta, \phi$ ) 相结合，它可以将每次测距转换为一个带有地理参考的三维坐标 $(x,y,z)$ 。

该系统每秒重复此过程数百万次，生成一个点云：一个由数十亿个独立测量点组成的、下方景观的幽灵般的三维数字复制品。

塑造世界：从点到面

这个点云是一组宏伟但杂乱无章的数据集合。为了使其有用，我们需要建立秩序。为了测量树高，我们对两个主要表面感兴趣。

首先，我们需要知道“裸露地表”在哪里。这就是 数字地形模型 (DTM)，有时也称为数字高程模型 (DEM)。创建一个 DTM 是一项富有挑战性的艺术。它需要复杂的算法来筛选点云，并将点分为“地面”点和“非地面”点（如植被或建筑物）。然后，DTM 通过仅对地面点进行插值来创建一个连续的表面。在茂密的森林中，很少有激光脉冲能真正到达林地，这使得这项工作尤其困难。

其次，我们需要一张景观最上层表面的地图——也就是激光脉冲会首先击中的东西。这就是 数字表面模型 (DSM)。从概念上讲，它的创建更简单。对于网格上的任何给定位置，DSM 值通常是在该区域内找到的最高 LiDAR 点的高程。它是景观的“皮肤”，覆盖在树冠、屋顶和其间的一切之上。

伟大的减法：冠层高度模型的诞生

这里就引出了那个优美而简单的核心思想。如果你有一张顶部表面的地图 (DSM) 和一张其下地面的地图 (DTM)，你如何找出任何给定位置的树高？你只需相减！

这个简单的减法就得到了 冠层高度模型 (CHM)。

\mathrm{CHM}(x,y) = \mathrm{DSM}(x,y) - \mathrm{DTM}(x,y)

这个优雅的公式是我们主题的核心原理。对于给定的坐标 $(x,y)$ ，CHM 值告诉我们该位置物体离地面的高度。在一个植被区域，CHM 值为 $13.5 \text{ m}$ 意味着冠层高 $13.5$ 米。在裸露的地面上，DSM 和 DTM 的高程几乎相同，所以 CHM 将接近于零。

然而，这种减法只有在两个严格的条件下才有意义。首先，DSM 和 DTM 必须完美对齐，或称 精确配准，这样我们才能在完全相同的水平位置上，从表面高程中减去地面高程。其次，两个模型都必须参考相同的垂直基准面（“零”高程的通用参考，如平均海平面）。试图用不同基准面的高程相减，就像试图通过用从天花板测量的头部高程减去从地板测量的鞋底高程来测量一个人的身高一样——结果将毫无意义。

同样重要的是要记住这个新模型向我们展示了什么。CHM 是所有物体离地面的高度。在一个混合景观中，它会显示森林中树木的高度和城市中建筑物的高度。对于许多应用，比如计算森林生物量，我们必须首先使用土地覆盖图来“掩膜”掉非植被区域，以确保我们的分析纯粹集中在冠层上。

深入观察：创建的细节

让我们放大到将点云转换为像 CHM 这样的网格化地图的实际步骤。一个网格单元，比如 2 米乘 2 米，可能包含几十个 LiDAR 点。我们如何将它们所有的高度提炼成该单元的一个单一值？这种聚合策略的选择对最终模型有深远的影响。

我们可以取最大高度。这似乎合乎逻辑，因为它应该能捕捉到最高树木的顶端。然而，它对异常值非常敏感。一个错误的异常高点，甚至一只在恰好不巧的时刻飞过激光束的鸟，都可能给该单元一个虚假的高值。
我们可以取均值（平均）高度。这对于单个异常值更具鲁棒性，但它有其自身的问题。均值会被来自较低树枝和冠层侧面的许多回波拉低，导致对真实冠层顶部高度的系统性低估。
一个巧妙的折中是使用一个高的百分位数，比如第 95 百分位数 ( $q = 0.95$ )。这种策略忽略了顶部的 5% 的点，使其对异常值具有鲁棒性，同时仍能捕捉到一个非常接近真实冠层顶部的值，这与均值不同。

这种选择不仅仅是技术性的；它反映了一种哲学上的决定，即我们希望我们的 CHM 代表什么：绝对最高点、集中趋势的度量，还是冠层上表面的鲁棒估计。

森林的面纱：穿透与凹陷

到目前为止，我们所描绘的画面有些理想化。在现实中，森林冠层不是一个实体表面。它是一个复杂的、多孔的体。当激光脉冲进入冠层时，它不仅仅是击中顶部就停止了。脉冲的一部分能量可能会从上层叶片反射，产生首次回波。脉冲的其余部分继续向下，可能会击中更低的树枝，产生中间回波，而一些能量甚至可能一直到达地面，产生末次回波。

脉冲到达地面的概率随着其在冠层中穿行而大致呈指数下降——就像阳光在你潜入水中越深时越暗淡一样。这可以用一个类似于比尔-朗伯定律的原理解释。在非常茂密的森林中，任何给定脉冲到达地面的几率可能非常小，也许只有 10-20%。这就是为什么末次回波不保证是地面回波；它可能只是脉冲在能量耗尽前所能击中的最低树枝。这使得在茂密冠层下创建一个准确的 DTM 成为 LiDAR 处理中最大的挑战之一。

这个采样问题也给 DSM 带来了一个主要问题：内插凹陷。如果偶然间，在某个区域内没有激光脉冲击中树顶，那么该处的 DSM 将会因由附近较低树枝的回波生成而错误地偏低。这会在 CHM 中产生一个人工的“凹陷”。

为了解决这个问题，一种名为无凹陷 CHM 的优雅技术被开发出来。我们不是仅在单一尺度上计算 DSM（例如，使用 1 米半径内的最大高度），而是在多个尺度上计算多个 DSM——比如，使用 1 米、3 米、5 米和 10 米的半径。然后，对于每个像素，我们从所有这些尺度中取最高值。小半径搜索在采样良好的地方保留了单木树冠的精细细节。大半径搜索则充当安全网，在采样稀疏的间隙上“搭桥”，有效地填补了凹陷。这种多尺度方法完美地平衡了细节保留与稳健填补间隙的需求。

创造的艺术：平衡密度与细节

这就把我们带到了从点数据创建任何网格化模型的一个基本权衡：单元大小的选择。我们面临两种相互竞争的愿望。

为了捕捉地形或冠层的精细细节，我们希望我们的网格单元尽可能小。来自信号处理的奈奎斯特-香农采样定理给了我们一个硬性限制：为了忠实地捕捉某个尺寸（波长 $\ell$ ）的特征，我们的单元大小 ( $s$ ) 必须不大于该尺寸的一半 ( $s \le \ell/2$ )。
为了在每个单元中获得可靠的高度估计，我们需要有足够的 LiDAR 点落入其中。如果我们的单元太小而 LiDAR 点密度 ( $\lambda$ ) 太低，许多单元将是空的，不包含任何数据。一个单元为空的概率可以使用泊松过程建模，得出 $P(\text{空}) = \exp(-\lambda s^2)$ 。

平衡这两个约束是 LiDAR 数据处理的艺术所在。必须选择一个单元大小 $s$ ，它既要小到足以捕捉所需的细节，又要大到足以确保在给定的点密度下，空单元的数量是可接受的低。如果所需的细节水平对于给定的点密度来说太精细，唯一的解决方案是接受数据缺口，或者更好的是，从一开始就计划进行更高密度的 LiDAR 采集。

我们有多确定？不确定性的科学

我们已经从一道光脉冲走到了一幅美丽的、彩色的冠层高度图。但是这张图有多好呢？一张没有自身不确定性声明的地图在科学上是不完整的。

首先，我们可以通过将其与独立的“地面实况”测量进行比较来评估地图的准确性。这至关重要。我们不能用我们构建模型的数据来测试它；那就像自己给自己批改作业。通过收集冠层高度的野外测量值并与我们的 CHM 进行比较，我们可以计算出诸如以下的指标：

偏差 (Bias)：我们的模型是系统性地高估还是低估了高度？
平均绝对误差 (Mean Absolute Error, MAE)：平均而言，误差的量级是多少？
均方根误差 (Root Mean Square Error, RMSE)：一个与 MAE 类似的指标，但它对大误差的惩罚更重。

更进一步，我们可以为我们的 CHM 的每一个像素建立一个不确定性模型。CHM 值的总误差来自两个主要来源。

系统性偏差 (Systematic Bias)：最大的偏差来源通常来自 DTM。如果地面分类算法错误地将低矮植被（高度为 $m_i$ ）标记为“地面”，那么该单元的 DTM 将会过高。如果这种情况以一定的概率 ( $q_i$ ) 发生，它会在 DTM 中引入一个大约为 $b_{E,i} \approx q_i m_i$ 的正偏差。由于 CHM = DSM - DTM，这个正的 DTM 偏差会产生一个负的 CHM 偏差，导致我们低估真实的树高。
随机误差 (Random Error)：我们对一个单元中 DSM 和 DTM 估计的精度取决于用于创建它们的点的数量。就像在一次政治民意调查中一样，你拥有的数据点（选民）越多，你的误差范围就越小。高度估计的标准差通常与 $1/\sqrt{n}$ 成正比，其中 $n$ 是单元中的点数。

通过结合这些效应，我们可以为每个像素计算一个总不确定性，比如均方误差 ( $MSE = \text{方差} + \text{偏差}^2$ )。这将 CHM 从一张简单的图片转变为一个真正的科学数据产品：一张不仅向我们展示森林高度，还告诉我们对每一个值的确信程度的地图。这是将光之舞转变为对我们世界深刻理解的最后、关键的一步。

应用与跨学科联系

现在我们对冠层高度模型 (CHM) 是什么有了一定的了解——这个森林表面的非凡石膏模型——我们可以提出最令人兴奋的问题：它有什么用处？一张树高地图固然美观，但当我们不把它看作一幅静态的图画，而是看作一把能解开关于森林这个生生不息的系统的一系列秘密的钥匙时，它的真正力量才得以显现。让我们踏上一段旅程，从森林中最具体的物体开始，一直到森林在整个地球平衡中的作用。

从一幅图画到一次种群普查

使用 CHM 最直接、最明显的做法是测量树木。观察 CHM，我们看到一个由穹顶和尖塔组成的景观，每一个都对应着一棵树的树冠。每个穹顶的最高点，很简单，就是树梢。它在 CHM 中的高度就是这棵树离地面的高度。穹顶底部的面积为我们提供了树冠宽度的度量。我们甚至可以定义一些指数，比如树冠边缘高度与其顶峰高度的比率，来描述其形状或“紧凑度”。对于一棵孤立的单木来说，这非常直接。

但是一片森林包含数百万棵树。我们如何为它们全部进行一次普查？我们不能简单地坐着逐一指向每个穹顶。我们必须教会计算机去看懂这些树。这才是真正巧妙之处的开始。任务是设计一个算法来寻找 CHM 中的局部最大值——即山峰。一种天真的方法可能会在一棵大树冠的崎岖表面上找到几十个“山峰”。事实证明，诀窍在于一个在科学领域中随处可见的美妙原则：你的测量工具的尺度必须与你所测量的物体的尺度相匹配。

为了找到树梢，我们可以使用一个数字滤波器，它在 CHM 上滑动一个“窗口”，寻找该窗口内的最高点。如果窗口太小，它会迷失在单个树冠的纹理中，报告多个虚假的峰值。如果窗口太大，它可能会跨越两三棵较小的树，只报告最高的那一棵，而忽略了它的邻居。因此，理想的窗口大小，其半径大约与该森林中典型树冠的半径相同。通过将我们分析的尺度与树木本身的尺度相匹配，我们可以可靠地自动化定位和计数大片景观中单木的过程，将连续的 CHM 转化为森林居民的离散目录。

林地建筑学

除了单木之外，CHM 还揭示了森林的集体建筑——它的纹理、它的复杂性、它的“粗糙度”。一个简单的衡量标准是样地内冠层高度的标准差。高值表明冠层复杂，有高大的树木和深的间隙，而低值则表明冠层更均匀、平滑。

但在这里我们遇到了一个奇妙的微妙之处，一个关于数字能告诉我们什么和不能告诉我们什么的经典教训。想象两个森林样地。一个中间有一个巨大的缺口，那里一棵巨树倒下了。另一个则点缀着几十个由较小扰动造成的小缺口。假设两个样地中缺口的总面积相同，并且其余的树木也完全相同。如果你计算两个样地冠层高度的标准差，你会得到完全相同的数字！这个简单的统计数据，尽管有用，却对空间格局视而不见。它无法区分一个大洞和许多小洞。

为了看清纹理，我们需要更复杂的工具——空间统计学。像半变异函数或空隙度这样的度量旨在回答关于格局的问题。例如，半变异函数测量的是，作为点对之间距离的函数，冠层高度的差异程度。在有许多小缺口的森林中，高度在短距离内就会变得不相关，而在有一个大缺口的森林中，相关性会延伸得更远。这些工具使我们能够量化缺口和树冠的特征尺寸，提供一个超越简单高度变化度量的真实冠层纹理度量。

这种复杂的结构在何处最为重要？事实证明，这种结构不仅仅是一种好奇心；它是一幅生态过程的地图。考虑一个森林斑块的边缘。森林并不仅仅在其与田野的边界处停止；它的特性会发生变化。阳光和风从侧面侵入，抑制了生长。CHM 让我们能够以惊人的清晰度看到这种“边缘效应”。如果我们从开阔的田野深入林中画一条样带，我们会看到冠层高度逐渐上升，从边缘的恶劣条件中恢复过来。值得注意的是，这种恢复过程常常遵循一个简单而优雅的数学定律：一条指数曲线。这与描述一杯冷却的咖啡或一个放电的电容器的“趋于平衡”过程相同。CHM 让我们能够测量这种效应的特征长度——“结构边缘深度”——并看到这个影响区域，一种生态半影，是如何因地而异的。

最终，这种结构是生命上演的舞台。一只鸟不关心森林的“平均高度”；它关心的是特定栖息点、筑巢地和觅食地的可得性。一个结构简单的种植园提供的生态位很少，而一个具有间隙和枯立木的复杂、多层次的森林则提供了许多。这就是“生境异质性假说”的精髓。CHM 提供了这种异质性的直接、定量的地图。通过将冠层粗糙度、高度方差和林窗分数等指标纳入物种分布模型，生态学家可以显著提高他们预测生物多样性的能力。由 LiDAR 测量的物理结构，成为森林所能支持的生物丰富度的有力预测因子。

动态的森林：时间、变化与灾害

也许 CHM 最强大的应用来自于对不同时间点的 CHM 进行比较。通过在同一片森林上隔几年进行一次 LiDAR 勘测，我们可以在景观尺度上玩“找不同”的游戏。

这项技术最引人注目的用途是在自然灾害之后。想象一下，一场强烈的风暴席卷了一片森林。通过从风暴前的 CHM 中减去风暴后的 CHM，一幅破坏地图瞬间显现。具有较大负值的像素代表冠层坍塌的区域。我们可以精确计算冠层损失的总面积。此外，我们可以看到损害的格局——通常是一条破坏轨迹或一簇倒下的树木，其中一棵树的倒下使其邻居暴露在外，引发了灾难性的多米诺骨牌效应。

当然，科学要求严谨。我们如何区分少量的真实生长和 LiDAR 测量中固有的“模糊性”或噪声？这时，侦探工作变得真正复杂起来。测量高度的变化是真实变化与来自多个来源的误差的组合：第一次勘测的垂直不确定性、第二次勘测的垂直不确定性，以及因两张地图未完美对齐而产生的误差。科学家可以利用统计理论来传播这些误差，以计算差分 CHM 中的总预期噪声。只有这样，他们才能设定一个统计上站得住脚的阈值，并充满信心地说：“这种变化是真实的。”这使他们能够创建可靠的地图，将整个森林分类为显著生长区、显著扰动区或稳定区。

这种模拟结构和变化的能力为灾害（尤其是野火）的预测建模打开了大门。火灾的行为由燃料、天气和地形决定。CHM 提供了关于燃料三维结构的关键信息。它不仅告诉我们冠层的高度，还告诉我们它的密度和冠底高。这种结构反过来又决定了风如何在森林中和森林上空流动。利用流体动力学原理，如对数风廓线，科学家可以使用 CHM 衍生的指标来估算近地面的风速。这个风速是火蔓延模型的关键输入。通过将 CHM 与一系列物理模型联系起来，我们可以从简单地绘制森林地图，发展到预测其潜在的火线强度，为风险评估和管理创造至关重要的工具。

全球资产负债表：碳、覆盖与气候

最后，我们把视野放大到行星尺度。森林是全球碳循环的巨大引擎之一，从大气中吸收大量二氧化碳并以生物量的形式储存起来。量化这个碳储量是气候科学中最紧迫的任务之一，而 CHM 是一个不可或缺的工具。

该方法是野外工作和遥感的绝妙结合。我们无法称量整片森林的重量，但我们可以称量一个小样地里所有树木的重量。生态学家们就是这样做的，并根据这些测量结果，计算出样地中的总地上生物量 (AGB)。同时，他们从 CHM 中提取该样地的结构指标——比如冠层高度的第 95 百分位数，这是一个能稳健反映优势木高度的指标。通过从许多样地收集这些信息，他们可以建立一个统计模型，将 CHM 的结构与地面的 AGB 联系起来。

这个模型就成了一块“罗塞塔石碑”。它使我们能够将冠层高度的语言翻译成生物量的语言。然后，我们可以将这个模型应用于整幅 CHM，将整个高度图转换为碳储量图。当然，为了使这些估算在国际气候减缓报告中足够可信，统计数据必须无可挑剔。模型必须考虑到生物生长的乘性特征，验证必须在独立数据上进行以避免自欺欺人，并且必须纠正由数学变换引入的细微偏差。

即使是对于像“冠层覆盖度”——被树木覆盖的地面比例——这样一个看似简单的指标，CHM 也提供了一个新的复杂层次。科学家们不再只是给出一个二元的“是/否”答案，而是可以利用他们对 LiDAR 测量误差的了解，来计算任何给定像素真正被冠层覆盖的概率。这不仅给了我们一个估计值，还给了我们一张对该估计值信心的地图。

从一棵树到全球碳预算，这段旅程令人叹为观止。冠层高度模型，诞生于从飞机上发射的激光束，远不止是一张简单的高度图。它是一种具有深远力量的科学仪器——一个我们可以透过它看到森林的结构、监测其脉搏、预测其未来，并量化其在我们世界运作中的重要作用的镜头。