栅格数据模型

玻尔百科

核心要点

栅格数据模型通过将空间划分为赋值单元格的规则网格，在表示高程或温度等连续现象方面表现出色。
地理参考在数学上将网格的内部坐标与真实世界系统联系起来，从而将简单的图像转换为可量化、可分析的地图。
地图代数提供了一种强大的空间分析语法，能够使用局部、焦点、区域和全局操作在多个栅格图层上进行复杂计算。
单元格大小（粒度）和研究区域边界（范围）的选择深刻影响分析结果，这是一个被称为可变分区单元问题（MAUP）的关键考量。

引言

栅格数据模型是地理信息科学（GIS）的基石，为表示和分析我们的世界提供了一种强有力的方法。虽然我们通常将世界感知为离散对象的集合——道路、建筑、湖泊——但许多地理现象，如温度、高程和空气污染，是遍布于整个景观的连续场。该模型解决的核心挑战是如何以计算机能够理解和处理的离散、可计算的格式，来捕捉现实世界这种连续、流动的特性。本文将对这一基础数据模型进行全面探讨。

以下各节将首先解构栅格模型的核心原理和机制。我们将探讨它如何通过“场视图”捕捉世界，地理参考在赋予数据地球位置上的关键作用，每个像素值背后的含义，以及允许我们进行分析的强大地图代数语法。随后，我们将转向应用和跨学科联系，展示这个简单的网格如何成为水文学中模拟地表径流、保护规划中执行多标准分析、以及生态学和遥感中追踪环境动态的不可或缺的工具。

原理和机制

要真正领会栅格数据模型的力量，我们必须超越彩色方块网格的简单图像。我们必须将其理解为一种深刻而优雅的思想，用以捕捉世界连续、流动的本质，并将其转化为离散、可计算的形式。这有点像音乐：一段连续的旋律可以被写成一系列离散的音符。音符本身不是音乐，但它们为我们提供了一种语言来阅读、分析甚至创作新的音乐。栅格模型则为我们提供了描绘地球交响曲的语言。

网格中的世界：场视图

想象一下，你想描述一个房间里的温度。温度在哪里？嗯，它无处不在。房间里的每一点都有一个温度。这就是地理学家所称的场（field）：一个在给定空间内每一点都有定义的量。高程、气压、土壤湿度——这些都是场。它们没有清晰的边界，而是从一个地方到另一个地方连续变化。

那么，我们怎么可能为每一个点都记录一个值呢？点的数量是无限的！栅格模型提供了一个非常实用的解决方案。我们不试图描述场在每一点的情况，而是将空间分割成一个由微小、相同的单元格组成的网格，这个过程称为空间剖分（tessellation）。然后，对每个单元格，我们记录一个单一的值来代表该单元格区域内的场。这个值可能是在单元格中心的一次测量，或者更常见的是整个单元格的平均值。

这种“场视图”的世界观与“对象视图”有根本的不同。“对象视图”将世界看作是离散、定义明确的事物的集合：一个湖泊（多边形）、一条河流（线）、一口井（点）。矢量数据模型是这种视图的自然语言。但对于像从卫星数据中获得的平滑变化的土壤湿度图这样的现象，将其强行塑造成离散对象的形状，就像试图通过画一个单一、僵硬的边界来描述一朵云。场视图，以及延伸开来的栅格模型，是对此类连续现象更自然、更强大的表示方法。

魔毯：为网格在世界中定位

现在我们有了一个数字网格。这与你电脑上的一张数码照片有何不同？绝对不同。照片只是一个颜色值的矩阵。你可以谈论左上角的像素，但那个角落本身在现实世界中没有内在意义。而地理空间栅格则不同，它就像一张可以铺在地球表面的魔毯。毯子上的每一个单元格都知道它在现实世界中的确切位置。

这种“魔法”被称为地理参考（georeferencing）。它是一种数学变换，在网格的离散内部坐标系——行列索引 $(i, j)$ ——与连续的真实世界坐标系，如经纬度或以米为单位的平面投影 $(x, y)$ ——之间建立了一个不可破坏的联系。

对于大多数栅格数据，这种变换是一种非常简单的仿射变换（affine transform）。想象一下，整个网格的左上角被锚定在一个已知的世界坐标 $(x_0, y_0)$ 上。每个像素的宽度为 $\Delta x$ ，高度为 $\Delta y$ 。要找到第 $i$ 列、第 $j$ 行像素的中心，我们只需从锚点向右走 $i$ 加半步，向下走 $j$ 加半步。其映射关系变为：

$x_{\text{center}} = x_0 + \Delta x \left(i + \frac{1}{2}\right)$ $y_{\text{center}} = y_0 + \Delta y \left(j + \frac{1}{2}\right)$

请注意，由于图像坐标 $(j)$ 通常向下增加，而地图坐标 $(y)$ 向上（向北）增加，因此 $\Delta y$ 的值通常是负数。

这组简单的方程是栅格模型的核心。正是它们将一张普通图像变成了可量化的地图。它使我们能够计算单元格之间的真实距离，测量一片森林的面积，以及计算具有物理意义的量，如山丘的坡度或温度场的梯度。没有地理参考，关于空间关系的讨论就毫无意义；有了它，我们就可以将物理定律应用于我们的数字世界。

机器中的幽灵：像素值意味着什么？

采样及其原罪：混叠

栅格是连续现实的一组样本。这种采样行为受信号处理原理的支配，会产生深远的影响。我们网格单元格的中心间距 $\Delta$ 是采样间隔。根据 Nyquist-Shannon 采样定理，要完美捕捉一个以空间频率 $f$ 重复的模式（例如，成排的作物形成的模式频率为每100米2个周期），我们的采样频率必须至少是该频率的两倍。换句话说，我们能无歧义地捕捉到的最高频率是奈奎斯特频率（Nyquist frequency），即 $f_N = \frac{1}{2\Delta}$ 。

如果现实世界的模式频率高于 $f_N$ 会发生什么？这个模式并不会简单地丢失；它会“折叠”回我们的采样数据中，伪装成一个实际不存在的低频模式。这种现象称为混叠（aliasing）。这与电影中汽车轮子看起来在倒转是同样的效果。例如，如果我们的像素大小为 $\Delta = 0.5 \text{ km}$ ，我们的奈奎斯特频率就是 $f_N = 1 \text{ cycle/km}$ 。如果存在一个真实温度模式，其频率为 $f = 1.6 \text{ cycles/km}$ ，那么在我们的栅格地图中，它不会显示为 $1.6 \text{ cycles/km}$ ，而是以一个混叠频率 $|f - 2f_N| = |1.6 - 2.0| = 0.4 \text{ cycles/km}$ 出现。幸运的是，传感器通常测量像素区域内的平均值，这起到了天然低通滤波器的作用，从而减少（但不能消除）这些混叠效应。

单元格的内容：混合像元

一个像元值很少代表单一、纯净的物质。在农业景观中，一个 $30$ -米像元可能包含灌溉作物、干旱土壤和树木投下的阴影的混合体。这就是一个混合像元（mixed pixel）。这是否意味着该像元的值毫无意义？远非如此。我们可以对其进行“解混”。

最常见的方法是优雅的线性混合模型（linear mixing model）。该模型假设，像元测得的光谱（其在不同波段上的反射率值向量）只是其组分纯净光谱的面积加权平均值，这些组分被称为端元（endmembers）。这可以写成一个简单的线性方程：

$y = M f + \epsilon$

在这里， $y$ 是我们混合像元测得的光谱，矩阵 $M$ 的列是纯净端元（植被、土壤、阴影）的已知光谱， $f$ 是我们想要找到的丰度分数向量，而 $\epsilon$ 是一个小的误差项。通过求解这个方程——同时强制执行分数不能为负且总和必须为一的物理约束——我们可以估计出，例如，我们的像元包含 $50\%$ 的植被、 $40\%$ 的土壤和 $10\%$ 的阴影。这种强大的技术使我们能够窥视像元内部，从单一的混合测量中揭示一个亚像元复杂性的世界。

网格的语法：地图代数

既然我们对栅格网格及其值的含义有了深入的了解，我们就可以开始对其进行操作。地图代数（Map algebra）是一种语法，它允许我们通过强大的方式组合栅格图层来提出复杂的空间问题。这种语法的操作可分为几个关键类别。

首先，我们必须整理好原始材料。栅格的值可以是整数（integers），通常用于表示分类数据（例如， $1 = \text{水体}$ ， $2 = \text{森林}$ ， $3 = \text{城市}$ ），也可以是用于表示连续物理量（例如，高程或温度）的浮点数（floating-point）。对物理量使用整数算术可能因截断而导致无意义的结果，因此转换为浮点数是科学计算的关键第一步。此外，我们需要一种处理缺失信息的方法——一个特殊的nodata值。地图代数的基本规则是nodata会传播：任何涉及nodata值的操作都会产生nodata值，从而防止虚假结果污染我们的分析。

在数据被正确定义后，我们可以执行几种类型的操作：

局部操作（Local Operations）： 这是最简单的逐单元格计算。输出单元格在位置 $(i, j)$ 的值仅取决于输入单元格在完全相同位置上的值。例如，要计算像NDVI这样的植被指数，我们取近红外（Near-Infrared）和红光（Red）波段，并为每个单元格计算 $(NIR - Red) / (NIR + Red)$ 。要使此操作有效，所有输入栅格必须完全对齐——即共享相同的网格几何结构。
焦点操作（Focal Operations）： 这些操作作用于一个邻域。一个单元格的输出值取决于其邻居的值。可以把它想象成一个在栅格上滑动的移动窗口。在每个位置，它根据窗口内的单元格计算一个值，例如它们的平均值、中位数或标准差。计算某一点的地形坡度需要查看其邻居的高程。这是一种焦点操作。
区域操作（Zonal Operations）： 这些操作作用于“区域”（zones），即共享一个共同属性（通常由第二个栅格定义）的单元格组。例如，我们可以有一个降水量栅格和一个县界的区域栅格。区域操作可以计算特定县内所有单元格的平均降水量，生成一张地图，其中一个县内的每个单元格都具有相同的值：该县的平均降雨量。
全局操作（Global Operations）： 这是范围最广的操作。每个单元格的输出值都取决于整个栅格中所有其他单元格的值。例如，要将高程栅格归一化，使其值范围从 $0$ 到 $1$ ，我们首先需要找到整个地图上的单一最小值和最大值。然后利用这个全局信息来转换每个单元格的值。

空间的构造：邻域和分辨率

栅格网格的离散特性迫使我们做出一些选择，而这些选择对我们如何解释空间模式有着惊人而重大的影响。

连通性：谁是我的邻居？

两个生境斑块“相连”意味着什么？在栅格中，这归结为我们如何定义邻接关系。如果我们使用4邻域邻接，一个单元格只与其共享边的四个单元格（上、下、左、右）相连。如果我们使用8邻域邻接，它还与其在角上接触的四个单元格相连。这个看似微小的决定会极大地改变我们的分析。如生境斑块研究所示，在4邻域规则下看起来是六个孤立的小斑块的景观，在8邻域规则下可能会合并成只有三个更大、更具生存能力的斑块。为避免逻辑悖论（即“生境”路径和“非生境”路径可以在一个角上交叉而不相交），数字拓扑学规定我们必须使用互补规则：如果我们用4邻域定义生境连通性，就必须用8邻域定义周围的非生境，反之亦然。

改变构造：重采样

我们常常需要合并以不同网格尺寸创建的栅格。为此，我们必须对其中一个网格进行重采样（resample）以匹配另一个。这涉及到根据旧网格的值来“猜测”新网格位置的值。有几种方法可以做到这一点，每种方法都有其自身的权衡：

最近邻法（Nearest Neighbor）： 最快、最简单的方法。它直接获取旧网格中最近单元格的值。这对于分类数据至关重要，因为它从不创建新值（例如，它不会将“森林”和“水体”平均成一个无意义的中间类别）。缺点是外观呈块状、像素化。
双线性插值法（Bilinear Interpolation）： 一种更平滑的方法，它将新值计算为原始网格中四个最近单元格的距离加权平均值。它产生视觉上更令人愉悦的结果，但通过平均化改变了原始值。
三次卷积法（Cubic Convolution）： 一种更复杂的方法，它着眼于一个 $4 \times 4$ 的16个单元格邻域来拟合一个平滑的三次曲面。它通常能产生最清晰、最美观的图像，但计算量更大，并且有时会引入“振铃”伪影或略微超出原始数据范围的值。

方法的选择是辐射保真度、视觉平滑度和计算成本之间的经典工程权衡。它提醒我们，每当我们操作栅格数据时，我们都在就如何表示底层的连续场做出决定，而这个决定至关重要。从地理参考场的基本思想到连通性的微妙规则，栅格模型是一个用于理解我们世界的深刻而强大的框架。

应用和跨学科联系

在窥探了栅格数据模型的内部工作原理之后，我们可能会倾向于将其视为一种相当简单甚至刻板的世界观——一幅数字马赛克，一个彩色方块的网格。但如果止步于此，就好比看着大师的棋盘，只看到棋盘格，却错过了即将展开的无限而美妙的对弈。栅格模型的真正力量不在于它是什么，而在于它让我们可以做什么。它是一个计算的画布，一个用于模拟、分析和理解我们世界复杂系统的引擎。现在，让我们来探索这场宏大的博弈，看看这个简单的网格如何成为解锁水文学、流行病学和生态学等不同领域秘密的关键。

作为数字景观的栅格：建模表面与流

也许栅格最直观的应用是表示一个表面。想一想地形图。高程场是一个连续的属性——地表上的每一点都有一个高程。栅格通过为每个单元格赋予一个平均或代表性的高程值来捕捉这一点，从而创建了我们所说的数字高程模型（DEM）。你可能会想，为什么不使用矢量方法，比如不规则三角网（TIN），它使用大小不一的三角形来模拟表面？TIN具有极好的自适应性，在复杂、多山的地形中放置更多顶点，在平坦的平原上则放置较少。然而，栅格DEM拥有一种优美而直接的简洁性。其规则的网格结构意味着任何单元格与其邻居之间的关系都是隐含且固定的。这种规律性对于计算来说是一份不可思议的礼物。对于想要知道水将流向何处的水文学家来说，栅格是天赐之物。他们可以编写一个算法，对每个单元格，只需查看其紧邻的邻居，找出哪一个最低。这种“局部邻域”操作在数百万个单元格上重复执行，可以以惊人的效率绘制出整个大陆的河流网络。

这种分析局部邻域的思想不仅仅局限于高程。想象一下，我们的栅格网格不再是高度图，而是一个“成本表面”，其中每个单元格的值代表穿越那片土地的难度或“摩擦力”。茂密森林中的一个单元格可能有很高的成本，而开阔地则成本较低。现在，如果我们想找到从A点到B点的“最低成本路径”——即阻力最小的路径——我们就可以使用这个栅格。问题转化为在一个巨大的图上寻找最短路径，其中单元格是节点，与邻居的连接是加权边。我们定义的连通性规则——是只能像棋盘上的车一样上下左右移动（4邻域规则）？还是可以像王一样对角线移动（8邻域规则）？——从根本上改变了移动的几何形状，从而也改变了最优路径。一个对角线步，虽然只是一步，但覆盖的距离是单元格边长的 $\sqrt{2}$ 倍，与走两步正交步相比，是一个巧妙的捷径。通过编写这些简单的规则，我们可以模拟从新公路的最有效路线到寻求节约能量的动物可能的迁徙路径等一切事物。静态的网格变得生动起来，引导着运动并揭示着流动的路径。

作为计算器的栅格：地图代数实战

真正的魔力始于我们意识到可以像堆叠透明胶片一样堆叠这些栅格网格，并逐像素地在它们之间进行计算。这就是“地图代数”的精髓。在其最简单的形式中，它每天都在遥感中使用。卫星不仅仅是拍摄彩色照片；它捕捉电磁波谱不同片段的亮度，并将每个片段存储为独立的栅格波段。例如，我们有一个栅格记录植物反射的红光，另一个记录它们反射的近红外光（NIR）。健康的植被会贪婪地吸收红光进行光合作用，但会强烈反射近红外光。我们可以用一个简单的逐像素公式定义一个“植被指数”，比如著名的归一化植被指数（NDVI）：

\mathrm{NDVI} = \frac{\mathrm{NIR} - \mathrm{Red}}{\mathrm{NIR} + \mathrm{Red}}

计算机可以飞速处理数百万个像素，为每个像素计算这个值，立即将两个原始数据层转换为一张有意义的植被健康状况图。但这个过程要求严谨。如果在红光波段的一个像素被云遮挡，而在近红外波段没有，会发生什么？该像素的数据是缺失的，即 NoData。就像在算术中试图除以零一样，任何涉及 NoData 值的计算都必须传播这种不确定性，在输出中产生 NoData。这种规范确保了我们的计算画布不会因信息不完整而产生误导性结果。

这种代数能力可以扩展到令人难以置信的复杂程度。想象你是一位保护规划师，试图找到种植新森林的最佳地点。你的标准是多方面的：土壤必须合适，土地不应太陡，需要远离干扰性道路，并且不能位于现有的保护区或水体上。这些标准中的每一个都可以表示为一个栅格。我们有一个温度栅格、一个坡度栅格、一个到道路距离的栅格，以及水体和保护区的分类栅格。使用布尔逻辑，我们可以将我们的标准转化为一个单一的地图代数表达式：

S = (T \text{ is moderate}) \wedge (\theta \text{ is gentle}) \wedge (D \text{ is far}) \wedge (\neg W) \wedge (\neg P)

这里， $S$ 是最终的适宜性地图， $T$ 是温度， $\theta$ 是坡度， $D$ 是距离， $W$ 是水体， $P$ 是保护区，而 $\wedge$ 和 $\neg$ 分别是逻辑运算符 AND 和 NOT。栅格计算器对每个像素评估此表达式，生成一张最终地图，其中只有满足所有条件的像素才被标记为适宜。这是一种强大的空间决策形式，一个通过我们要求的网格来筛选整个景观的数字筛子。

这种数据融合可以变得更加复杂。构建洪水模型的水文学家需要知道SCS径流曲线数（ $CN$ ），这是一个描述降雨在地表径流与下渗之间分配比例的参数。这个单一的数字取决于土地覆盖、土壤类型以及土壤的现有湿度（前期土壤湿度条件，或AMC）。现代水文学家会进行一种数字炼金术：他们获取一个分类的土地覆盖栅格（NLCD）、一个分类的土壤栅格（HSG）、一个从DEM派生的坡度栅格，以及一个来自像SMAP这样的卫星的连续土壤湿度栅格。然后，他们构建一个工作流，将所有这些数据集重新投影到一个共同的网格上，使用适当的方法（分类数据用最近邻法，连续场用双线性插值法）对其进行重采样，并使用既定的物理公式将它们组合起来，以生成一个最终的高分辨率 $CN$ 栅格。这是栅格模型的巅峰之作：一个将不同数据源整合为单一、综合产品以供科学模型使用的框架。

时间中的栅格：捕捉动态

地景并非静止不变。它们变化、生长和演变。一堆栅格不仅可以代表不同的属性，还可以代表同一属性在不同时间点的状态。例如，通过一个NDVI栅格的时间序列，我们可以观察到森林随季节“呼吸”。在每个像素点，我们可以绘制NDVI值随时间变化的曲线，看到一条春天上升、夏天达到顶峰、秋天下降的曲线。从这条曲线中，我们可以提取关键的物候指标，例如“季节开始”——即地景开始变绿的那一天。

但这引入了一个深刻的问题：我们需要多频繁地观察？如果我们的卫星每天提供一张图像，我们就可以高精度地确定春天的开始。但如果由于云层或传感器调度，我们每16天才得到一张可用的图像呢？我们的观测现在是对真实、连续的绿化曲线的粗略采样。我们检测到的“季节开始”将是第一个超过我们绿度阈值的16天观测值，平均而言，这将比真实事件晚大约半个采样周期（8天）。我们观测的频率从根本上限制了我们知识的精度。这是信号处理中一个深刻的教训，在大陆尺度上演绎出来，提醒我们选择如何测量世界会影响我们所看到的内容。这个时间维度对于模拟大规模动态系统至关重要，例如可再生能源评估所需随时间变化的风场。管理这些庞大的四维 $(x, y, z, t)$ 数据集需要像 NetCDF 气候与预报（CF）约定这样稳健的标准，这些标准将关键的元数据——单位、坐标、投影——嵌入文件本身，确保这海量的数据在科学上保持其意义 [@problem_-id:4093381]。

栅格与对象：模糊界限

虽然逐像素的方法很强大，但这并不总是我们人类感知世界的方式。我们看到的是田野、湖泊和建筑，而不是五彩纸屑般的像素。图像分析中的先进技术已经开始模仿这一点。面向对象的影像分析（OBIA）是一种巧妙的两步舞。首先，它对栅格进行分割，将具有相似属性（如颜色和纹理）的相邻像素分组为“对象”。结果是一组代表场景中有意义事物的不规则多边形。其次，它分类的是这些对象，而不是单个像素，使用的是更丰富的特征集，如形状、大小和上下文，以及光谱属性。这种方法对困扰基于像素分类器的“椒盐”噪声具有更强的鲁棒性，并能生成更干净、更符合地图学原理的地图，这些地图可以直接转换为矢量多边形。这是两种数据范式的完美结合，利用类似矢量的概念来理解栅格世界。

栅格视图和矢量视图之间的选择也可能具有深刻的科学意义。试想一位研究哮喘的流行病学家。他们可以通过人口普查区来绘制发病率地图，创建一个矢量分级统计图。这很有用，但边界是任意的政治界线。住在街道一侧的人的风险并不会神奇地低于街对面的邻居。根本原因可能是一个环境因素，比如细颗粒物空气污染，它在空间上是连续变化的。将这种污染表示为一个连续的栅格风险表面，可能会揭示出在矢量地图中完全不可见的热点和梯度，为观察到的疾病模式提供更有力的解释。在这里，栅格模型不仅仅是一种不同的表示方法；它是一种在科学上更诚实的表示方法。

警示之言：地理学家的不确定性原理

这就把我们带到了最后一个令人谦卑的观点。当我们选择一种数据模型时，我们是在就如何观察世界做出决定。就像在量子物理学中一样，观察行为本身并非中立。在地理学和生态学中，这被称为可变分区单元问题（MAUP）。它有两个组成部分：尺度效应和分区效应。

我们分析的尺度，或称粒度（grain），是我们基本单元的大小——即栅格单元的大小，或矢量地图中的最小制图单元。如果我们使用粗糙的 $90 \times 90$ 米网格，小池塘和狭窄的溪流可能就直接消失了，被吸收到周围的森林类别中。我们计算出的边缘密度将低于使用精细的 $30 \times 30$ 米网格时的结果。我们看到的模式是我们用来观察它的分辨率的函数。

范围（extent），即我们研究区域的边界，也很重要。如果我们为一个小编制县计算森林覆盖比例，可能会得到 $0.4$ 。如果我们将范围扩大到整个州，其中包括一个大型国家森林，这个比例可能会跃升至 $0.6$ 。我们得到的数字取决于我们画出的框。

我们对粒度和范围的选择不仅仅是技术细节；它们是塑造我们结果的基本假设。一个地景的斑块、边缘和基质结构会因观测尺度的不同而显得完全不同。粗化粒度可能导致一个连通的森林基质呈现为一组不连通的斑块，从而完全颠覆我们对地景结构的解释。没有单一“真实”的表示方法。每一种都是通过特定镜头观察世界所得到的视图。明智的科学家了解自己镜头的特性，并对自己得出的结论保持应有的谦逊。栅格模型，以其全部的力量和简洁，并没有给我们世界本来的样子；它给了我们一个可以测量、建模，并且只要我们足够谨慎，就可以开始理解的世界。