try ai
科普
编辑
分享
反馈
  • 基于对象的影像分析 (OBIA)

基于对象的影像分析 (OBIA)

SciencePedia玻尔百科
核心要点
  • OBIA 通过在分类前将像素分组为有意义的对象,革新了影像分析,克服了传统基于像素方法的“椒盐”噪声问题。
  • OBIA 的核心是一个两步过程:分割(基于同质性对影像进行划分)和分类(利用生成对象的光谱、形状和上下文等丰富特征)。
  • 选择最佳尺度参数涉及一个关键的偏差-方差权衡,即在减少随机噪声与避免合并不同现实世界地物的风险之间取得平衡。
  • 这种以对象为中心的方法应用广泛,从遥感中的土地利用变化制图到数字病理学中的细胞结构识别,再到材料缺陷的模拟。

引言

当我们观察世界时,我们的头脑不会记录一个由单个颜色组成的混乱网格;我们感知到的是连贯的对象——一棵树、一座房子、一条河流。计算机分析影像所面临的挑战,一直是弥合原始像素数据与这种有意义的、符合人类认知尺度的理解之间的鸿沟。传统的影像分析方法将每个像素孤立对待,常常无法完成这项任务,导致解译结果充满噪声且支离破碎。基于对象的影像分析(Object-Based Image Analysis, OBIA)提供了一种革命性的解决方案,它教计算机像我们一样看待世界:将其视为对象的集合。本文将深入探讨这一强大的范式,揭示它如何将原始影像转化为结构化的知识。

接下来的章节将引导您领略 OBIA 的知识图景。在“原理与机制”一章中,您将学习该过程的工作原理,从分割的基本概念、定义对象同质性的艺术,到尺度的关键选择,以及赋予对象身份的丰富描述性特征。随后的“应用与跨学科联系”一章将展示该方法卓越的通用性,探索其在遥感、气象学、医学和材料科学等不同领域的变革性影响。读完本文,您将不仅理解 OBIA 的“如何做”,更会明白“为什么”——为什么将我们的焦点从像素转向对象会开辟新的发现前沿。

原理与机制

要真正欣赏这个世界,我们不能仅仅凝视单个的光点和颜色。我们的大脑会本能地将这些点组合成连贯的整体:一堆绿色斑点成为一棵“树”,一片蓝色区域成为一个“湖泊”,一个由直线组成的网格成为一个“城市街区”。我们看到的是对象,而不仅仅是像素。基于对象的影像分析(OBIA)的根本性突破,就是教会计算机做同样的事情。它将整个范式从微观的、通常充满噪声的像素世界,转向宏观的、有意义的对象世界。这不仅仅是技术上的改变,更是一种深刻的视角转变,一种新的观察方式。

超越像素:一种新的观察方式

想象一下,您想欣赏 Seurat 的一幅宏伟的点彩画,但只被允许通过一根细小的管子观看,一次只能看到一个颜料点。您可以一丝不苟地记录下每一个点的颜色,但您将完全错过画作的全貌——沐浴的人们、树木、波光粼粼的水面。这正是传统​​基于像素的分类​​方法的根本局限。通过独立地或仅考虑其紧邻像素来处理每个像素,它通常会生成一张看起来充满噪声和碎片化的分类图,即一种由孤立的、错误分类的像素组成的“椒盐”效应,这些像素几乎没有地理意义。

OBIA 采用一种更整体化、更像人类的方​​法。它分两大阶段运行:首先是​​分割​​,其次是​​分类​​。

  1. ​​分割:​​ 计算机扫描整个影像,并围绕属于一起的像素组绘制边界,将影像分割成一系列有意义的、不重叠的对象。一片广阔的玉米地成为一个单独的对象,一条蜿蜒的河流成为另一个。
  2. ​​分类:​​ 一旦这些对象被定义,计算机就会将每个对象作为一个整体进行分析。它不只是问:“这个对象的颜色是什么?” 它会问:“它的平均颜色是什么?它的颜色变化有多大?它的形状是什么?是细长的,还是圆而紧凑的?它的邻居是什么?”

这个两阶段过程本质上更为稳健。一个颜色异常的像素——可能是由于传感器故障或偶然的太阳反光——不会干扰整个分析。它只是被吸收到一个更大的对象中,其影响被平均化了。这是 OBIA 的第一个美妙之处:通过转向更高层次的抽象,我们获得了对世界更稳定、更有意义的看法。

划定界线:分割的艺术

计算机如何决定在哪里划定界线?分割的核心原则是​​同质性​​。其目标是创建内部尽可能一致,同时与相邻对象尽可能不同的对象。但“同质性”是一个非常丰富的概念,是分析师可以调整的不同标准的混合体,就像艺术家在调色板上混合颜色一样。

最常用的方法是​​多尺度分割​​,它从将每个像素视为一个微小对象开始,然后迭代地合并相邻对象。只有当合并后产生的新的、更大的对象不会变得“过于”异质时,合并才被允许。这种异质性的定义是其秘诀所在。它通常是两个主要因素的组合:色彩和形状。

  • ​​光谱同质性:​​ 这与颜色有关,或者更准确地说,与像素的光谱特征有关。如果一个对象内部像素值的方差很低,它就被认为是光谱同质的。我们实际上是在说:“把这些像素组合在一起,因为它们的颜色都非常相似。”

  • ​​形状同质性:​​ 这是对几何形状的约束。我们可以指示算法偏爱那些平滑或紧凑(更接近圆形)的对象,并惩罚那些蛛网状和曲折的对象。这有助于确保生成的对象不仅在光谱上相似,而且还具有合理且具有制图意义的形状。

控制整个过程的是至关重要的​​尺度参数​​。可以把它想象成一个旋钮,用于设定算法对异质性的容忍度。

  • ​​小尺度参数​​意味着低容忍度。算法非常挑剔,只会合并最相似的对象,从而产生大量小而高度均一的对象。这就像用放大镜观察地表。

  • ​​大尺度参数​​意味着高容忍度。算法更宽容,允许更多样化的区域被合并,从而产生较少数量的大对象。这就像从高空飞行的飞机上俯瞰地表。

至关重要的是,算法的行为也会适应影像本身。在像郊区这样有房屋、草坪和道路的光谱上“繁忙”的区域,算法会自然地生成较小的对象。而在广阔、均一的麦田中,它会生成一个巨大的对象——所有这些都是在相同的尺度设置下完成的。这种智能、自适应的行为是 OBIA 方法的一个标志。

最佳尺度:一种优美的权衡

选择“正确”的尺度参数是 OBIA 中最关键、也最富智力挑战性的部分之一。它不是一个随意的选择,而是一场对最佳平衡的探索,是​​偏差-方差权衡​​的一个完美范例——这一概念在统计学、机器学习和自然科学中随处可见。

让我们思考一下估算某个土地覆盖斑块真实属性(如其平均植被指数)的误差。这个误差有两个组成部分:偏差和方差。

  • ​​方差:​​ 在非常小的尺度下,我们的对象非常微小,可能只有几个像素。它们的平均颜色极易受到随机传感器噪声的影响。这个估计是有噪声的,或者说具有高​​方差​​。随着我们增加尺度参数,对象变大,我们对越来越多的像素进行平均。这个平均过程显著减少了随机噪声的影响,就像一百次抛硬币的平均结果比单次抛掷更可靠一样。因此,随着尺度的增加,方差减小。

  • ​​偏差:​​ 在非常大的尺度下,我们的对象变得巨大。它们如此之大,以至于可能开始跨越地表的自然边界,例如将一片森林与相邻的田地合并在一起。生成的对象是两个不同现实世界类别的混合体。其平均颜色不再是任一类别的真实表示;它是一个有偏差的平均值。这被称为​​欠分割​​。随着尺度的增加,这种混合效应变得更加明显,我们估计中的​​偏差​​也随之增加。

这里我们面临一个优美的两难境地。增加尺度会减少方差,但会增加偏差。减小尺度会减少偏差,但会增加方差。最佳尺度 s∗s^*s∗ 是使总误差最小化的那个尺度,那个我们已经平均掉足够噪声,但尚未引入过多混合偏差的最佳点。在实践中,这个最佳值通常可以通过绘制分割质量随尺度变化的图来找到。例如,我们可能会发现对象之间的平均光谱差异在某个尺度上达到峰值。这个峰值,通常被称为曲线的“拐点”,表明在该尺度下我们的对象与地面上真实的、不同的斑块对应得最好——这是可分离性最强的点,是分类最有利的平衡点。

描述世界:对象特征的力量

一旦影像被整齐地分割成一系列最佳对象,OBIA 的第二阶段就开始了:描述它们。这才是真正神奇的地方。与只能告诉你其颜色的像素不同,一个对象有着丰富的“传记”。我们可以提取一整套特征来描述其光谱属性、形状及其在世界中的位置。

  • ​​光谱特征:​​ 当然,我们可以计算一个对象中所有像素的​​平均​​光谱特征 (μ\muμ)。但我们也可以计算​​方差​​ (σ2\sigma^2σ2),它告诉我们对象的内部纹理。它是一片光滑的路面(低方差)还是一片斑驳的森林冠层(高方差)?。

  • ​​形状特征:​​ 这可以说是 OBIA 最大的优势。通过定义对象,我们现在可以使用几何的语言。想象两个光谱上完全相同的对象——都是灰色的。但一个是细长蜿蜒的线条,而另一个是完美的圆形。基于像素的方法会认为它们是相同的;OBIA 则可以立即将它们区分开,也许会将一个分类为“道路”,另一个分类为“筒仓顶部”。我们可以计算数十种形状特征,例如 [@problem_id:3852861, @problem_id:3860437]:

    • ​​紧凑度:​​ 对象的形状与完美圆形的接近程度如何?这可以区分人造池塘和自然的、形状不规则的湖泊。
    • ​​伸长度:​​ 对象的拉伸程度如何?这有助于区分像道路和河流这样的线性地物与像田地这样的面状地物。
    • ​​分形维度:​​ 这个高级概念衡量对象边界的复杂性。崎岖的自然海岸线比平滑的人造运河堤岸具有更高的分形维度。
  • ​​上下文特征:​​ 对象并非孤立存在。其身份通常由其周围环境定义。OBIA 允许我们提问:这个对象的邻居是什么?这片小的绿色斑块(一个潜在的公园)是被建筑物(城市)包围还是被水体(水体)包围?通过量化一个对象与其邻居的关系——例如,通过计算其边界与其他类别接触的比例——我们可以将上下文用作强大的分类线索。

这套丰富的光谱、形状和上下文特征为分类算法提供了前所未有的信息量。通过将它们组合起来,通常以加权分数的形式,我们可以做出比仅看光谱值远为细致和准确的决策。

从对象到知识

分析影像的最终目的不是生成地图,而是产生知识。通过处理对象,OBIA 在数据和我们关心的现实世界实体之间建立了更直接、更稳健的联系。

当 OBIA 分类结果被转换为标准矢量地图以在地理信息系统(GIS)中使用时,结果是清晰而直观的。我们得到的不是由数百万个微小像素多边形组成的混乱集合,而是为每块田地、每座建筑和每个湖泊提供一个单一、明确定义的多边形。这种与人类尺度地理实体的一致性是一个巨大的实践优势。它还允许我们将地理智能直接构建到分析中。例如,我们可以强制执行一个“最小制图单元”,告诉算法忽略任何小于特定尺寸的对象,从而从一开始就有效地滤除无意义的斑点。

这种以对象为中心的视图在监测地球随时间变化时尤其强大。在执行​​变化检测​​时,比较两个日期之间的对象远比比较数百万个充满噪声的像素更可靠、统计上更健全。它使我们能够更有信心地追踪有意义的事件——一个新小区的增长、一片森林的砍伐。然而,这种知识的质量关键取决于初始分割的质量。一张​​欠分割​​的地图,即不同对象被不当合并,可能导致​​错分误差​​(例如,因为一块田地与附近的建筑物合并而被判为“城市”)。一张​​过分割​​的地图,即单个实体被 fragmented 成许多碎片,可能导致​​漏分误差​​(例如,因为一片森林被分割且其碎片被错误分类而未能识别)[@problem_t:3794263]。

最终,基于对象的影像分析是统计学、几何学和计算机科学的美妙结合,它使我们能够将原始影像转化为结构化知识。通过教会机器不将世界看作一个由不相连的像素组成的网格,而是看作一个由有意义的对象组成的镶嵌体,我们向理解塑造我们世界的复杂模式和过程又迈进了一步。

应用与跨学科联系

在了解了我们如何教计算机不将世界看作一堆不相连的点,而是看作有意义对象的集合之后,您可能会好奇:这一切究竟是为了什么?它仅仅是一种巧妙的计算技巧,还是为我们打开了观察世界的新窗口?答案是,而且是一个令人愉快的答案,这种视角的转变具有深刻的变革性。通过从像素转向对象,我们拥有了一种用途惊人广泛的工具,它在绘制地球地图和诊断疾病等迥然不同的领域中都找到了用武之地。让我们通过对象的眼睛,来游览这个新世界。

从上空看地球

或许,基于对象的分析最自然的应用领域是遥感——从远方理解地球的艺术。卫星为我们提供了上帝视角,但它们传回的影像是像素的喧嚣,每个像素都只是对反射光的简单测量。真正的挑战在于将这些数据转化为知识。

想象一下,您想创建一张地球上所有水体——湖泊、河流和海洋——的地图。一种简单的方法可能是教计算机,水具有特定的光谱特征,即在特定波长的光下呈现特定的“颜色”。对于田野中央一个大而清澈的湖泊,这种方法效果很好。但对于一条蜿蜒穿过密集城市的狭窄运河呢?一座高楼投下的深色阴影,其光谱特征可能与水几乎完全相同。基于像素的方法会完全混淆,生成一张从摩天大楼流出“幽灵”河流的地图。但我们不会这么容易被愚弄。我们看到运河是一个长的、连续的、相对平滑的形状,而阴影则参差不齐,并沿着建筑物的边缘分布。基于对象的影像分析(OBIA)赋予了计算机同样的智慧。通过首先将像素分组为分割对象,它不仅可以分析它们的平均特征,还可以分析它们的纹理和形状。它了解到,水体往往比建筑阴影的伸长、混乱的形状,或被风吹拂的海岸上太阳反光和泡沫所形成的丝状、有纹理的图案更加同质和紧凑。通过这种方式,它将真正的水体与冒名顶替者区分开来,创建出一张远为准确和智能的地图。

当我们观察随时间发生的变化时,这种超越单纯颜色的观察能力甚至更为关键。我们的世界并非静止。森林被砍伐,城市在扩张,农田被灌溉。假设我们想同时监测小而分散的森林砍伐斑块和一大片农田的扩张。这两种类型的变化构成了一个经典的难题。一个小的森林砍伐斑块是一个强烈、清晰的信号,但它很微小。一个大型灌溉项目可能在广阔的区域内引起非常细微的反射率变化。如果我们以非常精细的尺度观察影像,我们可以发现小块的砍伐地,但可能会在噪声中错过大范围的微弱变化。如果我们放大视野,在大的区域上进行平均,来自巨大灌溉田的信号会因噪声抵消而变得清晰,但微小的森林砍伐斑块则被完全冲淡而消失。

基于对象的分析以其固有的尺度概念优雅地解决了这个难题。我们可以指示计算机同时在多个尺度上寻找对象。它可以搜索可能对应于森林砍伐的小而紧凑的变化对象,同时也可以搜索可能代表新农田的非常大的变化对象。通过设置根据对象大小智能调整的检测阈值——理解到一个巨大对象上的微弱信号与一个微小对象上的强烈信号同样重要——我们可以构建一幅完整而稳健的地景动态图。这种多尺度视图对于评估如滑坡疤痕等地质灾害(分析必须根据碎屑场的特征尺寸进行调整)到理解城市增长的复杂镶嵌格局 等各方面都不可或缺。

从天气到细胞

基于对象的观点的美妙之处在于它不局限于地景。任何排列在网格上的数据都可以是“影像”,其中的任何连贯现象都可以是“对象”。思考一下天气预报的挑战。一个对流解析模型可能会预测一场雷暴,但这个预测好吗?与雷达数据进行逐像素比较常常会产生误导。模型预测的雷暴可能形状稍有偏差或偏离真实位置几公里;基于像素的评分会宣布其为完全失败,尽管从所有实际目的来看,这个预报非常出色。

气象学家现在正转向 OBIA 以进行更智能的评估。他们将预测的雷暴和雷达观测到的雷暴视为对象 [@problem_t:4090730]。然后他们提出一些合理的问题:模型雷暴对象的*质心是否接近雷达对象的质心?它的大小是否相似?它的峰值强度*是否真实?通过比较这些“对流对象”的属性,他们可以对模型的性能有一个更有意义的理解,不仅评估像素级的准确性,还评估模型再现天气基本结构和动态的能力。

现在让我们把尺度急剧缩小,从一朵雷雨云到单个活细胞内的宇宙。一位生物学家可能想知道,一种特定的蛋白质,比如一种弥散在细胞质中的激酶,是否会集中在特定的细胞结构上,比如那些显示为稀疏亮点的微小内体。这是一个经典的*共定位*问题。在这里,基于像素的相关性度量将毫无用处。因为激酶无处不在而内体很罕见,绝大多数像素显示没有相关性,即使激酶在每个内体上都高度富集,该度量值也会接近于零。

然而,基于对象的方法恰恰以生物学家的方式提出问题。首先,它执行困难但至关重要的预处理步骤:校正光学畸变和荧光通道间的颜色“渗色”。然后,它将内体识别为对象。最后,对于每个内体对象,它测量该位置的激酶信号强度,并将其与紧邻区域的激酶信号进行比较。这就得出了一个直接的、针对每个内体的“富集”度量。然后我们可以提出统计学问题:中位富集是否显著?显示强富集的内体比例是多少?这个流程为生物学问题提供了一个清晰、定量且统计上稳健的答案,而基于像素的方法只会提供噪声。

同样的逻辑在医学中也具有深远的影响。在数字病理学中,为癌症生物标志物染色的活检切片成为影像。例如,对于乳腺癌,诊断的一个关键部分是 Allred 评分,它量化了激素受体的表达。病理学家通过目测估计染色的肿瘤细胞核百分比及其平均染色强度来完成此操作。一个稳健的数字流程现在也做同样的事情,但具有定量的严谨性。它利用基于对象的分析原理,首先分离染料,然后分割切片上的每一个细胞核。接着,它运行一个分类器来区分肿瘤细胞核和健康细胞。最后,它测量每个肿瘤细胞核对象内的生物标志物染色量。由此,它精确计算出阳性肿瘤细胞核的比例并对其强度进行分类,忠实地复制了病理学家的诊断逻辑,但具有机器的客观性和可重复性。这里的“对象”是细胞核,生物功能和功能障碍的基本单位。

统一的哲学

我们看到的是一个反复出现的主题:世界是结构化的。从森林到风暴云再到细胞核,自然并非点的无结构集合。基于对象的范式之所以强大,是因为它提供了一个描述这种结构的框架。

在生态学中,研究森林与草原之间边界或“边缘”的研究人员对真正的生物过渡带感兴趣。一个简单的、基于像素的边缘检测器,如 Canny 算法,很容易被欺骗。它寻找亮度的急剧梯度,因此它会很乐意在森林冠层投下的阴影边缘画一条线。但阴影是光照造成的人为假象,而不是栖息地边界。基于对象的方法通过首先识别“森林”和“草原”的连续区域,要稳健得多。它理解落入森林斑块内的阴影并不会改变其仍然是森林斑块的事实,它描绘的是区域本身之间的真实边界,从而为生态学家提供关于生境破碎化更有意义的数据。

这种追踪对象的思想甚至延伸到了材料模拟的抽象世界。为了理解金属在辐射下的降解过程,科学家需要模拟原子尺度缺陷——空位、填隙原子及其团簇——的行为。对于感兴趣的时间尺度(秒到年),追踪晶体中每个原子状态的模拟在计算上是不可能的。解决方案是一个被称为对象动力学蒙特卡洛(OKMC)的绝妙概念飞跃。在这里,缺陷本身被视为对象。模拟不再关心晶格中数以万亿计的完美原子;它只追踪几千个缺陷对象的状态和位置。它计算这些对象迁移、相互反应或分解的速率。因为对象的数量远小于原子的数量,这些模拟可以达到预测材料寿命所需的漫长物理时间。这里的“影像”是晶体的状态,而“对象”是其演变的动因。

从卫星对地球的俯瞰到晶体中原子的模拟,教训是相同的。通过将我们的焦点从不相连的像素转向情境化的对象,我们不仅仅是改进了一项测量。我们在原始观测数据和我们理解的概念模型之间架起一座桥梁。我们教会机器更像我们一样看待世界:不是一个无意义的点的图案,而是一个丰富且结构化的现实。