首页纹理量化

纹理量化

玻尔百科

定义

纹理量化是指通过灰度共生矩阵（GLCM）等统计方法将定性的视觉模式转化为客观度量指标的过程。该技术属于图像分析领域，利用滤波器和分形分析等多尺度技术来提取不同细节层面的纹理信息。纹理量化在医学癌症分级和古生物学饮食研究等多个学科中具有广泛应用，其实施过程需严格考虑成像分辨率和重建算法对测量值的影响。

核心要点

纹理量化利用灰度共生矩阵 (GLCM) 等统计方法，将定性的视觉模式转化为客观的度量指标。
滤波器和分形分析等多尺度技术对于捕捉存在于不同细节层次的纹理信息至关重要。
纹理分析具有广泛的跨学科应用，从医学中的癌症分级到古生物学中确定古代人族的食谱。
成像系统的特性，包括分辨率和重建算法，深刻影响测得的纹理值，这需要审慎的科学考量。

引言

我们的大脑可以毫不费力地区分光滑的鹅卵石和粗糙的树皮，但我们如何教会计算机看到这种差异呢？从定性感知到定量测量的转变是纹理量化的核心挑战。这一过程解锁了数字图像中海量的隐藏信息，将简单的像素转变为有意义的科学数据。它解决了如何系统地表征我们直观感知为纹理的强度空间排布这一根本问题。本文对这一强大的分析领域进行了全面概述。首先，在“原理与机制”部分，我们将探索用于测量纹理的基础方法，从简单的直方图到复杂的多尺度分析和分形分析。随后，“应用与跨学科联系”部分将展示这些量化技术如何应用于解决现实世界的问题，并推动医学、古生物学和材料科学等不同领域的发现。

原理与机制

在我们理解世界的旅程中，我们通常从分类事物开始。我们说这块岩石光滑，那块树皮粗糙；这种织物是编织的，那种则带有斑点。我们的大脑毫不费力地执行这种“纹理分析”。但我们如何教会计算机做同样的事情呢？我们如何从“粗糙度”的定性感觉转向一个定量的、客观的数字？这就是纹理量化的核心问题。这是一段从图像的原始像素化数据到对其所代表结构的更深层次理解的旅程。

初探：直方图及其局限性

让我们从处理图像时能做的最简单的事情开始。图像只是一个数字网格，每个数字代表一个像素的亮度（或灰度级）。最基本的方法是完全忽略这些像素的空间排列，只计算每个亮度级别的像素有多少。这就得到了直方图。

想象一位病理学家正在观察组织样本中的一个感兴趣区域。直方图告诉她“染色强度”的总体分布。从这个简单的计数列表中，我们已经可以计算出一些出人意料的有用数值，通常称为一阶统计量。我们可以计算平均强度，它告诉我们该区域的平均亮度或暗度。我们可以计算方差，它告诉我们强度分布的范围有多宽——这是对异质性的第一个粗略度量。一个均匀、平淡的组织可能方差较低，而一个包含多种不同细胞类型的复杂组织则可能有较高的方差。

我们甚至可以更进一步，计算直方图的香农熵。在此背景下，熵是衡量意外或不可预测性的指标。如果一个组织区域仅由两三种可预测数量的不同强度级别组成，其熵值就较低。如果它是由许多不同强度级别组成的混乱混合体，其熵值就较高。这让我们对强度分布的“复杂性”有了一定的了解。

但在这里我们遇到了瓶颈。直方图对模式是“盲目”的。想象一张沙滩的照片和一张纯随机噪声的照片。通过巧妙的安排，我们可以使它们具有完全相同的直方图。然而，在我们眼中，一个有明确的纹理，而另一个是无意义的噪声。直方图丢弃了所有的空间信息，这无异于将精华与糟粕一同抛弃。要真正理解纹理，我们必须考虑像素的排列方式。

洞悉模式：灰度共生矩阵

要看到模式，我们必须研究像素值如何与其邻居相关联。用于此目的的经典且最强大的工具是灰度共生矩阵 (GLCM)。尽管这个名字有点拗口，但其思想却异常简单。

想象你是一个站在图像中某个像素上的小探险家。你为你的旅程设定一个规则：例如，“总是向右走一步”。你开始旅程，并在每一步都进行记录。你记下你所站立的像素的灰度级（称之为 $i$ ）和你将要踏上的像素的灰度级（称之为 $j$ ）。GLCM 只是一个网格，你每走这样一步，就在单元格 $(i, j)$ 中添加一个标记。

在遍历整个图像后，这个矩阵一旦归一化，就会告诉你，在给定的特定移动规则（由距离 $d$ 和角度 $\theta$ 定义的偏移量）下，强度为 $i$ 的像素旁边紧邻强度为 $j$ 的像素的概率 $p_{ij}$ 。

这个矩阵是关于图像空间结构的信息宝库。但一个庞大的数字矩阵本身还不是一个单一、有用的度量指标。因此，我们用一组二阶统计量来对其进行总结。其中最重要的两个是对比度和能量。

对比度是“繁忙程度”或局部变化的度量。其公式本质上是共现像素强度平方差的加权平均值： $\sum_{i,j}(i-j)^2 p_{ij}$ 。 $(i-j)^2$ 项意味着强度差异非常大（即 $i-j$ 较大）的像素对会对最终得分产生很大影响。具有许多锐利边缘和快速变化的纹理，比如一片碎石地，其对比度会很高。
能量，也称为角二阶矩 (ASM)，是衡量有序性和均匀性的指标。其公式为 $\sum_{i,j}p_{ij}^2$ 。当概率集中在少数几个 $(i,j)$ 对上时，这个和达到最大值。这种情况发生在高度规则、周期性的纹理中，其中相同的模式反复出现，例如砖墙，或者在医学背景下，整齐排列的胶原纤维。对于这样的纹理，GLCM 会有少数几个非常亮的点，从而导致较高的能量值。

当我们考虑“旅程”的方向时，GLCM 的真正魅力就显现出来了。如果我们正在分析一张排列整齐的纤维图像，水平方向的旅程（沿着纤维）将主要遇到相似像素对，导致低对比度和高能量。然而，垂直方向的旅程（穿过纤维）会不断地从纤维跳到背景，导致高对比度和低能量。通过比较来自不同方向的 GLCM 特征，我们可以量化纹理的各向异性——这是描述材料科学和生物学中定向结构的一个强大概念。

超越像素对：表征区域和斑块

GLCM 很强大，但它的视角基本上是局部的——它只考虑像素对。如果重要的纹理信息存在于相同强度的连续区域的大小和形状中，该怎么办？想想豹子的斑点或活检组织中的腺体结构。

这就需要一种不同的方法，一种基于“斑块”或“区域”的方法。一个区域 (zone) 被定义为一组具有相同灰度级的连通像素。我们可以扫描图像，识别所有这些区域，并为每个区域记录其灰度级和大小（它包含的像素数）。

灰度区域大小矩阵 (GLSZM) 就是这种统计的结果。它是一张表格，其中条目 $Z_{g,s}$ 简单地告诉我们在图像中发现了多少个灰度级为 $g$ 、大小为 $s$ 的区域。

与 GLCM 类似，GLSZM 也可以被总结为一些直观的特征。例如：

大区域强调 (LZE) 赋予较大区域更高的权重。LZE 值高的图像主要由大的、粗糙的、同质的区域构成。
小区域强调 (SZE) 赋予较小区域更高的权重。SZE 值高的图像由许多小的、细粒度的斑点或区域组成。

这种基于区域的方法为基于像素对的 GLCM 提供了补充视角，捕捉了另一种与方向无关的结构信息。

多尺度世界：滤波器和频率

纹理的一个基本特性是它存在于多个尺度上。一棵树的纹理包括其树皮的细微纹理、树枝的中等尺度分叉以及其树冠的粗大轮廓。在单一尺度上计算的单个纹理指标可能会忽略全局信息。

为了在不同尺度上“观察”，我们可以使用滤波器组。其思想是首先用一个能增强特定尺寸结构的滤波器处理图像，然后在滤波后的图像上计算纹理特征。

一个常用的工具是高斯拉普拉斯 (LoG) 滤波器。这听起来很复杂，但其直觉很简单。高斯部分只是一种特定的模糊函数。“拉普拉斯”部分是一个算子，用于突出边缘或更普遍地，突出与其周围环境不同的区域。组合后的 LoG 滤波器充当“斑点检测器”。高斯模糊的大小由其标准差 $\sigma$ 决定，它调整滤波器使其对相应大小的斑点最为敏感。通过应用一组具有不同 $\sigma$ 值（例如 $\sigma \in \{2, 3, 4, 6\}$ mm）的 LoG 滤波器，我们可以创建一系列新图像，每个图像都突出显示特定物理尺度下的纹理。

另一个更复杂的工具是小波变换。你可以把小波分解想象成一个图像“均衡器”，类似于你音响上的那个。它将图像分解成不同的“频带”——一组只包含最精细细节的子图像，另一组包含稍粗糙细节的子图像，以此类推，一直到最粗糙的大尺度结构。通过分析这些频带内的纹理特征，我们可以获得对图像异质性的丰富、多尺度的描述。

粗糙度的几何学：分形视角

到目前为止，我们的方法都是基于计数和概率的统计方法。但是，还有另一种优美的几何方式来思考复杂性：分形的语言。

思考这个经典问题：大不列颠的海岸线有多长？著名的答案是，这取决于你测量尺的长度。用100公里的尺子，你会得到一个答案。用1米的尺子，你会描绘出更多的角落和缝隙，总长度会大得多。分形是一个其复杂性随测量尺度变化的物体。

许多自然纹理，从云和山脉到肿瘤脉管系统，都表现出这种尺度不变性。分形维数是捕捉这一特性的一个数字。普通的线维度为1，平面维度为2，而一条褶皱的、空间填充的分形曲线的维度可以在1到2之间。它量化了物体的“粗糙度”或“复杂性”。

其形式化的数学定义，即豪斯多夫维数，是一个优雅但极为抽象的概念，涉及极限和对集合的无限覆盖。对于一张真实的、有噪声的、像素化的医学图像，它的计算是不可行的。

幸运的是，我们有一个实用且直观的替代方法：盒计数维数。该算法很容易可视化：

用大小为 $\epsilon$ 的大方格网格覆盖图像。
计算包含部分纹理的方格数量 $N(\epsilon)$ 。
用逐渐变小的方格重复此过程。对于分形纹理，所需方格的数量根据幂律增长： $N(\epsilon) \propto \epsilon^{-D_B}$ ，其中 $D_B$ 是盒计数维数。通过绘制 $\log(N(\epsilon))$ 与 $\log(1/\epsilon)$ 的关系图，直线的斜率就是我们所求的维度。更高的值意味着更复杂、空间填充性更强和更“粗糙”的纹理。

测量的现实：扫描仪如何塑造纹理

我们必须掌握最后一个关键原则。在科学中，测量行为总是会影响被测量的对象。我们量化的纹理并非生物组织的真实、基准纹理。它是通过成像系统镜头所看到的纹理。放射组学流程中的每一步，从扫描床上的患者到屏幕上的最终数字，都会在数据上留下其印记。

首先，扫描仪本身的物理原理施加了根本性的限制。任何成像系统都有有限的分辨率；它会内在地模糊图像。这种模糊由系统的点扩散函数 (PSF) 来描述——即它为一个无穷小的光点生成的图像。在频域中，这由调制传递函数 (MTF) 来表征，它告诉我们扫描仪能多好地“看到”不同大小的细节。就像廉价的音频扬声器会抑制高音一样，每个成像系统对高空间频率（精细纹理）的衰减都比对低空间频率（粗糙纹理）的衰减更严重。例如，空间频率为 $0.5$ cycles/mm 的精细纹理，其对比度可能会降低到其真实值的仅 $29\%$ ，而频率为 $0.1$ cycles/mm 的粗糙纹理则能保留 $95\%$ 。这意味着扫描仪系统地使物体看起来比实际更平滑，并且这种效应对最精细、最微妙的纹理影响最强。

其次，用于从原始扫描数据创建图像的软件也起着巨大作用。在CT中，选择重建核心是一种权衡。 “锐利”核心试图消除部分扫描仪的模糊，增强边缘，但同时也会急剧放大噪声。“平滑”核心产生更清晰、噪声更少的图像，但代价是造成更严重的模糊。由于纹理特征对噪声和清晰度都高度敏感，核心的选择可以完全改变最终的纹理值。

最后，即使是看似简单的预处理步骤也很重要。医学图像通常是以各向异性体素获取的（例如，在x-y平面上清晰，但在z方向上模糊）。为了进行真正的3D分析，我们必须将图像重采样到各向同性的网格上。用于此插值的算法——无论是简单的最近邻、线性还是平滑三次插值——都涉及到在模糊图像和引入块状或混叠伪影之间的另一种权衡。每种选择都会创建出略有不同的纹理版本。

理解这些原则不仅仅是一项学术练习，它是通向良好科学的关键。它教导我们，纹理特征不是一个单一、神奇的数字，而是从一个复杂过程中得出的测量值。通过领会定义和测量纹理的不同方法——从简单的直方图到多尺度分形——并尊重成像系统的深远影响，我们才能开始使用这些强大的工具，解锁医学图像中隐藏的信息，并将我们看到的模式与我们试图理解的生物学现实联系起来。

应用与跨学科联系

在探索了我们如何教机器“看”纹理的原理之后，你可能会想，“这一切究竟是为了什么？”这是一个合理的问题。为一个表面的“颗粒感”赋予一个数字，除了满足学究式的好奇心之外，还有其他作用吗？答案是响亮的“是”。纹理量化不仅仅是一项学术活动；它是一面具有深远力量的透镜，揭示了几乎所有科学领域中隐藏的故事。它使我们能够将我们直观感知的视觉模式与创造这些模式的潜在过程联系起来。现在，让我们来探索这个广阔而迷人的应用领域，从活细胞的内部世界到化石牙齿的古老表面，再到构成我们世界的材料的本质结构。

内部世界：生物学和医学中的纹理

也许纹理分析最直接、最有影响力的应用在于生物学和医学领域，在这些领域，生物的结构与其功能和健康状况密不可分。在这里，纹理不仅仅是一个特征；它通常是生物过程的直接标志。

想象一下通过显微镜观察一个细胞的细胞核。在一个年轻、健康、增殖的细胞中，遗传物质——染色质——以一种弥散、相对均匀的雾状形式分布。但是，随着细胞衰老并进入衰老状态，这片宁静的景象会发生戏剧性的变化。染色质凝结成密集的、明亮的、轮廓清晰的团块，称为衰老相关异染色质灶 (SAHF)。在人眼看来，纹理从光滑变为粗糙和块状。但我们如何用数字来描述这种变化呢？在这里，我们的纹理指标就派上了用场。一个在明亮灶点和黑暗区域之间有清晰边界的纹理将具有高对比度。图像变得不那么均匀，因此其同质性和能量会降低。而且因为模式更复杂、更难预测，其熵会增加。通过测量这些简单的量，机器可以精确地追踪细胞衰老的过程，将定性观察转变为定量测量。

这种量化细胞外观的能力对作为癌症诊断基石的病理学具有革命性的影响。一个多世纪以来，病理学家通过观察微观特征来为肿瘤分级——细胞核有多不规则？它们的大小和形状变化有多大？这个过程虽然能挽救生命，但带有主观因素。纹理分析为建立一个更客观、可重复的标准提供了一条途径。通过分析组织样本的数字化图像，算法可以从数千个细胞核中计算纹理特征。它可以量化每个细胞核内染色质纹理的“粗糙度”，这一特征通常与侵袭性肿瘤行为相关。这些纹理指标，结合细胞核形状和有丝分裂活动的定量测量，为癌症（如乳腺癌）的分级提供了一个强大的、数据驱动的特征。

纹理分析的视角可以进一步扩大，从显微镜载玻片放大到医学扫描。“放射组学”领域旨在从CT和MRI等医学图像中提取大量定量数据，这些数据通常是肉眼无法看到的。CT扫描上的肿瘤不是一个均匀的斑块；它是一个由癌细胞、血管和细胞死亡（坏死）区域组成的复杂、异质的生态系统。这种生物异质性在图像中表现为一种纹理。一个光滑、均匀的肿瘤纹理可能表明其生长行为良好，呈包裹性生长。相比之下，一个混乱、高熵、低同质性的纹理通常反映了更具侵袭性的生物学特性——一场快速、无序生长和坏死的风暴。此外，肿瘤的边界本身也具有纹理。一个光滑的球形形状表明肿瘤正在推开周围组织，而一个具有高表面积体积比的毛刺状、不规则边缘则暗示着一种浸润性生长模式，即癌细胞的触角正在侵入邻近结构。通过量化这些形状和纹理特征，我们可以建立模型，从标准的临床扫描中预测肿瘤的分期，例如其局部侵犯（ $T$ 分期）及其扩散的可能性。

当然，一个新医疗工具的采用并不仅仅因为它看起来很巧妙。它必须在严苛的临床实践现实中被证明是有效的。这就是从一个好主意到成为一个有效生物标志物的旅程，演变为一项严谨科学事业的地方。一个有前景的基于纹理的生物标志物，比如从高分辨率CT扫描计算出的“肺纤维化指数”，必须首先被证明是可靠且可重复的。然后，它必须证明其随时间的变化不仅仅是随机噪声，而是反映了真实的生物学进展。最后，也是最重要的，它必须通过预测对患者真正重要的事情来证明其价值：未来的临床结果。通过生存模型等复杂的统计分析，研究人员可以表明，即使在考虑了所有标准临床测量指标后，纹理生物标志物的变化也能独立预测患者疾病恶化的风险。这种严谨的验证过程，是将科学好奇心与能够真正指导患者护理的工具区分开来的关键。

更广阔的视野：纹理在各科学领域的应用

纹理分析的力量并不仅限于医学。同样的基本思想——空间模式包含信息——在截然不同的科学领域和尺度上引起共鸣。

让我们回到近两百万年前的东非平原，去解决一个著名的进化谜题。这里生活着Paranthropus boisei，这是一种人族近亲，因其巨大的下颚、矢状嵴和巨大的臼齿而被称为“胡桃夹子人”——所有这些似乎都是为压碎极其坚硬的食物而设计的。然而，当科学家分析其牙釉质中的稳定碳同位素时，他们发现了一种与以柔软的C4植物（如草或莎草）为食相符的特征。这就产生了一个悖论：为什么要进化出颅骨大锤来吃柔软的食物？答案是通过观察牙齿本身的纹理找到的。牙齿微磨损纹理分析 (DMTA) 使用高倍率成像来量化牙齿咀嚼表面上的微小凹坑和划痕。P. boisei 的牙齿被发现覆盖着复杂的凹坑，这是由食用坚硬、易碎的食物而非柔软的草类造成的模式。这个悖论通过理解两种信号的不同时间尺度而得以解决。同位素反映了牙齿形成数年间的平均饮食，而微磨损则反映了生命最后几周的“最后一餐”。P. boisei 可能大部分时间以柔软的C4植物为生，但其巨大的咀嚼器官是一项关键的适应，用于在首选食物稀缺时通过食用坚硬、易碎的“后备食物”来度过困难时期。化石牙齿上的纹理讲述了一个仅靠化学无法揭示的生存故事。

从骨骼的纹理到金属的纹理，其原理保持不变。在材料科学中，“织构 (texture)”一词有其特定含义：多晶材料中晶粒的优选取向。具有强纤维织构的材料，其所有微小晶粒都朝相似方向排列，其性质（如强度或导电性）将与晶粒随机取向的材料大不相同。我们如何测量这个？一种方法是使用电子衍射。在衍射实验中，一束电子穿过材料，产生一个环状图案。对于具有随机取向的材料，这些环是完全均匀的。但在具有织构的材料中，这些环变得不均匀，出现高强度的亮弧。衍射图样的图像纹理直接反映了材料底层的晶体织构。通过对环强度进行方位角分析，科学家可以精确量化优选取向的程度，从而将图像中的模式与材料的基本结构和性质联系起来。

放大到行星尺度，纹理帮助我们解读地球本身的面貌。一张地景的卫星图像是一幅由各种纹理交织而成的织锦。森林的纹理与草原不同，草原的纹理又与城市不同。在遥感技术中，研究人员分析这些纹理来对土地覆盖进行分类并监测环境变化。例如，在半干旱地貌中，纹理可以区分细粒土壤区域和点缀着灌木和卵石的粗粒区域。在这里，像拉普拉斯尺度空间分析这样的计算机视觉方法特别强大。这种技术就像拥有一个可变放大倍率的镜头，可以自动在其特征尺寸上找到“斑点状”物体。通过分析图像中检测到的物体尺寸分布，我们可以得出稳健的纹理粒度度量，从而了解地面的物理结构，这些信息对地质学、生态学和农业至关重要。

现代视角：纹理、人工智能与未来之路

在深度学习和人工智能 (AI) 时代，这些“手工制作”的纹理特征有何地位？人们普遍认为，我们只需将原始图像输入一个大型卷积神经网络 (CNN)，让它自己解决所有问题。但这忽略了其中一个优美而深刻的观点。当我们在数百万张自然图像上训练一个 CNN 时，它在最早的层级学到了什么？它会自发地学习到一些经过精确调整的滤波器，用以检测不同方向和尺度上的边缘和纹理。这些学习到的滤波器与视觉科学家几十年来为模拟人类视觉系统初级阶段而开发的Gabor滤波器及其他数学构造惊人地相似。

“迁移学习”——即使用在自然图像上预训练的网络来完成像分析CT扫描这样完全不同的任务——其惊人成功，是对一个普遍原理的最终证明。自然图像和医学图像，尽管来源不同，却共享一个基本的统计结构：它们主要由被锐利边缘分隔的逐片平滑区域构成。正是由于这种共同的“语法”，从猫和汽车的照片中学到的低级纹理和边缘检测器为学习识别肿瘤和组织提供了极其强大的归纳偏置，或者说是一个“领先优势”。人工智能不必重新发明边缘的概念；它已经知道边缘是什么了。

这将我们引向最后也是至关重要的一点：一句警示。正是这种使得纹理分析如此强大的敏感性，也使其容易受到偏差的影响。想象一个旨在通过CT扫描预测疾病的放射组学模型。如果用于训练模型的数据来自两家不同的医院，而其中一家医院一直使用比另一家更厚的CT切片，那么就会出现一个严重的问题。厚切片图像天生会更平滑，其高频纹理信息将不可逆地丢失。一个标准的处理流程，即使是将所有图像重采样到相同体素大小的流程，也无法恢复这些丢失的信息。结果是两组数据之间的纹理特征存在系统性差异，这与生物学无关，而完全与扫描仪有关。一个天真的人工智能模型可能无意中变成一个出色的“医院检测器”而非疾病检测器，导致其在部署到新环境时表现出偏差且不可靠的性能。因此，理解图像形成和纹理分析的基本原理不仅仅是一项学术活动；对于任何为现实世界构建人工智能工具的人来说，这都是一项道德责任。

从垂死细胞最微弱的变化到我们星球的宏伟格局，从遥远的过去到人工智能的未来，纹理都是信息的根本载体。学会解读和量化它，就是学习一种描述世界的新语言，这种语言将继续解锁新的科学发现和深远的技术能力。