
生态学中最基本的问题之一不仅是某个物种有多少个体,还在于它们在哪里以及数量如何。对于保护和管理而言,种群密度——单位面积内的动物数量——是关键的衡量标准。然而,对于行踪隐秘的野生动物来说,这一指标长期以来都极难获取。传统的捕获-重捕获方法可以估算总种群数量,但要将其转换为密度,就需要定义一个“有效取样面积”,这是一个通常带有任意性且在科学上难以令人满意的步骤,可能会极大地改变结论。这种需要空间指标却使用非空间方法的差距,给生态学家带来了重大挑战。
本文探讨了空间显式捕获-重捕获(SECR),这是一个为解决此问题而设计的革命性统计框架。通过将空间概念融入其核心,SECR 将探测数据转化为对密度和活动范围的稳健估计。以下章节将引导您了解这种强大的方法。首先,“原理与机制”将解析 SECR 的统计引擎,解释活动中心和探测函数的直观概念,并揭示空间重捕获数据如何让模型了解未被观测到的信息。随后,“应用与跨学科联系”将展示 SECR 的实际应用,说明它如何用于设计更优的研究、与遗传数据整合,以及模拟景观对动物分布和活动的影响。
想象一下你是一名野生动物生物学家。你在偏远的丛林里花了几个月时间,布设了一个相机陷阱网格,以研究一种稀有而行踪隐秘的物种,比如巽他云豹。取回存储卡后,你煞费苦心地从数千张照片中识别出 50 个独特的个体。这是一次激动人心的成功!但它立刻引出了一个关键问题:“50 只猫”到底意味着什么?是 100 平方公里内的 50 只猫,还是 1000 平方公里内的?动物数量本身很有用,但保护和生态学的核心指标是密度——单位面积内的个体数量。
几十年来,生态学家一直为此苦恼。传统的捕获-重捕获方法可以很好地估算出总种群数量,比如 只猫。但要将其转化为密度,他们必须定义这个种群所分布的区域。通常的做法是在最外围的陷阱周围画一个边界,并加上一个任意的缓冲区,从而创建一个临时的有效取样面积(ESA)。这种做法让人觉得不满意,在科学上也站不住脚。缓冲区应该多宽?最终的密度估算值可能会因这个猜测而发生巨大变化。这就像用一张大小未知的网在一个巨大的湖里捕鱼;你知道你捕到了什么,但你不知道你实际采样的区域占整个湖的多少比例。
这就是空间显式捕获-重捕获(SECR)旨在解决的根本问题。SECR 不是在事后附加一个空间组件,而是将空间概念直接构建在其统计机制的核心。它不仅问“有多少”,还问“有多少,在哪里?”。
SECR 的核心建立在两个非常直观的概念之上。
首先,每个动物都被假定有一个“基地”或活动中心()。这不一定是一个巢穴或窝,而是其家域和活动的中心。当然,我们无法看到这个位置。它是每个动物个体的一个隐藏的,或称潜在的属性。我们可以将每个动物的活动中心想象成地图上的一个秘密点。
其次,在陷阱处探测到动物的概率取决于其秘密活动中心与该陷阱之间的距离()。这是常识:动物经过位于其家域中心的相机陷阱的概率,远大于经过数英里外陷阱的概率。SECR 用一种称为探测函数的精确数学形式来表述这一常识。最常见的选择是半正态探测函数,它看起来像钟形曲线的一侧:
这个优美的方程仅由两个参数控制,这两个“旋钮”定义了特定物种在特定环境中的探测过程:
:这是基线探测概率。它表示如果动物的活动中心恰好位于陷阱位置(),在单次机会(例如,一天内)探测到该动物的概率。你可以把它看作是动物固有的“可探测性”或陷阱的效率。高的 意味着动物易于捕捉或陷阱非常有效。
:这是空间尺度参数。它决定了钟形曲线的宽度,控制着随着动物活动中心远离陷阱,探测概率衰减的速度。像狼这样拥有广阔领地的动物,其 值会很大,这意味着即使在很远的距离上,其探测概率也保持在较高水平。而家域范围很小的小型哺乳动物,其 值会很小。从本质上讲,它是衡量动物“活动范围”的指标。
SECR 的核心挑战是仅使用我们能看到的数据——哪个动物被探测到、在何处、何时——来估算这些隐藏参数,即秘密位置 和探测“旋钮” 和 。
那么,模型是如何学习这些隐藏信息的呢?关键在于在多个不同地点捕获到同一个体。这些事件被称为空间重捕获,它们是使 SECR 得以奏效的统计学“黄金”。单个个体在陷阱阵列中的探测空间模式,为解开这个谜题提供了所需线索。
让我们来考虑动物的活动范围()与我们陷阱间距之间的关键关系:
情景 1:陷阱间距过大()。 想象一下,你的相机陷阱相距 5 公里,但你的研究对象——一只山猫——的 只有 500 米。一只活动中心在陷阱 A 附近的山猫,在陷阱 B 被探测到的机会几乎为零。你将获得很少,甚至没有空间重捕获。没有这些数据,模型就无从下手。它无法区分一只害羞、恋家的山猫(小 、高 )和一只稍微爱冒险但更难被发现的山猫(大 、低 )。参数 和 变得难以区分,模型无法可靠地估算它们中的任何一个。
情景 2:陷阱间距过小,或 巨大()。 现在想象一下,用仅相距 1 公里的陷阱来研究一只拥有巨大领地( 达数公里)的狼。对于任何生活在你阵列附近的狼来说,它在你的每一个陷阱处的探测概率几乎都相同。探测曲面基本是平的。模型失去了所有的空间信息,因为在整个阵列中探测概率没有可察觉的衰减。我们无法再估算 。这就产生了一个新的困惑:我们看到许多探测事件,是因为有一个难以捕捉的狼的高密度种群(高密度 ,低 ),还是一个容易捕捉的狼的稀疏种群(低密度 ,高 )?模型无法区分这两种可能性。
情景 3:最佳区域()。 这就是奇迹发生的地方。你的陷阱间距与动物的生物学特性相匹配。你在陷阱 A 捕获了 17 号狼三次,在陷阱 B 捕获了一次,而在陷阱 C 一次也没有捕获到。模型看到了这个模式。由于知道陷阱的固定位置,它可以进行一种统计三角测量。它推断出这只狼的活动中心很可能位于陷阱 A 附近,但离陷阱 B 也不太远。通过比较在不同陷阱处的相对探测频率,模型可以推断出探测曲线的形状——从而得到对 的可靠估算!一旦形状()被确定,高度()就可以根据总体的探测率来确定。这种研究设计与动物活动之间的精妙相互作用,使得 SECR 能够稳健地估算出隐藏的探测过程。
一旦我们理解了如何为一个体建模探测过程,我们如何将其扩展到整个种群呢?SECR 设想景观中布满了活动中心,这些活动中心根据齐次泊松点过程散布在研究区域内。这是一个花哨的名称,其背后是一个简单而强大的思想:个体活动中心是随机且独立分布的,平均密度为每单位面积 个个体。这个参数 正是我们要寻找的种群密度。
探测过程随后就像一个过滤器,作用于这个潜在的点场之上。我们的陷阱无法“看到”每一个体。我们只探测到种群的一个子集。用点过程理论的语言来说,我们观测到的个体是真实种群过程的一个稀疏化版本。
这种公式的数学之美在于,似然函数——连接数据与参数的方程——自然地将我们确实看到的动物数量()与所有动物(包括看到的和未看到的)的密度 联系起来。似然函数包含一个观测到恰好 个个体的概率项,这个概率直接取决于 和陷阱采样的“有效面积”。但与旧方法不同,这个有效面积不是一个任意的猜测;它是通过在整个景观上对我们的探测函数进行积分直接计算出来的。由于 是似然函数中的一个显式参数,我们可以直接估算它。模型为我们解决了“观察者的困境”。
当然,现实世界比我们简洁的数学模型要复杂得多。一个稳健的科学工具必须能够解释现实世界的复杂性。
如果一只动物的家域横跨我们陷阱网格的边界怎么办?它的活动中心可能在网格之外,但它仍可能被靠近边缘的陷阱探测到。如果我们的模型只考虑网格内部的活动中心,我们就会忽略这些个体的贡献,从而使我们的密度估算产生偏差。
解决方案既简单又巧妙:我们通过添加一个缓冲区来定义状态空间——我们假设动物可以生活的区域——使其大于我们的陷阱网格。关键问题是,这个缓冲区应该多宽?探测函数的数学原理给出了明确的答案。由于探测概率以 的形式衰减,如果我们将缓冲区宽度 设置为 的倍数,我们就可以使从缓冲区外探测到动物的概率小到可以忽略不计。一个常见的经验法则是使用宽度为 的缓冲区。在这个距离上,被忽略的探测比例仅约为 。换句话说,通过使用 的缓冲区,我们确保了超过 98% 的潜在探测都被考虑在内,将边缘效应偏差降至最低水平。
我们的基本模型还假定一个物种的所有个体在行为上都是完全相同的克隆——它们都共享相同的 和 。但大自然充满了多样性。有些个体胆大,有些则害羞;有些恋家,有些则喜欢闲逛。
再以用气味标记柱研究的巽他云豹为例。比如说,如果只有占优势的成年雄性才会进行这种特定的标记行为,那会怎样?那么我们的研究,无论设计得多好,都将完全无法观测到雌性、幼豹和从属地位的雄性。我们估算的将是占优势雄性的密度,而不是整个种群的密度。
这个问题,被称为未建模的个体异质性,可能是一个主要的偏差来源。如果更容易被捕获的个体(较高的 或较大的 )在我们的样本中占比过高,我们的模型将对现实产生扭曲的看法。它会观察这个高度可探测的动物样本,并错误地得出结论:所有动物都容易被捕获。这会夸大整个种群的估算探测概率,进而导致对真实种群密度的严重低估。
现代 SECR 方法可以通过将异质性直接构建到模型中来解决这个问题。这些随机效应模型不假定所有个体都有相同的 和 ,而是允许每个个体 拥有其自身的 和 。这些特定于个体的参数被假定是从种群层面的分布中抽取的。这种复杂的方法使模型能够解释从最害羞到最大胆的各种行为,从而得出更准确、更可信的种群密度估算。
我们以最后一种统计学上的奇思妙想来结束,它解决了问题的核心所在的一个深刻挑战:动物的总数 是未知的。当你甚至不知道总样本量时,你如何进行统计推断?
一个绝妙的解决方案是数据增强技术,它是现代 SECR 贝叶斯实现的核心。这个巧妙的技巧是这样运作的。
假设我们在研究中观测到了 个独特的动物。然后,我们通过虚构大量“幽灵”个体——比如 450 个——来增强我们的数据。每个幽灵个体都被赋予一个全零的捕获历史。我们现在有了一个新的、固定大小的组合数据集, 。
对于这 个个体中的每一个,我们引入一个潜在的“现实开关” ,它可以是 1(真实动物)或 0(虚构个体)。对于我们实际观测到的 50 只动物,它们的开关被永久地固定为 。但对于那 450 个全零的幽灵个体,模型的任务是估算它们每一个实际上是我们调查期间碰巧完全错过的真实动物的概率。
模型运行后,利用估算出的探测参数,可能会得出结论:在这 450 个幽灵个体中,有 30 个很可能是真实但未被探测到的动物。我们对总种群数量的估算就简单地是真实动物和“已实现的”幽灵个体之和:。
这种巧妙的技术将一个关于未知且可变的种群数量 的难题,转化为了一个更容易处理的问题,即在一个大小为 的固定数据集上,唯一的任务是估算一系列概率。它证明了创造性的统计思维如何能为看似棘手的科学挑战提供优雅的解决方案。
要真正领会一条物理定律或一个数学模型,我们必须看它在实践中的应用。纸页上一个精美构建的方程本身就是奇迹,但其真正的力量在于它帮助我们理解周围混乱复杂的世界时才得以显现。空间显式捕获-重捕获(SECR)的原理也是如此。在探讨了该框架的“是什么”和“怎么做”之后,我们现在转向最激动人心的部分:“那又如何?”在本章中,我们将探索 SECR 的多样化应用,发现它如何从一个优雅的统计理论转变为生态学家强大而实用的工具包,以及它如何与其他科学学科建立起令人惊讶的联系。
种群生态学中最基本的任务是回答那个听起来简单的问题:“有多少?”对于那些我们无法简单地排队计数的行踪隐秘的动物来说,这是一个巨大的挑战。SECR 提供了一个非常直观的解决方案。想象一个生态学家团队使用运动激活相机网格研究美洲狮。他们收集了数千张照片,经过大量努力,识别出一些独特的个体。但这并不是总种群数量;这只是他们碰巧看到的动物数量。
SECR 的关键洞见在于,这些探测事件的空间模式包含了关于那些未被看到的动物的隐藏信息。模型的参数,特别是基线探测概率()和空间尺度参数(),告诉我们一个典型动物的“可探测性”如何。参数 描述了动物活动的特征尺度,为我们提供了对其家域面积的自然估算。参数 告诉我们,如果我们的相机正好位于动物家域的中心,我们探测到它的可能性有多大。
将这些结合起来,我们就可以计算出相机网格的“有效调查面积”。如果我们知道总探测次数和有效调查面积,将前者除以后者,就能得到我们一直追求的目标:种群密度 的估算值——即每平方公里的动物数量。这种方法的美妙之处在于,对空间探测数据进行一次统一的分析,就能提供生态学中两个最关键的参数:种群密度和个体的家域大小。
一个强大的科学理论不仅仅是解释过去的观察;它还为未来的观察提供指导。SECR 在这方面表现出色,它在部署任何设备之前就为实验设计提供了关键的见解。一个计划进行调查的生态学家必须做出实际决策:使用多少相机或陷阱,以及把它们放在哪里?这些选择对研究的成本、工作量和最终成功有重大影响。
考虑陷阱间距的问题。如果陷阱相距太远,一些动物可能一生都生活在陷阱之间的空隙中,对研究来说是不可见的。如果陷阱相距太近,工作量可能冗余,成本也可能过高。SECR 让我们能够找到最佳平衡点。通过使用探测函数,我们可以对景观中任何位置探测到动物的总概率进行建模。然后我们可以识别出“最冷”的点——在我们提议的网格上,动物最难被探测到的点(通常是四个陷阱构成的正方形的中心)。
然后我们可以问:在保证生活在这个最差位置的动物仍有相当高的被探测概率的前提下,最大的网格间距 是多少?通过设定一个可接受的最低探测概率,比如 ,我们就可以解出相应的 。这将调查设计从猜测转变为一个定量的、优化的过程,确保收集到的数据能够回答研究问题。
捕获-重捕获中的“捕获”不一定是照片。任何能提供个体身份和位置信息的方法都可以。这一认识为野外生态学和分子遗传学之间的强有力合作打开了大门。许多害羞或隐蔽的物种难以直接观察,但它们会以毛发、羽毛或粪便(scat)的形式留下遗传足迹。
通过收集这些非侵入性遗传样本,科学家可以通过 DNA 指纹分析来识别个体。每个样本的位置都是一次空间“重捕获”。这种方法使我们能够在广阔、偏远的景观中研究像行踪隐秘的狼獾这样的物种。但这种令人兴奋的融合也带来了自身的挑战。遗传样本不像照片那样清晰明确。其中的 DNA 会随着时间降解,受到湿度、温度和日晒的影响。一个收集到的样本可能在实验室中无法产生可用的基因型。
在这里,SECR 展示了其卓越的灵活性。高级模型可以构建为一个两阶段或分层的过程。首先是生态过程:动物必须留下样本,而这次相遇的概率由其活动和与调查样线的接近程度决定。其次是观察过程:收集到的样本必须在实验室中成功进行基因分型。成功的概率可以建模为在野外记录的协变量的函数,例如样本的年龄或发现它的基质(雪地 vs. 土壤)。总的探测概率是这两个概率的乘积。这个框架使生态学家能够明确地考虑并校正现实世界数据的混乱性,将分子生物学原理直接整合到种群模型中。
到目前为止,我们大多想象动物在单一、无特征的平原上移动。但当然,现实世界是由森林、河流、山脉和草地交织而成的织锦。当我们将这种环境织物直接编织到模型中时,SECR 的真正优雅之处便得以彰显。这可以通过两种基本方式实现,对应两个不同的生态学问题。
首先,我们可以问:动物选择在哪里生活?我们可以不假设动物活动中心在景观中均匀分布(齐次泊松点过程),而是提出其密度是栖息地的函数。例如,某个物种可能更喜欢在森林覆盖密集或靠近水源的区域建立其家域。通过将空间协变量(栖息地类型、海拔等地图)纳入模型,我们可以让点过程的强度 在状态空间 上变化。一种常见的方法是将强度的对数建模为协变量的线性函数,例如 ,其中 是位置 处的栖息地值向量。这使我们能够根据景观来绘制和预测动物密度,从而将 SECR 变成一个强大的栖息地选择研究工具。
其次,我们可以问:景观如何影响动物的移动方式?动物家域的大小和形状并非总是固定的。生活在资源贫乏的开阔栖息地的个体,可能需要比生活在资源丰富的小片森林中的个体漫游更大的区域。这意味着活动参数 对整个种群而言不是一个单一的值,而是可以根据环境在不同个体间变化。我们可以将个体 的活动尺度 建模为其活动中心 处的栖息地以及其性别等其他特征的函数。这直接将 SECR 与行为生态学和运动生态学领域联系起来。
我们可以通过引入景观阻力的概念将这一思想更进一步。我们可以计算反映真实移动成本的“有效距离”,而不是简单地测量直线距离(“鸟飞距离”)。对于一个避开开阔田野的动物来说,穿越 100 米草地的成本要比穿越 100 米森林的成本高得多。我们可以构建一个“阻力表面”,为每种栖息地类型分配一个成本。两点之间的有效距离则是它们之间的最低成本路径,而非最短路径。通过将这些成本距离纳入 SECR 探测函数,我们可以创建出极其逼真的模型,来描述动物如何感知和利用其环境。
我们已经看到 SECR 如何分析空间模式,以及如何与遗传学结合。现在我们来到了最终的综合,这些分支汇合起来解决非侵入性研究中最棘手的问题之一:身份危机。
想象一下,你在两个不同的地点发现了两份毛发样本。它们的基因型略有不同。这些样本是属于两个不同的个体吗?还是属于同一个体,而差异仅仅是由于实验室 PCR 过程中的一个小错误(“等位基因脱落”)造成的?回答这个问题至关重要,因为它决定了你是观测到了一只动物两次,还是两只动物各一次。
一个由 SECR 驱动的贝叶斯统计框架,使我们能够权衡来自两个独立来源的证据。
通过使用贝叶斯定理结合这两个似然,我们可以计算出这两个样本属于同一个体的后验概率。这是空间生态学、种群遗传学和统计推断的惊人整合。它使我们能够从我们来之不易的数据中榨取每一滴信息,从看似零散和不完美的线索中构建出一幅连贯的图景。
从最初作为一种巧妙的动物计数方法,SECR 已经发展成为一个用于现代空间生态学的全面、综合的框架。其力量和美感在于它能够将野外观察与复杂的统计模型相结合,并将个体动物的活动与种群层面的模式、景观特征,甚至分子生物学的微妙过程联系起来。它证明了这样一个观点:通过仔细观察我们在何处看到事物,我们可以学到大量关于我们看不到的事物的信息。