try ai
科普
编辑
分享
反馈
  • 系统发育聚类

系统发育聚类

SciencePedia玻尔百科
核心要点
  • 系统发育聚类表明,群落中的物种比随机预期的关系更近,这通常是由于强环境过滤作用于保守性状所致。
  • 相反,系统发育过度分散则表明,共存物种间的亲缘关系比预期要远,这通常是由近缘物种间的竞争(限制性相似)驱动的。
  • 生态学家使用净亲缘关系指数(NRI)和最近分类单元指数(NTI)等指标来量化系统发育结构,并推断主导的构建过程。
  • 在比较研究中忽略系统发育可能会导致错误的结论;系统发育广义最小二乘法(PGLS)等方法可以校正物种的非独立性。

引言

用于生命分类的系统,从林奈系统到现代系统发育学,不仅仅是一个简单的组织工具,它更是一幅演化历史的地图。每个物种在这棵“生命之树”上都有一个地址,反映了其深远的祖先联系。然而,生态学中的一个重要问题是,共同生活在一个群落中——一片森林、一个珊瑚礁或一滴水——的物种集合,仅仅是一种随机的组合,还是其构成受到无形规则的支配?本文旨在通过探索物种间的演化关系如何揭示构建这些自然群落的过程,来填补这一知识空白。

本文深入探讨了系统发育群落结构这一强大概念。在第一部分“​​原理与机制​​”中,我们将定义单系群、多系群和并系群等基本概念,以理解如何正确解读演化历史。接着,我们将探讨环境过滤如何导致“系统发育聚类”(近缘物种构成的群落),以及竞争如何导致“系统发育过度分散”(远缘物种构成的群落),并检视用于检测这些模式的统计工具。第二部分“​​应用与跨学科联系​​”将展示该框架如何应用于解决现实世界中的难题,从理解古代动物身体构造的演化到在实验室中组装微生物群落,展现其在整个生物学领域的广泛相关性。

原理与机制

伟大的生命之树:不只是一个文件柜

几个世纪以来,自然学家一直致力于为纷繁复杂的生命命名和分类。你可能会认为这有点像整理图书馆——一个为方便追踪一切而人为设定的系统。狮子的学名 Panthera leo 和老虎的学名 Panthera tigris 看起来像是一个简单的“属、种”标签。但其意义远比这深刻得多。这个我们从 Carl Linnaeus 继承而来的系统,实际上深刻地反映了一个伟大的自然真理:生命被组织成一棵共享祖先的、枝繁叶茂的巨树。

当我们看到两个物种共享同一个属名,比如新发现的(假设的)植物 Solanum bifurcatum 和 Solanum novum,我们其实是在陈述一个强有力的演化假说:这两个物种彼此间的最近共同祖先,要比它们中任何一个与,比如说,Capsicum eximium 或 Atropa belladonna 的共同祖先更近,即使它们都属于同一个更大的科——茄科 (Solanaceae)。物种的名称不仅仅是一个标签,它是演化历史地图上的一个地址。整个分类系统不是一个文件柜,而是一本家族相册,一部记录了数十亿年来分化与传承的编年史。要理解自然,我们必须首先学会正确地阅读这幅地图。

解读地图:真实的支系与巧妙的伪装

解读生命之树的黄金标准是识别​​单系群​​(monophyletic groups),或称​​支系​​(clades)。想象一棵巨树上的一个单独分枝。如果你把它剪下来,你会得到它生长所源自的祖先枝条以及它所有的后代叶片、细枝和更小的分枝。这就是一个单系群。它代表了一段完整的、共享的历史。

然而,大自然并不总是以如此整洁的方式呈现自己,而我们人类的思维也倾向于创造一些方便但可能在演化上产生误导的分组。想象一位博物馆馆长设计一个名为“狩猎大师”的展览,展出大白鲨、非洲狮和白头海雕。它们都是顶级捕食者,这是一个有趣的趋同演化案例,不同谱系独立地演化出了相似的生态角色。但作为一个演化群体?这纯属虚构。它们最近的共同祖先是某种古老的脊椎动物,肯定不是这种模式的顶级捕食者,而且这个“群体”还排除了无数的亲戚,如蜥蜴、金枪鱼和我们人类。这样一个基于共享的、趋同演化出的性状而从不同分支中拼凑出来的群体,被称为​​多系群​​(polyphyletic)。

同样的模式无处不在。在厨房里,我们愉快地将草莓、覆盆子和蓝莓归为“浆果”。然而,从植物学角度看,它们来自植物家族树中非常不同的部分。“烹饪浆果”这个群体是一个基于共同的果实特征而形成的多系发明,它并不反映一个单一、统一的祖先。在安第斯山脉,一只甲虫、一只飞蛾和一只猎蝽可能都演化出相同的鲜艳警戒色来吓退捕食者,形成一个缪勒氏拟态环。它们是生态上的伙伴,但它们不是一个支系;它们是一个由幸存者组成的​​多系​​委员会。

还有另一种演化上的错觉:​​并系群​​(paraphyletic group)。这就像剪下一个分枝,但因为其中一些小枝看起来不同而决定将它们留下。很长一段时间里,我们把没有细胞核的庞大生命世界——“原核生物”,看作是与拥有细胞核的“真核生物”(如我们)截然不同的一个基本群体。但 Carl Woese 在 1970 年代的革命性工作,利用核糖体 RNA 序列作为分子钟,揭示了一个惊人的事实。我们称之为古菌界 (Archaea) 的生命形式,虽然看起来像细菌,但实际上与我们真核生物的亲缘关系比它们与细菌界 (Bacteria) 的关系更近。因此,一个包括细菌界和古菌界但排除真核域 (Eukarya) 的“原核生物 (Prokaryota)”群体是不完整的。它是一个并系群,因为它包含一个共同祖先,但没有包含其所有的后代。 “原核生物”这个概念在描述细胞类型时很有用,但作为生命之树上的一个真实分支,它是不成立的。

新游戏:从物种到群落

理解这些分类原则是第一步。但现在,让我们来玩一个新游戏。我们不再着眼于数百万年的宏伟生命之树,而是对一个地点、一个时间的生命进行快照。走进一片森林,潜游于珊瑚礁之上,或者检视一滴池塘水。你会发现一个由共存物种组成的群落。生态学的一个基本问题是:谁能在这里生存?

这个群落仅仅是从更广泛的、区域性的潜在栖居者库中随机抽取的物种集合吗?还是有无形的规则,即“构建过程”,在塑造其成员构成?事实证明,通过将系统发育树与存在的物种列表相结合,我们能开始揭示这些规则。

门口的“保镖”:环境过滤与系统发育聚类

想象一小块土地,土壤是贫瘠的蛇纹岩土壤,必需营养素含量低,但有毒重金属含量高。这种环境就像一个严格的​​环境过滤​​器。只有那些拥有能耐受这些条件的特定生理机制的植物才能生存并建立种群。

现在,关键的联系来了。如果这些特定的耐受性状——比如隔离重金属或在低氮环境中茁壮成长的能力——并非随机散布在生命之树上呢?如果它们在科内高度保守呢?也就是说,如果一个物种拥有该性状,它的近亲也极有可能拥有。这种亲缘关系近的物种彼此相似的倾向被称为​​系统发育信号​​。

当一个环境过滤器作用于一个具有强系统发育信号的性状时,一个完全可预测的模式就会出现。通过过滤并形成当地群落的物种,它们彼此间的亲缘关系将比你从该区域随机抽取一把物种所预期的更近。这种模式被称为​​系统发育聚类​​。这个群落不是一个随机的组合;它是一次家族聚会,一个或几个恰好拥有进入这个严酷环境“门票”的支系的集会。

自然学家的工具箱:如何衡量“亲近度”

这一切听起来很美妙,但我们如何证明呢?我们需要一个量化的工具箱。生态学家已经开发了几种指标来衡量群落的系统发育结构。

  • ​​Faith 的系统发育多样性 (PD):​​ 该指标旨在回答:“这个群落中包含了多少总的演化历史?” 它的计算方法是,将连接群落中所有物种的最小子树上所有分枝的长度相加。对于给定数量的物种,较低的 PD 值表明它们都仅来自主树的几个部分。

  • ​​平均成对距离 (MPD):​​ 这是群落中每对可能物种之间系统发育距离——即自共同祖先分化以来的时间——的平均值。一个小的 MPD 值告诉你,平均而言,群落中的每个成员都是相对较近的亲戚。该指标对群落所在树段的整体、深层结构很敏感。

  • ​​平均最近分类单元距离 (MNTD):​​ 该指标提出了一个更具个性化的问题:“平均而言,我在这个群落中最近的亲戚有多远?” 它是每个物种到其共存的最近邻居的平均系统发育距离。一个小的 MNTD 值是系统发育末端(“树梢”)聚类的有力指标,表明该群落由几组关系非常紧密的物种(如来自同一个属的几个物种)组成。

为了确定观测到的 MPD 或 MNTD 值是否小于“预期”值,我们采用一种统计学上的巧妙手法。我们通过从区域物种库中随机抽取物种名称来替换我们群落列表中的物种,同时保持物种数量不变,从而创建数百或数千个“零群落”。这为我们提供了在随机世界中 MPD 或 MNTD 可能呈现的分布。然后,我们可以计算一个标准化的效应值,通常表示为​​净亲缘关系指数 (NRI)​​(基于 MPD)和​​最近分类单元指数 (NTI)​​(基于 MNTD)。按照惯例,这些指数的构建方式使得​​正值表示显著的系统发育聚类​​,这是环境过滤的标志性特征。

另一个“保镖”:竞争与系统发育过度分散

但当环境不那么严酷时会怎样呢?在植被繁茂、环境温和的栖息地,达尔文所说的“生存斗争”,可能更多地是关于与邻居争夺光、水和空间,而不是抵抗自然环境。这就引出了第二个主要的构建规则:​​限制性相似​​。

这个原则很简单:过于相似的物种竞争过于激烈。它们吃同样的食物,使用同样的筑巢地点,并受到同样疾病的攻击。最终,一个物种很可能胜过另一个物种,并将其驱赶至局部灭绝。如果决定竞争的性状是系统发育上保守的(通常如此),那么近亲就是最激烈的竞争者。在这种情况下,竞争就像一个强制执行社交距离的保镖,阻止近亲共存。

其结果与聚类相反:一个群落中的物种彼此间的亲缘关系比随机预期的更远。这种模式被称为​​系统发育过度分散​​。就好像物种们为了最小化生态位重叠而将生命之树划分开来。当我们为这样的群落计算 NRI 和 NTI 时,我们会发现显著的​​负值​​。

盐沼上的大综合

我们可以沿着环境梯度看到这两种力量美妙的动态相互作用。以沿海盐沼为例。

在靠近海洋的​​高盐度区​​,非生物胁迫极端。环境过滤是主导力量。只有少数几个演化出耐盐性的支系的物种能够生存。结果呢?正的 NTI 和 NRI 值,表明强烈的​​系统发育聚类​​。

沿着梯度向上移动到​​低盐度区​​,淡水的影响使生命变得容易。环境是温和的,但这里很拥挤。对光的竞争非常激烈。在这里,限制性相似是主导力量,淘汰了生态上相似的近亲。结果呢?负的 NTI 和 NRI 值,表明​​系统发育过度分散​​。

这揭示了一个深刻的原则:群落的系统发育结构是构建它的生态和演化过程的活生生记录。通过解读亲缘关系的模式,我们可以推断出塑造自然世界的过滤和竞争这两只无形之手。

为何重要:警惕数据中的“幽灵”

你可能会问,我们为什么要费这么大劲进行统计分析。因为忽略系统发育是自欺欺人最简单的方式之一。想象一下,你正在研究一组物种,你注意到所有生活在岛屿上的物种都比它们在大陆上的亲戚体型更大。你可能会轻易得出结论,认为岛屿上的生活导致了体型变大的演化。

但如果很久以前,一个体型庞大的物种家族恰好非常擅长殖民岛屿呢?你所有的岛屿物种体型较大,可能仅仅因为它们都是那个巨大祖先的后代。它们不是独立的数据点;它们是伪重复,是单一演化事件的回响。一个将它们视为独立的朴素统计检验会极大地低估真实的不确定性,并报告一个“显著”的关系,而这可能只是一个幽灵——共享祖先的印记。

这就是​​系统发育广义最小二乘法 (PGLS)​​ 等现代统计方法变得至关重要的地方。它们是校正镜片,可以校正物种的非独立性,考虑到两个表亲比两个陌生人更相似。这些方法使我们能够从共享历史的混杂效应中,分离出生态变量(如生活在岛上)的真实效应。这是一个科学统一性的惊人例子,深远的演化历史原则成为进行可靠统计推断不可或缺的工具。通过学习以生命之树的视角看世界,我们不仅欣赏它的美丽,也学会了提出更明智的问题并避免自欺欺人——这毕竟是科学的第一原则。

应用与跨学科联系

现在我们已经掌握了系统发育聚类的基本原理——即群落中物种的亲缘关系可以告诉我们是什么力量将它们聚集在一起这个简单而深刻的思想——让我们用这个新视角来观察世界。它能告诉我们什么故事?它能解决什么谜题?我们正在踏上一段发现之旅,并欣喜地发现,这一个概念几乎在生物学的每个领域都有回响,从宏大的演化历程到土壤群落的微观喧嚣,甚至延伸到未来的工程化生态系统。它是一个统一的主题,揭示了生命世界深邃而美丽的结构。

解读远古时代的历史档案

让我们从可以想象的最大尺度开始:整个动物生命的历史。当我们看到动物形态令人惊叹的多样性时,我们可能会想,演化是否是一个完全自由的过程,像四肢、翅膀或复杂的体腔这样的创新在生命之树上随机出现?还是说其中有某种模式?演化是否更像一个家族企业,某些技能和蓝图通过代代相传得以继承、提炼和发展?

系统发育分析使我们能够回答这个问题。考虑一个基本特征,如容纳我们器官的内部体腔——coelom。生物学家长期以来一直在争论它的演化历史。它是一次演化而来,还是多次?我们可以通过将性状——无体腔 (acoelomate)、假体腔 (pseudocoelomate) 和真体腔 (eucoelomate)——映射到动物生命之树上来解决这个问题。当我们这样做时,我们发现该性状并非像五彩纸屑一样散落。相反,它显示出强烈的“系统发育信号”。亲缘关系较近的门(phyla)往往共享相同的身体构造。这种系统发育聚类告诉我们,该性状是“粘性的”;它倾向于在谱系内保守。在这种情况下,演化并非在不断地重新发明轮子,而是在利用继承下来的设计。这一发现——即该性状在树上的聚集程度远超随机预期的程度——为我们洞察贯穿演化的深层保守性提供了有力的见解。

这个原则从可见的身体构造一直延伸到构建它们的基因。在我们的基因组时代,我们不仅可以研究单个特征,还可以研究整个“适应性综合征”——即让生物体在极端环境中生存的复杂基因套件,比如沙漠的酷热或盐滩的超高盐度。这些用于生存的基因工具包是在每个谱系中重新组装的,还是它们也是家族的传家宝?

通过应用复杂的比较方法,我们可以检验这些基因组综合征是否在系统发育上聚集。我们发现它们通常是聚集的。例如,一大群相关的植物物种可能使用一组相似的基因来应对高盐环境。这告诉我们关于适应过程的一些基本道理:演化是一个修补匠,而不是一个不受约束的发明家。重新利用和修改从共同祖先那里继承来的现有基因工具包,通常比从头构建一个新的要容易。这些适应性基因集在生命之树上的聚类,揭示了演化历史和限制的路径。

自然邻里的构建过程

看过亲缘关系如何塑造宏大的演化弧线后,让我们把镜头拉近到今天,聚焦于一片森林或一撮土壤。一个局域的物种群落是如何形成的?很长一段时间里,这是一个巨大的谜团。这是一个彩票游戏,任何碰巧到达的物种都能留下吗?还是有构建的规则?系统发育聚类为我们寻找这些规则提供了最锐利的工具之一。

想象有两个强大的力量在塑造一个群落。第一个是​​环境过滤器​​:当地的条件,如温度、pH值或水的可利用性。任何想在那里生存的物种都必须具备合适的性状才能通过这个过滤器。第二个是​​竞争守门员​​:已经生活在那里的其他物种。一个新来者必须与它的邻居有足够的差异,以避免在食物、光线或空间的竞争中被淘汰。

现在,让我们把这与系统发育联系起来。如果通过环境过滤器所需的性状是“家族性状”(即它们在系统发育上是保守的),那么这个过滤器就会让成群的亲缘物种通过。这就是环境过滤导致的​​系统发育聚类​​。反之,如果竞争激烈,而近亲是最强的竞争者(因为它们需要相同的资源),那么竞争守门员就会把近亲推开。这导致​​系统发育过度分散​​,即共存的物种比你随机预期的亲缘关系更远。

我们在自然界中能清晰地看到这种动态。在一片从湿润到干燥的土壤梯度明显的热带森林地块里,我们找不到随机混合的树木。在较干燥的区域,生态学家常常发现共存的物种彼此间的亲缘关系比预期的更近——这是一个清晰的系统发育聚类信号。这就是环境过滤在起作用。严酷、干燥的条件选择了具有耐旱性状的物种,而因为这些性状在家族中遗传,这个过滤器实际上是在选择整个支系。

但这种力量的平衡不是静态的,而是一场动态的舞蹈。思考一下野火过后森林地面会发生什么。在早期阶段,环境恶劣而贫瘠。环境过滤器至关重要。只有少数耐寒的先锋真菌物种能够定居,它们往往亲缘关系很近,导致强烈的系统发育聚类。几十年后,森林已经成熟。土壤肥沃,群落密集拥挤。现在,主要的挑战不再是环境,而是对资源的竞争。在这种情况下,竞争守门员变得占主导地位。我们经常看到模式反转:真菌群落变得系统发育过度分散,因为近亲因激烈竞争而被排斥。群落的系统发育结构就像一个晴雨表,告诉我们在特定时间和地点哪种生态力量占主导地位。

岛屿、摇篮与距离之舞

岛屿是大自然自己的实验室,是观察这些构建规则在更大尺度上演绎的绝佳场所。一个群岛就是一系列并行进行的实验。我们在这里能看到什么?

在气候严酷干旱的岛屿上,植物群落常常显示出系统发育聚类——这是强环境过滤的标志。但在附近那些面积大、气候温和、生命容易生存的岛屿上,竞争往往成为主导力量,我们可能会发现系统发育过度分散。

岛屿还能揭示一个更令人兴奋的过程。在非常古老的、与世隔绝数百万年的岛屿上,我们有时会发现一个奇特的模式:整个群落可能没有聚类,但我们看到有过多的亲缘关系非常近的物种——那些位于系统发育树最顶端的物种。这种末端聚类,通常用像最近分类单元指数(NTI)这样的指标来衡量,是原地多样化的标志。这个岛屿不仅仅是在过滤外来移民;它已经变成了一个“演化的摇篮”,孕育出新物种,这些新物种接着形成一个由全新亲戚组成的小型局域聚类。通过梳理这些不同的系统发育结构测量指标,我们可以区分群落构建的生态过程和物种形成本身的演化过程。

从观察到工程

这个框架如此强大,以至于我们可以将它从观察自然带到主动设计自然。欢迎来到​​合成生态学​​领域。我们能构建一个具有期望属性的微生物群落吗?系统发育聚类的原则可以指导我们。

想象一下,我们在一个名为恒化器 (chemostat) 的实验室反应器中组装了一个多样化的细菌库。然后我们施加一个强烈的环境过滤器,比如极高的盐度。哪些细菌会存活下来,形成新的、稳定的群落?正如理论预测的那样,如果耐盐性是我们库中一个系统发育上保守的性状,那么最终的群落将会是系统发育聚类的。幸存者彼此间的亲缘关系将比原始的随机混合物更近,因为过滤器选择了“耐盐家族”。

这不仅仅是一个学术上的好奇心。这种预测微生物群落构建的能力对生物技术具有巨大意义,例如优化工业发酵;对医学也同样如此,例如学习如何构建一个健康稳定的肠道微生物组。任何科学理论的终极检验是其预测和控制的能力,而在合成生态学中,我们看到系统发育群落结构的原则出色地通过了这一检验。

当然,要进行任何这些现代分析——从热带森林到实验室反应器——我们首先需要知道那里有什么。对于微生物或含有痕量DNA的环境样本来说,这是一个巨大的挑战。答案在于​​宏条形码 (metabarcoding)​​,这是一种我们从整个环境样本中测序一个特定的“条形码”基因的技术。这会产生数百万条原始DNA序列。第一个关键步骤是计算步骤:我们将这数百万条序列聚类成“操作分类单元 (OTU)”,每个OTU充当一个物种的代理。这是一种不同类型的聚类——一个数据处理步骤——但它是所有这些强大的生态学和演化学生存见解得以建立的必要基础。

从所有生命的DNA中书写的宏伟演化模式,到局域群落的动态构建,再到工程化生态系统的未来,系统发育聚类的概念提供了一条简单却极其强大的线索。它教导我们,生命世界不是一个随机的生物集合,而是一幅结构深邃的织锦,由环境、竞争,以及最重要的——共享历史的力量编织而成。