try ai
科普
编辑
分享
反馈
  • 双域模型

双域模型

SciencePedia玻尔百科
核心要点
  • 双域模型取代了传统的三域观点,主张真核生物是从古菌域内部进化而来,而非一个独立的姐妹群。
  • 阿斯加德古菌(Asgard archaea)的发现为真核生物复杂性的古菌起源提供了关键的“确凿证据”,因为这些古菌拥有真核生物特征蛋白(ESP)。
  • 真核生物是生物嵌合体,其信息系统来自古菌祖先,而产生能量的操作性系统则来自细菌内共生体(线粒体)。
  • “域”的概念是一个强大的统一原则,不仅适用于生命之树,也适用于蛋白质的模块化结构和DNA的拓扑组织。

引言

几十年来,将生命划分为细菌域、古菌域和真核域这三大域的分类法,一直是现代生物学的基石。这个简洁的模型为我们描绘了一幅清晰的生命世界地图以及我们在其中的位置。然而,基因组学的最新进展和复杂的全新分析方法揭示了令人信服的证据,挑战了这一基础观点,表明我们对生命最深层分支的理解尚不完整。本文旨在描绘这场科学革命的历程。在第一章“原理与机制”中,我们将探讨推动从三域模型向双域模型转变的证据,最终的发现重塑了我们自身的谱系,视其为古菌域内部涌现的一个分支。然后,在“应用与跨学科联系”中,我们将拓宽视野,看看“域”的概念如何作为一个强大的统一原则,揭示蛋白质机器的模块化设计以及塑造我们DNA的物理力量。

原理与机制

三个王国的故事

在20世纪后期很长一段时间里,我们的生命地图似乎简单而确定。基于Carl Woese的开创性工作,我们将所有细胞生命分为三个伟大的域:​​细菌域(Bacteria)​​、​​古菌域(Archaea)​​和​​真核域(Eukarya)​​。Woese使用核糖体中一个关键分子的序列作为通用标尺,核糖体是细胞的蛋白质制造工厂。细菌域是人们所熟悉的微观世界。古菌域则是“极端微生物”,生活在沸腾的温泉和咸水湖中的奇特生物。那么真核域呢?那就是我们。它包括所有具有复杂细胞结构的生物:细胞核、线粒体以及构成植物、动物、真菌和原生生物的所有其他部件。

在这个“三域模型”中,古菌域和真核域被描绘成姐妹群,这意味着它们与彼此共享的最近共同祖先,比它们任一方与细菌域共享的都要晚。生命之树的主干首先分裂,将细菌域与其他所有生物分开。然后,第二个分支再次分裂,产生了古菌域和真核域。这是一幅优美的图景,出现在每一本生物学教科书中。但随着我们阅读生命之书——基因组——的能力日益精进,我们开始在书页的空白处发现潦草的笔记,暗示着故事远比这更富戏剧性、更令人惊讶。

寻找起点:一个关于复制的技巧

每个好故事都有一个开端,对于生命之树而言,这个开端就是​​最后普遍共同祖先(Last Universal Common Ancestor)​​,简称​​LUCA​​。要真正理解这棵树的形状,你需要找到它的根——即对应于LUCA、所有分支从中发出的那个点。但是,当你自己就坐在一根细枝上时,你如何能找到树的根呢?你没有外部参照点,没有“外群”,来告诉你第一次分裂发生在哪里。

正是在这里,分子遗传学家们从他们的帽子里掏出了一个聪明的戏法,一个基于基因复制的美妙推理。想象一个基因,它非常重要,以至于在LUCA自身中就发生了复制,在生命分裂成我们今天所知的各个域之前。我们称原始基因为GGG,它的两个旁系同源拷贝为G1G_1G1​和G2G_2G2​。LUCA之后的所有生物都继承了G1G_1G1​和G2G_2G2​。现在,如果你为来自生命各界的全部G1G_1G1​基因构建一个家族树,再为全部G2G_2G2​基因构建一个单独的树,你就有了两份独立的生命史记录。

技巧就在这里:G1G_1G1​基因家族可以作为G2G_2G2​基因家族的完美外群,反之亦然。根据定义,G1G_1G1​和G2G_2G2​之间的分裂比任何分隔细菌域、古菌域和真核域的分裂都要古老。通过比较这两棵树,你就能定位物种树的根。当科学家们用古老的复制基因(如那些用于基本蛋白质制造机器的基因)进行此操作时,一个一致的图像出现了。生命之根位于将细菌域与古菌域和真核域的共同祖先分开的那个分支上。这一发现加强了三域模型以及古菌与真核生物的姐妹关系。一时间,这个故事似乎是确定无疑的。

长枝的幻象

然而,这种自信为时过早。事实证明,尽管用于构建这些树的方法很强大,但它们存在一个微妙而深刻的缺陷,一种被称为​​长枝吸引(Long-Branch Attraction, LBA)​​的统计幻象。

想象一下,你正试图根据人们说话的方式来重建一个家族的历史。你有两个失散多年的表亲,他们搬到了不同的国家,经过几代人,发展出了非常快且独特的方言。你还有一个亲戚留在家乡,说话方式缓慢,保留着祖先的风格。当你听这三个人说话时,那两个语速快的人听起来彼此更相似,而不是像那个语速慢的人,仅仅因为他们都与原始方式有了很大改变。你可能会错误地将他们归为亲密的兄弟姐妹,即使其中一个实际上是语速慢的人的真正兄弟姐妹。

在分子进化中,基因的“方言”是其AAA、TTT、CCC和GGG的序列,而“语速”是其进化速率。一些谱系的进化速度比其他谱系快,积累突变的速度更快。早期的系统发育模型就像那个天真的听者,容易被LBA所迷惑。它们倾向于将快速进化的谱系归为一类,而不论它们的真实历史如何。碰巧的是,由于各种生物学因素,真核生物的基因通常具有长枝——相对于它们的许多微生物 cousins,它们进化得很快。

解决方法是开发更智能的模型,就像一位训练有素的历史语言学家,能够考虑不同的变化速率和词汇转变。这些复杂的​​位点异质性模型(site-heterogeneous models)​​允许基因中的每个位置都有自己的偏好和进化速度,从而滤除LBA的幻象。当科学家们用这些更好的模型重新分析大量保守基因的数据集时,生命之树不仅变得更清晰,而且被从根本上重新绘制了。

一个来自内部的情节反转

新的、更可靠的分析一致地揭示了一个惊人的情节反转。真核域并非古菌域的姐妹群。相反,真核生物的分支出现在*古菌域的深处*。这就是​​双域假说(two-domain hypothesis)​​,有时也被称为“始祖细胞假说(eocyte hypothesis)”。

这改变了一切。这意味着生命只有两个主要的域:细菌域和古菌域。我们,真核生物,不是第三个平等的王国。我们是古菌的一个特化的、高度衍生的分支。对分类学家来说,这意味着“古菌域”这个群体,如果定义为排除我们,就是一个​​并系群(paraphyletic)​​——一个不完整的分组,剪掉了自己的一个后代分支。这类似于将“爬行动物”归为一个正式的类群,却排除了鸟类,尽管我们知道鸟类是从恐龙进化而来的,而恐龙是爬行动物。真正的进化分类要求单系群(monophyletic groups),即包括一个共同祖先及其所有后代。

双域模型提出,我们自身的谱系并非始于古菌的姐妹,而是作为其中一员。这是一个激进的想法,最初基于复杂的统计论证。但科学需要的不仅仅是统计数据;它寻求“确凿的证据”。

来自洛基城堡的报告:确凿的证据

那个确凿的证据来自地球上最不宜居的地方之一:位于格陵兰和挪威之间北冰洋深处的一片深海热液喷口区,绰号为​​Loki's Castle​​。通过筛查那里的泥浆并测序其中的DNA,科学家们发现了一个全新的古菌超门,他们恰如其分地将其命名为​​阿斯加德古菌(Asgard archaea)​​。

当他们组装这些难以捉摸的生物的基因组时,他们发现了令人震惊的事情。这些生物明确无误是古菌——它们没有细胞核,细胞膜中含有特征性的醚键脂质。然而,它们的基因组中散布着曾被认为是真核生物专属的基因。它们拥有形成原始细胞骨架的蛋白质基因、用于重塑细胞膜的组件,甚至还有与囊泡运输和用于标记蛋白质的泛素系统相关的机器——一整套后来被称为​​真核生物特征蛋白(Eukaryotic Signature Proteins, ESPs)​​的工具包。

这就是缺失的一环。简约性原则——即最简单的解释通常是最好的解释——有力地反驳了这几十个复杂的、相互作用的系统独立进化两次的可能性,一次在阿斯加德古菌中,一次在第一个真核生物中。同样,这些基因从一个真核生物整体转移到一个古菌的可能性也小得多。最简约的结论是,这些特征根本不是“真核生物的”;它们是祖先的。一个古老的、类似阿斯加德的古菌已经拥有了细胞复杂性的遗传起始材料,而我们,真核生物,继承并发展了它们。从这些新数据构建的系统发育树证实了这一点:真核生物的分支正是从阿斯加德古菌的主干上生长出来的。

基因组科学家的侦探工作

这种科学——从环境样本中重建基因组——是繁琐而又出色的侦探工作。你常常处理的是无法在实验室培养的生物的单细胞。为了获得足够的DNA进行测序,科学家使用的方法有时会扩增样本中其他微生物的零散DNA片段,导致​​污染(contamination)​​。

那么,我们如何能确定这些“真核”基因真正属于阿斯加德古菌,而不是来自混入其中的污染性原生生物呢?这正是现代基因组学大放异彩的地方。基因组学家有几种工具来识别冒名顶替者。

首先,他们检查​​覆盖深度(coverage depth)​​。来自单个生物基因组的所有DNA应该以大致相同的拷贝数存在。如果一段DNA(一个“contig”)的覆盖度远低于或高于其余部分,那它就是可疑的。其次,他们检查​​核苷酸组成(nucleotide composition)​​,比如鸟嘌呤-胞嘧啶碱基对的百分比(GCGCGC含量)。不同生物有不同的组成特征。一个与平均值偏差很大的contig就是一个危险信号。最后,他们查看​​同线性(synteny)​​——它的邻居是哪些其他基因?在一个DNA片段上发现一个疑似ESP基因与一个核心的、无可争议的古菌基因物理上相连,这是其真实性的极强证据。

在实践中,研究人员通常发现大多数ESP都能顺利通过这些测试:它们具有相同的覆盖度、相同的GCGCGC含量,并且紧邻已知的古菌基因。他们可能也会发现一些可疑的contigs未通过测试,并且显然是污染物——或许来自样本中也存在的某种细菌。但正是这种仔细、怀疑地从噪音中分离信号的过程,使得最终的结论如此有力。即使在考虑了污染之后,核心发现依然成立:真核生物的古菌祖先早已为复杂性做好了准备。

新的综合:你,宏伟的嵌合体

来自基因组学的大量新证据锻造了一种新的综合理论,一个关于我们起源的更美丽、更复杂的故事。生命之树的根本分裂是在细菌域和古菌域之间。我们是古菌域的一部分。

那么,我们自身起源的故事就变成了一个关于两个伙伴的故事。它始于一个类似阿斯加德的古菌,它已经拥有一套复杂的基因来管理其内部细胞景观。这个古菌随后参与了生命史上最具变革性的伙伴关系:它吞噬了一个α-变形菌。这个细菌没有被消化,而是在其中定居下来,最终变成了线粒体——我们细胞的动力工厂。

这使我们成为嵌合体。我们的“信息”系统——存储和读取我们遗传蓝图的机器(DNA复制、转录和翻译)——在特性上基本上是古菌的。但我们的“操作”系统,特别是我们产生能量的方式,是我们细菌内共生体的遗产。双域模型不僅重繪了生命樹;它為理解我們自身細胞的鑲嵌本質提供了一個驚人連貫的框架,揭示了所有生命深層的統一性和相互關聯性。

应用与跨学科联系

当一个简单而强大的思想在一个全新且意想不到的地方出现时,会带来一种奇妙的愉悦感。这是科学的巨大乐趣之一。在探索了域组织的基本原则之后,我们现在冒险去看这个思想会引向何方。我们会发现,从“域”——这些独特的、半独立的区域——的角度思考,并不仅仅是一种学术分类方案。它是一把钥匙,能让我们更深地理解分子生活的几乎所有方面,从蛋白质机器的复杂舞蹈到作用于我们DNA上的巨大扭转力。这是一个统一的原则,揭示了隐藏在细胞内的机械优雅。

作为工具箱的蛋白质:域是自然的乐高积木

想象一下,试图通过将一整块熔融金属铸造来制造一台复杂的机器,比如汽车发动机。那将是一场噩梦。一个更好的方法是用更小的、定义明確的部件来建造它:活塞、阀门、火花塞。每个部件都有特定的工作,它们被组装起来创造一个功能性的整体。大自然以其无穷的智慧,早已发现了这种模块化设计的原则。它用来构建其蛋白质机器的“部件”,就是我们一直在讨论的域。

源于结构的功能

在其最基本的层面上,域的排列定义了一个蛋白质能做什么。考虑许多被称为脱氢酶的酶,它们对新陳代謝至关重要。它们通常由两个不同的域组成。一个域,常常具有一种称为罗斯曼折叠(Rossmann fold)的美丽且重复出现的结构,是捕获必需辅因子分子(如NAD+NAD^{+}NAD+)的专家。另一个域是结合实际底物(例如酒精分子)的专家。魔法并非发生在一个域或另一个域内部,而是在它们之間的裂缝中。酶的折叠方式使得这个域间裂缝形成一个单一、完美的活性位点。在这里,来自一个域的辅因子和来自另一个域的底物以恰到好处的方向被带到一起,从而以惊人的效率发生化学反应。蛋白质不仅仅是两个粘在一起的部件;它是一个精确设计的分子虎钳。

动力学与通讯:活的机器

但蛋白质不是静态的雕塑。它们是动态的、活生生的机器,必须移动和改变形状才能发挥作用。在这里,域结构再次成为核心。许多蛋白质由刚性域通过柔性多肽连接链连接而成,就像两块木头用一小段绳子连接一样。这允许了大规模的刚体运动,这对于调控和信号传导至关重要。

我们可以在无数的调控蛋白中看到这一原则的作用。利用像Förster共振能量转移(FRET)(它就像一个分子尺)和圆二色性(CD)(它检查二级结构的完整性)这样的生物物理技术,科学家们可以观察这些运动的发生。他们可能会发现,当一个信号分子结合时,两个域会摆动得更近,即使每个域的内部折叠完全保持不变。这就是变构效应——远程作用——的物理基础。一个信号结合到一个域上,引起一个大的机械运动,从而改变了远处域的功能。

也许最优雅的例子是在G蛋白中找到的,它们是细胞通讯的主开关。G蛋白的α亚基有两个主要域:一个“Ras样”域,它结合核苷酸“钥匙”(GDP表示“关闭”或GTP表示“开启”),以及一个像盖子一样的“全螺旋”域。在非活性的、GDP结合的状态下,盖子是关闭的。但是当GTP结合时,它额外的磷酸基团就像一个微小的杠杆,触发了Ras样域内柔性“开关环”的构象变化。这种变化传播到域之间的界面,导致整个全螺旋域摆动开来,暴露出一个全新的表面,现在可以与下游效应蛋白相互作用。一个微小的化学变化因此被放大为一个大的结构重排,向整个细胞广播一个信号。

进化蓝图

这种模块化并非偶然;它是蛋白质进化方式的直接结果。大自然是一个了不起的修补匠,而不是一个从零开始的发明家。创造新的、复杂的蛋白质的主要机制是对编码现有成功域的基因进行复制和重排。DNA复制过程中的一个简单错误可能导致“不等交换”(unequal crossing-over)事件,从而产生一个基因的串联重复。随后的一个小的缺失可以无缝地融合这两个基因拷贝,去掉第一个基因的“终止”信号和第二个基因的“起始”信号。结果是一个新的单一基因,产生一个包含两个相连的相同域的长多肽链。这个新蛋白质现在可能以高得多的亲和力(“亲合力效应”)结合其靶标,提供直接的进化优势。整个蛋白质组,以其令人眼花缭乱的多样性,就是通过这种混合和匹配有限的成功域模块库的过程,在亿万年中建立起来的。

解构与重建机器

域的概念如此强大,以至于它已成为现代生物学家工具箱的核心部分,跨越从蛋白质组学到计算建模的多个学科。

为了测试哪个域负责特定的相互作用,科学家们可以进行“域交换”(domain swapping)实验。假设你有两种相似的激酶,激酶A和激酶B,它们与不同的伴侣结合。通过创造嵌合蛋白——例如,取A的N端域与B的C端域融合——并使用定量质谱法来观察它们与什么结合,研究人员可以精确地映射出哪个域赋予了哪种特异性。这是对模块化假说的终极证实。

这种模块化也为结构生物学带来了挑战和机遇。当我们试图用低温电子显微镜(cryo-EM)为一个灵活的多域蛋白质拍照时,域相对于彼此的连续运动会使最终图像模糊,就像长时间曝光拍摄一面飘扬的旗帜会得到一张模糊的照片一样。然而,通过将每个域视为一个独立的刚体——一种“多体精修”(multi-body refinement)方法——强大的计算算法可以从原始数据中独立对齐每个域,从而得到每个运动部分的高分辨率图谱。

最后,域模型指导我们如何构建蛋白质的预测模型。如果我们想为一个有两个由柔性连接链连接的域的蛋白质建模,目标不是生成一个单一的、静态的雕像。物理上正确的方法是构建一个可能性的系综,在保持域刚性的同时,对连接链的巨大构象空间进行采样。然后,这个计算系综可以与实验数据(如FRET测量值)进行比较,以找到一组能代表该蛋白质在溶液中真实动态性质的结构。

压力下的DNA双螺旋:双域模型

现在,让我们将注意力从蛋白质的世界转向基因组本身,我们惊喜地发现,域的概念在一个完全不同但同样深刻的背景下再次出现。在这里,域不是蛋白质的物理块,而是DNA双螺旋的动态拓扑区域。

想象一下RNA聚合酶,这是将基因转录成RNA的分子机器。它是一个巨大的工厂,必须沿着它的轨道——DNA双螺旋——移动。现在,想象一下这个DNA轨道不是一根自由漂浮的绳子,而是一个环,在细菌染色体内受到拓扑约束和锚定。聚合酶必须解开右手螺旋的DNA才能读取遗传密码。如果巨大的聚合酶和锚定的DNA都不能自由旋转,一个简单的物理后果就會产生。随着聚合酶向前移动,它迫使其前方的DNA变得过旋,就像把一根绳子越拧越紧。同时,它身后的DNA則变得欠旋。

这个卓越的洞见是Liu-Wang​​双域模型​​的核心。在一个受约束的模板上进行转录会产生两个不同的拓扑域:聚合酶前方的一个正超螺旋(过旋)域,以及其后方的一个负超螺旋(欠旋)域。产生的扭转应力是巨大的。聚合酶每移动1050个碱基对——大约是螺旋的100圈——它就会在前方产生约+100+100+100圈的过旋,并留下约−100-100−100圈的欠旋。这种压力会很快使转录陷入停顿。

因此,生命需要一套“张力管理器”——称为拓扑异构酶的酶。值得注意的是,这些酶根据双域模型划分了它们的劳动。在细菌中,一种名为​​DNA促旋酶(DNA gyrase)​​的酶专门放松正超螺旋。它被发现在聚合酶前方紧张地工作,充当一个转环来缓解扭转屏障。与此同时,另一种酶,​​DNA拓扑异构酶I(DNA topoisomerase I)​​,专门放松负超螺旋。它被发现在转录的尾迹中工作,清理留下的欠旋DNA。这种优雅的分工是双域模型的直接预测,也是其有力的证据。

这个物理模型具有生死攸关的后果。我们许多最有效的抗生素,即氟喹诺酮类药物,就是通过抑制DNA促旋酶来起作用的。它们破坏了那个转环。没有DNA促旋酶来缓解压力,正超螺旋会累积到不可能的水平,基本的转录过程被扼杀,从而杀死细菌。这是一个美丽的例子,说明了对生物学中一个基本物理过程的深刻理解如何直接催生了救命的药物。当然,整个现象都依赖于DNA受到拓扑约束。在一小段末端可以自由旋转的线性DNA上,扭矩只会消散,不会累积显著的超螺旋。这场戏剧只有在染色体被组织成受约束的域时才会上演。

从蛋白质的模块化构造到我们基因上的拓扑应力,域的概念提供了一个镜头,透过它,细胞的复杂性分解为一个更易于理解、机械上更优雅的系统。这证明了简单、统一的思想在我们探索生命机器的征程中的强大力量。