try ai
科普
编辑
分享
反馈
  • 核酸结构

核酸结构

SciencePedia玻尔百科
核心要点
  • 糖环上是否存在一个2'-羟基,区分了RNA和DNA,并决定了其化学稳定性和螺旋几何构型(A型 vs. B型)。
  • 核酸链具有由磷酸二酯键建立的内在的5'到3'方向性(即极性),这对于遗传信息的顺序读取至关重要。
  • DNA双螺旋的特定三维几何构型,特别是其大沟和小沟,使得蛋白质能够通过直接和间接读取机制识别并结合特定序列。
  • 对核酸结构原理的理解,催生了革命性技术的发展,包括CRISPR-Cas9基因编辑系统和DNA折纸术中复杂形状的构建。

引言

核酸,即DNA和RNA,是生命的“主宰分子”,掌握着每个生物体的蓝图。这些长链聚合物负责一系列惊人的任务,从稳定、长期地储存遗传信息到动态调控细胞过程。这就引出了一个根本性问题:由一小组简单化学单元构成的分子,如何能实现如此深刻的复杂性和功能多样性?答案不仅在于它们的序列,更在于其复杂而优雅的三维结构。理解这一结构是理解生命本身的关键。

本文将深入探讨核酸的构造,揭示形式如何决定功能。我们将探索支配这些分子如何构建和折叠的化学原理与物理力量。通过剖析它们的结构,我们可以领会为何DNA是遗传密码的稳定守护者,而RNA是功能多样的“多面手”,以及细胞机器如何读取这两者并与之相互作用。

这段旅程分为两部分。在第一章 ​​“原理与机制”​​ 中,我们将审视核酸的基本构件,从区分DNA和RNA的原子,到将它们连接成有方向性链条的化学键,再到将它们扭曲成标志性双螺旋的作用力。在第二章 ​​“应用与跨学科联系”​​ 中,我们将看到这些结构原理的实际应用,探索它们如何解释从病毒生命周期、用CRISPR进行基因编辑,到遗传密码的起源等一切事物。准备好见证一个分子的精巧设计如何塑造了整个生物世界。

原理与机制

想象一下,你是一位工程师,任务是建造一台能够储存和传输海量信息库的机器——这是一个完整生物体的蓝图。你会选择什么样的材料?它需要足够简单,以便可靠地组装;又要足够复杂,以编码大量数据。它需要足够稳定,以持续一生;又要足够易于访问,以便按需读取和复制。大自然这位终极工程师,在数十亿年前就通过发明核酸解决了这个问题。要真正欣赏它们的精妙,我们必须像任何优秀的工程师一样,查看零件清单和组装说明。

信息的原子:一个关于缺失氧原子的故事

核酸的核心是一种聚合物,一条由称为 ​​核苷酸​​ 的重复单元构成的长链。每个核苷酸都是一个精巧的三部分组合:一个磷酸基团、一个五碳糖和一个含氮碱基。让我们从糖开始,因为这里一个看似微不足道的差异,为两个截然不同的世界奠定了基础:DNA的世界和RNA的世界。

DNA(脱氧核糖核酸)和RNA(核糖核酸)都使用一种称为戊糖的五碳糖。在RNA中,这种糖是 ​​核糖​​。在DNA中,它是一种非常近的“亲戚”,称为 ​​脱氧核糖​​。它们的名字已经泄露了天机。“脱氧-”意味着“没有氧”。在糖环上一个标记为2'(读作“二撇”)碳的特定位置,核糖有一个羟基(−OH-\text{OH}−OH)。而脱氧核糖,名副其实,其上的氧被剥离,只留下一个氢原子(−H-\text{H}−H)。

你可能会想:“一个小小氧原子有什么大不了的?”事实证明,这是整个生物学中最具深远影响的决定之一。核糖上的那个羟基是一个活泼的化学基团,使RNA更容易分解。通过去除它,大自然创造了DNA,一个远为稳定的分子——非常适合长期、档案式地储存遗传信息。而RNA,这个更脆弱、更短暂的“亲戚”,则被安排扮演临时信使或快速反应的调控机器等角色。这一个原子的差异是化学设计的神来之笔,决定了分子的稳定性和最终命运。

核苷酸的第二个组成部分是 ​​含氮碱基​​,这是实际携带信息的部分。它们分为两种类型:较大的双环 ​​嘌呤​​——腺嘌呤(A)和鸟嘌呤(G)——以及较小的单环 ​​嘧啶​​——胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)。一个简单的规则支配着它们的使用:DNA使用A、G、C和T,而RNA则用尿嘧啶(U)取代胸腺嘧啶(T),即A、G、C、U。这些碱基通过一个称为 ​​N-糖苷键​​ 的牢固共价键连接到糖的1'碳上,将信息字母与其糖骨架牢固地结合在一起。

生命的单向链

现在我们有了核苷酸构件。如何将它们串联起来?这就是第三个组成部分——​​磷酸基团​​——发挥作用的地方。一个核苷酸的磷酸基团与下一个核苷酸的糖形成连接,创造出一条连续的 ​​糖-磷酸骨架​​。这不仅仅是任意的连接;它是一种特殊的、有方向性的键,称为 ​​磷酸二酯键​​。

想象一下你正在连接一列玩具火车车厢。如果每节车厢都相同,并且两端都可以连接,那么这列火车就没有固有的方向。但如果每节车厢前端有一个钩子,后端有一个锁扣呢?那么这列火车就有了明确的方向。核酸的构建方式正是如此。磷酸二酯键是不对称的:它连接一个糖的5'碳和链中 下一个 糖的3'碳。

这种不对称性带来一个深远的结果:整个链条具有内在的方向性,即 ​​极性​​。链的一端总会有一个连接在5'碳上的游离磷酸基团(​​5'端​​),而另一端则会在3'碳上有一个游离羟基(​​3'端​​)。按照惯例,我们从5'到3'读取和书写核酸序列,就像从左到右阅读一个句子一样。像5'-GATTACA-3'这样的序列是一个精确的化学陈述。它告诉我们,鸟嘌呤位于链的首端(5'端),腺嘌呤位于链的末端(3'端),总共有七个核苷酸,由六个磷酸二酯键连接(一条有 nnn 个核苷酸的链有 n−1n-1n−1 个键)。这个以正确的5'-至-3'顺序书写的碱基序列,就是核酸的 ​​一级结构​​。

秘密的“握手”:两条链的舞蹈

单链DNA本身就很奇妙,但当它找到一个伴侣时,其真正的力量才被释放出来。在20世纪中叶,生物化学家Erwin Chargaff有了一个令人困惑的发现。他发现在任何生物体的DNA中,腺嘌呤的量几乎总是与胸腺嘧啶的量完全相等(%A≈%T\%A \approx \%T%A≈%T),而鸟嘌呤的量几乎总是与胞嘧啶的量完全相等(%G≈%C\%G \approx \%C%G≈%C)。这后来被称为 ​​查格夫法则(Chargaff's rules)​​。

为什么会这样呢?这是一条最高级别的线索。它暗示了一种特定的配对关系。这是解开双螺旋之谜的钥匙。如果你分析一个病毒基因组,发现其碱基组成为28% A、20% U、22% G和30% C,你会立刻知道它不可能是简单的双螺旋,因为A不等于U,G也不等于C。规则被打破了,所以结构必定是单链。

Watson-Crick模型揭示了这个秘密。两条核酸链相互缠绕成一个螺旋,通过碱基之间的 ​​氢键​​ 连接在一起。但不是任意碱基配对。A总是与T(在DNA中)或U(在RNA中)通过两个氢键配对。G总是与C通过三个氢键配对,这是一个稍强的连接。这就是著名的 ​​互补碱基配对​​。这两条链也是 ​​反平行​​ 的;它们沿相反方向延伸,就像高速公路的两条车道。如果一条链是5'到3'方向,它的伙伴链必须是3'到5'方向。这种排列方式是互补碱基完美契合的唯一方式。

信息的形状:B型、A型和强大的-OH基团

所以,我们有了一个双螺旋。但只有一种吗?这里我们必须回到开头讨论的那个微小的氧原子。它的存在与否决定了整个螺旋的三维结构。

骨架中的呋喃糖环并非完全平坦。它会发生折叠(pucker),就像一个稍微弯曲的信封。它主要采取两种稳定构象中的一种:​​C2'-内式​​(2'碳与碱基在同侧凸出)或 ​​C3'-内式​​(3'碳在同侧凸出)。这种 ​​糖环折叠​​ 的细微变化决定了一切。

在DNA中,脱氧核糖缺少那个笨重的2'-OH基团。它自由而灵活,并且出于整体稳定性的考虑,它偏爱C2'-内式折叠。这种构象导致了一种细长而优雅的螺旋,即 ​​B型​​ 螺旋。这就是经典的Watson-Crick双螺旋,现代生物学的标志。

现在考虑RNA。它的核糖带有2'-OH基团。在C2'-内式折叠中,这个羟基会产生 ​​空间位阻​​——它会实实在在地撞上相邻的磷酸基团。为了避免这种不舒服的拥挤,核糖环基本上被迫采取C3'-内式折叠,这将碍事的基团移开。这种被迫的糖环折叠变化对整个螺旋产生了连锁效应。磷酸基团之间的距离缩短,碱基倾斜,整个结构转变成一种更短、更宽、更紧凑的螺旋,即 ​​A型​​ 螺旋。

这就是为什么双链RNA,甚至是由一条DNA和一条RNA链组成的杂合螺旋(如转录过程中所见),总是会采用A型几何构型。RNA链,凭借其“苛刻”的2'-OH基团,发号施令,决定了这对链的结构。

其功能后果是惊人的。B型DNA螺旋有一个宽阔且易于接近的 ​​大沟​​,就像一个巨大的化学广告牌。蛋白质可以滑入这个沟中,“读取”碱基对的序列,而无需解开螺旋。这是信息识别的主要位点。相比之下,A型螺旋的大沟非常深而窄,使蛋白质几乎无法接近。它的信息被隐藏起来。这种沟槽可及性的差异是支配蛋白质如何与DNA与RNA相互作用的一个基本原则,是一个原子存在与否的直接后果。

生命的折纸术:超越双螺旋

A型和B型螺旋是细胞的主力军,但大自然的创造力并未止步于此。核酸,特别是单链RNA和DNA,可以自我回折,形成各种令人惊叹的复杂三维形状,很像蛋白质。

一个绝佳的例子发生在我们染色体的最末端,即端粒区域。在这里,富含G的单链突出端折叠成一种非凡的结构,称为 ​​G-四链体​​。与Watson-Crick配对不同,四个鸟嘌呤碱基排列成一个平面正方形,通过一种称为 ​​Hoogsteen配对​​ 的替代氢键排布方式连接在一起。这些被称为G-四分体的方块,像一叠扑克筹码一样堆叠起来,形成一个紧凑且高度稳定的结构,作为染色体末端的保护帽。

从最简单的糖的选择到G-四链体的复杂折叠,核酸的结构是一个跨越尺度的故事。它是一个由简单部件构建,遵循优雅化学规则,创造出具有深远功能重要性的结构的分子。理解这些原则不仅仅是记忆事实;它是欣赏生命机器内在的美丽与逻辑。

应用与跨学科联系

在上一章中,我们拆解了核酸分子,审视了它的“螺母和螺栓”——糖、磷酸、碱基——以及它们如何组装成标志性的双螺旋。这可能感觉像在研究一座宏伟大教堂的蓝图,欣赏其设计的优雅,但或许会好奇在其中“生活”是什么感觉。现在,我们将穿行于这座大教堂。我们将看到我们学到的结构原理并非静止的事实,而是生命中那些动态、充满活力,有时甚至是出人意料过程的源头。理解核酸结构是让我们能够阅读生命之书、诊断其错误,甚至开始书写我们自己新篇章的钥匙。

化学印记:我们如何知道DNA是遗传物质

让我们从一个简单但深刻的事实开始:DNA含磷,而蛋白质通常含硫。这个看似微不足道的元素组成细节,是生物学史上最重要的实验之一的关键。在20世纪中叶,科学家们激烈地辩论是蛋白质还是DNA携带遗传信息。Alfred Hershey和Martha Chase设计了一个优雅的实验来解决这个问题。他们使用了噬菌体,一种感染细菌的病毒,它本质上是由蛋白质外壳包围核酸核心的小注射器。

他们准备了两批病毒。一批用放射性磷(32P^{\text{32}}\text{P}32P)培养,这种磷被专门整合到DNA骨架的磷酸基团中。另一批用放射性硫(35S^{\text{35}}\text{S}35S)培养,这种硫被整合到蛋白质外壳的含硫氨基酸中。在让病毒感染细菌后,他们用搅拌机将所有东西搅动起来,以使病毒外壳从细菌表面脱落,然后检查放射性物质的去向。结果是明确的:来自DNA的放射性磷进入了细菌内部,而来自蛋白质外壳的放射性硫则留在了外面。是DNA,而不是蛋白质,被注入细胞以控制它。这就是确凿的证据。DNA具有磷酸骨架这个简单、朴素的事实,是证明它是遗传分子的关键()。这种源于对分子结构基本理解的差异标记原理,至今仍是分子生物学研究的基石。

信息的形状:蛋白质如何读取基因组

知道DNA掌握着指令是一回事;理解细胞机器如何读取它们则是另一回事。一个负责激活单个基因的蛋白质,如何在三十亿个碱基对中找到其精确的起点?答案在于双螺旋的几何形状。碱基序列不仅储存了数字代码;它还创造了一个物理的、三维的景观。蛋白质是“分子登山家”,它们进化出了两种精妙的策略来导航这片“地形”。

第一种策略称为 ​​直接读取​​。想象用手指触摸一行盲文。你通过它们独特的物理形状来识别字符。同样,蛋白质可以将其一部分(通常是一个螺旋片段)插入DNA的大沟中。大沟是一个富含化学信息的景观,碱基对的边缘呈现出独特的氢键供体和受体模式。A-T对看起来与G-C对不同,蛋白质可以形成特定的氢键来直接“读取”序列。这是蛋白质的氨基酸与DNA的碱基之间直接的化学“握手”()。

第二种,更微妙的策略是 ​​间接读取​​。DNA的序列不仅影响暴露的碱基边缘;它还影响螺旋本身的整体形状和柔韧性。例如,一段重复的A-T对序列会产生一段本身弯曲且小沟较窄的DNA。一些蛋白质,比如帮助启动转录的TATA结合蛋白(TBP),与其说是在读取碱基,不如说是在识别DNA的 形状。TBP会锁住TATA盒的小沟,并使螺旋产生一个剧烈的扭结。它只能在构象上“愿意”被这样弯曲的序列上高效地做到这一点。这不像阅读盲文,更像锁匠找到唯一一把符合锁独特轮廓的钥匙([@problem_g_id:2966814])。因此,细胞同时使用化学触摸和对其物理形态的感觉来读取自己的基因组。

动态螺旋:作用与反应中的结构

DNA螺旋不是一根静止、刚性的杆。它会呼吸、弯曲,甚至解链。它的RNA“表亲”更像一个柔术大师,能折叠成复杂的形状,充当开关、支架和信号。这些结构的稳定性不是绝对的;它是一个微妙的热力学平衡,对其环境极为敏感。

考虑转录过程,即一个基因被复制成RNA。这个过程不能永远进行下去;它需要一个停止信号。在细菌中,最简单也最优雅的停止信号之一是 ​​不依赖Rho因子的终止子​​。基因末端的DNA序列被设计成这样:当它被转录成RNA时,新的RNA链会立即回折,形成一个稳定的富含G-C的发夹环,后面跟着一串弱的尿嘧啶碱基。新生RNA中这个发夹环的形成,会物理性地拉动转录机器,使其暂停。然后,将RNA固定在DNA模板上的弱U-A配对断裂,整个复合体分崩离析,转录结束。这是一个分子力学的奇迹。但如果提高温度会发生什么?热量提供的能量可以破坏维持发夹环的脆弱氢键。如果发夹环无法形成,停止信号就被破坏了,机器可能会一直转录到基因末端之后。这提供了RNA结构的生物物理稳定性与基因表达调控之间的直接联系()。

这就引出了一个更深层次的问题:DNA和RNA之间为什么会存在分工?为什么DNA是稳定的档案库,而RNA是短暂的信使?答案很大一部分在于一个微小的化学细节:RNA核糖2'位置的羟基,而DNA的脱氧核糖中没有这个基团。这个2'-羟基不仅仅是一个被动的旁观者。

首先,它使RNA具有化学活性,容易发生自我剪切,这使其成为需要被降解的临时信息的良好候选者。其次,也是更微妙的一点,它充当了一个关键的分子“把手”。2'-OH基团的存在迫使核糖呈现特定的“折叠”或构象,这反过来又决定了RNA螺旋采用A型几何构型,比DNA的B型更短更宽。此外,2'-OH基团本身可以形成氢键。蛋白质已经进化到利用这一点。例如,参与另一种转录终止的Rho解旋酶,其工作方式就是抓住新生RNA并沿着链条拉动自己。它的中心通道被精巧地塑造,以结合单链RNA的独特几何形状,利用一个专门与2'-羟基相互作用的接触网络。它无法在DNA上获得适当的抓握力,因为DNA缺乏这些“把手”并且具有不同的骨架形状。这种分子辨别是细胞区分这两种核酸的基础()。

这种复杂性在 ​​剪接密码​​ 等现象中达到顶峰。在真核生物中,基因被非编码的内含子打断,这些内含子必须从RNA转录本中移除。决定什么是需要保留的外显子,什么是需要剪切的内含子,是由一个比遗传密码本身复杂得多的“密码”来控制的。这是一个综合的、概率性的计算,基于多种结构线索:短序列基元、RNA折叠成局部二级结构的方式、RNA聚合酶移动的速度,甚至DNA所缠绕的染色质上的化学标签。这是一个令人惊叹的信息处理范例,其中一层又一层的结构信息被整合起来,以做出一个单一、精确的决定()。

杂合体、入侵者和病毒劫持者

生命并不总是像纯粹的DNA双螺旋或折叠的RNA那样整洁。通常,最有趣的事件发生在这两种分子混合时。​​RNA:DNA杂合体​​,即一条链是RNA,另一条是DNA,是许多生物过程中的关键中间体。

像HIV这样的逆转录病毒的整个生命周期都建立在这种结构之上。HIV病毒以RNA的形式携带其遗传信息。为了整合到我们的基因组中,它必须首先将其RNA复制成DNA。它通过一种叫做逆转录酶的酶来完成这个过程。第一步是以病毒RNA为模板合成一条DNA链,从而创建一个RNA:DNA杂合体。但要制造稳定的双链DNA,必须移除原始的RNA模板。该病毒的逆转录酶中内置了第二种酶活性,称为 ​​RNase H​​,其唯一的工作就是识别RNA:DNA杂合体并降解掉RNA链。没有RNase H,该过程会卡在杂合体阶段,病毒无法复制。这使得RNase H成为抗病毒药物的主要靶点,这是一个源于这种杂合结构独特性质的直接医学应用()。

现在,我们利用RNA入侵DNA的这一原理,发展出了革命性的基因编辑技术——CRISPR。CRISPR-Cas9系统的核心是 ​​R环​​ 的形成。装载了向导RNA的Cas9蛋白扫描基因组。当它找到与向导RNA匹配的DNA序列时,RNA会入侵DNA双螺旋。它会剥开两条DNA链,并与其互补的目标链形成一个高度稳定的RNA:DNA杂合体,使另一条DNA链以单链环的形式被置换出来。真正了不起的部分是这次入侵的热力学。RNA:DNA杂合体在能量上是如此有利,以至于它的形成所提供的能量足以撕开稳定的DNA双链,而不需要任何像ATP这样的外部能量来源。它是一个自供电的搜索-入侵机器,完全由核酸杂交的基本原理驱动。理解这个三链R环结构的热力学,就是理解CRISPR背后的魔力()。

用生命之砖搭建:从纳米技术到生命起源

我们对核酸结构规则——Watson-Crick配对、可预测的几何构型——的深刻理解,使我们能够成为分子建筑师。在 ​​DNA折纸术​​ 领域,科学家们使用一条长的单链DNA“支架”和数百条短的“订书钉”链,将支架折叠成几乎任何可以想象的二维或三维形状:带有可打开释放药物的盖子的纳米盒子、笑脸,甚至是能够执行逻辑运算的纳米机器人。在这里,基础化学同样重要。由DNA构建的纳米结构在体内相对稳定。而由RNA构建的等效结构会迅速降解,这既是因为2'-羟基使得骨架不太稳定,也是因为我们的细胞中充满了破坏RNA的酶()。像FRET这样的生物物理技术,如同一个分子尺,甚至让我们能够实时观察这些结构的形状变化,例如,观察DNA螺旋在非水环境中从标准的B型转变为较短的A型时的细微压缩()。

最后,让我们将对结构的理解推向其终极极限:生命本身的起源。遗传密码是通用的,这表明它有单一的起源。然而,执行这一密码的酶——将正确的氨基酸连接到其相应tRNA上的氨酰-tRNA合成酶(aaRS)——却是一个深邃的谜题。它们分为两个截然不同的类别,I类和II类,它们具有完全不相关的蛋白质折叠,并且值得注意的是,它们从相反的方向接近tRNA接受臂(小沟侧与大沟侧)。对于一个统一的系统,怎么会产生如此根本的二分法?

最优雅、最令人脑洞大开的假说之一,即Rodin-Ohno模型,提出了一个植根于DNA双螺旋自身互补性的解决方案。也许,在非常遥远的过去,一个单一的祖先基因是从它的 两条 链——“有义”链和“反义”链——进行转录和翻译的。由于遗传密码的性质,这将产生两种完全不同但以互补方式相关的肽。该假说认为,这两种肽作为一个二聚体协同工作,结合在原始tRNA的相对面上催化装载反应。经过亿万年的演化,这两种肽独立进化,成为我们今天看到的两个aaRS类别的催化核心()。如果这是真的,那将意味着翻译机器中的这一深刻分歧是双螺旋本身的活化石——是核酸结构在生命基本逻辑中回响的美丽回声。

从证明DNA在遗传中的作用,到重新设计基因组,再到思考我们的起源,核酸结构的故事就是现代生物学的故事。其简单的组装规则催生了一个充满惊人复杂性和功能的世界,一个我们才刚刚开始完全欣赏和驾驭的世界。