蛋白质折叠与自由能：生命的热力学蓝图

玻尔百科

核心要点

蛋白质折叠是一个自发过程，由吉布斯自由能的最小化驱动，它平衡了内部化学键（焓）的有利形成与链随机性（熵）的损失。
疏水效应——水分子从笼罩非极性残基的状态中释放出来所导致的巨大熵增——是水环境中蛋白质折叠的主要驱动力。
折叠能量景观常被形象地描绘成一个漏斗，它引导着高熵的展开状态向单一的、低能量的天然结构移动，从而解释了折叠路径和中间体。
理解折叠热力学对于解释由不稳定突变引起的遗传病、朊病毒的行为，以及设计具有特定功能的新型蛋白质至关重要。

引言

一条长而柔性的氨基酸链是如何自发且可靠地折叠成对其功能至关重要的、单一而复杂的三维结构？这个问题，即蛋白质折叠问题，是分子生物学的核心。其可能构象的数量之多，意味着通过随机寻找正确构象所需的时间将超过宇宙的年龄，然而蛋白质在数秒内就能完成这一壮举。这个悖论的答案并不在于某种神秘的生物力，而在于热力学的基本定律。本文深入探讨自由能概念，将其作为主导这一令人难以置信过程的大师法则。通过理解蛋白质遵循的热力学脚本，我们可以揭开其功能的奥秘、在疾病中的失效原因，甚至学会编写我们自己的脚本来设计新蛋白质。接下来的章节将首先探讨折叠的原理与机制，剖析焓、熵和关键的疏水效应所扮演的角色。然后，我们将进入应用与跨学科联系的世界，看这些原理如何解释疾病、驱动进化，并为蛋白质工程领域赋能。

原理与机制

想象一下，你有一条长绳，也许有一百米长，你随意地将它揉成一团然后松开。它会每次都形成一个完美的、复杂的结，而且每次都是完全相同的结的几率有多大？这个几率小得可笑，简直是天文数字。然而，这恰恰是蛋白质——一种长长的、线状的分子——在一个活细胞繁忙而混乱的环境中所做的事情。它在短短几秒甚至更短的时间内，将自己折叠成一个精确的、功能性的三维机器。这不是魔法，而是物理学定律在起作用的深刻体现。要理解这个日常奇迹，我们不需要发明新的生物力。相反，我们必须求助于所有科学中最强大的概念之一：自由能。

一场宇宙级的平衡之舞：吉布斯自由能

宇宙的核心受制于一种对稳定性的不懈追求。对于在恒温恒压下发生的过程，比如细胞中的蛋白质折叠，稳定性是由一个叫做吉布斯自由能的量来衡量的，用 $G$ 表示。自然界总是试图最小化这个能量。球滚下山是为了降低其势能；热的物体冷却下来是为了散播其热能。同样地，蛋白质折叠是因为其纠缠的、未折叠状态的吉布斯自由能高于其最终的天然结构。折叠过程是一个沿着自由能山坡自发向下滑动的过程。

这个基本思想被一个优美而简单的方程所捕捉：

\Delta G = \Delta H - T\Delta S

这里， $\Delta G$ 是吉布斯自由能的变化。为了使折叠成为自发过程， $\Delta G$ 必须为负。这个变化取决于两个相互竞争的项： $\Delta H$ ，即焓变，和 $\Delta S$ ，即熵变，其中 $T$ 是绝对温度。

焓， $H$ ，本质上是系统的热含量。可以把它看作是储存在化学键和相互作用中的能量。当蛋白质折叠时，它会形成大量的弱相互作用——氢键、范德华力、静电引力——这些在能量上是有利的。就像微小的磁铁吸附在一起，这些键的形成会释放能量，使得焓变 $\Delta H$ 为负。一个负的 $\Delta H$ 有助于使 $\Delta G$ 为负，从而有利于折叠。

熵， $S$ ，是衡量无序或随机性的尺度。它关乎一个系统可以有多少种不同的排列方式。一个凌乱的房间有高熵；一个整洁的房间有低熵。一个未折叠的蛋白质链就像一根蠕动的意大利面，能够采取无数种不同的形状。它具有非常高的熵。将它折叠成一个单一、明确的结构是一种极端整理的行为。这迫使蛋白质本身的熵急剧下降，使其自身的熵变 $\Delta S_{\text{protein}}$ 成为一个大的负数。

所以这里就产生了一场斗争。焓项 $\Delta H$ 通常是负的，推动蛋白质折叠。但熵项 $-T\Delta S_{\text{protein}}$ 是一个大的正数（因为 $\Delta S_{\text{protein}}$ 是负的），它强有力地反对折叠。对于一个典型的小蛋白质，焓变可能在 $\Delta H = -250 \text{ kJ/mol}$ 左右，而熵项可能提供一个 $+217 \text{ kJ/mol}$ 的惩罚，导致净自由能变化为 $\Delta G \approx -33 \text{ kJ/mol}$ 。蛋白质折叠了，但只是勉强折叠。这是一种微妙的平衡。是什么打破了僵局？

看不见的建筑师：水与疏水效应

解决这场热力学拉锯战的秘密不在于蛋白质本身，而在于它所处的环境：水。蛋白质的绝大部分由一条主链和装饰其上的各种侧链组成。其中一些侧链是“亲水”的（water-loving），但许多是“疏水”的（water-fearing），就像油一样。

在未折叠状态下，这些油性的、非极性的侧链暴露在周围的水中。水分子非常善于交际；它们喜欢彼此形成氢键。当遇到一个它们无法与之成键的油性表面时，它们被迫在非极性基团周围排列成高度有序的、称为笼形水合物的笼状结构。这种有序化降低了水的随机性——就像强迫一群动态的人群形成一个整齐、静态的圆圈。这对水来说是一种熵非常低的状态，而自然界不喜欢这样。

现在，看看蛋白质折叠时会发生什么。它巧妙地将所有疏水侧链藏入其核心，远离水。这一行为解放了大量被困在那些有序笼子里的水分子。摆脱了束缚，它们现在可以自由地与大量溶剂混合翻滚，导致水的熵，即 $\Delta S_{\text{water}}$ ，急剧增加。

这种现象被称为疏水效应，是蛋白质折叠的主要驱动力。整个系统的总熵变为 $\Delta S_{\text{total}} = \Delta S_{\text{protein}} + \Delta S_{\text{water}}$ 。尽管蛋白质自身的熵下降了（ $\Delta S_{\text{protein}} 0$ ），但水熵的增加是如此之大（ $\Delta S_{\text{water}} \gg 0$ ），以至于总熵变可以为正。

为了看出这有多强大，考虑一个假设情况，即折叠在焓上实际上是能量不利的，比如说 $\Delta H = +15 \text{ kJ/mol}$ 。你可能会认为这种蛋白质永远无法折叠。但让我们看看数字。埋藏其非极性基团可能会导致水的熵巨量激增，比如 $\Delta S_{\text{water}} = +258 \text{ J/(K}\cdot\text{mol)}$ ，而蛋白质自身的有序化使其损失了 $\Delta S_{\text{protein}} = -200 \text{ J/(K}\cdot\text{mol)}$ 。在体温（ $310 \text{ K}$ ）下，总熵变为 $\Delta S_{\text{total}} = 58 \text{ J/(K}\cdot\text{mol)}$ 。最终的自由能变化变为 $\Delta G = \Delta H - T\Delta S_{\text{total}} \approx +15 \text{ kJ/mol} - (310 \text{ K} \times 58 \text{ J/(K}\cdot\text{mol)}) \approx +15 \text{ kJ/mol} - 18 \text{ kJ/mol} = -3 \text{ kJ/mol}$ 。蛋白质自发地折叠了，尽管只是勉强稳定，但这几乎完全是由水分子渴望自由的统计力所驱动的。蛋白质与其说是将自己拉到一起，不如说是被周围水分子的统计力挤压成形。

折叠之旅的地图：折叠能量漏斗

所以我们知道折叠是自由能的下坡滑动。但是蛋白质只是随机尝试不同的形状，直到偶然发现正确的那个吗？这就是被称为莱文塔尔悖论的难题：一个典型的蛋白质有如此多的可能构象，以至于通过随机搜索找到天然状态所需的时间将超过宇宙的年龄。

现代观点通过将此过程可视化为在一个广阔的能量景观上的旅程，而不是沿单一路径的搜索来解决这个悖论。想象一个巨大的曲面，其中垂直高度代表吉布斯自由能，而水平面上广阔的维度代表蛋白质可以采取的每一种可能形状。对于一个注定要折叠的蛋白质来说，这个景观不是一个平坦、无特征的平原。它的形状像一个巨大的、多维的折叠漏斗。

在顶部，漏斗的边缘很宽，代表着数量庞大的高能量、高熵的未折叠构象。单一、稳定的天然状态位于漏斗的最底端——吉布斯自由能的最低点。折叠过程类似于一群弹珠从漏斗的边缘各处开始，沿着倾斜的侧壁向底部滚动。

至关重要的是，这个漏斗有一个全局性的倾斜。无论你在这个曲面上的哪个位置，“下坡”的大致方向都指向天然结构。这意味着搜索不是随机的。蛋白质不断地受到一个热力学偏向的引导——一种温和但持续的推动，使其朝向更稳定、更接近天然的结构。这种漏斗状的景观是氨基酸序列的一个涌现特性，通过进化被精美地编码，以确保蛋白质在回家的路上不会迷失。

当路径崎岖不平时：中间体与崎岖景观

当然，这个漏斗的表面并非完美光滑。它是“崎岖”的，布满了小山丘和山谷。那些小山谷是暂时的停歇点——亚稳态的折叠中间体，蛋白质可能在其中暂时被困住。一个常见的例子是熔球态，这是一种像天然蛋白质一样紧凑，但内部缺乏紧密堆积的状态。在我们的漏斗上，熔球态位于斜坡半途的一个盆地中：它的自由能低于未折叠状态但高于天然状态，其构象熵同样介于两者之间。

这些颠簸和陷阱决定了折叠的动力学。一个非常“崎岖”且有深陷阱的景观会导致折叠缓慢，因为蛋白质必须通过热扰动才能从这些陷阱中逃脱，继续其下坡之旅。一个折叠顺利迅速、不会陷入中间体的蛋白质被称为“两态折叠者”。我们甚至可以在实验室里看到这种差异。当我们加热一个蛋白质并测量它吸收的热量（一种称为差示扫描量热法的技术）时，一个两态折叠者会显示一个单一、尖锐的吸热峰。而一个多态折叠者，由于其可被布居的中间体，会显示一个更宽、更复杂的峰，这是其崎岖的漏斗之旅的直接标志。

这种景观观点也优雅地解释了变性。当我们加入像尿素这样的化学物质时，我们不是在“破坏”蛋白质的天然状态。相反，我们正在改变漏斗本身的形状。尿素非常善于与蛋白质的主链和侧链相互作用，因此它优先稳定了漏斗顶部的未折叠状态。这使得漏斗变得更浅，减小了顶部和底部之间的自由能差距，直到蛋白质保持折叠状态不再有利。

证实规则的例外：无序之美

几十年来，“结构-功能”范式一直占据主导地位：一个蛋白质必须折叠成特定的结构才能具有功能。然后，科学家们发现了一整类挑战这条规则的蛋白质：内在无序蛋白质（IDPs）。这些蛋白质功能齐全，常常在细胞通讯网络中充当灵活的枢纽，然而它们却以一种扭动的、动态的构象系综形式存在，似乎一直处于“未折叠”状态。

这是否打破了 Anfinsen 的热力学假说？恰恰相反，这是对其最微妙而优美的证实。该假说只陈述了一个蛋白质将采纳吉布斯自由能最低的构象。它从未承诺这个状态必须是单一、刚性的结构。

对于IDPs，其氨基酸序列通常疏水性残基含量低，而净电荷高。这意味着折叠成一个紧密堆积的结构只有非常弱的焓奖赏（ $\Delta H$ 不是非常负）。同时，放弃无序状态自由度的熵惩罚（ $\Delta S_{\text{protein}}$ 是非常负）仍然巨大。当你将这些值代入吉布斯方程时， $-T\Delta S$ 项完全占主导地位。系统的最低自由能状态实际上就是无序的系综本身。一个IDP的能量景观不是一个深漏斗，而更像一个浅而宽的盆地。对于这些蛋白质，功能源于其灵活性，而非刚性。

因此，一条蛋白质链的旅程——从随机线团到一个精确的机器，或者到一个功能性的、动态的云团——是一个用热力学的通用语言写就的故事。它证明了简单而优雅的焓和熵定律，一场能量与无序之间的平衡之舞，如何能够催生出生命令人惊叹的复杂性和美丽。

应用与跨学科联系

在上一章中，我们穿行于抽象但强大的自由能景观世界。我们看到蛋白质的命运——折叠或失败——是如何由能量与熵之间微妙的热力学拉锯战所决定，并被形象地描绘为一个宏伟的多维漏斗。这些是游戏规则。现在，我们将看到游戏的实际运作。因为这些原理不仅仅是优雅的理论；它们是塑造生命、死亡、疾病和医学未来的无形建筑师。理解蛋白质折叠的自由能，就等于掌握了一把钥匙，可以解开横跨生物学的秘密，从最寒冷的海洋到我们自身细胞的核心，甚至让我们自己也能成为建筑师。

生命与疾病的热力学脚本

自然界是应用物理定律的终极大师。每一种蛋白质的折叠都是一场由其氨基酸序列编写并由其环境决定的热力学脚本所指导的表演。但是，当环境改变，或者脚本中出现一个拼写错误时，会发生什么呢？

一个关于此脚本适应性的迷人例子来自在极寒环境中繁盛的生物。蛋白质必须足够稳定以维持其形状，但又必须足够灵活以执行其功能——这一特性由其折叠自由能 $\Delta G_{\text{fold}}$ 定义。在低温下，疏水效应——那种驱动非极性基团聚集在一起远离水的强大力量——变得更强。如果将一个来自温带生物的蛋白质置于寒冷中，它会变得过于刚性，其疏水核心被锁得太紧，以至于无法移动和发挥功能。进化的解决方案出人意料地反直觉。嗜冷生物（psychrophiles）或“喜冷者”的蛋白质通常进化出更弱的疏水核心。它们有意地减少了埋藏非极性残基所带来的焓和熵增益。这种稳定性的降低是一种特性，而不是一个缺陷！这是对热力学参数的精确调节，以在严寒世界中实现灵活性所需的完美的、边际的稳定性。这是一个美丽的证明，生命并非简单地最大化稳定性，而是为功能而优化稳定性。

如果大自然的脚本被调整得如此精细，一个单一的错误就可能是灾难性的。考虑一个突变，它将一个深藏在蛋白质核心内的疏水性氨基酸（如亮氨酸）替换为一个带电荷的氨基酸（如天冬氨酸）。从热力学角度看，这是一场灾难。疏水核心就像一个油性残基的私人俱乐部，而我们刚刚试图强行塞入一个带有强电荷的亲水成员。能量代价是巨大的。这里既有有利的疏水相互作用的损失，更重要的是，将一个电荷从舒适的水的极性环境中拖出并埋入非极性内部所付出的巨大代价。这单一的改变可以极大地增加天然状态的自由能，使得 $\Delta G_{\text{fold}}$ 的负值变得小得多，甚至可能为正。折叠漏斗实际上被压平或倒置了。蛋白质再也找不到其天然折叠，而是常常错误折叠并聚集成无用的、有时是有毒的聚集体。这个简单的思想实验为大量遗传病提供了分子基础，在这些疾病中，基因的一个小改变导致一个有缺陷的蛋白质，从而扰乱了细胞复杂的机器。

但错误折叠的故事可能更加离奇。如果“错误”的结构也是一个稳定的结构呢？这就是朊病毒（prions）的险恶之处，它们是克雅氏病（Creutzfeldt-Jakob disease）等疾病的病原体。一个朊病毒蛋白的能量景观与一个典型的、行为良好的蛋白质的能量景观有根本的不同。朊病毒的景观不是一个通往单一天然状态的深邃漏斗，而是具有至少两个深而稳定的吸引盆，它们被一个高能量屏障隔开。一个盆对应于正常的、健康的蛋白质。另一个对应于错误折叠的、致病的朊病毒形式。两者都是稳定的，意味着蛋白质可以愉快地长时间存在于任一状态。它们之间的高屏障阻止了自发的转换。危险在于，朊病毒形式可以充当模板，有效地降低这个屏障，并催化健康蛋白质向朊病毒形式的转化。这是一个令人不寒而栗的例子，说明自由能景观的拓扑结构——它的形状、它的陷阱和它的山脉——本身就可以引起一种既是遗传性的又是传染性的疾病。

探测与塑造能量景观

有了这种深刻的理解，我们不再仅仅是被动的观察者。科学家现在可以积极地探测甚至操纵蛋白质的能量景观，以揭示其秘密或纠正其缺陷。

一种粗暴的操纵方法是变性。在实验室里，我们经常需要完全展开一个蛋白质，也许是为了分析其序列。为此，我们使用尿素或盐酸胍等化学物质。它们是如何工作的？它们改变了游戏规则。这些物质对于蛋白质的极性和非极性部分都是极好的溶剂。通过包围蛋白质，它们使得未折叠状态成为一个更舒适、能量更低的地方。它们实质上是通过为其组成部分提供比折叠结构内部更具吸引力的环境来“贿赂”蛋白质解体。未折叠状态的自由能 $G_U$ 被降低如此之多，以至于平衡被打破，未折叠状态在热力学上变得更受青睐。

我们也可以更加微妙。考虑在我们的实验中用“重水” $\text{D}_2\text{O}$ 替代水。氘形成的键比氢略强。这对折叠有两个相互竞争的后果。首先，它使得 $\text{D}_2\text{O}$ 成为一个更“结构化”的溶剂，这增强了疏水效应，进一步稳定了蛋白质的核心。其次，它使得溶剂-蛋白质氢键更强，因此为了形成蛋白质的内部氢键而打破它们需要付出更大的能量代价。通过测量在 $\text{D}_2\text{O}$ 中折叠平衡的微小变化，我们可以进行一场漂亮的侦探工作，将总折叠自由能分解为其组成部分，并了解疏水效应和氢键对蛋白质稳定性的相对贡献。

当然，细胞有自己的操纵大师：分子伴侣。当一个蛋白质在折叠过程中卡住，被困在一个并非真正的能量最低点但又无法逃脱的错误折叠状态时，会发生什么？它正坐在一个动力学陷阱中——主能量漏斗侧面的一个小坑。分子伴侣不仅仅是推它一把。一个ATP依赖性分子伴侣是一个主动的机器，它利用ATP水解的化学能来做功。它抓住错误折叠的蛋白质，并以一项非凡的分子工程壮举，将其展开。它强行将蛋白质从其动力学陷阱中拉出，并将其扔回折叠漏斗的顶部，给它一个新的开始去寻找其正确的天然状态。这是一个至关重要的细胞质量控制机制，一个主动塑造折叠景观以确保功能并防止有毒聚集的非平衡过程。它也强有力地提醒我们，细胞不是一个处于平衡状态的被动化学袋，而是一个动态的、由能量驱动的系统。

从理解到构建：蛋白质工程时代

检验对一个系统理解程度的最终标准是构建它的能力。凭借折叠自由能的原理，我们进入了一个蛋白质从头设计的时代，从零开始创造具有新功能的新型蛋白质。

这个领域最深刻的教训之一是“负向设计”的概念。假设你想设计一个能够折叠成特定目标形状的蛋白质。直观的方法是找到一个能使该形状尽可能稳定的氨基酸序列——尽可能地挖深受目标结构的能量最低点。这是“正向设计”。但早期的尝试常常惨败。设计的蛋白质可能非常稳定，但却是完全不同的形状！问题出在哪里？设计者忽略了负向设计。仅仅确保你的序列在目标折叠中稳定是不够的。你还必须确保同一序列在所有其他可能的竞争折叠中都是不稳定的。目标状态的自由能 $G_{\text{target}}$ 必须低于任何替代状态的自由能 $G_{\text{alternative}}$ 。一个成功的蛋白质设计者，在确保其序列适合目标结构上花多少时间，就会花同样多的时间来确保其序列不适合其他结构。

我们也可以物理上强迫蛋白质进入期望的形状。想象一下，你想创造一个能保持特定螺旋形状的短肽，也许可以作为药物。靠它自己，这样短的链会是松软无序的——高熵状态将占主导。但如果我们安装一个共价支架，一个“环钉”，将链的一部分与另一部分连接起来呢？。通过正确选择连接点，这个环钉可以极大地惩罚未折叠的、随机的状态，有效地降低它们的熵。它提高了能量景观未折叠区域的基底，使得受约束的、折叠的状态相比之下更有利。这是对蛋白质自由能景观的直接、物理的重新工程，这项技术现在被广泛用于创造稳定的、具有生物活性的肽用于治疗。

为了结束我们的旅程，让我们进行最后一个触及折叠驱动力核心的思想实验。我们已经看到，在水中，疏水效应是主角。但如果我们完全改变舞台呢？如果我们试图在像油一样的非极性溶剂中折叠我们的蛋白质呢？。突然之间，疏水效应消失了。非极性侧链非常乐意与溶剂接触。整个驱动力都颠倒了过来。现在，蛋白质骨架和侧链的极性基团成了被排斥的对象，它们拼命地试图逃离非极性溶剂。主导驱动力变成了埋藏这些极性基团，以便它们能够形成一个令人满意的分子内氢键网络。结果呢？一个“内外颠倒”的蛋白质，具有极性核心和非极性表面。

这最后的景象或许是所有教训中最强大的一个。基本原理——追求最小化吉布斯自由能——是普适的。但是涌现出的结构，即生命的架构本身，是蛋白质与其环境相互作用的直接结果。通过理解序列、环境和能量之间的这场舞蹈，我们不仅能欣赏自然界已构建的结构之美，而且还能获得智慧和工具，开始我们自己的构建之旅。