20种常见氨基酸：生命的字母表

玻尔百科

核心要点

20种常见氨基酸由其独特的侧链（R基团）定义，这些侧链决定了它们独特的化学性质，如极性、电荷和大小。
氨基酸的序列由遗传密码决定，其侧链的化学多样性是蛋白质折叠和功能背后的主要驱动力。
所有20种氨基酸都是由源自中心代谢途径的仅仅七种前体分子高效合成的，这使得蛋白质合成与细胞的能量状态紧密相连。
每种氨基酸的独特性质在不同科学领域得到应用，从进化生物学中的序列比较到合成生物学中新功能蛋白质的设计。

引言

广阔而复杂的生物学世界建立在一个简单而优雅的基础之上：二十种常见氨基酸。这些分子是蛋白质的基本构建模块，而蛋白质是催化反应、提供结构支持、运输物质以及执行细胞内几乎所有关键任务的分子机器。然而，若仅仅将它们视为一份需要记忆的清单，就会错失它们所讲述的故事。真正的挑战在于理解它们各自的化学“个性”，以及这个由20个字母组成的字母表是如何被用来书写生命复杂而动态的语言的。

本文将通过两个部分来解读这门语言，探索氨基酸的世界。在第一章 原理与机制 中，我们将解构这些分子，以理解它们共有的构架和独特的特征。我们将探讨它们的分类规则、其“手性”的重要性，以及确保每一个氨基酸被正确置入生长中的蛋白质链的精妙系统。随后，在 应用与跨学科联系 章节中，我们将展示这些分子的实际应用。我们将审视它们的组合能力如何催生了生命巨大的多样性，它们的合成如何巧妙地融入细胞代谢，以及它们如何在从进化论到合成生物学前沿等领域中扮演关键角色。我们的旅程将从审视这一卓越分子构建集的基本设计开始。

原理与机制

想象你有一套积木。但你拥有的不是完全相同的塑料砖块，而是20种不同类型的模块。它们都具有相同的通用连接器——一个中心碳原子，称为 $\alpha$ -碳（ $C_{\alpha}$ ），它连接着一个氨基（ $-\text{NH}_2$ ）、一个羧基（ $-\text{COOH}$ ）和一个氢原子。这个共同的骨架使它们能够连接成长链。但其魔力所在，即让它们能够构建从消化食物的酶到构成头发的角蛋白等一切物质的关键，在于该中心碳上的第四个连接物：一个独特的附属物，称为侧链或R基团。每个氨基酸的全部“个性”——其大小、形状、电荷和反应性——都由这个侧链决定。

规则与例外：手性与朴实的甘氨酸

让我们从一个自然界美妙的特性开始。如果你观察那个中心的 $\alpha$ -碳和它的四个连接基团（氨基、羧基、氢和R基团），对于20种氨基酸中的19种，这四个基团都是不同的。这使得 $\alpha$ -碳成为一个手性中心，意味着该氨基酸具有“手性”。就像你的左手和右手互为镜像但不能重叠一样，这些氨基酸可以以两种镜像形式存在：L-异构体和D-异构体。而生命，以其奇特的智慧，几乎只使用L-型。

但第20种氨基酸呢？如果侧链是能想象到的最简单的东西——另一个氢原子呢？在这种情况下， $\alpha$ -碳连接着两个相同的基团（两个氢）。它不再有四个不同的取代基，因此失去了“手性”。它是非手性的。这种特殊的、最简单的氨基酸就是Glycine（甘氨酸）。这是关于基本原理的一课：支配着19种构建模块的手性规则，恰恰是由那个因极致简单而打破规则的例子所定义的。

个性字母表：氨基酸分类

为了理解这20种模块如何构建起宏伟的生命机器，我们需要对它们进行分类。就像化学家整理一架子试剂一样，我们可以根据它们侧链的化学“个性”将它们分组。这为我们预测蛋白质如何折叠和行使功能提供了一个强大的框架。让我们来探索一下主要的家族。

烃类家族：非极性与疏水

这个群体相当于水中的油。它们的侧链主要由碳和氢组成，这些原子电中性，不喜欢与极性的水分子相互作用。在主要由水组成的细胞内部，这些氨基酸倾向于聚集在一起，通过一种称为疏水塌陷的过程将自己埋藏在蛋白质的核心——这是蛋白质折叠的主要驱动力。

这个群体包括像Alanine（丙氨酸，一个甲基）、Valine（缬氨酸）、Leucine（亮氨酸）和Isoleucine（异亮氨酸）这样的简单氨基酸。Leucine和Isoleucine尤其引人入胜。它们是结构异构体，意味着它们拥有完全相同的原子（ $C_{6}H_{13}NO_{2}$ ），但连接方式不同。在Leucine中，侧链在离主链更远一个原子的γ-碳（ $C_{\gamma}$ ）处分支，而在Isoleucine中，分支点就在靠近主链的β-碳（ $C_{\beta}$ ）上。这种结构上的微小差异赋予了它们不同的形状，就像两把略有不同的钥匙，这对于适配酶的紧密口袋至关重要。

两个非极性成员是真正的“角色”：

Methionine（甲硫氨酸）的侧链中有一个硫原子，这可能会让你误以为它是极性的。然而，这个硫是硫醚，夹在碳原子之间（ $-\text{CH}_2-\text{CH}_2-\text{S}-\text{CH}_3$ ）。它没有氢可以用于形成氢键，其整体特性是油性的和非极性的。至关重要的是，这种结构意味着它不能形成其含硫表亲Cysteine（半胱氨酸）所能形成的强二硫键。
Proline（脯氨酸）是这个群体中的“叛逆者”。它的侧链非常急于参与其中，以至于它回环过来与自身的骨架氮原子形成一个共价键。这将标准的伯氨基转变为仲胺，形成一个刚性的五元环。因此，Proline在技术上是一种亚氨基酸。这种结构刚性在多肽链中引入了一个固定的扭结或弯曲，使Proline成为“螺旋破坏者”，但同时也是在蛋白质结构中创造急转弯的关键元素。

社交名流：极性与乐于交际

这些氨基酸的侧链含有氧或氮等电负性原子，这些原子产生极性键，使它们能够形成氢键——这种弱但数量众多的相互作用，就像将折叠好的蛋白质固定在一起的魔术贴。

极性不带电：这个亚组是极性的，但在生理 $\mathrm{pH}$ （约7.4）下不带净电荷。
- Serine（丝氨酸）和Threonine（苏氨酸）都带有一个羟基（ $-\text{OH}$ ）。这个简单的基团是极佳的氢键供体和受体，使得这些残基常见于蛋白质表面，在那里它们可以与水相互作用。与Isoleucine一样，Threonine的侧链中也有第二个手性中心，增加了另一层结构上的细微差别。
- Asparagine（天冬酰胺）和Glutamine（谷氨酰胺）含有一个酰胺基（ $-\text{CONH}_2$ ），它也是一个优秀的氢键供体和受体。它们是酸性氨基酸Aspartate（天冬氨酸）和Glutamate（谷氨酸）的中性表亲。
- Cysteine（半胱氨酸）是第二种含硫氨基酸，其“个性”与Methionine完全相反。它的侧链末端是一个巯基（ $-\text{SH}$ ）。这个巯基具有反应性。在氧化条件下，两个Cysteine残基可以连接起来形成一个二硫键（ $-\text{S-S}-$ ），这是一种强力的共价“订书钉”，可以将蛋白质链中相距遥远的部分锁定在一起，提供巨大的结构稳定性。
芳香族俱乐部：这是一个由三种大型氨基酸组成的特殊群体：Phenylalanine（苯丙氨酸）、Tryptophan（色氨酸）和Tyrosine（酪氨酸）。它们的决定性特征是一个庞大、扁平的芳香环系统。这些环主要是疏水的，但也可以参与特殊的 $\pi$ -堆积相互作用。
- Phenylalanine是最简单的，是一个纯粹的烃环。
- Tryptophan以其独特的双环吲哚结构，拥有所有20种氨基酸中最大的侧链。其吲哚环含有一个可以作为氢键供体的氮原子。
- Tyrosine本质上是Phenylalanine附加上一个羟基。这使得它极性显著增强，并成为一个氢键供体，跨越了非极性与极性世界的界线。然而，其主导的化学特征仍然是芳香环。

带电角色：酸与碱

这个群体包含化学性质最活跃的侧链。在细胞接近中性的 $\mathrm{pH}$ 下，它们的侧链带有一个完整的正电荷或负电荷，使它们能够形成强大的离子键（盐桥），与DNA等带电分子相互作用，并直接参与化学反应。

酸性二人组：Aspartate（天冬氨酸）和Glutamate（谷氨酸）。它们的侧链含有一个羧酸基团。这些基团的酸解离常数（ $pK_a$ ）约为4。因为细胞的 $\mathrm{pH}$ 值（约7.4）远高于它们的 $pK_a$ ，它们很容易失去质子，以其去质子化的、带负电荷的羧酸根（ $-\text{COO}^-$ ）形式存在。这个负电荷是它们的决定性特征。例如，一个以Aspartate等酸性残基开头的肽段，其N末端区域将带有明显的负电荷。
碱性三人组：Lysine（赖氨酸）、Arginine（精氨酸）和Histidine（组氨酸）。它们的侧链含有作为碱的含氮基团。它们的 $pK_a$ 值很高，意味着在 $\mathrm{pH}$ 7.4时，它们已经很容易地接受了一个质子并携带正电荷。
- Lysine有一个长而柔韧的烃链，末端是一个伯氨基（ $pK_a \approx 10.5$ ），该基团变为 $-\text{NH}_3^+$ 。
- Arginine拥有一个胍基，这是一种极强的碱（ $pK_a \approx 12.5$ ），在几乎所有生物条件下都带正电荷。
- Histidine是三者中最有趣的。它的咪唑环的 $pK_a$ 约为6.0，非常接近生理 $\mathrm{pH}$ 。这意味着它可以响应其局部环境的微小变化，在质子化（正电）和去质子化（中性）状态之间轻松切换。这使得Histidine成为一个主要的化学开关，并经常出现在酶的活性位点，在那里它可以来回穿梭质子以促进反应。

游戏规则：从字母表到语言

我们有了这个奇妙的20个字母的字母表。但细胞如何用它来书写呢？它如何知道在这里放一个Aspartate，在那里放一个Lysine？这是遗传密码和翻译奇迹的工作。对于20种标准氨基酸中的每一种，细胞都使用一种专门的酶，即氨酰-tRNA合成酶。这种酶是一位配对大师。它能识别一种特定的氨基酸及其对应的转移RNA（tRNA）分子，并将它们连接在一起。这个“带电荷的”tRNA随后将正确的氨基酸递送到核糖体。

这种一对一映射的必要性是深远的。想象一个假想的细胞，它拥有所有20种氨基酸，但只有19种合成酶。系统将面临模糊性的危机。一种酶将不得不处理两种不同的氨基酸，或者一种氨基酸将无法连接到任何tRNA上。遗传密码将变得败坏，错误的氨基酸会被插入蛋白质中，导致灾难性的错误折叠和功能丧失。这一整套合成酶的存在是翻译保真度的基石。

这引出了最后一个澄清点：是什么让这20种氨基酸成为“标准”的？毕竟，生物学家已经发现了其他氨基酸，比如Selenocysteine（硒代半胱氨酸）。虽然它被核糖体编入蛋白质，但它并不在标准名单上。为什么？因为它的掺入需要一个特殊的技巧。它由UGA密码子编码，而该密码子通常是向核糖体发出停止翻译的信号。只有当信使RNA中存在一个特殊的信号序列（SECIS元件）时，细胞的机器才会将这个终止信号“重新编码”为“插入Selenocysteine”。而“标准20种”则是那些由规范的、无歧义的遗传密码直接编码的氨基酸，无需任何特殊技巧。

最后，让我们把这一点带回到我们自己的身体。虽然所有20种氨基酸对于构建我们的蛋白质都是生物学上必需的，但它们并非都是营养上必需的。我们的代谢途径足够聪明，可以从头开始或从其他分子合成其中的大约一半。这些是非必需氨基酸。然而，另一半我们无法制造。这些是必需氨基酸——如Leucine、Lysine和Tryptophan——我们必须从我们饮食中的蛋白质中获取它们。这个简单的营养事实是我们进化历史的直接结果，也是一个有力的提醒：从字面上看，我们是由一个古老而优雅的、由20个化学词汇组成的字母表构建而成的，我们吃什么，就是什么。

应用与跨学科联系

我们已经探索了二十种常见氨基酸的基本原理，研究了它们的结构和化学特性。但要真正领会其重要性，我们必须看到它们在实际中的应用。了解字母表是一回事；能读懂用它写成的史诗则是另一回事。在本章中，我们将看到这二十个分子字母如何被用来构建生命机器，它们如何连接不同的科学领域，以及我们现在如何学习用它们来书写新的生物学故事。

无限可能的世界：生命的组合力量

让我们从一个简单的问题开始：你能制造多少种不同的蛋白质？想象一下，我们想构建一个只有三个氨基酸长的微小肽——一个三聚体。用我们20个字母的字母表，第一个位置有20个选择，第二个有20个，第三个也有20个。这给了我们 $20 \times 20 \times 20 = 20^3 = 8,000$ 种独特的三聚体。如果我们稍微扩展一下工具箱，就像合成生物学家经常做的那样，加入一些非标准氨基酸，数量增长得更快。用26个构建模块，可能的三聚体数量飙升至 $26^3 = 17,576$ 。

这是一个简单的计算，但它揭示了一个惊人的事实。大多数蛋白质不是三个氨基酸长，而是数百个。一个相对较小的、由100个氨基酸组成的蛋白质，可能存在于 $20^{100}$ 种可能的序列中。这个数字是1后面跟着130个零——一个远超可观测宇宙中原子估计数量的量。这个巨大的“序列空间”是进化数十亿年来进行创作的画布，产生了我们今天看到的巨大生物功能多样性，从消化食物的酶到抵抗疾病的抗体。

这种组合爆炸对自然来说是福，对现代蛋白质工程师来说却是祸。当科学家试图从头设计一种新酶，比如用来分解污染物时，庞大的可能性使得暴力搜索变得不可能。这就是为什么一个更常见的策略是，从一个已知的、稳定的蛋白质——一个“支架”——开始，只修改少数几个关键氨基酸来引入新功能。通过固定大部分序列，只改变 $L$ 个位置中的 $N$ 个，需要测试的序列数量从天文数字的 $20^L$ 减少到更易于管理的 $20^N$ 。这将搜索空间减少了 $20^{L-N}$ 倍，将一个不可能的问题变成了一个可解决的问题。

细胞的经济学：统一的代谢网络

看到这种巨大的多样性，你可能会想，大自然是否只是碰巧找到了20种随机的分子来构建其蛋白质。答案是响亮的“不”。这20种氨基酸的选择证明了新陈代谢美妙的经济性和其潜在的逻辑。生命并没有发明20条独立的、复杂的装配线。相反，它仅用少数几种简单的前体分子就构建了所有20种氨基酸的骨架。

这些前体从何而来？它们是细胞中心能量生成途径的关键中间产物：糖酵解、磷酸戊糖途径和三羧酸（TCA）循环。你可以将这些途径看作一个代谢城市的主要电网和制造中心。从这个中心基础设施中，细胞分流出仅仅七种简单的分子——如丙酮酸、 $\alpha$ -酮戊二酸和草酰乙酸——作为所有20种氨基酸的起始支架。例如，整个“谷氨酸家族”（谷氨酸、谷氨酰胺、脯氨酸和精氨酸）都是由TCA循环的中间产物 $\alpha$ -酮戊二酸构建的。这种模块化设计是效率的杰作，将生命基石的合成与细胞的能量状态紧密地整合在一起。

这个优雅的系统也对我们自身的健康有直接影响。人类已经失去了合成20种氨基酸中9种的生物合成途径。由于我们无法制造它们，我们必须从饮食中获取；这些就是“必需”氨基酸。如果一个生物体，无论是人还是细菌，缺少生物合成途径中哪怕一步的基因，它就会成为该化合物的“营养缺陷型”——它必须在环境中找到它才能生存。

剧中的角色：在生理学和信号传导中的独特作用

氨基酸不仅仅是可互换的砖块。每一种都拥有独特的侧链和独特的化学“个性”，这定义了它在生物戏剧中的角色。

考虑一下支链氨基酸（BCAAs）：Leucine、Isoleucine和Valine。它们庞大、非极性的侧链赋予了它们独特的性质。与大多数主要在肝脏中代谢的氨基酸不同，BCAAs优先被肌肉组织吸收和分解。在那里，它们可以在长时间运动中作为直接的能量来源。特别是Leucine，还作为一种强大的信号分子，触发刺激肌肉蛋白质合成的通路。这种与肌肉代谢的特殊关系使得BCAAs成为运动营养学的基石。

如果说BCAAs是氨基酸世界中强壮的运动员，那么其他氨基酸则扮演着更微妙的角色。Cysteine就是一个完美的例子。它的侧链含有一个巯基（ $-\text{SH}$ ），这个特性使其成为细胞通讯中的关键角色。它实现这一功能的最迷人的方式之一是通过一种称为S-亚硝基化的过程。信号分子一氧化氮（ $NO$ ）以其在调节血压中的作用而闻名，它可以与蛋白质上Cysteine残基的硫原子反应。这会附加上一个 $-\text{NO}$ 基团，形成一个S-亚硝基键。这种修饰就像一个分子开关，改变蛋白质的功能。至关重要的是， $S-\text{NO}$ 键相对较弱且不稳定，意味着它很容易形成和断裂。这种可逆性对于需要根据身体需求快速开启和关闭的瞬时信号系统至关重要。Cysteine独特的反应性使其能够充当细胞信号的动态传感器和转导器。

跨学科视角：解读生命的语言

氨基酸的重要性远远超出了生物学和生物化学的范畴，为从分析化学到进化理论等领域提供了必不可少的工具和概念。

我们究竟如何测量血液样本或食品中不同氨基酸的含量？这并不像听起来那么简单。大多数氨基酸是无色的，不发荧光，这使得它们在标准检测器下是“不可见的”。分析化学家们开发出一种巧妙的解决方案：柱后衍生化。在使用高效液相色谱法（HPLC）分离氨基酸后，将混合物与一种能让它们显色的化学物质反应。一种经典的试剂是茚三酮，它与19种氨基酸的伯氨基反应，产生一种在570纳米波长处吸收光线的亮紫色化合物。但对于Proline这个拥有仲氨基的特例呢？茚三酮仍然会反应，但会形成一种在不同波长440纳米处吸收的黄橙色产物。通过使用一个可以同时监测两个波长的检测器，化学家可以在一次运行中准确量化所有20种氨基酸。这是一个利用特定化学反应性进行实际测量的绝佳例子。

在实验室工作台之外，氨基酸序列本身就蕴含着生命的历史。在比较来自人类的蛋白质与其在细菌中的对应物时，我们如何评估其相似性？生物信息学使用诸如BLOSUM和PAM之类的取代矩阵来完成这项工作。这些矩阵为任何两种氨基酸的对齐分配一个分数，反映了在进化过程中一种氨基酸被另一种取代的频率。这些矩阵的一个关键特征是它们是对称的：用valine取代alanine的分数与用alanine取代valine的分数相同， $S(\text{Ala},\text{Val}) = S(\text{Val},\text{Ala})$ 。这种对称性并非任意的；它源于对进化本质的一个深刻假设：取代的底层过程是时间可逆的。这意味着，在统计层面上，从过去序列演化到当前序列的过程与从当前“退化”到过去的过程是无法区分的。这一深刻的原理将分子进化与统计物理学联系起来，正是它让我们能够构建这些强大的工具来解读用蛋白质序列写成的生命故事。

工程前沿：书写新的生物学故事

在学会了阅读氨基酸的语言之后，科学家们现在开始用它来书写。这就是合成生物学的领域，在这里，氨基酸被视为可编程的工程组件。

这可以像为微生物设计完美食物一样实用。通过对新发现细菌的基因组进行测序，我们可以确定它拥有哪些氨基酸生物合成途径，又缺少哪些。这精确地告诉我们哪些氨基酸对该生物是必需的——即其特定的营养缺陷型。掌握了这些知识，我们就可以配制出一种完美定制的、经济的“化学成分确定培养基”，只提供该细菌自身无法制造的营养物质，从而最大限度地促进其生长，以用于生物修复等工业应用。

更宏大的挑战是创造全新的蛋白质。正如我们所见，搜索空间太大，无法随机探索。取而代之的是，蛋白质工程师使用“定向进化”在试管中模拟自然选择，但时间尺度要快得多。一种强大的技术是位点饱和突变，科学家专注于蛋白质支架中的几个关键位置，并创建这些位点所有可能突变的文库。为了高效地做到这一点，他们使用简并密码子，如“NNK”（其中N是任何碱基，K是G或T）。这个巧妙的设计旨在编码多种氨基酸，同时最大限度地降低产生过早终止密码子的风险，因为终止密码子会终止蛋白质合成，成为实验的死胡同。

也许最令人兴奋的前沿是遗传密码本身的扩展。如果20个字母不够用怎么办？合成生物学家已经实现了曾经是科幻小说的设想：诱使细胞使用第21种非经典氨基酸（ncAA）。这是通过创建一个“正交对”来实现的：一个转移RNA（tRNA）和其匹配的酶（氨酰-tRNA合成酶，或aaRS），它们独立于宿主细胞的机器运作。新的tRNA被设计成识别一个终止密码子（如UAG），而新的aaRS则被进化成只用所需的ncAA来为该tRNA“充电”。为了从庞大的突变体文库中找到一个功能性的配对，人们使用了一种绝妙的选择策略。一个关键的生存基因，比如抗生素抗性基因，被修饰以在其中间包含一个UAG终止密码子。然后，在同时含有抗生素和ncAA的培养基中培养这些细胞。只有那些拥有功能性正交系统的稀有细胞才能通读该终止密码子，产生全长的抗性蛋白并存活下来。这为创造具有自然界前所未见的新化学性质的蛋白质和材料打开了大门。

从作为简单构建模块的角色，到它们在代谢、进化和合成生物学新前沿的核心地位，20种常见氨基酸揭示了一个令人叹为观止的优雅和无限潜力的世界。它们不仅仅是一份需要记忆的清单，而是一个动态且相互关联的系统，为我们提供了洞察生命世界运作方式的最深刻见解之一。