表型方差的分解

玻尔百科

定义

表型方差的分解是数量遗传学中的一个基础框架，它将群体内的总表型变异在数学上分解为遗传来源和环境来源。该方法通过识别决定遗传性的加性遗传方差，来衡量性状对自然选择或人工选择的响应程度。这一理论框架被广泛应用于农业和医学领域，用于预测演化变化并解析复杂性状。

核心要点

一个群体中的总表型方差 ( $V_P$ ) 可以在数学上分解为遗传 ( $V_G$ ) 和环境 ( $V_E$ ) 来源，从而量化“先天”与“后天”的争论。
只有遗传方差中的加性部分 ( $V_A$ ) 能够稳定地传递给后代，这使得狭义遗传力 ( $h^2$ ) 成为性状响应自然选择或人工选择的关键决定因素。
遗传力不是一个性状的固定属性，而是一个特定于特定环境下的特定群体的动态度量。
方差分解框架是一个基础工具，用于预测进化变化和解析从农业到人类医学等领域的复杂性状。

引言

生命的巨大多样性，从兄弟姐妹间的细微差异到生态系统中万千物种的形态，长期以来一直吸引着人类的好奇心。几个世纪以来，这种变异一直被框定在“先天与后天”的哲学辩论中。然而，现代生物学已将这个定性问题转变为一门定量科学。其关键在于我们能够系统地将任何性状的可观察变异——即其表型方差——分解为可归因于遗传和环境的组分。这种方法为我们理解遗传、适应以及进化的内在机制提供了一个强有力的视角。

本文对这一基本概念进行了全面概述。第一章“原理与机制”将介绍核心方程 $V_P = V_G + V_E$ ，深入探讨不同类型的遗传方差（加性、显性和上位性），并定义广义和狭义遗传力这两个关键概念。我们将看到这些组分如何决定一个性状的进化潜力。第二章“应用与跨学科联系”将展示该框架的深远效用，探讨方差分解如何成为现代农业的基石、解析人类性状的关键工具，以及进化生态学和生物医学科学前沿研究的基本方法。读完本文，您将不仅理解生物变异的“是什么”，还将理解其“为什么”。

原理与机制

为什么我们并非千篇一律？看看你周围——你的朋友、家人，公园里的树木，喂食器旁的鸟儿。变异是生物世界的基本构成。几个世纪以来，这个简单的观察是“先天与后天”这一永恒辩论的源头。但现代科学已将这个哲学论证转变为一个定量的研究领域。我们现在可以剖析我们所看到的变异——我们称之为表型方差（ $V_P$ ）——并将其来源归于不同的原因。我们如何做到这一点的过程是一个充满科学巧思的精彩故事。

伟大的分解：量化的先天与后天

让我们从一个最简单的想法开始。任何可观察的性状，从鱼的体长到羽毛的亮度，都是两大影响因素的产物：生物体的基因构成和其所经历的环境。用数量遗传学的语言，我们可以写下一个优美而大胆的方程：

$V_P = V_G + V_E$

在这里， $V_P$ 代表我们在一个群体中可以测量的总表型方差。 $V_G$ 是由个体间基因差异引起的那部分方差，而 $V_E$ 是由他们环境差异引起的那部分方差。乍一看，这似乎只是一个会计恒等式，但它是一个极其有力的陈述。它表明我们可以为先天和后天赋予数值。

例如，想象一组研究人员在一个大水族箱中研究孔雀鱼的体长。他们测量了数千条鱼，发现总方差 $V_P$ 为 $36.5 \text{ mm}^2$ 。通过巧妙的育种分析（我们稍后会探讨），他们确定遗传方差 $V_G$ 为 $21.2 \text{ mm}^2$ 。利用我们的简单方程，我们立刻知道环境方差 $V_E$ 必定是谜题的剩余部分： $V_E = 36.5 - 21.2 = 15.3 \text{ mm}^2$ 。就这样，我们将连续的变异图谱分解为离散的、可量化的组分。

破解密码：如何将基因与环境分离

但是你可能会问，我们究竟如何才能将这两种相互交织的力量分离开来？科学史上一些最杰出的实验就诞生于这样一个简单的“你怎么可能知道？”的问题。答案在于一个优雅而简单的策略：消除一个变异来源，以分离出另一个。

设想一位聪明的遗传学家在研究蕨类植物。她取一株蕨类植物并进行克隆，创造出一个由基因完全相同的个体组成的大群体。由于每株植物都拥有完全相同的基因组，该群体的遗传方差（ $V_G$ ）根据定义为零。然后她将这些克隆体种植在自然森林中，让它们经历不同的光照和土壤条件。她测量了它们的叶状体长度，发现（不出所料）它们的长度并不完全相同；其长度的方差为 $5.0 \text{ cm}^2$ 。这种变异从何而来？不可能是来自它们的基因。因此，这个值必定是对环境方差 $V_E$ 的纯粹测量。

现在是第二幕。这位遗传学家从野外收集了多样化的孢子样本，代表了该蕨类植物群体的全部基因彩票。她将这些孢子在完全相同的林下环境中培育。这一次，她测得的总表型方差（ $V_P$ ）为 $42.0 \text{ cm}^2$ 。这个总方差同时包含了遗传和环境组分。但由于我们已经从克隆群体中得到了一个极佳的 $V_E$ 估计值，我们可以进行简单的减法运算： $V_G = V_P - V_E = 42.0 - 5.0 = 37.0 \text{ cm}^2$ 。我们破解了密码。

这使我们能够定义一个关键概念：广义遗传力（ $H^2$ ）。它就是总表型方差中由任何类型的基因差异所引起的部分所占的比例：

$H^2 = \frac{V_G}{V_P}$

对于我们的蕨类植物， $H^2 = \frac{37.0}{42.0} \approx 0.881$ 。这告诉我们，在该森林中，叶状体长度的可观察变异中有超过 88% 可归因于蕨类植物之间的遗传差异。这是在给定群体和环境中，衡量一个性状受遗传决定程度的指标。

难以驾驭的遗传：并非所有遗传方差都生而平等

至此，我们的故事进入了一个更深刻、更微妙的转折。简单地说一个性状是“遗传的”并不是故事的结局，而是一个新篇章的开始。术语 $V_G$ 是一个包罗万象的统称，一个黑箱。要真正理解遗传和进化，我们必须撬开它。当我们这样做时，我们发现遗传方差并非一个单一的实体，它本身由不同的部分组成，每个部分的行为方式都独一无二。完整的分解如下：

$V_G = V_A + V_D + V_I$

让我们来看看这些组分中的每一个，因为它们是我们进化戏剧中的角色：

加性遗传方差 ( $V_A$ ): 想象基因就像乐高积木。你从父母那里遗传的每个等位基因都有一个微小的、独立的效果，这个效果会简单地与其他等位基因的效果相加。一个“高”等位基因增加一点身高，一个“矮”等位基因减少一点。最终的表型是这些部分的总和。这是遗传中表现良好、可预测的组分。它被称为加性方差，因为等位基因的效果是累加的。
显性方差 ( $V_D$ ): 这个组分捕捉了同一基因座上等位基因之间发生的“意外”互作。例如，一个杂合子（基因型Aa）的表型可能不完全是两个纯合子（AA和aa）的中间值。等位基因可能以非加性的方式相互作用。这种特定的Aa组合在每一代中都是新产生的，并且当个体产生配子时又会被拆散。因此，虽然显性是一种遗传现象，但其效应并不能以一种简单、可预测的方式从亲代传递给子代。
上位性方差 ( $V_I$ ): 如果说显性是局部互作，那么上位性就是不同基因座上基因之间的共谋。一个基因上的等位基因的效果可能完全取决于基因组中远处另一个基因上存在的等位基因。这就像一个复杂的食谱，其中添加酵母的效果取决于是否存在糖。这些错综复杂的基因网络产生的表型效应高度依赖于整个基因组中等位基因的特定组合——而这个组合在每一次有性生殖中都会被重组彻底打乱。

进化的通货：加性方差与狭义遗传力

为什么这堆“字母汤”般的方差如此重要？它之所以重要，是因为它区分了驱动进化的那部分遗传与不驱动进化的那部分。想一想一个核心观察：后代往往与父母相似。遗传组合的哪一部分导致了这种可预测的相似性？不可能是显性或上位性，因为那些特殊的、互作的等位基因组合会被减数分裂拆散和重组。那部分能够忠实地从一代传递到下一代，并导致这种相似性的方差组分，就是加性遗传方差， $V_A$ 。

我们来到了可以说是进化数量遗传学中最重要的单个概念：狭义遗传力 ( $h^2$ )。它被定义为总表型方差中仅由基因的加性，“乐高积木式”效应引起的那部分比例：

$h^2 = \frac{V_A}{V_P}$

这个数字， $h^2$ ，是进化的真正通货。它是衡量一个性状进化潜力的指标。进化响应的基本定律，即育种家方程，指出一个群体的平均表型从一代到下一代的变化（ $R$ ，代表响应）是狭义遗传力与选择强度（ $S$ ，选择差）的乘积：

$R = h^2 S$

这是一个优美而强大的方程。它告诉我们，如果没有加性遗传方差（ $V_A = 0$ ，因此 $h^2=0$ ），那么无论你对一个性状进行多么强烈的选择，该群体都不会进化。自然选择只有在存在可遗传的加性变异供其作用时，才能产生持久的变化。

$H^2$ 和 $h^2$ 之间的区别至关重要。虽然 $H^2$ 告诉我们总共有多少变异是遗传的，但 $h^2$ 告诉我们有多少是可在选择作用下进化的。它们之间的差异， $H^2 - h^2$ ，量化了被锁定在显性和上位性等非加性遗传效应中的那部分变异的比例。

完美的悖论：为何适合度不是完全可遗传的？

这引出了一个奇妙的悖论。自然选择最直接地作用于生物体的相对适合度——其在生存和繁殖上的总体成功。如果选择如此强大并且需要加性方差 ( $V_A$ ) 才能起作用，难道它不应该在很久以前就将适合度推向完美，并在此过程中耗尽所有的加性方差吗？

伟大的统计学家和生物学家 Sir Ronald A. Fisher 指出，这正是我们应该预期的。他的自然选择基本定理阐明，一个群体平均适合度的增长速率等于适合度本身的加性遗传方差（ $V_A(w)$ ）。其含义是惊人的：只要适合度存在任何加性方差，选择就会对其起作用，提高平均适合度，并在此过程中消耗自身的燃料。这就像一团火烧尽其可用的木材。

因此，对于与适合度密切相关的性状，我们预计持续的定向选择已经基本耗尽了加性方差。在进化平衡状态下，适合度的 $V_A$ 应该非常低，仅靠新突变的涓涓细流来维持。这意味着适合度本身的狭义遗传力 ( $h^2$ ) 预计会很低。然而，大量的非加性遗传方差（ $V_D$ 和 $V_I$ ）仍然可以隐藏在群体中，这意味着适合度的广义遗传力 ( $H^2$ ) 仍然可以相当可观。这是一个优美而反直觉的结果，揭示了消耗可遗传变异的选择与提供变异的突变之间的动态张力。

当世界碰撞：全景图

我们目前的模型 $V_P = V_G + V_E$ 包含了一些潜在的、简化的假设。真实世界还有最后一层关键的复杂性，它完善了我们的图像。如果最好的基因组合取决于环境会怎样？如果某些基因更有可能在某些环境中被发现又会怎样？

基因型-环境互作 ( $V_{G \times E}$ )：当不同的基因型对环境变化的反应不同时，就会发生这种情况。我们可以用反应范式（reaction norms）来将其可视化，这是一种绘制基因型在不同环境范围内的表型的图表。如果不同基因型的线是平行的，它们的相对表现是恒定的。但如果这些线不平行，甚至交叉，我们就有了G×E互作。

一个令人震惊的假设性例子清楚地说明了这一点。想象两个植物克隆。在一个环境良好、水分充足的花园里，克隆1表现最佳，它们之间的变异纯粹是遗传的（ $h^2 = 1$ ）。在一个严酷干旱的花园里，克隆2更优越，但同样，它们之间的变异也完全是遗传的（ $h^2 = 1$ ）。然而，它们的反应范式交叉了——“最佳”基因型发生了改变。如果一位生态学家愚蠢地将两个花园的数据合并，这两个克隆在两种环境下的平均表现将变得完全相同！突然之间，合并数据集中的加性遗传方差（ $V_A$ ）将崩溃为零，计算出的遗传力将变为 $h^2 = 0$ 。所有的表型方差现在在统计上都被定义为互作方差 ( $V_{G \times E}$ )。这给我们上了一堂最深刻的课：遗传力不是一个性状的固定、恒定的属性。它是一个群体在特定环境集合中的属性。

基因型-环境协方差 ( $\mathrm{Cov}(G,E)$ )：这是现实世界中出现的另一个复杂情况。它描述了基因型在不同环境中的分布不是随机的情况。例如，一个奶牛场主可能会给产奶基因最好的奶牛提供最高质量的饲料。在这里，优越的基因型与优越的环境系统地相关。这种非随机的关联在我们的方程中增加了一个必须考虑的协方差项。

因此，我们得到了表型方差的完整、宏伟的分解：

$V_P = V_G + V_E + V_{G \times E} + 2\mathrm{Cov}(G,E)$

我们必须记住 $V_G$ 本身是由 $V_A + V_D + V_I$ 组成的。从一个简单的想法 $P = G + E$ 开始，现已发展成一个复杂的框架。这个方程中的每一项都讲述了一个独特的故事，关于生物体携带的基因与其居住的世界之间错综复杂而美丽的舞蹈。它本身就是生命复杂性的数学体现。

应用与跨学科联系

既然我们已经煞费苦心地将生物世界美丽而混乱的多样性分门别类，放入 $V_G$ 、 $V_E$ 及其同类这些整齐的统计盒子中，你可能会忍不住问：这有什么意义？这仅仅是生物学家的一项复杂的会计工作吗？答案，我希望你会和我一样觉得欣喜，是一个响亮的“不”。方差分解不是对过去的总结；它是理解现在，并且最了不起的是，预测未来的工具。它是科学家理解宇宙变化杠杆的指南，一个从农田延伸到现代医学前沿的智力框架。

育种家方程：预测进行中的进化

让我们从这些思想最直接、或许也是最古老的应用开始：指导进化过程本身。几千年来，人类一直在塑造我们周围的生物，选择最饱满的谷物、最忠诚的狗和最高产的牲畜。这就是人工选择。但在大部分历史中，这是一种艺术，而非科学。数量遗传学将其变成了一门预测性科学。

想象你是一位想要培育更高向日葵的植物学家。你看着你的田地，看到各种不同的高度。这是你的总表型方差， $V_P$ 。你知道这种变异一部分是由于遗传（ $V_G$ ），一部分是由于幸运的土壤或阳光（ $V_E$ ）。如果你想培育更高的植物，你不能只挑选最高的那些然后期待最好的结果。为什么？因为一株特别高的植物可能只是一个基因普通的个体，恰好碰上了一块施了肥的好地。它的后代不会继承它的好运。你需要知道的是，在最狭义的意义上，方差的哪一部分是可遗传的——即哪一部分是由亲代忠实传递给后代的加性遗传效应造成的。这就是狭义遗传力， $h^2 = V_A / V_P$ 。

我们如何测量这个神奇的量？最优雅的方法之一就是简单地将子代的性状与亲代性状的平均值进行绘图。如果你测量了许多对向日葵亲本的高度，然后再测量它们后代的高度，你会发现这些点形成了一个有趋势的点云。最能拟合这个点云的直线的斜率就是狭义遗传力 $h^2$ 的直接估计值。陡峭的斜率（接近1）意味着高大的亲本会产生非常高大的后代——该性状是高度可遗传的。平缓的斜率（接近0）意味着亲本高度对后代高度的预测能力很差。那个简单的斜率不仅仅是一个数字；它是一个预言。它直接代入“育种家方程”，告诉你对于给定的选择压力，你的下一代向日葵会高出多少。这一原理是现代农业和动物育种的基石，是一个建立在方差分解之上的价值数十亿美元的产业。

解开先天与后天之结：人类的背景

从向日葵，我们很容易就能跳跃到对我们自身提出同样的问题。探寻人类行为和生理差异根源的追求——永恒的“先天与后天”之辩——其核心就是一个方差分解问题。虽然我们不能对人类进行育种实验，但大自然为我们提供了一个非凡的实验：双胞胎。

同卵（单卵）双胞胎源于单个受精卵，实际上共享100%的基因。异卵（双卵）双胞胎的亲缘关系不比普通兄弟姐妹更近，平均共享50%的分离基因。通过比较同卵双胞胎对中某个性状的相似性与异卵双胞胎对中的相似性，我们可以开始估计 $V_G$ 的大小。但当我们考虑到被收养并在不同家庭中长大的双胞胎时，故事变得更加有趣。通过比较一起长大的同卵双胞胎和分开长大的同卵双胞胎，我们可以施展一个惊人的技巧。一起长大的双胞胎比分开长大的双胞胎更相似的程度，为我们提供了对共享家庭环境方差 ( $V_{Ec}$ ) 的估计，这是“后天”的组成部分，包括教养方式、社会经济地位和饮食。

这个看似简单的比较一直是行为遗传学中最强大的工具之一，为从人格特质到精神疾病易感性等所有事物的遗传力提供了见解。然而，这种力量伴随着重大的责任。科学史上充斥着对这些概念误解或滥用的警示故事。例如，20世纪初的优生学家常常观察到像“流浪癖”或贫困这样的性状在家族中遗传，并轻率地断定这主要是遗传的。他们犯了一个致命的统计错误：他们忽略了基因-环境协方差， $\mathrm{Cov}(G,E)$ 。他们没有认识到，在许多社会中，父母的遗传倾向（可能与社会地位或机会相关的性状）强烈影响着他们孩子成长的环境。拥有高学术成功潜力的孩子更有可能在一个充满书籍的环境中成长。忽略这种协方差会导致对遗传影响的高估，并可能为可怕的社会政策提供虚假的“科学”依据。方差分解不仅仅是关于数字；它关乎正确识别方程中的所有项。

超越简单加和：一个动态互作的世界

简单的模型 $V_P = V_G + V_E$ 是一个优美而有用的起点，但生物世界很少如此简单。方差分解框架的真正力量在于其扩展和容纳生物学光辉复杂性的能力。

首先，我们必须摒弃遗传力是性状的一个固定的、普适常数的想法。它不仅是性状的属性，也是特定群体在特定环境中的属性。想象一种珍稀的高山植物，被种植在温室舒适、受控的条件下。由于所有植物的水分和养分都相同，环境方差（ $V_E$ ）很低。我们看到的叶片大小差异几乎都必须归因于基因，因此遗传力（ $H^2$ ）很高。现在，将同一个群体种植在严酷、多风的山坡上。一些种子落在岩石、干燥的地块，另一些则落在更隐蔽、湿润的地方。环境方差 $V_E$ 急剧增加。尽管该群体的遗传方差 $V_G$ 没有改变，但它对总方差的贡献现在被巨大的环境效应所掩盖。结果，叶片大小的遗传力骤降。这是一个至关重要的教训：一个性状在一种情境下是“高度遗传的”，并不能说明它在另一种情境下的决定性。

接下来，我们必须考虑到基因和环境不仅仅是简单相加，而是在进行对话。这就是基因-环境互作 ( $V_{G \times E}$ ) 的概念。一个基因的实际效应会根据上下文而改变。一个经典的例子可以在像Arabidopsis thaliana这样的植物的开花时间中看到。某个特定的基因变异在短日照周期下可能对开花时间有强大影响，但在长日照周期下几乎不起作用。基因的效应不是恒定的；它是条件性的。这在生物学中不是例外，而是常规。我们的遗传蓝图不是一份静态的指令清单；它是一个响应环境线索的动态脚本。

这种情境依赖性的思想甚至更深。一个基因的“环境”包括基因组中的其他基因。一些基因充当主调控因子或缓冲器。在正常的遗传背景下，它们的存在可以掩盖许多其他基因座上变异的影响。但如果你禁用了这一个调控基因——比如说，一个修饰DNA包装蛋白的基因——大量先前隐藏的或“隐蔽”的遗传变异就可能被释放出来，导致像体重这样的性状的表型方差急剧增加。这揭示了基因组是一个有弹性的、相互连接的网络，具有创造出稳健生物体的多层调控，并将数量遗传学的原理与表观遗传学的分子世界联系起来。

现代生物学家的工具箱：从田野到培养皿

有了这个复杂的框架，现代生物学家正在跨所有学科解决极其复杂的问题。

在野外，进化生态学家希望了解生物如何适应其自然栖息地。利用经过数十年田野工作拼凑出的复杂谱系，他们采用一种称为“动物模型”的强大统计方法。该模型不仅可以同时解析一个性状（如野生哺乳动物的体重）的方差，将其分解为通过谱系传递的加性遗传 ( $V_A$ )，还可以分解为母体照料的影响（母体效应）和个体生命中其他持续存在的特质（永久环境效应）。与此同时，他们进行着精巧的实验。为了检验两个竞争物种是否在驱动彼此的进化——一个称为性状替换的过程——他们使用共同花园实验和交互移植实验。通过在共享的实验室环境中饲养来自不同地点的昆虫，他们可以判断像口器长度这样的性状差异是否真的是遗传的。通过将它们移植回有或没有竞争者的不同野外地点，他们可以测量进行中的自然选择。这使他们能够通过实验将遗传分化与即时可塑性分离开来。

同样的逻辑也延伸到了生物医学科学的最前沿。研究人员利用人类干细胞制造“迷你大脑”（类器官）来研究神经系统疾病，面临着一个巨大的挑战：变异性。一个类器官的发育可能因供体的基因、干细胞系建立时发生的随机突变，或者仅仅因为它在孵化器中处于一个“坏批次”而有所不同。为了找到候选疾病基因的真实效果，科学家必须使用方差组分模型来解释所有这些噪音来源：由供体引起的方差、由特定细胞克隆引起的方差以及由实验批次引起的方差。这与动物育种家使用的逻辑完全相同，但应用于培养皿中的神经元系统，一切都为寻找人类疾病的治疗方法服务。即使是一个看似技术性的问题，比如是在线性尺度还是对数尺度上分析数据，也变得至关重要；选择错误的尺度可能会违反模型的假设，导致对遗传力的错误估计，因为一个乘法过程 ( $P = G \times E$ ) 需要进行对数转换才能变成加性过程 ( $\ln(P) = \ln(G) + \ln(E)$ )。

结论：变异的统一性

表型方差的分解，最初只是作为作物改良的简单工具，现已发展成为一个普适的智力框架。它为我们提供了一种语言和一种方法，来剖析任何复杂系统中差异的起源。它教导我们，遗传力并非宿命，先天与后天处于持续对话之中，而“事物为何不同？”这个问题的答案永远与情境相关。从简单图表上一条线的斜率，到解析来自类器官数据的复杂统计模型，其核心思想始终如一：这是一种深刻而有力的方式，用以理解生命那壮丽、多变的织锦。