
探究先天(遗传)与后天(环境)在塑造人类特质中所扮演的角色,是科学领域最古老也最深刻的问题之一。一项“自然实验”带来了显著的突破:同卵(单卵)和异卵(双卵)双生子的存在。通过比较这两种双生子类型的相似度,行为遗传学的研究人员可以估算我们基因的影响力。然而,这一精妙的方法依赖于一个关键且常受争议的支柱:环境均等假设(Equal Environments Assumption, EEA)。该假设——即同卵双生子的环境在影响特定性状方面,并不比异卵双生子的环境更相似——是使简单的遗传度计算成为可能的关键。
本文将剖析这一至关重要的假设。在接下来的章节中,我们将首先探讨双生子研究方法的原理与机制,详细阐述ACE模型和Falconer公式如何用于计算遗传度,并揭示EEA在这一等式中所扮演的核心角色。随后,我们将审视其应用与跨学科关联,考察检验该假设的真实案例、违背该假设的后果,以及双生子研究的逻辑如何被扩展并整合到现代基因组学和流行病学研究中,以构建一幅更完整的人类多样性图景。
我们如何才能解开先天与后天那错综复杂、共同塑造了我们的丝线?数百年来,这个问题一直停留在哲学辩论的层面。但科学在不懈追求答案的过程中,偶然发现了一项极为非凡的自然实验:双生子的存在。
想象一下两种类型的双生子。首先是单卵(MZ)或“同卵”双生子。他们源于单个受精卵分裂为二,创造出两个在各种意图和目的上都是完美基因克隆的个体。他们是自然界的复印件。其次是双卵(DZ)或“异卵”双生子。他们由两个独立的卵子分别与不同的精子受精发育而来。在遗传上,他们与任何其他兄弟姐妹的相似度无异,平均共享50%的分离基因。他们只是碰巧共享了同一个子宫。
双生子研究的绝妙之处就在于这个简单的比较。如果某个特定性状——无论是身高、像“认知灵活性”这样的性格特点,还是“听觉模式识别”的天赋——受到我们基因的影响,那么我们可以预期同卵双生子在该性状上的相似度会高于异卵双生子。这个简单而有力的直觉构成了现代行为遗传学的基石。
为了将这一直觉转化为科学工具,我们需要一种进行“记账”的方法。想一想我们在人群中看到的某个性状的所有变异——为什么有些人高,有些人矮;有些人外向,有些人内向。这种可观察到的总变异被称为表型方差()。我们的目标是将其分解为基本来源。
完成这项任务最著名的“账本”是ACE模型。它提出,总方差可以被划分为三个独立的来源:
A:代表加性遗传方差(additive genetic variance)。这是“先天”部分。它代表了影响该性状的许多单个基因效应的总和。这是我们遗传继承中以直接、累加方式起作用的部分。
C:代表共同或共享环境(common or shared environment)。这是“后天”中使在同一家庭长大的双生子或兄弟姐妹彼此更相似的部分。它包括父母的社会经济地位、他们成长的社区、家庭饮食习惯以及共同的养育方式等。
E:代表独特或非共享环境(unique or non-shared environment)。这是“后天”中使个体(即使是在同一家庭中长大的同卵双生子)彼此不同的部分。它涵盖了从拥有不同的朋友或老师,到遭受独特的疾病或事故,甚至子宫内微小的生物学差异等一切因素。这个成分也很方便地包含了我们测量中的任何误差。
因此,我们解释人与人之间差异的宏大公式就是:。双生子研究的全部任务就是确定对于任何给定性状,A、C和E的相对大小。
现在我们可以将ACE模型与我们的双生子联系起来。两个双生子之间的相似度由一个称为组内相关性()的统计量来衡量,其范围可以从0(无相似性)到1(完全相同)。这个相关性反映了双生子共享的方差比例。
对于共享100%基因和100%共享环境的同卵(MZ)双生子,他们预期的相关性是遗传和共享环境成分的总和: (为简化起见,我们用A、C和E来表示总方差的比例,因此。)
对于平均共享50%基因但共享100%共享环境的异卵(DZ)双生子,他们预期的相关性是:
接下来就是巧妙的技巧了。看看这两个简单的方程。我们有两个方程和两个未知数(和)。我们可以解这个方程组!如果我们将DZ相关性从MZ相关性中减去,共享环境项就神奇地消掉了:
重新整理这个式子,我们得到了一个由遗传学家Douglas Falconer首次推导出的、极其简洁而强大的公式:
这个值,就是该性状的狭义遗传度(narrow-sense heritability, )——即总变异中可归因于加性遗传差异的比例。例如,在一项关于收缩压的研究中,研究人员可能发现和。使用Falconer公式,遗传度估计为。这表明在该人群中,大约74%的血压变异是由遗传因素造成的。 一旦我们得到了,我们就可以轻易地算出()和()。这种巧妙的减法让我们能够量化基因的影响。
值得注意的是,ACE模型中的只是总遗传方差的一部分。更复杂的遗传效应,如显性效应(单个基因的两个拷贝之间的相互作用)和上位效应(不同基因之间的相互作用),也有贡献。由所有遗传因素()引起的方差比例被称为广义遗传度(broad-sense heritability, )。简单的双生子研究为我们提供了对加性部分的良好估计,这通常是预测性状如何从父母传递给子女时最大且最重要的组成部分。
Falconer公式的美妙简洁性依赖于一个关键的隐藏假设。当我们减去这两个方程时,我们假设了项——即共享环境的贡献——对于同卵和异卵双生子是完全相同的。这就是著名的环境均等假设(EEA)。
EEA到底意味着什么?这是遗传学中最易被误解的概念之一。它并不意味着MZ和DZ双生子有相同的生活经历。这显然是错误的。它假设的是,那些使双生子在特定性状上更相似的环境因素,平均而言,对两种类型的双生子具有同等的影响力。
但这合理吗?一个直接的反对意见是,同卵双生子因为长相如此相似,很可能被父母、老师和朋友更相似地对待。也许他们被穿着相同的衣服,被鼓励培养相同的爱好,并且通常比异卵双生子更被视为一个“整体”。如果这种更相似的对待方式影响了我们正在测量的性状,那么MZ双生子的共享环境()就会大于DZ双生子的共享环境()。我们简单的减法就不再成立,整个纸牌屋似乎就要轰然倒塌。
幸运的是,科学家是一群多疑的人,他们不会不经检验就接受假设。几十年来,研究人员开发了各种巧妙的方法来探究EEA的有效性。
一种方法是直接测量。我们不只是假设环境均等,而是去测量它们。例如,一项研究可能会开发一个“父母对待相似度”评分。如果EEA被违背,我们预期会发现MZ双生子在这个评分上的被对待相似度高于DZ双生子。然而,真正的检验在下一步。我们可以使用统计方法来检验这种额外的环境相似性是否解释了MZ双生子在性状上的额外相似性。在一个假设性研究中,研究人员发现,在他们通过统计方法匹配了MZ和DZ双生子对,使其具有可比的环境相似性水平后,他们性状相关性的巨大差异几乎消失了。这表明,对于那个特定性状,MZ双生子更高的相似性确实是由于他们更相似的环境,而非他们的基因——这是对EEA的明确违背。
另一类检验依赖于巧妙的自然实验。那些被父母和同伴误认为是同卵的异卵双生子情况如何?如果他们的性状相似性更像其他DZ双生子而非MZ双生子,这表明“同卵”这个社会标签并非关键驱动因素,这实际上会支持EEA。
也许最精妙的检验来自MZ双生子自身的生物学特性。大约三分之二的同卵双生子是单绒毛膜(MC)的,意味着他们在子宫内共享一个胎盘及其血液供应。其余三分之一是双绒毛膜(DC)的,拥有独立的胎盘,就像所有DZ双生子一样。这种共享的胎盘环境可能是MC双生子产前相似性更高的一个来源。如果我们测量一个性状,发现MC双生子的相关性高于DC双生子(例如, vs. ),这就为一种可能违背EEA的纯环境效应提供了强有力的证据,因为这两个群体在遗传上是相同的。
那么,如果EEA被违背而我们未能考虑到它,后果会是什么?假设,正如普遍的反对意见所言,MZ双生子经历了一剂额外的与性状相关的共享环境,我们可以称之为。世界的真实情况将是:
如果我们天真地应用Falconer公式,我们对遗传度()的估计就变成:
这个结果极其重要。额外的环境相似性()并不仅仅是被误认为是环境。它被加倍并错误地归因于遗传成分。违背EEA会导致遗传度估计值被人为夸大。同时,对共享环境的估计()则被人为压低,因为它被计算为。本应归功于后天的方差被错误地记入了先天的账户。
环境均等假设是一个强大的简化,尽管它在许多检验中表现得相当不错,但它仍然是经典双生子研究的“阿喀琉斯之踵”。要绕过这个假设,我们需要更强大的研究设计。
分离基因和环境的“黄金标准”是领养研究,尤其是那些包含分开抚养的双生子的研究。
在不同家庭中长大的同卵双生子共享100%的基因,但没有共享的家庭环境。因此,他们之间的相关性是对遗传度的一个非常直接的估计,不受的混淆影响。
在同一家庭中长大的无血缘关系的领养兄弟姐妹共享家庭环境,但没有共享基因。他们的相关性提供了对共享环境影响的直接估计,不受遗传混淆。
通过将来自这些以及其他家庭关系(例如,非双生子兄弟姐妹、半兄弟姐妹)的数据整合到大型、复杂的模型中,遗传学家可以生成更稳健、更可靠的先天与后天影响的估计值,超越简单双生子设计的假设,描绘出一幅日益丰富的人类多样性成因图景。
在窥探了经典双生子研究的内部机制后,我们可能会以为自己找到了一个神奇的公式。我们有这样一个极其简单的配方:测量同卵和异卵双生子的某个性状,计算两个相关性,然后——瞧!——一个名为“遗传度”的数字就诞生了,它巧妙地分开了先天和后天的贡献。这种优雅不容否认。对于许多性状,从像社交焦虑这样的心理倾向到像冲动攻击这样的行为模式,使用Falconer公式 进行的初步计算,为我们提供了一个有力(尽管可能引人深思)的起点。这是一个绝佳的例子,说明了对“自然实验”——即双生子这一偶然事件——的巧妙观察如何能被转化为一种量化工具。
但在其最精粹的形式中,科学是一项永不满足的事业。一个优雅的答案并非终点,而是提出更深刻、更具挑战性问题的邀请。这些问题中最重要的一个直指我们双生子研究引擎的核心:那个“环境均等假设”怎么办?如果同卵双生子的世界系统性地比异卵双生子的世界更相似,那我们那个简洁的小计算会发生什么?
让我们从一种常见的病症开始我们的侦探工作:发展过敏的倾向,一种被称为特应性(atopy)的状况。研究人员发现,同卵双生子在特应性上的相关性高于异卵双生子。应用我们的公式,我们可能会得出结论,特应性有显著的遗传成分。但让我们停下来思考一下。父母、朋友和老师对待同卵双生子的方式是否比对待异卵双生子更相似,并且这种相似性专门影响了他们的免疫系统?也许是。如果是这样,我们的假设就被违背了。同卵双生子之间这种额外的环境相似性被误认为是遗传效应,因为我们的公式无法区分它们。结果呢?我们对遗传度的估计被人为地夸大了。我们标记为“先天”的一部分,实际上是伪装成“后天”的因素。
这不仅仅是一个假设性的担忧。我们可以通过超越简单的双生子设计,引入更丰富的角色阵容来检验它。考虑一项针对一种看似随机的疾病——阑尾炎——的精湛流行病学调查。表面上看,它具有家族性——如果你的兄弟姐妹得了,你自己的风险也会升高。这是因为共享的基因使人易患阑尾炎吗?
为了找出答案,我们可以比较不同类型的配对。最具启发性的比较是在出生时被收养并在不同家庭中长大的亲生兄弟姐妹,与被收养到同一家庭的无血缘关系的孩子之间进行。第一对共享基因但没有共享环境;第二对共享环境但没有共享基因。这样一项研究的数据讲述了一个引人入胜的故事:与一个患病但无血缘关系的同住兄弟姐妹共享家庭环境所带来的风险,实际上大于与一个你从未共同成长但共享一半基因的患病兄弟姐妹共享基因所带来的风险。这与简单的遗传故事所预测的截然相反!它表明阑尾炎的“家族性”更多地与共享的家庭环境有关——或许是共同接触特定的肠道微生物或饮食习惯——而不是共享的DNA。来自双生子研究的正式遗传度估计,虽然不为零,但很可能是一个高估值,正如我们对过敏的怀疑一样。这个漂亮的研究设计,通过整合来自不同家庭结构的证据,让我们能够揭开环境均等假设的幕布,看到真实的情况。
那么,遗传度总是一种幻觉,一个由错误假设 conjured 出来的幽灵吗?完全不是!这种科学方法的美妙之处在于它不会每次都给出相同的答案。让我们从阑尾转向大脑,考虑像分裂样精神障碍这样的严重精神疾病的案例。
在这里,侦探故事得出了一个截然不同的结论。当我们集结我们的角色——双生子、被领养者以及他们的亲生和领养亲属——时,强有力的遗传贡献的证据是压倒性的且趋于一致。一个患者的同卵双胞胎的患病风险远远高于异卵双胞胎。更有说服力的是,患有该障碍的父母被领养出去的亲生孩子,与普通人群相比,其风险显著升高。形成鲜明对比的是,由一个患病的领养父母抚养长大的领养儿童,其风险几乎没有增加。
与阑尾炎的故事不同,在这里,遗传纽带的呼声响亮,而共享环境的低语几乎听不见。领养数据不受环境均等假设的影响,为双生子研究首次探测到的信号提供了强有力的、独立的证实。这表明该方法并非一招鲜;它是一种真正的发现工具,能够揭示不同人类特质的迥异构造。对于某些特质,家庭相似性是环境性的;对于另一些,它则被写入了我们的遗传密码。
当然,自然界很少像“基因对环境”那么简单。最激动人心的发现往往在于两者之间错综复杂的舞蹈。经典双生子模型,在其简单形式下,有时会忽略这种编舞的微妙之处。
其中一种舞蹈动作被称为基因-环境相关性,即我们的遗传倾向会影响我们所经历的环境。例如,在对神经性贪食症等饮食失调的研究中,观察到具有较高遗传易感性的个体,可能通过其行为或气质,引来同伴和家人更多与体重相关的批评。这种批评是一个环境因素,但它不是随机的——它与个体的基因相关。一个经典双生子研究,由于无法看到这种细微差别,会将整个效应归因于遗传,再次夸大遗传度的估计。先天和后天不是独立的行动者,而是陷入了一个反馈循环。
另一个关键概念是素质-应激模型,它为思考易感性提供了一种更复杂的方式。在这里,基因(素质)并不直接导致疾病;它们创造了一种潜在的脆弱性,就像给枪上膛。然后需要一个环境因素(应激)来扣动扳机。我们在双生子研究中测量的遗传度,不是疾病本身的遗传度,而是潜在易感性的遗传度。这解释了一个关键事实:遗传度不是一个普适的自然常数。它是特定群体在特定环境下的一个属性。在高应激环境中,扳机被频繁扣动,脆弱性的遗传差异可能变得更加明显,遗传度可能看起来更高。在低应激环境中,同样的遗传差异可能处于休眠状态。
双生子研究的基本逻辑——利用“自然实验”进行因果推断——已经启发并被整合到一个更广泛的科学工具箱中。
流行病学中一个最强大的现代工具是孟德尔随机化(MR)。与双生子方法一样,MR利用减数分裂的随机抽签来解开因果关系。它不是利用被“随机”分配为MZ或DZ双生子的身份,而是利用特定基因变异的随机分配作为代理或“工具变量”,来检验可变暴露(如胆固醇水平)对健康结果(如心脏病)的因果效应。虽然它们的目标不同——双生子研究划分方差,而MR估计特定的因果效应——但它们在哲学上是近亲,都源于同一个巧妙的想法:利用遗传学作为相关性汹涌海洋中的一个锚点。
现代基因组学的爆炸式发展也与经典双生子研究展开了深入对话。全基因组关联研究(GWAS)使我们能够构建多基因风险评分(PRS),这些评分汇总了数千个基因变异的效应。当我们将PRS解释的性状方差与双生子研究估计的遗传度进行比较时,我们常常发现一个巨大的差距。例如,双生子研究可能表明神经性贪食症的遗传度为60%,而最好的PRS可能只解释了几个百分点的方差。这个“遗传度缺失”之谜并没有否定双生子估计的有效性;相反,它凸显了遗传结构的巨大复杂性以及我们当前基因组工具的局限性。
这引导我们去设想一个真正全面、现代化的研究会是什么样子。它不会是一个简单的设计,而是一个强大的综合体:一个“双生子-领养队列”,不仅包括双生子,还包括被领养者、他们的亲生和领养家庭,以及继兄弟姐妹。它不会用单一的问卷来测量感兴趣的性状,而是用一系列的访谈、观察和知情人报告。至关重要的是,它会直接测量环境,并使用基因分型来确认卵性、构建多基因评分,并检验基因-环境的相互作用。这是行为遗传学未来的蓝图——一个既尊重原始双生子设计的简洁优雅,又拥抱现实世界复杂性的未来。
事实上,其核心逻辑是如此强大,以至于可以扩展到探索遗传的前沿领域。我们能否利用这些设计来寻找更奇特的机制,比如跨代表观遗传?通过构建能够预测亲属间特定协方差模式的模型——例如,比较一个被领养者与他/她亲生母亲和亲生父亲的相似度,或者与他/她外祖母和祖母的相似度——我们原则上可以从标准孟德尔遗传的信号中分离出母系传递的表观遗传标记的独特印记。这场始于两种双生子简单比较的旅程,如今将我们带到了进化生物学的前沿,证明了一个优美简洁想法的持久力量。