try ai
科普
编辑
分享
反馈
  • 分子流行病学

分子流行病学

SciencePedia玻尔百科
核心要点
  • 分子流行病学将病原体基因组用作历史记录,通过遗传相似性来推断近期的传播事件。
  • 全基因组测序(WGS)提供高分辨率数据,这对于区分密切相关的感染和重建详细的疫情暴发图谱至关重要。
  • 系统动力学通过分析系统发育树的分支模式来估算流行病学参数,例如有效再生数(RtR_tRt​)。
  • “同一健康”理念应用这些基因组工具来追踪跨越人类、动物和环境的病原体,这对于研究人畜共患病和抗菌素耐药性至关重要。

引言

在与传染病的斗争中,公共卫生官员长期以来扮演着侦探的角色,他们拼凑线索以了解疫情如何开始和传播。然而,传统方法往往难以揭示完整的故事,常常遗漏连接不同病例的无形传播链。如果我们能阅读病原体自身的日记呢?这正是分子流行病学的承诺,一个将基因组学的精确性与流行病学的人群层面洞察力相结合的革命性领域。通过解码病毒和细菌的遗传物质,我们可以创建高分辨率的疫情图谱,揭示其起源、追踪其路径并预测其下一步动向。

本文将带领您进入分子流行病学的世界,旨在让您对其力量和实践有一个基础的理解。我们将从​​原理与机制​​一节开始,探索那些让我们能够将基因序列转化为可操作的公共卫生情报的核心概念。您将学习到突变如何充当面包屑踪迹,全基因组测序如何提供必要的细节,以及系统发育树和分子钟如何重建疫情暴发的历史。在​​应用与跨学科联系​​一节中,我们将看到这些原理的实际应用,审视分子流行病学如何被用来解决现实世界的问题——从追踪医院内的疫情暴发和抗菌素耐药性,到指导疫苗开发,甚至揭示癌症的遗传学奥秘。读完本文,您将理解阅读基因组语言如何正在改变我们保护全球健康的能力。

原理与机制

想象一下你是一位历史学家,但你的文本不是尘封的卷轴和破碎的陶器,而是世界上最微小、最强大生物——病毒和细菌——的遗传密码。这些病原体在它们不懈复制的动力驱使下,无意中写下了自己的日记。每当它们复制其遗传物质——即基因组——时,它们会产生微小、随机的错误,即​​突变​​。这些突变会遗传给它们的后代,形成一条祖先留下的面包屑踪迹。如果你能读懂这份遗传脚本,你就能重建它们的家族树,从而揭开一场疫情的故事:它从何处开始,如何传播,以及它如何演变。这就是​​分子流行病学​​的精髓,一门将基因组学的精确性与流行病学的人群层面视角相结合的学科。

让我们从一个简单而有力的想法开始。

作为传播编年史的病原体

分子流行病学的核心基于一个单一而优美的原则:​​序列相似性反映了近期的共同祖先​​。就像你与你的兄弟姐妹比与远房表亲共享更多的DNA一样,两个基因上非常相似的病原体一定比两个基因上差异很大的病原体更晚从一个共同祖生分化而来。

考虑一个现实世界的公共卫生难题:一场突发的食物中毒疫情。几个人生病了,罪魁祸首是特定菌株的E. coli(大肠杆菌)。调查人员怀疑一批预包装沙拉是源头。他们如何确定呢?他们可以扮演侦探,对来自患病患者的细菌基因组进行测序,并将其与在沙拉中发现的细菌基因组进行比较。如果这些序列几乎完全相同,就好像在多个犯罪现场发现了相同的指纹;这提供了强有力的证据,证明沙拉是“感染”所有患者的共同源头。

这种简单的比较行为——读取和匹配遗传指纹——是整个领域的基础。但是我们能讲述的故事的丰富程度,完全取决于我们决定阅读多少“文本”。

从单页到全书:WGS的力量

在早期,科学家们只能负担得起对病原体基因组的一小部分进行测序,也许只是一个单一的基因。这就像试图通过只读一章来理解《战争与和平》。你只能瞥见一角,却错过了宏大的叙事。对于一个快速演变的病毒来说,这种局限性尤其令人烦恼。

让我们想象一个病毒在一个月内从一个人传播到另一个人。突变在其整个基因组中不断发生。然而,如果我们只看那个基因组的一小段,我们可能碰巧根本看不到任何突变。这两个病毒看起来会完全相同,我们将无法判断是一个人感染了另一个人,还是他们之间隔着一条漫长而看不见的传播链。线索就此中断。

这就是​​全基因组测序(WGS)​​彻底改变该领域的地方。我们不再只读一章,而是阅读整本书。通过增加我们检查的遗传文本量,我们极大地增加了发现那些区分不同感染的“印刷错误”的机会。

让我们把这一点具体化。想象一种病毒,其基因组长度为 L=30,000L = 30,000L=30,000 个核苷酸,突变率已知。如果我们从相隔30天采样的两名患者身上测序一个长度为 ℓ=500\ell = 500ℓ=500 个核苷酸的短基因片段,那么这两个序列完全相同的概率惊人地高——大约为 0.960.960.96。它们几乎肯定看起来一样,无法提供任何有用的信息。现在,让我们应用WGS。通过测序整个 30,00030,00030,000 个核苷酸的基因组,这两个序列完全相同的概率骤降至约 0.0850.0850.085。反过来说,我们有超过 0.90.90.9 的概率会发现至少一个新的突变!WGS为我们提供了所需的高清分辨率,以照亮那些否则会隐藏在黑暗中的精细传播路径。

构建家族树:系统发育学

有了这些高分辨率的序列,我们就可以从简单的两两比较转向重建整个疫情的“家族树”。这个过程被称为​​系统发育推断​​。由此产生的图表,即​​系统发育树​​,是分子流行病学的核心地图。树的分支根据共享的突变连接病原体,分支长度代表遗传变化的量。在树上位置相近、由短分支隔开的样本是近亲;它们共享一个近期的共同祖先。

在一场疫情中,发现一个紧密的​​系统发育簇​​——一组基因上相似的病毒——是潜在传播网络的一个闪烁信号。它告诉公共卫生官员,这些病例不是随机的,而是可能通过一连串近期的传播事件联系在一起,即使这些个体之间彼此不认识。

但系统发育树不仅仅是一幅亲缘关系的图画。如果我们能加上时间维度,它就变成了一部动态的疫情编年史。

分子钟:将突变转化为时间

病原体不仅会积累突变;它们以大致可预测的速率这样做。这一观察是​​分子钟​​假说的基础。对于许多病毒来说,突变的积累就像时钟的滴答声。如果我们知道时钟滴答的速度——即​​替换速率​​,用 μ\muμ 表示——我们就可以将两个病毒之间的遗传距离转化为它们从共同祖先分化以来所经过时间的估计值。

基本关系非常简单。两个谱系之间的预期遗传差异 ddd 大约等于替换速率 μ\muμ 和它们分化以来的时间 ttt 的乘积的两倍:E[d]≈2μtE[d] \approx 2 \mu tE[d]≈2μt。我们从序列中测量 ddd,我们想知道 ttt,所以我们只需要 μ\muμ。

我们如何找到速率 μ\muμ 呢?这就是在试管上写下样本采集日期这个简单的举动变得非常强大的地方。通过在不同时间点收集样本,我们可以将它们的遗传差异与已知的采样日期绘制成图。这条线的斜率给了我们替换速率的估计值。一旦校准,这个分子钟就允许我们在系统发育树的分支上标注日期。我们可以估计整个簇的最近共同祖先的日期,为我们提供一个了解疫情可能何时开始的窗口。

当然,自然界很少如此简单。有时时钟在树的不同分支上以不同的速度滴答。为了解决这个问题,科学家们开发了复杂的​​宽松分子钟模型​​,这些模型允许速率变化,从而提供更稳健、更现实的时间估计。

疫情的形状:系统动力学

一旦我们有了一棵带时间尺度的树,我们就可以解锁更深层次的洞察。树的形状本身就包含了关于病原体种群动态的信息。这就是​​系统动力学​​(phylodynamics)的领域。

想象一棵树,在靠近现在的时间点上爆炸式地分化成茂密的分支丛。这种快速、近期的分支模式是指数增长的经典标志——一场疫情正在起飞。谱系的增殖速度超过了它们消亡的速度。相反,一棵树如果分支长而稀疏,不常分裂,则表明疫情正在减缓或处于潜伏状态。新谱系的出生率大致等于它们的死亡率。

通过将种群增长的数学模型(如出生-死亡模型或溯祖模型)拟合到树的分支模式,系统动力学分析可以直接从序列数据中提取定量的公共卫生指标。最值得注意的是,它可以提供​​有效再生数(RtR_tRt​)​​的估计值,即在给定时间,一个感染者平均引起的二次感染数。观察树的形状如何随时间变化,让我们能够看到疫情的“呼吸”——看到它因季节、人类行为和公共卫生干预而扩张和收缩。

科学家的重负:严谨、告诫与谦逊

基因组学和流行病学的这种融合极其强大,但它并非魔法。我们做出的推断是概率性的,并伴随着关键的告诫。科学诚信要求我们承认它们。

准种与瓶颈

首先,我们必须认识到,一个感染了病毒的人并非携带单一、均一的实体。他们宿主着一个由相关但不同病毒基因组构成的多样化“云”,这被称为​​准种​​。我们通常报告的“共有基因组”只是这个云中最常见的序列,掩盖了其下丰富的潜在变异。

这种隐藏的多样性在传播过程中变得至关重要。当病毒从一个人传给另一个人时,移动的不是整个云,而是一个微小的、随机的样本——通常只是一个病毒颗粒。这被称为​​传播瓶颈​​。供体中的一个低频变体,可能纯粹由于运气,成为穿过瓶颈并在受体中建立起整个感染的那一个。这种“奠基者效应”意味着一个人身上的次要变体可能成为下一个人身上的主导株,这是对机遇在传播中作用的鲜明提醒 [@problem_-id:2489884]。它也使我们精确追踪传播的能力变得复杂。

未见数据的迷雾:抽样偏倚

其次,我们必须时刻牢记,我们是透过一个钥匙孔在看疫情。我们分析的序列只代表了总感染中的极小一部分。如果我们的抽样不能代表整体,我们的图像就会被扭曲。这就是​​抽样偏倚​​。

想象一场疫情跨越两个城市,人们在两城之间对称流动。如果我们在A市的监测强度是B市的两倍,我们就会从A市收集到两倍的序列。当我们构建系统发育树时,它会看起来好像病毒主要从A市流向B市,这仅仅是因为在采样更密集的地方可以找到更多的祖先谱系。我们可能会错误地得出结论,认为A市是疫情的源头,而实际上它只是我们看得更仔细的地方。解释我们如何、在何处以及何时进行抽样,是该领域最大的挑战之一。

推断的局限:网络,而非点名

这就引出了最重要的告诫。系统发育树显示的是​​相关性​​,而非​​因果关系​​。它可以告诉我们两个病例是同一传播网络的一部分,但它本身无法告诉我们谁感染了谁。两个病毒序列可能基因上很接近,不是因为直接传播,而是因为两个个体都被同一个、未被采样的第三方感染了。我们可以识别出传播的森林,但要指出是哪棵树压倒了另一棵树,则充满了不确定性。

发现的引擎:可复现性

最后,从患者样本到RtR_tRt​估计值的过程是一条漫长而复杂的计算路径。它涉及数十个用于质量控制、基因组组装和系统发育建模的软件工具和参数。这些步骤中任何一个微小的改变都可能改变最终结果。为了让科学值得信赖,它必须是​​可复现的​​。这需要对每个工具、每个版本和每个参数进行细致的记录——一种被称为​​溯源信息​​的数字实验记录本。没有这种严谨性,科学就会变得脆弱,其结论也无法被他人验证或在其上进行构建。

人文维度:有良知的科学

分子流行病学的原理赋予了我们前所未有的能力,可以近乎实时地观察疫情的展开。但这种力量伴随着深远的伦理责任。我们测序的基因组并非存在于真空中;它们来自人,每个人都有自己的生活、权利和隐私。

当病原体的基因组与采样日期和地点相关联时,它可能成为一个“准标识符”,一个可能被用来重新识别个人的指纹。这些数据的使用必须遵循公共卫生的核心伦理原则:行善(beneficence)、不伤害(non-maleficence),以及尊重人们的自主和保密。

分子监测的目标不是为了指责或惩罚,而是为了指导富有同情心和有效的公共卫生行动。当一个系统发育簇被识别出来时,正确的反应不是点名道姓,而是认识到一个需要帮助的社区。这是一个信号,提醒我们要敏感地、自愿地提供检测、治疗和预防性药物等资源,以帮助切断传播链,保护所有相关人员的健康。当分子流行病学的科学力量被带着智慧、谦逊和对人类尊严的深刻尊重来运用时,它才找到了其最真实、最高尚的宗旨。

应用与跨学科联系

在探索了分子流行病学的基本原理之后,我们现在到达了探索中最激动人心的部分:在现实世界中看到这些思想的实际应用。如果说前一节给了我们一种新语言——基因组语言——的语法和词汇,那么这一节就是关于阅读用它写就的史诗故事。您将会看到,有了这种新的读写能力,我们能做的远不止是为生命的多样性编目。我们可以成为侦探、历史学家,甚至是预言家,追踪那些连接单个病人与全球大流行、农场动物与医院病房、个人祖先与其疾病风险的无形丝线。

一个深刻科学原理的美妙之处在于其普适性。同样一套逻辑,既能让我们解读一场病毒暴发的历史,也能被转向内,解读一个个体内肿瘤发展的历史。让我们开始这次应用之旅,您会发现,通过基因组的镜头看世界,世界会变得相当不同。

侦探的艺术:实时追踪疫情暴发

想象一下,一个医院病房里有几位病人突然生病。这是巧合,还是有什么东西在传播?在基因组学出现之前,公共卫生官员依赖访谈和观察——这些都是极好的工具,但很容易错过一次短暂的接触或一个无症状的携带者。今天,我们有了一个分子证人:病原体自己的基因组。

每当病毒或细菌复制时,就像一个抄写员在复制一份长手稿。微小、随机的印刷错误——我们称之为单核苷酸多态性(SNPs)——不可避免地会悄悄出现。如果两个病人的病毒拥有相同或几乎相同的基因组,这就像找到了两份带有同样独特拼写错误的手稿副本。这是一个强有力的证据,表明其中一个直接从另一个复制而来,或者两者都从一个非常近的共同来源复制而来。

考虑一项针对两种臭名昭著的病毒——SARS-CoV-2和埃博拉(Ebola)——的医院调查。在一个集群中,来自病人C2的病毒与病人C3的病毒完全相同(相差零个SNP),而它们与病人C1的病毒仅有一个SNP的差异。我们还知道他们症状开始的日期。C1最先发病,五天后是C2,再过五天是C3。这个时间线与已知的代际间隔——传播对中症状发作的典型时间——完美契合。此外,我们有C2和C3之间的接触记录。这告诉我们什么?故事不言自明:病毒很可能从C1传播到C2,然后从C2传播到C3。C2和C3病毒之间的基因同一性,就是将它们与有记录的接触联系起来的“确凿证据”。

同样的逻辑也让我们能够解决单个病人体内更微妙的谜题。当一个患有像Clostridioides difficile(艰难梭菌)这样的细菌感染的病人在治疗后康复,但随后再次生病时,医生面临一个关键问题:这是​​复发​​,即原始感染潜伏后重新出现?还是​​再感染​​,即病人被环境中一个全新的、不相关的菌株所定植?治疗方法可能不同,公共卫生影响也巨大。

基因组流行病学提供了一种极为优雅的判断方法。我们可以对第一次和第二次发病时的细菌基因组进行测序。如果是复发,第二个基因组是第一个基因组的直系后代,仅隔着几周或几个月的演化时间。我们预计会看到非常少的新SNP,这个数量我们甚至可以用一个简单的突变数学模型,如泊松分布,来预测。如果是再感染,第二个菌株来自更广泛的细菌群体,它与第一个菌株的最近共同祖先可能远在数年或数十年前。它的基因差异会大得多。通过比较观察到的SNP数量与这两种竞争性故事下的预期数量,我们可以计算出每种情况的概率,并做出自信的诊断。这是一个利用基本演化模型在床边做出关键临床决策的绝佳例子。

同一健康:连接人类、动物与环境

在太长的时间里,我们一直在各自独立的“筒仓”中研究人类医学、兽医医学和环境科学。然而,病原体从未尊重这些人为的界限。“同一健康”(One Health)理念认识到,人类、动物和生态系统的健康是密不可分的。分子流行病学是“同一健康”的自然语言,使我们能够追踪病原体在物种间跳跃和在环境中移动的旅程。

一个经典的例子是人畜共患病毒的溢出。通过对来自蝙蝠、猪和人类的病毒进行测序,我们可以重建其家族树,即系统发育。我们常常会发现一种模式,即来自人类的病毒形成一个单一、紧密的分支(一个单系分支),而这个分支本身又嵌套在猪体内发现的更大多样性的病毒中。而猪的病毒又嵌套在蝙蝠体内发现的更深层多样性的病毒中。

这种分支模式讲述了一个级联传播的故事。蝙蝠体内巨大的多样性和深层分支表明它们是古老的、长期的宿主库,病毒已在其中循环了数千年。在某个时刻,病毒跳跃到猪身上,在那里建立了一个新的宿主库,维持了一个稳定的种群。我们可以从病毒基因组中看到这种稳定性,它们随时间显示出稳定的遗传多样性。最后,从这个猪“扩增”种群中,一个单一谱系跳跃到人类,引发了一场暴发。人类暴发显示出不同的基因组特征:多样性迅速爆炸,然后崩溃,这是一场最终会自行消亡的疫情的典型标志。系统发育不仅告诉我们发生了什么;它揭示了方向性以及每个宿主所扮演的不同流行病学角色——祖先宿主库、扩增宿主和溢出受害者。

这不仅仅是一个学术练习。考虑一个肾移植病人感染了戊型肝炎(Hepatitis E)。他是从捐赠的器官得到的,还是几周前吃了未煮熟的猪肉?临床时间线可能很模糊。但基因组会说明问题。如果病人的病毒与从器官捐赠者储存样本中发现的病毒完全相同,但与当地社区菌株相差许多个SNP,那么结论就很清楚了。零错配的连接完全符合分子钟对几周内直接传播的预测,而与社区菌株的巨大差异则意味着它们的共同祖先生活在多年前。器官就是源头。

同样的“同一健康”视角使我们能够追踪现代医学面临的最大威胁之一:抗菌素耐药性(AMR)。当一个耐药基因出现在人类临床感染中时,它从何而来?通过对来自牲畜和人类患者的细菌进行测序,我们可以构建一个可能的传播路径网络,包括沿细菌谱系的直接“垂直”遗传和通过可移动遗传元件的“水平”转移。通过为每种类型的跳跃分配成本——跨物种跳跃的惩罚更高——我们可以找到基因从农场到诊所的最简约路径,从而突显出干预的关键控制点 [@problem_-id:4630037]。在像利什曼病(Leishmaniasis)这样的复杂媒介传播疾病中,一项真正稳健的调查需要这种综合方法,细致地从人类、狗(疑似宿主库)和沙蝇媒介中取样并测序寄生虫,以证明基因上完全相同的寄生虫在空间和时间上从一个隔室移动到下一个隔室。

病毒世界的通用语言

COVID-19大流行期间病原体测序的爆炸式增长带来了一个新挑战:我们如何谈论层出不穷的新变异株?科学家们需要一个清晰、合乎逻辑且动态的命名系统。这导致了不同分类方案的产生,每种方案都有其独特的目的,就像图书馆的不同区域。

​​Pango命名法​​(例如 B.1.1.529)就像一份详细的系谱记录。它严格基于祖先关系。当一个单系群——一个共同祖先及其所有后代——显示出成功传播的证据时,就会命名一个新的谱系。它不关心变异株的行为,只关心它的家族史。

​​Nextstrain分支​​(例如 21K)是更广泛的类别。可以把它们想象成将病毒分到主要的“科”或“属”。这些是根据关键的遗传标记定义的,旨在提供全球流行的病毒主要分支的高层次概览。一个谱系需要在世界舞台上扮演重要角色,才能获得自己的Nextstrain分支名称。

最后,​​世界卫生组织(WHO)标签​​(例如 Omicron)根本不是系统发育术语。它们是公共卫生的“通缉令”。如果一个变异株有证据表明它具有危险的新表型——例如更具传播性、导致更严重的疾病,或能逃避我们的疫苗和疗法——它就会得到一个像“关切变异株”(VOC)这样的标签。

理解这些不同的系统至关重要。一个病毒可能获得一个使其更严重的突变(使其成为VOC的候选者),但如果它通过趋同进化与一个不相关的谱系共享同一个突变,它们并不属于同一个Pango谱系,因为它们不共享一个唯一的共同祖先。这些框架提供了一种通用语言,以系统的方式追踪进化和风险。

预测未来:指导疫苗策略

也许分子流行病学最深刻的应用是它从一个历史工具演变为一个预测工具。通过观察一个新病毒变异株的频率增长速度,我们可以估计其适应性优势——即其选择系数 sss。有了这个,我们就可以预测其未来的增长,就像天文学家预测彗星的路径一样。

这对于像流感(influenza)这样的疾病至关重要。疫苗生产需要数月时间。我们不能等到一个新的、能逃避疫苗的菌株占主导地位;到那时就太晚了。取而代之的是,监测项目不断扫描全球。当一个新的分支出现,在关键抗原位点有突变时,我们可以做两件事。首先,我们在实验室中测试它,看接种疫苗的人的抗体中和它的效果如何。如果中和作用显著下降到已知的保护阈值以下,那就是一个危险信号。其次,我们追踪它的频率。如果它正在快速上升,我们可以用其估计的选择系数来预测它在新疫苗推出时的流行率。如果预测显示它将占主导地位,而我们目前的疫苗预计对它无效,那么更新疫苗株的决定就可以提前数月做出。

然而,这一策略并非万能。对于艾滋病病毒(HIV),病毒在单个宿主体内惊人的多样性和快速进化使得这种菌株匹配的更新徒劳无功。取而代之的是,基因组流行病学被用于一个不同的目的:扫描数千个病毒基因组,寻找那些不变的保守区域——病毒的阿喀琉斯之踵——然后这些区域可以被“通用”免疫原或广谱中和抗体靶向。对于像Mycobacterium tuberculosis(结核分枝杆菌)这样生长缓慢的细菌,即引起结核病(TB)的病原体,更新疫苗的门槛要高得多。我们需要看到一个赋予耐药性的突变在整个谱系中固定下来,并跨越多个区域传播,同时还要有证据表明临床疗效确实在下降。策略必须始终根据病原体的基本生物学特性来量身定制。

超越病菌:审视人类疾病的透镜

追踪祖先和将遗传标记与性状联系起来的原则并不仅限于微生物世界。同样的智力工具包可以转向内部,以理解人类疾病(如癌症和自身免疫性疾病)的起源和多样性。

每个肿瘤都是一个不断演变的细胞群。肿瘤的基因组是其发展的历史记录。通过对肿瘤DNA进行测序,我们可以看到其成因留下的突变特征。例如,尿路上皮癌(urothelial carcinoma),一种尿路内壁的癌症,可以由不同的原因引起。大多数膀胱癌是由环境致癌物引起的,比如来自烟草烟雾的致癌物,这些致癌物在尿液中浓缩。这些肿瘤具有特征性的突变谱,并且通常是微卫星稳定的。然而,一小部分尿路上皮癌,特别是那些位于上尿路(输尿管和肾盂)的,尿液快速通过的地方,并非由环境因素引起。相反,它们源于一种名为林奇综合征(Lynch syndrome)的遗传易感性,该综合征由DNA错配修复机制的胚系缺陷引起。这些肿瘤具有完全不同的特征:它们是超突变的,并表现出高度的微卫星不稳定性(MSI)。通过解读肿瘤基因组中的故事,我们可以推断其成因,这对患者的治疗及其家属的遗传风险筛查具有深远的影响。

同样,遗传流行病学可以帮助我们认识到,我们以为的单一疾病实际上是一组不同的病症。银屑病(Psoriasis)长期以来按发病年龄分类,但基因组数据为这种区分提供了生物学基础。早发型银屑病显示出非常强的家族聚集性,并且与一个特定的遗传标记——HLA-C*06:02等位基因——有强烈的关联。晚发型银屑病的家族联系要弱得多,与该等位基因的关联也远不显著。这告诉我们,从分子角度看,它们可能是不同的疾病。早发型是一种由特定免疫通路驱动的强遗传性疾病,而晚发型可能更多地由其他基因或环境因素驱动。这种重新分层是为每种亚型开发更精确和个性化疗法的第一步。

从实时追踪大流行到个性化癌症治疗,分子流行病学的应用像生命之树本身一样广阔。它是一个消除界限的领域——物种之间、学科之间,以及过去与未来之间。通过学习阅读写在DNA中的故事,我们对我们星球上的健康与疾病获得了更深刻、更统一、更强大的理解。