
在人口健康研究中,一项基本任务是衡量和比较不同群体间的疾病负担。这通常始于一个简单的问题:“某个状况在这个群体中与那个群体中相比,有多普遍?”这个问题看似直截了当,但要准确回答,需要审慎选择统计工具。某些度量(如优势比)的广泛使用有时会掩盖关联的真实强度,尤其是在疾病常见的情况下。这为依赖这些数据做出明智决策的研究人员、临床医生和政策制定者造成了关键的知识鸿沟。
本文为患病率比 (PR) 提供了全面的指南,这是一种更直观、更直接的衡量横断面数据关联性的度量。在第一章“原理与机制”中,我们将从头开始构建这一概念,区分患病率和发病率,并细致比较患病率比与患病优势比。您将了解关键的“罕见结局假设”以及病程偏倚这一深远的分析陷阱。在这一理论基础之后,第二章“应用与跨学科联系”将展示患病率比如何应用于现实世界的公共卫生调查、政策评估,以及在不同人群间进行公平比较的复杂挑战。
要真正理解一个概念,我们必须从头构建,从最简单的想法开始,观察其复杂性与美感如何展开。在流行病学中,我们的目标常常是理解疾病的负担。但我们如何衡量它呢?事实证明,这个看似简单的问题将我们引向一条引人入胜的道路,揭示了我们看待世界的方式与我们能得出的结论之间的深刻联系。
想象一个城市的公共卫生部门想要了解糖尿病的负担。他们可以提出两个截然不同的问题。第一:“我们城市现在有多少人患有糖尿病?”这是一个关于患病率 (prevalence) 的问题。它就像在时间中拍摄一张快照。我们正在计算人群中现有的病例“存量”。结果是一个比例:患有糖尿病的人数除以城市总人口数。如果一个10万人口的城市有10,000名病例,那么时点患病率就是 ,即 。请注意,这个数字没有单位;它只是一个分数,一个介于0和1之间的值。
第二个问题是:“每年有多少人新发糖尿病?”这是一个关于发病率 (incidence) 的问题。它不是快照,而是一部电影。我们正在衡量一段时间内新病例流入人群的“流量”。这是一个率,衡量疾病出现的速率,通常以“每1,000人年病例数”等单位表示。
这种区别不仅仅是学术上的,而是根本性的。想象一个浴缸。患病率是特定时刻浴缸里的水量(存量)。发病率是水从水龙头流入的速率(流入量)。然而,水位不仅取决于流入量,还取决于水排出的速度(流出量,代表痊愈或死亡)。一个浴缸的水位可以很高(高患病率),原因既可能是水龙头开得很大(高发病率),也可能是排水口堵塞了(长病程)。这个简单的类比是流行病学中最有力的思想之一。
现在,让我们继续关注我们的快照——患病率。它是我们从横断面研究中最常获得的度量,即我们在单个时间点对人群进行调查。假设我们调查了2,000名成年人,以了解当前吸烟是否与现患哮喘有关。我们发现有600名吸烟者和1,400名非吸烟者。在吸烟者中,48人患有哮喘。在非吸烟者中,70人患有哮喘。
我们如何比较这些群体?最直接的方法是计算每个组的患病率,然后进行比较。
吸烟者中哮喘的患病率为 。 非吸烟者中哮喘的患病率为 。
最直观的比较是取它们的比值。我们称之为患病率比 (Prevalence Ratio, PR)。
对于我们的哮喘例子,PR是 。其解释非常简单:“在该人群中,当前吸烟者的现患哮喘患病率是是非吸烟者的1.6倍。”它回答了“一个群体中疾病的普遍程度是另一个群体的多少倍?”这个问题。
我们也可以看绝对差异,即患病率差 (Prevalence Difference, PD):。这告诉我们,与吸烟相关的超额患病率为3个百分点。PR和PD都很有价值,一个提供相对视角,另一个提供绝对视角。
现在,让我们介绍一个稍微奇特的角色:患病优势比 (Prevalence Odds Ratio, POR)。患病率比比较的是概率,而优势比,顾名思义,比较的是优势 (odds)。在统计学和赌博中,“优势”是指一个事件发生的概率与它不发生的概率之比。
POR就是暴露组中患病优势与非暴露组中患病优势的比值。
让我们为我们的哮喘数据计算这个值。吸烟者患哮喘的优势是 。非吸烟者患哮喘的优势是 。这些优势的比值是:
注意这个值 与我们的患病率比 非常接近。我们为什么要费心使用这个不那么直观的度量呢?主要原因是它便利的数学特性。优势比是流行病学中最强大和最广泛使用的统计工具之一——逻辑斯谛回归——的自然输出。这使其成为医学研究的主力,但正如我们将要看到的,它的便利性附带着一个重要的警告标签。
在我们的哮喘例子中,PR () 和 POR () 如此相似并非巧合。让我们看看它们之间的数学关系:
这个小公式是关键。POR是PR乘以一个“校正因子”。这个因子何时会接近1?当和都是非常小的数时,它会接近1。如果疾病在两个组中都是罕见的(根据经验法则,比如患病率低于 ),那么和都非常接近1,它们的比值也非常接近1。在这种情况下,且仅在这种情况下,。
让我们通过实例来看看。考虑一项关于工厂工人职业性皮炎的研究中的两种情景。
情景1:常见结局。 暴露工人中,患病率 。非暴露工人中,。
情景2:罕见结局。 想象一种不同的、更罕见的疾病。暴露工人中的患病率为 。非暴露工人中为 。
这就是著名的罕见结局假设。它不是自然法则,只是算术的结果。当结局常见时,优势比总是比患病率比更偏离1.0。对于增加患病率的暴露,POR会高估PR。想象一项关于身体活动不足(一种非常普遍的状况)的研究,发现PR为2.0。POR可能为2.67。在没有上下文的情况下报告该值,可能会给人一种对效应的误导性放大印象。
有趣的是,由于PR和POR之间的关系在数学上是精确的,如果你知道POR和基线患病率 (),你总能计算出精确的PR。代数计算有点有趣,但它揭示了这里根本没有任何神秘之处!
到目前为止,我们一直满足于我们的快照。但科学很少满足于仅仅描述;它想知道为什么。我们想推断原因。而这正是患病率的快照视角可能极具欺骗性的地方。
让我们回到我们的浴缸。患病率是水位。从触发疾病的意义上讲,原因关乎流入量——发病率。一项横断面研究给我们提供了PR,即水位的比值。我们想要的是发病率比 (Incidence Rate Ratio, IRR),即流入速率的比值。它们相同吗?
仅在非常特殊的情况下。记住,患病率 发病率 病程。这意味着患病率比近似为:
其中和是暴露组和非暴露组中疾病的平均病程。这个方程是一个启示。患病率比混合了对发病率(我们通常关心的病因学方面)的影响和对病程的影响。
想象一种暴露,它对引发疾病没有影响。IRR是1.0。但如果这种暴露使疾病的持续时间延长一倍()呢?PR将大约为 。一项横断面研究会发现患病率高出两倍,并可能错误地断定该暴露导致了该疾病,而实际上它只是延长了病程。这被称为病程偏倚或患病率-发病率偏倚。
一个绝妙的假设例子清晰地说明了这一点。一项随时间追踪人群的队列研究发现,暴露和非暴露工人的某种肺部疾病发病率相同()。暴露并不导致该疾病。然而,临床记录显示,该疾病在暴露工人中持续2年,而在非暴露工人中仅持续1年。对同一人群进行的独立横断面调查发现,患病优势比 (POR) 约为2.0。横断面数据表明存在强关联,而纵向数据则显示与发病没有因果联系。快照中的全部关联都是由病程造成的假象。POR反映的是对患病率的影响,而不仅仅是对发病率的影响。在这些稳态条件下,优势比的真实关系实际上是精确的:。
这段从简单定义到微妙陷阱的旅程不仅仅是理论练习。它对科学家如何分析数据具有深远的影响。既然逻辑斯谛回归给出优势比,而优势比对于常见结局(与PR偏离)和因果推断(由于病程偏倚)都可能产生误导,那么研究人员该怎么办?
幸运的是,统计学家已经开发了其他工具。还有其他类型的广义线性模型 (Generalized Linear Models, GLMs) 可以直接估计患病率比。
这些方法允许研究人员报告更直观的患病率比,避免了对常见结局优势比的夸大。它们不能解决病程偏倚的问题——那需要纵向数据或非常强的假设——但它们确保了当我们描述我们的快照时,我们是用最清晰的语言来描述的。统计度量的选择不仅仅是一个技术决定;它关乎我们如何传达真相。
在掌握了患病率的原理以及我们可以从中构建的比值之后,我们现在踏上旅程,去看看这些思想在实践中的应用。就像物理学家从抽象的运动定律转向火箭飞行或行星轨道一样,我们将看到一个简单的数学比率如何成为理解和改善人类状况的强大透镜。这个工具的美妙之处不在于其复杂性,而在于其多功能性。它是公共卫生侦探的放大镜,社会学家衡量不平等的标尺,也是政策制定者驶向更健康社会的指南针。
让我们从公共卫生的世界开始,在这里,科学家们扮演侦探的角色,寻找线索来解释人群中的疾病模式。想象一项调查,旨在探究为何哮喘在某些社区的负担比其他社区更重。一个主要嫌疑是空气质量。一项横断面研究可能会发现,在细颗粒物水平高的社区,哮喘的患病率为 ,而在较清洁的社区,患病率为 。一个简单的减法给了我们患病率差 (PD):。这个数字具有直接、切实的意义:在高污染地区,每100人中就有6例超额哮喘病例。它量化了绝对的公共卫生负担,这是分配诊所或空气净化器等资源的关键信息。
但要了解关联的强度——即暴露看起来有多么“强效”——我们转向我们的主要工具,患病率比 (PR)。通过将两个患病率相除,我们得到 。这告诉我们,在污染社区,哮喘的患病率是1.6倍,或高出60%。PR让我们感受到暴露的相对“冲击力”。一个简单的二乘二表格计算,既揭示了问题的规模,也揭示了线索的强度。
这两个指标,绝对和相对,就像我们放大镜的两个不同镜片。一个显示足迹的大小;另一个显示印记的深度。两者都至关重要。考虑一项关于健康公平性的研究,比较最低和最高收入群体之间的哮喘患病率。假设患病率分别为12%和5%。PR为 ,表明存在非常强的关联——最低收入群体的患病率几乎是最高收入群体的2.5倍。这个强大的相对度量对于突显社会不平等的巨大程度非常有价值。然而,PD为 则讲述了一个互补的故事:7个百分点的超额负担,这相当于每1000人中多出70个病例。这个绝对数字是卫生系统规划者估算解决这一差距所需资源时所需要的。我们在青少年健康领域也看到同样的双镜头方法,例如,在量化不同社会经济地位学校之间电子烟使用率的差异时。PR突出了社会梯度的强度,而PD则量化了受影响的年轻人的超额数量。
发现问题是一回事,解决问题是另一回事。患病率比不仅仅是一个描述性工具,它还是评估我们的解决方案是否真正有效的关键组成部分。想象一个全球健康项目,旨在减少某地区的亲密伴侣暴力 (IPV),该地区的基线患病率高达 。经过严格评估,发现该项目具有一个相对效应——患病率比为 。这意味着在有该项目的地区,IPV的患病率是无项目地区的 倍。
这一个数字使我们能够预测如果该项目扩大规模后的影响。新的预期患病率将是 。这将导致患病率的预期绝对降低 。IPV患病率下降5个百分点,对成千上万的人来说是深刻的、改变生活的影响。患病率比充当了一座桥梁,将干预的相对效应与其绝对的、现实世界中的后果联系起来。
然而,与任何强大的工具一样,我们必须在理智上诚实地认识到它的局限性。考虑一项研究,检验城市级无烟政策与个人二手烟暴露之间的关联。研究人员可能会发现,在政策严格的城市,频繁二手烟暴露的患病率为 ,而在政策宽松的城市,为 。患病率比为 ,表明存在强关联。人们很容易宣称是强有力的政策导致了这种降低。但在这里,我们必须停下来。这项研究是横断面的;政策强度和烟雾暴露是在同一时间测量的。我们无法确定是政策先行。此外,暴露——即政策——是在群体(城市)层面测量的,而结局是在个体层面。这种关联是真实的,但它是一种情境性的关联。假设城市层面的关联统一适用于每个个体,将犯下“生态学谬误”。也许政策严格的城市也有不同的社会规范或人口特征,这些因素解释了差异。患病率比为我们提供了有力的线索,但它并没有结案。它为我们指明了一个有前途的政策,但它提醒我们,建立真正的因果关系需要更多,比如随时间追踪人群的纵向研究。
当我们面临一个常见的难题时,我们的推理迎来了其最精妙和微妙的应用之一:如何比较两个在某些可能扭曲我们结果的根本方式上有所不同的群体。这是经典的混杂问题。假设我们想比较阿尔法市和贝塔市的高血压患病率。我们发现阿尔法市的粗患病率更高。但如果阿尔法市的人口比贝塔市老得多,而且我们知道高血压随着年龄增长而变得更常见呢?直接比较粗患病率就像比较苹果和橙子;我们看到的差异可能仅仅是由于不同年龄结构造成的,而不是真正的健康差异。
我们如何进行公平的比较?优雅的解决方案是标准化。其思想是创建一个假设的“标准世界”,在这个世界里,混杂因素——在这里是年龄——被保持恒定。在直接标准化中,我们问:“如果两个市都采用同一个标准人口的年龄结构,那么每个市的患病率会是多少?”我们将每个市自己的年龄别患病率应用于这个标准人口的年龄分布。由此产生的年龄标化患病率现在可以直接比较,因为年龄结构的影响已经被移除了。
然而,有时我们没有我们研究人群稳定的年龄别率,也许是因为我们每个年龄组的样本量很小。这时我们可以使用间接标准化。逻辑略有不同但同样强大。我们问:“如果我们城市的人口经历与一个大型、稳定的标准人口相同的年龄别率,我们会预期看到多少高血压病例?”我们计算出这个预期的病例数,并将其与我们实际观察到的病例数进行比较。观察病例与预期病例的比值给了我们间接标准化患病率比 (ISPR)。例如,ISPR为 意味着,在考虑了其独特的年龄结构后,我们城市的高血压患病率是预期的 倍。标准化,无论其形式如何,都是实现比较公平性的一项高超技术,使我们能够从混杂的噪音中分离出信号。
我们现在来到了最深刻的挑战,一个将流行病学与心理测量学、人类学和文化精神病学联系起来的挑战。当我们不仅仅是在比较苹果和橙子,而是使用的测量尺会根据我们测量的水果而伸缩时,会发生什么?这就是跨文化测量不变性失效的问题。
想象一下,研究人员在两个不同的社会——文化A和文化B——研究一种“文化结合综合征”。他们使用一个经过翻译和改编的调查工具,发现观察到的患病率在A文化中是B文化的两倍。这是否反映了真实差异?答案埋藏在一片复杂的丛林中。首先,如果调查工具本身在两种文化中的运作方式不同怎么办?心理测量分析可能会揭示“标量不变性”的失效,这是一个技术术语,描述了一个简单但毁灭性的问题:来自两种文化、潜在综合征水平完全相同的个体,在测试中得到不同的分数。如果某些问题被不同地解释或带有不同的文化权重,就可能发生这种情况。因此,调查中的一个固定分界点在每种文化中将具有不同的灵敏度和特异度,从而凭空创造出患病率的表面差异。
但测量问题还不止于此。如果在文化B中,围绕该综合征的污名化更严重怎么办?那里的人们可能不太愿意承认症状,这是一种报告偏倚,会人为地降低工具的灵敏度,从而降低观察到的患病率。最后,如果我们看诊所里诊断的病例,我们面临另一个过滤器。如果在文化A的人们寻求该综合征帮助的可能性是文化B人们的四倍呢?如果在文化A的临床医生更擅长检测它呢?出现在登记系统中的病例数不仅是真实患病率的产物,而是整个求助和诊断行为链的产物。即使真实患病率相同,登记率的观察差异也可能完全由这些卫生系统因素解释。
这个最后的例子揭示了最深刻的真理:一个患病率数字从来不仅仅是一个数字。它是生物学、心理学、文化和社会系统交织在一起的产物。明智地解释它,就是要欣赏这种统一性。源于简单算术的谦卑的患病率比,迫使我们面对这些关于测量本质和人类经验的深刻而迷人的问题。它证明了对一个简单、诚实的比较的追求如何能将我们引向跨学科科学的核心。