首页人时计算

人时计算

玻尔百科

定义

人时计算是流行病学中用于确定研究对象在处于特定风险状态下的总观察时间的方法。该方法通过累加每个个体的随访周期，为计算发生率提供了精确的分母，从而有效避免因随访时间不等而导致的误导性结论。人时框架支持按年龄、日历时期或进入研究的时间进行分层分析，以准确处理竞争风险和各类偏倚。

核心要点

人时是研究中个体处于某结局风险下的所有观察时间的总和，为计算率提供了准确的分母。
通过考虑不等的随访时间，人时计算可以防止在比较不同组别事件频率时得出误导性结论。
人时框架允许数据按不同“时钟”——如年龄、日历时期或自研究开始以来的时间——进行分层，以厘清复杂的风险因素。
准确的分析需要精确定义“风险”状态，这可能涉及考虑滞后效应期、竞争风险以及如不朽时间偏倚等偏倚。

引言

衡量一种疾病的发生频率看似简单——只需计算病例数即可。然而，这种方法可能具有很强的误导性。我们如何公平地比较一个观察了一年的群体与另一个观察了五年的群体？如果不考虑观察的持续时间，即“风险暴露时间”，我们的结论可能完全错误。本文通过引入人时计算的概念来解决这个根本问题，该方法是衡量动态人群发病率的金标准。在接下来的章节中，您将首先学习核心的“原理与机制”，探讨什么是人时、如何计算它，以及它如何避免常见的分析陷阱。随后，“应用与跨学科联系”一章将展示这一强大工具如何在流行病学、公共卫生及其他领域中被用来获得关于健康与疾病的可靠见解。

原理与机制

风险的“通货”：什么是人时？

想象一下，你是一位城市规划师，想知道两个十字路口中哪一个更危险。在一个月里，你观察到A路口发生了10起事故，而B路口只有5起。似乎很明显，A路口更危险，对吗？但如果我告诉你，A路口是繁忙的市中心十字路口，每天有10万辆车通过，而B路口是安静的郊区角落，每天只有1000辆车通过呢？

情况突然改变了。简单地计算事件数量——在这里是事故数量——是不足够的。为了进行公平比较，你需要一个能够反映事件发生机会的分母。对于十字路口而言，这个分母可能是通过的总车流量。在医学和公共卫生领域，当我们研究疾病发生的频率时，我们也需要一种类似的“通货”来衡量人们患病的机会。这种通货被称为人时。

其核心在于，人时是指研究中每个人被观察并持续处于目标结局风险下的所有个体时间段的总和。其单位很简单：一个人被随访一年，就贡献了一个人年的观察量。同样，两个人各被随访六个月，也贡献了一个人年（ $2 \text{ persons} \times 0.5 \text{ years} = 1.0 \text{ person-year}$ ）。一个研究群组的总人时就是所有这些个体贡献量的简单总和，无论他们的观察期在日历上是否重叠。如果两人在同一个日历月内都处于风险中，他们总共贡献了两个人月。为什么？因为风险是由每个个体独立承担的。两个人可能会在同一英里的路上爆胎；他们的风险不会相互抵消。

“处于风险中”这一概念至关重要。对于每个人，我们必须定义他们的计时何时开始，何时停止。计时从他们进入研究、符合条件且未患病时开始。计时在以下几种可能性中最早发生的一项停止：

他们经历了事件（例如，被诊断出患有该疾病）。
他们失访了（例如，搬家后无法再联系）。
研究结束（行政删失）。

这种因目标事件之外的原因而停止计时的行为被称为右删失。它仅表示我们不知道此后该人发生了什么；他们真实的事件时间在时间轴上的某个右侧位置，但未被观察到。在计算人时时，一个被删失的个体贡献了他们直至被删失那一刻的全部时间。他们不被计为事件，但他们宝贵的风险暴露时间并未被舍弃。

让我们来看一个简单的例子。一项研究在36个月内随访了5名参与者。

参与者1在第0个月进入研究，在第20个月患病。贡献： $20$ 人月。
参与者2在第6个月进入，在第22个月失访。贡献： $22 - 6 = 16$ 人月。
参与者3在第12个月进入，在研究于第36个月结束时仍保持健康。贡献： $36 - 12 = 24$ 人月。
参与者4在第18个月进入，在第33个月患病。贡献： $33 - 18 = 15$ 人月。
参与者5在第24个月进入，在第30个月失访。贡献： $30 - 24 = 6$ 人月。

该队列的总人时为简单加总： $20 + 16 + 24 + 15 + 6 = 81$ 人月，即 $6.75$ 人年。这个数字， $81$ 人月，就是我们所需的分母。如果我们有2个病例，我们的发病率将是 $2 \text{ cases} / 81 \text{ person-months}$ 。这个率衡量的是疾病在人群中出现得多快，这个概念通常被称为发病密度。

为什么不只计算人数？天真比较的危险

你可能仍在想：为什么要这么麻烦？为什么不直接用患病人数除以研究总人数？这似乎更简单。答案是，这种“更简单”的方法可能具有极大的误导性，会制造假象，导致错误的结论。

想象一项比较新药与安慰剂的研究。药物组有300人，安慰剂组有300人。研究结束后，我们发现药物组有30个事件，安慰剂组有36个事件。天真的风险计算将是：

药物组风险： $30 / 300 = 0.10$
安慰剂组风险： $36 / 300 = 0.12$

看起来药物具有保护作用！但有一个隐藏的细节：随访时间是不同的。在药物组，人们平均被随访11个月。在安慰剂组，他们平均被随访17个月。安慰剂组有更多的时间让事件发生！

这时，人时就成了我们洞察真相的工具。让我们来计算率：

药物组人时： $3300$ 人月。率 = $30 / 3300 \approx 0.0091$ 事件/人月。
安慰剂组人时： $5100$ 人月。率 = $36 / 5100 \approx 0.0071$ 事件/人月。

药物组的发病率实际上高于安慰剂组！发病率比（ $IRR$ ）约为 $1.29$ ，表明该药物甚至可能有害。最初的结论是由不平等的观察时间造成的假象。人时通过将两组置于一个共同的尺度上——每单位风险时间的事件发生率——来驱散这种幻觉。它将比较从“谁的事件更多？”转变为“谁发生事件的速度更快？”

这种处理不等随访时间的能力不仅仅是一项技术修正；它是研究现实世界人群的关键。大多数人群都不是静止的。在固定队列中，每个人都在同一时间开始，我们试图对所有人进行相同时间的随访。但实际上，我们几乎总是面对动态队列（或开放队列），其中人们在不同时间进入，因各种原因离开，并被随访不同的时长。人时是在这些混乱、动态的系统中描述风险的自然语言。

生命地图：莱克西斯图与不同的时钟

为了真正领会人时的力量，我们可以将其可视化。想象一张地图，横轴是日历时间（1990年、1991年……），纵轴是年龄（0岁、1岁、2岁……）。在这张地图上，任何个体的生命都是一条斜率为+1的直线：随着一年的日历时间过去，他们也变老一岁。这张图被称为莱克西斯图（Lexis diagram）。一个人在研究中的时间由其生命线上的一段线段表示。一项研究的总人时是所有这些被观察线段的长度之和。

这张图揭示了一个深刻的见解：“时间”并非单一实体。我们可以使用不同的时钟来衡量它，而我们选择的时钟会改变我们所问的问题。流行病学中最重要的三个时钟是：

年龄：生物学时钟。对于许多疾病，从儿童期感染到老年癌症，年龄是风险最强的预测因素。
日历时间（时期）：历史时钟。该尺度捕捉在特定时间影响所有人的事件，如流感大流行、新的疫苗接种运动或环境污染的变化。
自进入研究以来的时间：研究时钟。这衡量的是从一个人注册入组开始的时间。它对于研究诸如手术或药物的短期效应等情况非常有用，因为在干预后风险会迅速变化。

人时框架的美妙之处在于，我们可以根据这些时钟中的任何一个来对数据进行切分。我们可以将莱克西斯图上所有细小的生命线段取出并分箱。我们可以按年龄将它们分组，以计算特定年龄组的发病率（“50岁人群的风险是多少？”）。或者我们可以按日历年份将它们分组，以计算特定时期的率（“2010年新法通过后，风险是否发生了变化？”）。这种对人时和事件进行分层的能力是现代流行病学的基石，让科学家能够厘清老龄化、历史背景和个体生命历程的复杂影响。

高级应用与微妙陷阱

对人时的仔细核算也有助于我们避开可能困扰医学研究的微妙逻辑陷阱。

其中最著名的一个是不朽时间偏倚。想象一项研究，旨在探究心脏移植是否能提高生存率。我们比较接受移植的患者和未接受移植的患者。要进入移植组，患者必须在等待名单上存活足够长的时间才能真正接受一颗心脏。这段等待期是“不朽时间”，因为根据定义，他们不可能在此期间死亡而仍能被分入移植组。天真地将移植组的全部生存时间与非移植组进行比较，会给移植带来不公平的优势。解决方法是正确处理暴露的时间依赖性：患者在等待名单上时，为人时贡献于“未治疗”组；只有在移植发生之后，才转换到为“治疗”组贡献人时。这种对人时的划分可以中和偏倚。

然而，该方法也有其局限性。整个人时分析框架都建立在一个关键假设之上：删失是非信息性的。这意味着一个人退出研究的原因与他们发生结局的风险无关。如果这一假设不成立呢？考虑一项关于呼吸道病毒的研究，其中出现严重咳嗽（该疾病的强预测指标）的人感到沮丧并停止参与。他们在风险最高时被删失了。我们从分子中丢失了他们的事件，他们计算出的发病率将被人为地拉低。这就是信息性删失，它会严重偏倚我们的结果。虽然标准的人时计算无法解决这个问题，但认识到这一局限性是第一步。已经发展出一些高级统计方法，如删失概率倒数加权法（IPCW），来尝试调整这种偏倚，其本质上是通过对数据重新加权，以弥补因退出者而丢失的信息。

从简单的时间核算，到驾驭动态人群、多重时间尺度和逻辑悖论复杂性的精密工具，人时的概念是一个绝佳的例子，展示了一个简单而强大的思想如何为人类健康那混乱、不断变化的本质带来清晰。它是一种稳定的节奏，让我们能够穿透现实世界的噪音，听到流行病学的乐章。

应用与跨学科联系

在掌握了人时的基本原理之后，我们现在准备看它在实践中的应用。就像一个简单的透镜，如果打磨得当，可以揭示遥远的星系或一滴水中的复杂生命一样，人时的概念让我们能以惊人的新清晰度看待健康与疾病的世界。它不仅仅是一种计算技巧；它是一种深刻的思维方式，能够连接不同学科，并将混乱、动态的生活现实转化为可量化的知识。

基础：从人群到率

在其核心，人时回答了一个非常简单的问题：“事情发生得有多快？”如果你想知道一个城市的交通事故率，你不能只计算撞车次数。你还必须知道路上有多少辆车，以及它们行驶了多长时间。一个空城发生一次撞车与一个繁华都市发生一次撞车是截然不同的。人时是我们衡量风险人群“总流量”的方式。

最简单的应用是利用已知的观察量来计算一个率。如果流行病学家告诉我们，他们观察一个队列总共 $4{,}500$ 人年，并记录到 $25$ 例新发疾病病例，我们就能立即计算出该疾病的率，或称发病密度。它就是事件数除以这些事件发生机会的总时间。

但这个神奇的数字“总人时”从何而来？它不是从天而降的。我们是根据研究中每个人的个体故事，一点一滴地构建起来的。想象一个小型心理治疗项目，试图了解其参与者中自杀未遂的发生率。一个人可能毫无意外地完成了整个18个月的项目。另一个人可能不幸在5个月时发生一次未遂事件，此时他们对“首次未遂事件的风险暴露时间”的特定贡献就此结束。第三个人可能在7个月后搬走，第四个人可能在一年后退出。每个人的“风险暴露时间”是他们独特旅程的长度，是宏大织锦中的一根线。人时就是所有这些个体线段的总和。正是这种自下而上的构建方式，赋予了该方法处理交错的进入时间、中途退出和不同结局的能力，而这些都是任何真实世界研究的标志。

比较的工具：流行病学家的透镜

测量单一的率是有用的，但科学的真正进步源于比较。一种新药是否比安慰剂效果更好？某个工厂环境是否比另一个更危险？人时提供了使这些比较公平且有意义所需的共同分母。

考虑一项研究，比较“暴露”组和“未暴露”组之间某一罕见事件的发生率。通过分别计算每组的发病率——事件数除以该组的人时——我们可以计算出发病率比（ $IRR$ ）。这个比率告诉我们，在暴露组中，每单位时间内事件发生的可能性是未暴露组的多少倍（或几分之一）。 $IRR$ 为 $2.0$ 表明暴露使事件的发生率加倍，而 $IRR$ 为 $0.5$ 则表明其将发生率减半。

这种比较能力在评估医疗干预措施时尤为关键。为了计算疫苗的效力，我们比较接种组的感染率与未接种组的感染率。每组的人时就像一台精确校准的天平，我们用它来衡量结局，从而能够将保护效果量化为率的百分比降低值。

然而，生活是复杂的。有时，我们对一个人的观察结束，不是因为我们正在研究的结局（例如中风），而是因为一个完全不同的原因（例如致命的心脏病发作，或移居他国）。这些被称为竞争风险。人时以其优美的简洁性处理了这个问题。当竞争性事件发生时，我们只需停止那个人的计时。他们不再可能经历我们正在研究的中风，因此他们不再“处于风险中”，也不应再为分母贡献任何时间。这种“特定原因”框架使我们能够从生活中无数其他可能性所产生的噪音中，分离出我们关心的信号。

精炼“风险”状态：定义的艺术

至此，我们触及了人时概念真正的精髓：其在定义“风险”状态方面的灵活性。这不是一个僵化、固定的定义，而是一个必须针对手头的具体生物学或社会学问题进行打磨和瞄准的精确工具。

如果一种暴露没有立即的效果怎么办？疫苗不会在针头离开手臂的那一刻就赋予免疫力。存在一个生物学上的建立期。在计算疫苗效力时，将接种后最初几周的人时计算在内是不正确的，因为在这段时间内疫苗不可能起作用。疫苗效果的“风险”时钟只应在这个免疫力建立期完成之后才开始计时。同样，对于一种在环境暴露后需要数年才能发展的慢性病，有意义的“风险暴露时间”可能与很久以前发生的暴露有关。我们可以引入一个滞后效应期，移动我们的观察窗口，以与假设的因果时间框架对齐。这使我们不仅能问“你现在是否暴露？”，还能问更具因果相关性的问题，“你在关键时期是否暴露过？”

人口本身的定义也可以是动态的。考虑一项在某工厂进行的职业健康研究，该工厂在粉尘暴露最严重的旱季有大量外来务工人员涌入。简单的工人数统计具有误导性，因为人口规模波动剧烈。人时通过精确追踪总“工人-月”的劳动量来解决这个问题，正确地考虑了数百名临时工每人贡献几个月，而一小部分常住居民则全年贡献时间。这使我们能够计算特定季节的率，并查明风险是否在多尘的季节真的更高，这是用较粗略的方法无法实现的。

事件本身的定义也决定了风险期。想象一下研究腹泻病。如果我们关心的是首次发作的率，那么一旦一个人有过一次腹泻，他们就不再处于首次发作的风险中，他们对该特定人时分母的贡献就停止了。然而，如果我们关心的是任何一次发作（包括复发）的率，那么一个人在病愈后又会重新处于风险中。如果未能做出这种区分，错误地将一个人不处于风险中的时间（例如，已经有过首次发作，或当前患病且对新感染免疫）计算在内，将会系统性地、错误地降低你计算出的率，可能掩盖一个严重的公共卫生问题。精确定义谁处于风险中以及何时处于风险中，是至关重要的。

不断扩展的应用领域

人时的原则远远超出了传统流行病学的范畴，在我们这个数据丰富的现代世界中找到了强大的应用。

在药物流行病学中，研究人员利用庞大的医保理赔行政数据库来监测药物安全。他们无法直接观察患者，但可以看到他们的数字足迹：处方续配记录。通过开发追踪药物供应的算法，包括延迟续配的宽限期和提前续配的结转量，他们可以为数百万人重建“在治”人时。这使得大规模监测能够检测罕见的药物不良事件，将平凡的药房交易数据转变为强大的公共卫生工具。

此外，这个概念对于生物统计学与研究设计也是基础性的。在任何参与者入组之前，研究人员必须问：“我们需要多少数据？”队列研究中的“数据”不仅仅是人数，更是他们将贡献的总人时。通过使用将估计率的方差与人时量联系起来的统计公式，研究规划者可以计算出达到所需精确度（例如，在其估计值周围获得足够窄的置信区间）所需的总人年数。这确保了研究设计具有足够的统计功效来明确回答其问题，而不会浪费资源。

从公共卫生和临床医学到数据科学和统计学，人时优雅的逻辑提供了一个统一的框架，用于在一个观察永不完美、人群总在变化的世界里衡量事件的节奏。它提醒我们，要理解事件，我们必须首先掌握如何衡量事件得以发生的机会时间。