
在浩瀚而复杂的人类健康世界里,我们如何从混乱中建立秩序?东京的卫生官员、伦敦的研究人员和内罗毕的诊所,他们在谈论疾病时如何能使用同一种语言?答案在于一个强大却又常常不为人见的工具:国际疾病分类(International Classification of Diseases, ICD)。尽管 ICD 对现代医学和公共卫生不可或缺,但其背后的原则和其影响的全部范围却常常被误解。许多人把它看作一个简单的编码列表,未能理解其让我们得以追踪全球健康趋势的精妙逻辑,也未能领会其塑造医疗实践乃至社会规范的深远方式。
本文将揭开这一全球卫生基础设施基本要素的神秘面纱。第一部分“原则与机制”将深入探讨 ICD 的核心逻辑,解释其作为统计分类系统的功能、其与其他医学词汇的关系,以及为保持数据在数十年医学进步中的可比性所采用的方法。随后的“应用与跨学科关联”将探讨 ICD 的深远影响,从助力流行病学探案和遗传学发现,到影响疾病的根本定义。读完本文,您将不再把 ICD 视作一本简单的行政账本,而是将其看作一种组织、揭示并塑造我们对人类状况理解的动态力量。
我们为什么要对事物进行分类?生物学家为新发现的昆虫分类,图书馆员为新购入的图书分类。我们这样做是为了给原本混乱的世界带来秩序,为了理解关系,为了找到事物,以及最重要的一点——为了对它们进行计数。如果你对于“小说”和“传记”没有一个共同的分类系统,两个图书馆要如何比较它们的藏书?它们又如何能知道读者在读什么?
在医学领域,这种分类行为被称为疾病分类学 (nosology),即对疾病的系统性排序。这种冲动自古有之,但在 19 世纪变得尤为迫切。随着城市的发展,了解人们死于何种疾病的需求也日益增长。是霍乱?是结核病?还是其他疾病?要战胜一个敌人,你必须首先能叫出它的名字,统计它的伤亡人数,并追踪它在时空中的动向。这就是生命统计学的诞生,一场由 Jacques Bertillon 等人物领导的革命,他们孜孜不倦地致力于创建一份国际死亡原因清单。这项努力正是我们今天所知的国际疾病分类 (ICD) 的直系前身,该标准由世界卫生组织 (WHO) 负责管理。
ICD 的根本目的并非成为一本全面的医学教科书或医生治疗单个病人的诊断指南。其首要且压倒一切的目的是为报告和监测健康趋势,特别是发病率 (morbidity)(疾病)和死亡率 (mortality)(死亡),提供一种通用语言。从本质上讲,它是全球公共卫生的总账本。它让我们能够回答诸如以下问题:北美的心脏病发病率是否在下降?非洲特定地区的疟疾发病率是否在上升?一项公共卫生干预措施是否真的有效?没有一个共享的分类系统,这些问题都无法回答。来自不同国家或不同年份的数据将如同比较苹果和橙子,毫无意义。
那么,如何构建一个能够实现这种严谨的全球比较的系统呢?答案在于一个优美、简洁而强大的数学思想:划分 (partition)。
想象你有一个巨大的容器,里面装满了所有可能的人类疾病。你的任务是把它们分拣到一组贴有标签的箱子里。要正确完成这项工作,你必须遵守两条严格的规则。首先,每一种疾病都必须能放进至少一个箱子里;不能有任何疾病被留在地板上。这被称为全穷尽 (collectively exhaustive)。其次,任何一种疾病都不能放进一个以上的箱子里。这被称为互斥 (mutually exclusive)。这两条规则共同为诊断世界创造了一个完美的划分。每一种病症都有一个,且只有一个指定的归宿。
这种严格的一对一映射是 ICD 统计威力的秘诀。当一个国家报告称其有 例缺血性心脏病死亡(ICD-10 编码 )时,我们知道这 人是明确区分的,并且没有同时被计入,比如说,“高血压性心脏病”的范畴。对任何类别 的汇总都是一个简单、明确的病例计数,即映射到该类别的病例 的总和:。
这就是为什么地方性的、自创的清单,无论它们看起来多么详细,都无法用于统计比较。一家医院可能有重叠的“心脏病发作”和“冠状动脉疾病”等本地类别,导致一些患者被同时计入两者。将这些数字相加将是一种毫无意义的重复计算,使数据在流行病学上毫无用处[@problem_a_id:4856662]。ICD 的高明之处在于它强制执行这种互斥结构。它在设计上就是一个刚性框架,因为正是这种刚性保证了当我们把数字加起来时,它们代表着真实且可比的意义。
现在,一个好奇的学生可能会问:“如果一个病人患有‘右膝严重原发性骨关节炎’,而一个 ICD 编码仅仅表示‘单侧原发性骨关节炎’,这难道不是丢失了很多重要细节吗?”答案是响亮的“是”!但这并非缺陷,而是一种特性。
ICD 是一种分类 (classification),而非临床词汇。要理解其中的区别,可以把健康数据世界想象成一个复杂的生态系统,其中不同的生物体适应于不同的角色。
分类系统 (ICD) 是公共卫生的记账员。其工作是将数据汇总到稳定、可比的类别中,以进行统计分析。为实现这一点,它刻意使用宽泛的、预先组合的(预组配 pre-coordinated)类别。它为了可比性和稳定性而牺牲了粒度。
参考术语集或本体 (例如 SNOMED CT) 是临床的叙事者。其目的是在诊疗时点表述患者病情的全部丰富性和复杂性。它是一个包含多种关系(多层级结构)的庞大逻辑概念网络,允许对诸如侧别(“右侧”)、严重程度(“严重”)和特定并发症等进行精细描述。它甚至支持后组配 (post-coordination),即临床医生可以组合原子概念来构建一个精确的描述,而这个描述并不作为一个单一的预制术语存在。
专用词汇表 (例如 CPT, LOINC) 是其狭窄领域的专家。《现行医疗程序术语》(CPT) 为医疗计费目的提供了详尽的医疗操作编码列表。《逻辑观察标识符名称和编码》(LOINC) 为每一种可以想见的实验室检验提供了通用标识符,不仅指定了测量的物质,还指定了标本、时间和属性。
一个现代化的卫生系统会协同使用所有这些工具。医生使用 SNOMED CT 的表达能力记录详细的诊断。为了计费,会为所执行的操作生成一个 CPT 编码。对于实验室结果,则使用 LOINC 编码。而为了公共卫生报告,详细的 SNOMED CT 诊断会被映射到一个合适的 ICD 编码。这种从丰富术语集到分类系统的映射()必然是一个多对一的过程。许多精细的细节“丢失”了,但这并非无意之失。它被折叠进了正确的统计箱中,实现了 ICD 的独特目的。试图用错误的工具做错误的工作——例如,使用面向统计的 ICD 来驱动详细的临床决策支持——会导致可预见的错误,并且无法捕捉到必要的临床细微差别。
我们在此遇到了一个有趣的悖论。为了能够有效地追踪趋势,一个分类系统必须随时间保持稳定。但为了保持医学相关性,它又必须随着科学知识的进步而演变。ICD 如何能既是一把固定的标尺,又是一个移动的目标呢?
ICD 会通过重大修订进行周期性更新——ICD-9、ICD-10,以及现在的 ICD-11。当一个国家从一个版本切换到另一个版本时,其卫生统计数据中可能会出现“断裂”或中断 (discontinuity)。某种特定癌症死亡率的突然飙升可能并不反映真实的疫情,而仅仅是编码规则的改变,将死亡从一个模糊的类别重新分配到了一个更具体的类别。
那么,我们如何看穿这些假象呢?解决方案是一种巧妙的方法学工具,称为桥接编码研究 (bridge-coding study)。在一段时间内,会对一份死亡证明样本进行两次编码:一次使用旧版本,一次使用新版本。通过比较同一组死亡的两种编码结果,我们可以为每种死因计算一个可比性比率 ()。例如,如果一项桥接编码研究发现,对于缺血性心脏病,ICD-10 下的死亡人数是 ICD-9 下死亡人数的 倍,那么 就是 。
这个比率就像一个转换因子。我们可以用这个比率乘以 ICD-9 时代的历史数据,使其与 ICD-10 时代的数据具有可比性。这种调整使我们能够创建一个一致的时间序列,消除人为的断裂,揭示真实的潜在健康趋势。正是通过这种方式,我们才能够有意义地追踪长期的转变,例如流行病学转变 (epidemiological transition)——即疾病模式从传染病向慢性非传染性疾病的历史性转变——这一过程跨越了数十年的数据。这种对向后兼容性的执着,是一个成熟统计系统的标志。最新的修订版 ICD-11 甚至在其结构中融入了这些经验,它有一个灵活的、类似本体的基础层 (Foundation) 用于知识表示,还有一个独立的、刚性的派生分类 (Linearization) 用于稳定的统计报告。
最后,要真正理解 ICD 是什么,我们还必须理解它不是什么。设想两个人遭受了完全相同的脊髓损伤。他们会共享同一个 ICD 编码。然而,他们的生活可能天差地别。一个生活在有坡道、无障碍交通和包容性就业政策的城市里,可能有一份全职工作和活跃的社交生活。另一个生活在有物理和社会障碍的农村地区,可能被限制在家中。
他们的疾病是相同的,但他们在世界中的功能 (functioning) 却截然不同。这种差异不是由病理学解释的,而是由他们的健康状况与他们的环境之间的相互作用解释的。ICD 在设计上对此视而不见。它的目的是对疾病进行分类,而不是对残疾的生命体验进行分类。
认识到这一关键差距,世界卫生组织开发了一个配套的分类系统:国际功能、残疾和健康分类 (International Classification of Functioning, Disability and Health, ICF)。ICF 的目的不是对疾病进行分类,而是对人类功能的全部谱系进行分类,包括身体功能、活动、社会参与以及环境因素的关键作用。
ICD 和 ICF 作为互补的一对协同工作。ICD 告诉我们一个人患有什么疾病。ICF 告诉我们那个人在他/她的特定世界中如何带着他们的健康状况生活。通过理解 ICD 的精确目的和精妙机制,我们看到的不再是一个枯燥的编码列表,而是一个促进全球理解的强大工具——一个通过了解自身局限,让我们能够提出关于人类健康与福祉更深层次问题的工具。
在掌握了国际疾病分类(ICD)的原则与机制之后,我们可能会倾向于将其视为一个相当枯燥的行政工具——一个为人类疾病建立的庞大而组织严密的图书馆目录。但这样做,就如同看一本字典只看到了一串单词,却错过了它们所能构筑的诗歌与散文。ICD 不仅仅是一个静态的列表;它是一个动态而强大的基础设施,支撑着现代医学,塑造着我们对疾病的理解,甚至影响着我们如何看待自身和社会。它的应用从临床实践的前线延伸到全球公共卫生的广阔领域,从遗传学研究的前沿延伸到医学伦理的微妙轮廓。
让我们踏上旅程,探索这个出人意料地丰富且相互关联的世界。
想象一下,你是一名医生,正在检查一位新发现肝脏肿瘤的患者。你该如何称呼它?只要你知道它是恶性的,这个名字还重要吗?答案是:至关重要。多年来,恶性肝脏肿瘤可能被称为“肝癌瘤 (hepatoma)”。“-oma”这个后缀通常暗示良性增生,就像一个简单的脂肪瘤。这个源于历史的单一词汇,承载着危险的模糊性。它可能迷惑患者,误导其他医生,并且至关重要的是,可能导致专门为追踪疾病而设计的系统出现灾难性错误。像“hepatoma”这样一个模棱两可的术语,可能在 ICD 中被错误地编码为良性的“D”类编码,从而有效地使这种癌症从指导研究和公共卫生资金的官方统计数据中消失。
这正是 ICD 第一个也是最根本的应用发挥作用的地方:强制执行精确性。通过坚持使用明确的术语,例如“肝细胞癌 (hepatocellular carcinoma)”,该系统确保肝脏的恶性上皮肿瘤始终被如此记录,并对应一个恶性的“C”类编码。这种精确性并非迂腐;它是构建其他一切的基石。它确保患者获得正确的信息和治疗,并让流行病学家能够准确地统计病例、计算存活率和分配资源。从这个意义上说,ICD 是伟大的标准化者,它将临床观察中混乱多样的语言翻译成一种通用的语言,从开罗的诊所到加利福尼亚的研究机构都能理解。
有了通用的语言,我们就可以开始计数。通过计数,我们便能开始看到在个体患者层面上不可见的模式。这就是流行病学的精髓。ICD 是现代公共卫生监测的引擎,使我们能够跨越时空追踪疾病的起伏。
但这段穿越时间的旅程并非没有其自身的谜题。ICD 本身也在演变。世界从 ICD-9 过渡到了 ICD-10,对死亡原因进行分类的规则也发生了变化。假设在 2002 年,一个国家根据 ICD-9 规则记录了 1200 例结直肠癌死亡。一项研究显示,如果同样的死亡病例按照新的 ICD-10 规则编码,数量将是 1260 例。突然之间,你看到了一个 5% 的死亡率“跃升”,这与生物学无关,而完全是记账方式的问题!为了看清真实趋势,流行病学家必须计算并应用一个“可比性比率”,这是一个校正因子,让他们能够看到一段连续的历史,就像经济学家为了比较不同时期的货币价值而进行通货膨胀调整一样。
当我们审视更长的时间尺度时,挑战会变得更深。在过去一个世纪里,人类经历了一场剧烈的“流行病学转变”,这是一个从传染病主导的世界到慢性非传染性疾病(NCDs)成为主要杀手的宏大转变。我们如何从数据中看到这个史诗般的故事?原始数据可能会误导人。在过去,当一个人死于一系列连锁事件时,死亡证明上可能只列出了一个中间原因,如“心力衰竭”,或者一个模糊的术语,如“衰老”。这些就是流行病学家所称的“垃圾编码”——它们没有指向引发致命事件链的根本疾病。
在 50 年的时间里,随着医学知识和死亡证明填报实践的改进,这些垃圾编码的比例下降了。曾经归因于“心力衰竭”的死亡现在被正确地分配到其真正的根本原因,也许是“缺血性心脏病”。这在非传染性疾病的死亡率上造成了人为的膨胀。为了看清真实情况,科学家们必须进行一项非凡的统计探案工作,称为“死因重新分配”。他们使用复杂的模型,将这些定义不清的类别的死亡重新分配给它们最可能的根本原因,从而清理历史数据,揭示出传染病的真实、平缓的下降趋势,以及与之对应的非传染性疾病负担的上升。
有时,通用的 ICD 不够敏锐。为了解决具体而紧迫的问题,世界卫生组织开发了专门的扩展版本。以孕产妇和围产期死亡的悲剧为例。为了预防这些死亡,我们需要的不仅仅是计数;我们需要知道它们为什么会发生。是像大出血这样的直接产科并发症,还是像因怀孕而加剧的既往心脏病这样的间接原因?ICD 孕产妇死亡分类(ICD-MM)和围产期死亡分类(ICD-PM)为回答这些问题提供了精细的框架。它们强制对因果链进行系统性调查,从而实现一个强大的“从审计到行动的循环”,将数据转化为拯救生命的干预措施。
我们在此触及一个更深层、更令人不安的真相。分类系统并非现实的被动反映。就像地图一样,它强调某些特征而忽略其他特征。通过这样做,地图本身可以影响我们去往何方以及发现什么。ICD 不仅描述疾病世界;它还主动塑造我们对这个世界的认知。
也许最惊人的例子来自对“卵巢癌”的研究。几十年来,归类于卵巢、输卵管和腹膜的癌症的年龄特异性发病率曲线看起来惊人地相似。它们在相同的年龄段上升并达到顶峰。这是一个隐藏在明面上的线索,表明它们可能不是三种不同的疾病,而是具有共同起源的同一种疾病。然而,主流理论是癌症始于卵巢。为什么?部分原因在于 ICD 的编码规则。当外科医生发现一个巨大的肿瘤同时包围了卵巢和邻近的输卵管时,规则常常默认将其编码为“卵巢癌”。输卵管被忽略了。
随后,一种新的病理学理解出现了:许多这类侵袭性癌症实际上始于输卵管伞端(羽毛状末端)的微小前驱病变(一种称为 STIC 的病症)。然后,癌症迅速扩散到卵巢,后者成为其生长为巨大肿块的更肥沃的“土壤”。多年来,ICD 的编码基础设施在无意中掩盖了真正的罪魁祸首,将研究和注意力引向卵巢,而真正的起源却在几厘米之外。这是一个深刻的教训,说明我们用于观察的工具也可能制造盲点。
社会学家 Geoffrey C. Bowker 和 Susan Leigh Star 对此有一个优美的术语:他们将像 ICD 这样的分类系统称为“基础设施 (infrastructure)”。就像建筑物中的管道或电线一样,它至关重要但又不可见——直到它改变或损坏。当 ICD 修订时,过去单一的、笼统的类别可能会被拆分成几个更精细的类别,从而突然使新的疾病对医疗系统变得“可见”。反之,不同的病症可能被合并到一个“残余”类别中,从而有效地使它们变得不可见。这些并非中性的行政调整;它们具有现实世界的影响,根据能够被计数的内容重新引导研究资金、公共卫生项目和资源。
今天,ICD 作为电子健康记录(EHR)的数字基石,焕发了新的生机。输入的每一个诊断代码都是一个面包屑,有了数十亿这样的面包屑,我们就可以开始追踪前所未有的路径。这催生了“计算表型分析”领域。
一个激动人心的应用是全表型关联研究(Phenome-Wide Association Study, PheWAS)。遗传学的传统方法是选取一种疾病,扫描整个基因组以寻找相关基因。PheWAS 则反其道而行之:它选取一个基因,扫描整个“表型组 (phenome)”——即 EHR 中记录的所有疾病和性状的集合——以观察它可能与什么相关联。表型组是通过将数千个 ICD 编码分组为数千个更易于管理的“Phecodes”来构建的。通过将单个遗传变异与整个人类疾病图景进行检验,科学家们可以发现新颖且意想不到的关系,揭示单个基因如何具有基因多效性(多种)效应。
但即便在此,ICD 也有其局限性。它被设计为一个*统计分类系统*,为分组和计数而优化。它就像一本书的目录——适合查看主要章节。它并非被设计为一个参考术语集——一个具有语法和语义丰富性、能够完全忠实地表示复杂临床思想的系统。为此,我们需要更像书的索引那样的东西。
这正是像 SNOMED CT 这样的系统发挥作用的地方。想象一下,试图构建一个临床决策支持系统——一个医生的 AI 助手——它需要理解“轻度间歇性哮喘”和“伴有急性发作的重度持续性哮喘”之间的区别。一个 ICD 编码可能会将这些混为一谈。SNOMED CT 凭借其精细的概念和组合它们的能力(一种称为“后组配”的功能),可以忠实地表示这种复杂性。对于下一代医疗 AI 的可计算、深度语义任务而言,ICD 通常过于粗糙。它提供了基础,但必须在其之上构建其他更具表现力的工具。
最后,我们必须认识到,ICD 不仅是一个技术产物,它也是一个社会产物。它是一份经过协商的文件,反映了我们对生病或健康的含义不断演变的理解。
思考一下精神健康领域。几十年来,一直有两个主要的分类系统并行运行:由世界卫生组织(WHO)为全世界制定的 ICD,以及由美国精神病学协会制定的《精神疾病诊断与统计手册》(DSM)。它们的目标虽然重叠,但有细微差别。DSM 的诞生源于为精神病学研究和临床实践创建高度可靠、可操作化标准的需要。ICD 的使命则更广泛:为全球公共卫生监测创建所有疾病的综合分类。理解它们不同的机构渊源和理念,是驾驭精神健康诊断复杂图景的关键。
然而,最深刻的联系在于“医疗化 (medicalization)”的过程——即曾经被视为社会或个人问题的人类问题,如何被定义和当作医疗状况来对待的途径。极端的工作倦怠是管理失败还是个人缺陷?或者,它是一种医疗状况?当它获得一个官方的 ICD 编码——即使该编码将其标记为“职业现象”而非正式的“障碍”——的那一刻,某些根本性的东西就改变了。它现在可以被正式记录在病历中。它为临床权威机构的干预提供了依据,或许可以通过开具药物或签署病假单。这个问题现在被置于生物医学推理的语言框架中,讨论着压力荷尔蒙和神经递质失衡。通过被纳入分类系统,这种现象获得了一种新的合法性,而医学也获得了对其的管辖权。
从一个肿瘤的简单用词选择,到对工作倦怠的社会定义,国际疾病分类已深深融入我们的健康、科学和文化的肌理之中。它远不止是一份关于人体可能出现问题的目录;它是一份活生生的文件,反映并反过来塑造着我们对理解人类状况的持续探索。