
在当今的数字世界中,信息常常被困在无法通信的孤立系统中,造成了现代版的“巴别塔”。这一挑战在医疗健康等关键领域尤为严峻,患者的数据可能以不兼容的格式分散在多个提供商之间,阻碍了安全有效的护理。系统不仅无法交换数据,更无法真正理解其含义,这种能力的缺失构成了巨大的鸿沟,损害了患者的治疗效果、科学研究和系统效率。本文旨在通过深入探讨互操作性标准的世界来解决这个问题。在第一部分“原则与机制”中,我们将剖析互操作性的基础层、结构层、语义层和组织层,并探索像 FHIR 这样现代标准的优雅设计。随后的“应用与跨学科联系”部分将阐明这些标准如何实际应用于革新患者护理、赋能全球研究、确保健康公平,甚至推动工程学和合成生物学等不同领域的创新。我们将首先探讨那些使我们能从无序、断连的数据中创造意义的核心原则。
想象一下,你正试图用从十几本不同书籍中撕下的书页来拼凑一个连贯的故事,这些书页用十几种不同的语言写成。有些书页使用罗马字母,有些是西里尔字母,有些则是象形文字。即便是在那些用英语写成的书页中,一位作者可能写的是“地球的卫星”(the earth's satellite),而另一位写的是“月亮”(the moon),第三位诗人则称之为“夜晚的银色君王”(night's silver sovereign)。你如何可能拼凑出一个关于天文学的、单一而可靠的叙述呢?
这在本质上就是现代信息系统所面临的挑战,尤其是在像医疗健康这样既重要又复杂的领域。当你的病史分散在家庭医生的诊所、你在度假时去过的医院以及一家专科门诊时,这些系统就像是从未谋面、使用不同语言、各有其独特简写方式的抄写员。为了让你的护理无缝且安全,这些不同的系统不仅必须交换信息,还必须理解信息。这就是对互操作性的追求,而使其成为可能的原则既优雅又至关重要。
让我们从一个简单而具体的任务开始。假设我们想找出两个不同医院系统总共收治了多少“2 型糖尿病”(Type 2 diabetes mellitus)患者。这似乎很简单——只需让每个系统计算出带有该诊断的患者数量,然后将数字相加即可。
但如果其中一家医院的系统 A 并不使用这个确切的短语呢?它的记录中可能有“成人发病型糖尿病”(adult-onset diabetes)(一个较旧但同义的术语),以及其他标记为“2 型糖尿病”的记录。与此同时,系统 B 有“2 型糖尿病”的记录,但还有一个“未指明为 1 型或 2 型的糖尿病”(diabetes mellitus not stated as type 1 or type 2)的类别,这个类别是模糊的。简单地搜索“2 型糖尿病”这个精确字符串会漏掉系统 A 中“成人发病型”的患者,并且对系统 B 中的模糊病例无能为力,从而导致一个极其不准确的统计结果。数据可以交换,但其意义却在转换中丢失了。
这个失败揭示了真正的沟通是分层进行的。为了解决这个数字巴别塔问题,我们必须建立一种数字版的“罗塞塔石碑”,在每个层面上建立理解。我们可以将互操作性想象成一个金字塔,每一层都支撑着上一层。
金字塔的底部是基础互操作性。这是最基本的要求:一个系统能否发送一个数据包,而另一个系统能够接收它?这相当于在两个城市之间建立了可靠的邮政服务。它确保数据从 A 点到达 B 点,但对包裹的内容一无所知。
上一层是结构互操作性(也称为句法互操作性)。这一层确保当包裹被打开时,其内容不只是一堆杂乱的字母。它为数据提供了“语法”。系统事先就特定的格式和结构达成一致,因此接收系统知道在哪里找到患者的姓名、出生日期、诊断代码和实验室检验值。可以把它想象成约定好每条消息都是一个结构化的句子,有主语、谓语和宾语,并且顺序是可预测的。像 HL7 第 2 版这样的旧标准是这方面的先驱,它们创建了带有段(segment)和字段(field)的消息结构,从而整理了医疗健康数据的混乱局面。这一层确保消息是可解析的,但不一定是可理解的。
这就把我们带到了对于有意义的交换最关键的一层:语义互操作性。这是共享的词典,是解锁意义的关键。结构互操作性为我们提供了语法正确的句子,但语义互操作性确保我们对句子中词语的含义达成一致。
这就是参考术语集发挥作用的地方。这些是为医疗健康概念编纂的、庞大而精心管理的词典。例如,医学术语系统化命名法—临床术语(Systematized Nomenclature of Medicine—Clinical Terms, SNOMED CT)为几乎每一个临床概念,从“2 型糖尿病”这样的诊断到一项操作或一个发现,都提供了一个独特、无歧义的代码。逻辑观察标识符名称和代码(Logical Observation Identifiers Names and Codes, LOINC)则为实验室检验和临床观察做了同样的事情。
通过使用这些标准,我们解决了糖尿病计数的问题。我们不再搜索模糊的文本字符串,而是要求两个系统提供与“2 型糖尿病”的特定 SNOMED CT 代码相关联的患者。系统 A 的“成人发病型糖尿病”和“2 型糖尿病”都会被映射到这同一个代码。系统 B 的模糊表述“未指明为 1 型或 2 型的糖尿病”则会被映射到一个不同的、不那么具体的代码,并被正确地从这次精确查询的计数中排除。我们不再是比较词语,而是在比较概念。这就是对话与嘈杂的区别。
金字塔的顶端是组织互操作性。即使有了共同的语言和语法,协作也需要信任、明确的规则和共同认可的流程。这一层与技术无关,它关乎治理、政策和人。它回答了诸如:我们可以在什么样的法律协议下跨国界共享数据?使用患者数据进行研究的同意政策是什么?如果出了问题,谁来负责?这些非技术性因素——数据共享协议、一致的同意政策和信任框架——往往是有效数据交换的最大障碍。没有这些社会规则,即使是技术上最完美的系统也依然保持沉默。
在这里,我们也必须将互操作性标准与更广泛的数据治理领域区分开来。互操作性标准规定了系统在技术上如何交换和解释数据。数据治理原则设定了合法和合乎道德地处理这些数据的规则——解决隐私、同意和数据质量保证等问题。前者是通信渠道的工程设计,后者是管理其使用的法律和伦理。
理解这些层次有助于我们欣赏像第七层健康信息标准之快速医疗互操作性资源(Health Level Seven Fast Healthcare Interoperability Resources, FHIR)这样现代标准的美妙之处。FHIR 不仅仅是另一种格式,它是一个为互联网时代设计的、用于构建可互操作系统的完整工具包。
可以把 FHIR 资源(Resources)看作一套标准化的、智能的乐高积木。有一个 Patient(患者)积木,一个 Observation(观察)积木(用于实验室结果),一个 MedicationRequest(用药请求)积木,等等。每个积木都有明确定义的结构,规定了它包含哪些信息。这提供了开箱即用的结构互操作性。
但真正的力量在于 FHIR 配置文件(Profiles)。一个配置文件就像一本使用乐高积木搭建特定模型的说明书。对于一项临床研究,一个配置文件可能会声明,每一个代表血糖测试的 Observation 积木必须包含一个来自 LOINC 词典的代码,并且必须使用来自统一计量单位代码(Unified Code for Units of Measure, UCUM)等标准的单位来报告其值。如果一条记录以“mmHg”而不是“g/dL”来报告血红蛋白,系统会立即知道它是无效的,不是因为它是一个统计异常值,而是因为它违反了数据模型的基本语义规则。
然后,FHIR 利用现代应用程序编程接口(Application Programming Interfaces, APIs)使这些积木易于连接,这与让你的天气应用从国家气象局获取数据的技术相同。这种方法改变了游戏规则,使我们从笨拙的点对点接口转向一个灵活的、基于网络的生态系统。
这种分层的、标准化的方法的优雅之处不仅仅是学术性的。它具有我们可以衡量的、深刻的现实世界影响。
考虑一项试图整合两家医院数据的研究。如果每家医院都使用自己本地的、非标准的代码,那么为一个患者找到一条可用的、正确映射的记录的概率可能很低。在一个假设但现实的场景中,在两个站点之间为一个患者获得一条完整、可比较记录的机会可能低至 。然而,通过采用具有严格术语绑定的 FHIR,这个概率可以跃升至 ——提高了超过 倍!。突然之间,以前不可能的研究变得可行,加速了挽救生命的证据的产生。
标准化的这一原则也使我们的系统具有了更强的可扩展性。如果 家医院都需要相互通信,为每一对医院建立定制连接将需要一个噩梦般的、接近 个接口的网络。通过让每个人都将其数据映射到一个单一的通用标准(一种“轴辐式”模型),所需连接的数量下降到 的数量级。这是一个难以管理的纠缠和一个优雅、可扩展的架构之间的区别。
这对人的生命有直接影响。对于一个频繁在不同诊所和医院之间转移的患者来说,他们的健康故事变得支离破碎,散落在无法相互交谈的系统中。将这个“纵向记录”拼凑起来可能是一个巨大的负担。建立在 FHIR 上的标准化 API 允许患者使用智能手机应用程序从每个医疗机构收集他们的记录,从而降低了管理自身健康的“摩擦成本”。对于面临最严重碎片化问题的服务不足人群来说,这种技术飞跃是迈向数字健康公平的一步。为确保这一点,我们必须将我们的国家健康信息系统建立在唯一的患者标识符和互操作性标准的基础上,这对于护理的连续性以及战略性地购买和衡量医疗质量至关重要。
互操作性是科学和医学数据一个更宏伟愿景的基石。它是 FAIR 指导原则的四大支柱之一:数据应该是可发现的(Findable)、可访问的(Accessible)、可互操作的(Interoperable)和可重用的(Reusable)。使数据可互操作并非最终目标;目标是使其能够被未来的研究、未来的世代,以我们今天甚至无法想象的方式重用。这也需要记录一个数据集的数据源头(provenance)——它的起源故事以及它经历的每一次转换——这样我们才能信任它。
实现这一愿景不仅仅是一个技术问题。标准的选择具有深刻的政治和经济维度。标准会产生网络效应:采用某个标准的国家或医院越多,加入它们的价值就越大。这可能导致锁定效应(lock-in),即转换到更好的替代方案变得成本过高。一个国家可能会因为供应商的激励()和高昂的转换成本()而被锁定在一个由单一供应商控制的专有标准中。要克服这种锁定效应以采用一个开放标准——一种真正的公共产品——可能需要协调行动,例如通过捐助方转移支付()来抵消私人成本,并将激励与开放的全球利益对齐。
通往互操作性的旅程是一个从混乱中创造秩序、从噪音中创造意义的故事。它证明了人类协作的力量,能够一层一层地建立共同的理解。从数据结构的语法到医学概念的通用词典,这些标准是构建一个更健康、更互联、更公平未来的无形架构。
在了解了互操作性标准的原则和机制之后,我们可能觉得自己已经对这片领域有了一张不错的地图。我们理解了“是什么”和“如何做”——那些允许不同系统说同一种语言的语法、句法和词典。但是,地图只有在你去往某地时才有用。所以现在我们要问最激动人心的问题:“为什么?”和“在哪里?”为什么这些标准如此至关重要?它们在哪些方面重塑了我们的世界?我们将看到,这些不仅仅是技术规范,而是实现更安全的医疗、更强大的研究、更公正的社会,乃至工程机器和生命体的无形架构。
互操作性的影响在健康领域最为直接和个人化。它构成了一种数字结缔组织,确保信息——医学的命脉——在需要时流向需要的地方,且其含义完好无损。
思考一条关键信息的旅程。一个新生儿接受了一种罕见但可治疗的遗传病的检测。结果必须从一个专门的州立实验室传到医院的电子健康记录(EHR)中,并迅速呈现在临床医生面前。一个过时的系统可能涉及传真或非标准信息,计算机无法自动理解。相比之下,像第七层健康信息标准(HL7)快速医疗互操作性资源(FHIR)这样的现代标准,就像一个通用信使,确保结果不仅近乎实时地送达,而且被完美理解,测试名称使用像逻辑观察标识符名称和代码(LOINC)这样的标准术语编码,临床发现在医学术语系统化命名法临床术语(SNOMED CT)中编码。这个看似简单的无缝交换行为,最大限度地减少了令人痛苦的延迟 和可能改变一个孩子一生的可怕的误解概率 。
这条数字线索现在已经延伸到医院围墙之外,融入我们的日常生活。想象一位患者参加心血管预防项目。他们的智能手机应用和蓝牙血压计产生了一系列有价值的数据流——身体活动分钟数、每日读数。在过去,这些信息会孤立地存在于患者的设备上,最多在下次就诊时口头报告。如今,像 FHIR 及其安全与启动框架伴侣 SMART-on-FHIR 这样的标准,允许患者授权在他们的应用和诊所的 EHR 之间建立安全连接。每天的活动可以作为一个离散的、可计算的 Observation 资源传输,其含义通过活动类型和单位的标准代码被锁定。然后,EHR 可以自动计算每周的总量,如果低于推荐阈值,就会为临床医生触发一个决策支持提示。个人数据变成了临床数据,数据变得可操作,预防也变得主动。
这种无缝流动始于最基础的层面:你身体上的传感器。一次心跳的旅程,由可穿戴监护仪捕获,始于像电气和电子工程师协会(IEEE)11073 系列这样的设备级标准。这些标准定义了设备本身——即“代理”(agent)——如何将其测量值传达给手机或网关等数据收集器。从那里,像 FHIR 这样的临床互操作性标准接管,将原始的设备级信息转换为对 EHR 具有临床意义的 Observation 资源。这是一场精彩的多阶段接力赛,数据从个人设备世界传递到临床世界,每个标准都确保接力棒不会掉落。
如果说互操作性改变了个体护理,那么它彻底革新了我们能从群体中学到的东西。通过允许我们合乎道德且高效地汇集来自庞大人群的数据,标准将个体记录的集合转变为强大的发现引擎。
思考一下抗击癌症的斗争。肿瘤学家希望了解哪些患者对强大的新型免疫疗法反应最佳。为此,他们需要汇集来自多家医院数千名患者的数据,寻找疗效与生物标志物(如程序性死亡配体 1 (PD-L1) 表达或肿瘤突变负荷 (TMB))之间的相关性。挑战在于,不同的实验室使用不同的检测方法,并以不同的方式报告结果。一家医院的 TMB 为“10”与另一家医院的 TMB 为“10”是否具有可比性?答案是“否”,除非你同时捕获了关键的方法学背景:分析的基因组区域大小、使用的生物信息学流程等等。用于研究的真正互操作性意味着创建数据结构,比如 FHIR Observation,它不仅携带值和单位,还携带科学可重复性所需的所有元数据。正是这种深度的语义标准化,使我们能够生成可靠的真实世界证据(RWE),并真正实现个性化医疗。
这一原则可扩展至全球范围。想象一下协调一个针对抗菌素耐药性(AMR)的全球监测系统,这是对公共卫生的最大威胁之一。为了计算给定病原体-抗生素对的有效合并耐药率 ,你不能简单地将不同国家的百分比取平均。你需要来自每个地点的原始分子()和分母()。更重要的是,你必须确保每个地点都以相同的方式对“耐药”进行分类。如果你只接收最终的解释,这是不可能的。唯一稳健的解决方案是标准化原始定量数据的交换——即最低抑菌浓度(MIC)或纸片扩散法抑菌圈直径——以及检测方法和折点版本。这使得中央系统可以根据一个单一、一致的标准重新分析所有数据,从而产生一个科学上有效的全球图景。没有这个,我们对超级细菌的全球雷达将变得 hopelessly blurred。同样的逻辑也适用于评估国家疟疾项目;要获得对检测覆盖率的无偏估计,必须能够将疑似病例、进行的检测和诊断试剂盒缺货的数据联系起来——如果没有设施、检测和商品的通用标识符,这项任务就充满了错误。
互操作性不仅关乎效率或发现,它更是一种道德责任。在我们日益复杂、由软件驱动的医疗体系中,它是患者安全的基石。考虑一个为住院患者推荐胰岛素剂量的“医疗器械软件”(SaMD)。这个算法的决策事关生死。它从多个来源获取数据:来自 EHR 的实验室值(通过 FHIR)、来自放射科档案的影像研究(通过 DICOM),以及来自输液泵和生命体征监护仪的近实时数据(通过 IEEE 11073)。任何这些数据流中的失败都可能是灾难性的。如果软件获取了错误患者的数据怎么办?或者六小时前的血糖值?或者一个单位错误的值?
这就是互操作性成为一种安全工程形式的地方。细致的、基于标准的要求——强制使用唯一的患者标识符、强制时钟同步、使用受控术语表示单位和代码、以及使用现代认证来保护数据——不仅仅是“良好实践”。它们是旨在降低危害概率 和严重性 的特定控制措施。用医疗器械风险管理的语言来说,这就是我们证明该设备具有可接受安全性的方式。
除了安全,互操作性是健康公平的先决条件。例如,基因组医学的承诺是根据个体的基因构成来量身定制治疗方案。但我们知道,健康结果是基因、环境和社会背景共同作用的产物。为了公平地部署基因组决策支持,我们还必须考虑健康的社会决定因素(SDOH)——如住房不稳定或缺乏交通工具等因素。如果我们的系统未能一致地捕获这些 SDOH 数据,特别是在负担最重的资源匮乏社区,我们就会引入一种毁灭性的偏见。一个旨在提供帮助的算法可能会系统性地辜负它本应服务的群体,因为它对他们的现实视而不见。采用标准来表示和交换 SDOH 数据——使用 ICD-10-CM Z-codes 或来自像 Gravity Project 这样的倡议的价值集——是朝着构建能够看到完整个人并减轻将社会不平等编码到我们数字健康基础设施中风险的第一步。
一个真正基本概念的美妙之处在于其普适性。让医生能够访问患者记录的思维模式,同样被工程师用来设计高超音速喷气机,被生物学家用来构建新的生命形式。互操作性就是这样一个概念。
想象一下为可重复使用的高超音速飞行器构建一个“数字孪生”的任务——这是一个复杂的仿真,集成了飞行力学、结构应力、热加热和航空电子学的独立模型。每个模型都是专业物理学的杰作,由不同团队使用不同工具构建。你如何让它们在一个连贯的仿真中一起“飞行”?你使用协同仿真(co-simulation),其中每个仿真器独立运行,但在同步的时间点与其他仿真器交换数据。为了管理这个复杂的舞蹈,工程师使用像功能样机接口(Functional Mock-up Interface, FMI)这样的标准,它将每个仿真器打包成一个带有通用 API 的标准化“黑盒子”;以及像高层体系结构(High Level Architecture, HLA)这样的标准,它在网络上协调仿真,管理逻辑时间和数据流。这个问题与医疗健康领域的问题完全相同:让异构的、专门的系统可靠地互操作。
现在,将尺度从航天器缩小到单个细菌。一位合成生物学家想要设计一个基因回路——一个基因级联,其中一个基因的蛋白质产物控制下一个基因的活性。为了构建这个,他们使用像金门克隆(Golden Gate cloning)这样的物理组装标准,以确保 DNA 片段正确地连接在一起。但这只保证了物理结构。它不保证电路会工作。来自第 1 层的输出信号是否足够强以激活第 2 层,但又不会强到使其饱和?为了使他们的设计可预测和模块化,生物学家正在开发功能信号标准。他们定义了细胞活动的单位,如用于转录的“每秒聚合酶数”(Polymerases Per Second, PoPS)和用于翻译的“每秒核糖体数”(Ribosomes Per Second, RiPS)。通过用这些共享的单位来表征他们的基因“部件”,他们可以设计复杂的多层系统,并显著降低其最终输出的不确定性。就像电气工程师依赖伏特和安培一样,生物工程师依赖 PoPS 和 RiPS。这是应用于生命物质编程的同样互操作性原则。
这种统一性甚至延伸得更远。为了理解人畜共患病——那些从动物传播给人类的疾病——的传播,我们必须拥抱“同一健康”(One Health)的方法。这需要整合来自人类临床护理、兽医学和环境监测的数据。每个领域都有自己的数据、自己的专家和自己的标准。人类健康使用 FHIR 和 SNOMED CT;动物健康使用世界动物卫生组织(WOAH)的模式;环境科学使用开放地理空间联盟(OGC)的传感器数据标准和达尔文核心(Darwin Core)的生物多样性记录标准。同一健康信息学的巨大挑战是在这些世界之间搭建桥梁,创建一个统一的数据生态系统来保护我们整个星球的健康。
最后,这些技术系统并非存在于真空中。它们被编织在一张由法律、伦理和政策构成的复杂织锦中。在美国,促进为护理目的自由交换健康信息的联邦法律(如《21 世纪治愈法案》,21st Century Cures Act)与受联邦 HIPAA 法案以及通常更严格的州级法规保护的隐私权之间存在着一种引人入胜的张力。一家医院在遵守联邦共享数据授权的同时,是否会违反一项要求对同样共享行为获得明确患者同意的州法律?答案在于联邦优先权(federal preemption)这一复杂的法律原则。通常,HIPAA 允许各州制定更强的隐私保护措施。然而,如果该州法律直接阻碍了实现一个令人信服的联邦目标,它就可能被优先适用。驾驭这一领域需要的不仅仅是程序员;它需要律师、伦理学家和政策制定者来平衡隐私和数据流动性这两种深刻的社会利益。这表明,真正的互操作性不仅是一项技术成就,也是一项社会和法律成就。
从单个患者到全球人口,从航天器到活细胞,从工程师的工作台到法庭,互操作性的原则是一股强大的、统一的力量。它们是创造共享意义的、安静而必不可少的工作,使我们能够构建更安全、更智能、更互联、更公正的系统——以及社会。