try ai
科普
编辑
分享
反馈
  • 适应性治疗

适应性治疗

SciencePedia玻尔百科
核心要点
  • 适应性治疗通过考虑个体的基线风险来量身定制治疗方案,确保对特定个体而言,绝对获益大于伤害。
  • 动态治疗方案 (DTRs) 为根据患者不断变化的状态做出序贯的“如果-那么”式治疗决策提供了一个科学框架。
  • 专门的试验设计,如序贯多次分配随机试验 (SMARTs),对于发现最有效的多阶段适应性策略至关重要。
  • 应用范围广泛,从通过实时即时适应性干预 (JITAIs) 管理慢性病,到利用演化生物学原理对抗癌症。

引言

长久以来,医学一直依赖于“一刀切”的模型,即治疗方案基于一般患者。这种方法往往未能考虑到关键的个体差异,以及患者病情可能随时间发生巨大变化的事实。适应性治疗提供了一种革命性的替代方案:一个科学框架,通过在患者的整个护理过程中做出动态的、数据驱动的决策来实现个性化治疗。但我们如何将这种直觉艺术转变为一门严谨的科学呢?本文旨在探讨这一新兴医疗范式的基础和前沿,以填补这一空白。文章将首先深入探讨其核心原理和机制,解释诸如动态治疗方案等概念以及用于测试它们的创新性试验设计。随后,文章将通过其在医学和科学领域的 diverse 应用和跨学科联系,展示这种方法的广泛影响。我们将从审视驱动适应性治疗的基本逻辑开始,超越平均水平,去理解风险与获益之间的个体化舞蹈。

原理与机制

超越“一刀切”:风险与获益之舞

让我们从一个简单、几乎不言自明的真理开始:没有两个人是完全相同的。我们不会期望同一双鞋能适合房间里的每一个人,那么我们又为何期望一种医疗方法能对每个人都同样有效呢?几个世纪以来,医学一直以平均值为基础运作。一种药物之所以被批准,是因为平均而言,它的益处大于害处。但你不是一个平均数,你就是你。适应性治疗的旅程始于这一根本性的认识。

想象两个人正在考虑一种新的预防性疗法。一个是年轻健康的个体,另一个是年长且有多种既存状况的个体。他们的医生告诉他们,这种疗法能将发生严重事件的风险降低四分之一。这是​​相对获益​​,听起来对他们两人同样有吸引力。但这对他们作为个体究竟意味着什么呢?

这就是​​基线风险​​概念发挥作用的地方。基线风险很简单,就是如果你什么都不做,坏事发生的概率。对于我们这位年轻健康的人来说,未来五年内发生该事件的基线风险可能非常低,比如说5% (pL=0.05p_{\mathcal{L}}=0.05pL​=0.05)。对于年长的个体,基线风险可能要高得多,也许是20% (pH=0.20p_{\mathcal{H}}=0.20pH​=0.20)。

现在让我们应用这25%的相对风险降低。对于低风险者,该疗法将其风险从5%降低到3.75%。​​绝对风险降低 (ARR)​​,即实际消除的风险量,仅仅是1.25个百分点。为了预防仅一例事件的发生,我们需要治疗80名这样的人(NNT=1/0.0125=80NNT = 1/0.0125 = 80NNT=1/0.0125=80)。然而,对于高风险者,同样的疗法将其风险从20%降低到15%。他们的绝对风险降低为5个百分点——是前者的四倍!在这里,我们只需要治疗20人就能预防一例事件(NNT=1/0.05=20NNT = 1/0.05 = 20NNT=1/0.05=20)。

这个简单的例子揭示了一个深刻的原理:即使一种治疗的相对获益是恒定的,其绝对获益也是疗法与个体之间的一场舞蹈。那些基线风险较高的人将获得更多益处。这是个性化医疗的基石。适应性治疗的第一步不是治疗每个人,而是治疗正确的人——那些获益大于成本和副作用的人。这自然引出了下一个问题:如果一个人的“风险”不是静态的呢?如果它随着时间,甚至是对治疗本身的反应而变化呢?

作为对话的医学:适应的逻辑

治疗慢性病不像是一次性的、决定性的行动,而更像是一场漫长的对话。医生开出一种治疗方案,等待观察患者的反应,然后相应地调整计划。适应性治疗力图将这种非正式的艺术转变为一门严谨的 science。它将这一过程形式化为一套预先指定的规则,称为​​适应性治疗策略​​,或更正式地称为​​动态治疗方案 (DTR)​​。

DTR本质上是一张路线图,是一系列“如果-那么”的指令,根据患者不断演变的信息来指导治疗。它不是即兴发挥,而是制定一个有原则的计划,预见患者 journey 中的曲折变化。

考虑一个旨在改善2型糖尿病患者体育活动和药物依从性的项目。一个DTR可能如下所示:

  • ​​第一阶段(第1-4周):​​所有人从关于饮食和锻炼的基础​​教育​​开始。
  • ​​决策点1(第4周末):​​我们检查他们的进展。他们的日均步数是否增加了至少10%并且他们是否服用了至少80%的药物?
    • ​​如果是(他们是“响应者”):​​很好!他们在接下来的四周继续接受教育。
    • ​​如果否(他们是“无响应者”):​​教育还不够。我们升级他们的治疗。
  • ​​第二阶段(第5-8周):​​无响应者现在会因达到目标而获得金钱​​激励​​。
  • ​​决策点2(第8周末):​​我们使用相同的标准再次检查他们的进展。
    • ​​如果是(他们现在有响应了):​​太好了!他们继续接受激励。
    • ​​如果否(他们仍然是无响应者):​​我们需要动用“重武器”了。
  • ​​第三阶段(第9-12周):​​持续无响应者被指派一名个人健康​​教练​​。

这种“阶梯式护理”方法是一个典型的DTR。它是适应性的,因为治疗路径取决于患者的历史。它是科学的,因为规则——“响应”的定义、决策的时机以及治疗选项——都是预先定义好的。这与​​固定方案​​有着根本的不同,后者是每个人都接受相同的治疗序列,无论他们的表现如何。测试此类策略的伦理基础是​​临床均衡​​——即专家们对于在任何决策点,针对具有特定病史的患者,哪种可用选项是真正最佳的选择存在真实的不确定性。但是,如果存在如此多可能的路径,我们到底该如何找出哪个DTR是最佳的呢?

规划路径:SMART设计的巧妙之处

传统的​​随机对照试验 (RCT)​​是回答简单问题的金标准,例如“药物A是否优于安慰剂?”。我们将一大群人随机分配到一个组或另一个组,并比较他们的平均结果。但RCT并非为比较分支式、适应性的路径而设计的。尝试这样做将需要一个大到不可能且极其复杂的试验。

为了解决这个问题,研究人员开发了一种巧妙的实验设计,称为​​序贯多次分配随机试验 (SMART)​​。SMART是一种多阶段试验,参与者不仅在开始时被随机化,还可能在后续的决策点被再次随机化。这是发现最佳DTR的完美实验室。

让我们为一个体育活动项目构建一个SMART。

  • ​​基线(第一阶段):​​我们将参与者随机分配到数字 coaching (DDD) 或团体课程 (GGG)。
  • ​​决策点(第8周):​​我们评估他们的反应。​​适配变量​​是他们的日均步数是否增加了超过10%。
    • 响应者只需继续他们最初的治疗。他们的路径已经确定。
    • 无响应者是有趣的群体。他们需要一些不同的东西,但是什么呢?
  • ​​再次随机化(第二阶段):​​我们对无响应者进行再次随机化。
    • 来自数字 coaching 组的无响应者被随机分配到获得健身房会员资格 (D+MD+MD+M) 或动机性访谈 (D+ID+ID+I)。
    • 来自团体课程组的无响应者被随机分配到两种不同的强化选项之一。

注意这个结构。试验本身包含了我们想要测试的DTRs的所有分支逻辑。完整的序列,如“D→D \rightarrowD→ 无响应者 →D+M\rightarrow D+M→D+M”,被称为​​嵌入式DTRs​​。到试验结束时,我们的参与者已经走过了许多不同的路径。每个阶段的随机化确保了选择(例如,在 D+MD+MD+M 和 D+ID+ID+I 之间为无响应者做出的选择)是公平的,没有偏见。现在的挑战变成了一个统计学问题:当我们从未从一开始就将任何人随机分配到一个完整的DTR时,我们如何比较这些完整的、分支路径的总体有效性?

统计学家的技巧:倾听每个声音

这里就涉及到了现代统计学中最优美的思想之一。如果我们只是天真地比较最终走上路径1的所有人和最终走上路径2的所有人的最终结果,我们的结果将是有偏的。这些组是不可比的;例如,路径1可能包含比路径2更多的初始“响应者”,而这些人无论如何都可能表现得更好。

为了解决这个问题,我们使用一种称为​​逆概率加权 (IPW)​​ 的技术。其核心思想出人意料地直观。想象一下,你正试图估算一个国家人口的平均身高,但你的调查不小心包含了比女性多一倍的男性。为了得到一个无偏的估计,你会给每个女性的测量值赋予两倍于男性的“权重”,以纠正这种不平衡。

IPW在SMART中做的也是同样的事情。每个参与者的旅程都有一定的概率。在我们的SMart例子中,每个人在开始时都有50%的几率接受 DDD 或 GGG。对于 DDD 组中的无响应者,他们接着有50%的几率接受 D+MD+MD+M。因此,那条特定路径(D→D \rightarrowD→ 无响应者 →D+M\rightarrow D+M→D+M)的总概率是 0.5×0.5=0.250.5 \times 0.5 = 0.250.5×0.5=0.25。为了估计这整个DTR的价值,我们取遵循该路径的人的最终结果,并赋予它一个 1/0.25=41/0.25 = 41/0.25=4 的权重。我们对每个人都这样做。那些旅程与我们正在评估的DTR一致的参与者,会根据他们路径的概率获得一个权重;其他所有人得到的权重为零。

通过计算这个加权平均结果,我们可以得到一个清晰、无偏的估计,即如果整个人群都遵循那一个特定的DTR,平均结果会是什么。我们可以为每一个嵌入式DTR重复这个过程。这种方法的魔力在于,每一位参与者都对分析做出了贡献,使我们能够高效、公平地一次性比较所有策略。

未来已来:即时干预

适应性治疗的原则不仅限于诊所里每隔几周或几个月做出的决策。如果我们能够时时刻刻地调整治疗呢?这就是​​即时适应性干预 (JITAIs)​​的前沿,通常通过智能手机和可穿戴设备实现。

想象一个心理健康应用程序。一个静态程序可能会在每天早上9点给你发送一个正念提醒。相比之下,一个JITAI是一个动态的数字伴侣。它使用你手机传感器的数据——你的位置、你的活动水平,甚至可能是你的心率变异性——作为实时的​​适配变量​​。JITAI的决策规则旨在发现脆弱或机会的时刻。你刚刚进入了一个你与高压力相关联的地点吗?你的睡眠质量是否不佳?JITAI随后可以决定何时干预以及提供什么——也许是现在的一个呼吸练习,或者稍后的一个认知重构提示。

当然,找出最佳的JITAI规则需要一种新的研究设计。于是,​​微观随机试验 (MRT)​​ 应运而生。在MRT中,单个参与者在研究过程中被随机分配数百次甚至数千次。每当一个机会时刻出现时,应用程序会随机决定是发送一个提示还是什么都不做。通过汇总这些无数次微观决策的数据,研究人员可以了解到哪些提示是有效的,对谁有效,以及在什么情境下有效,所有这些都是为了构建一个更好、响应更灵敏的JITAI。

问题的核心:探寻CATE

在所有这些设计和方法之下,存在一个单一的、统一的目标。对于任何一个具有特定特征集 XXX(他们的基因、病史、当前状态)的人来说,存在一个治疗的真实的、潜在的因果效应。我们称之为​​条件平均治疗效应​​,或​​CATE​​,记作 τ(x)\tau(x)τ(x)。它代表了具有特征 xxx 的人从治疗中相对于对照组所获得的精确益处,以某种效用(如改善的健康状况或生活质量)来衡量。

CATE,τ(x)\tau(x)τ(x),是我们试图发现的世界的一个属性。而​​个性化治疗规则​​ a(x)a(x)a(x) 是我们由此产生的行动计划。适应性治疗的整个事业——从SMARTs到JITAIs——都是关于收集正确的数据来构建对真实CATE的最佳可能估计 τ^(x)\hat{\tau}(x)τ^(x)。

一旦我们有了这个估计,最优的决策规则就惊人地简单:如果估计的获益 τ^(x)\hat{\tau}(x)τ^(x) 大于零,我们就推荐治疗。如果不是,我们就不推荐。

这就把我们带到了这项工作的终极伦理维度。每当我们的估计 τ^(x)\hat{\tau}(x)τ^(x)出错时——特别是当它的符号出错时——我们就为那位患者做出了错误的决定。这被称为​​决策遗憾​​。如果真实的获益 τ(x)\tau(x)τ(x) 是正的,但我们估计它是负的,那么患者就错失了一种有益的疗法。我们遗憾的大小恰恰是他们失去的获益 ∣τ(x)∣|\tau(x)|∣τ(x)∣。我们科学的质量可以通过我们估计误差的大小来衡量。误差越小,我们犯的符号错误就越少,整个人群的总遗憾就越低。因此,适应性治疗不仅仅是一个聪明的统计框架;它是一项有原则的、科学的追求,旨在为每一位患者,在每一个时刻,做出最佳的决策。

应用与跨学科联系

适应性治疗的核心原则不仅限于临床试验的设计,它们代表了一个具有广泛适用性的基本概念。利用反馈动态引导系统达到期望状态的想法是一个统一的原则,贯穿于众多科学和医学领域。这一概念的影响范围从慢性病管理到肿瘤学,代表了医疗实践的深刻转变。这种范式正从僵硬的、一次性的处方向连续的、基于生物系统演变状态的响应性干预转变。

个性化医疗:从慢性病到精神健康

让我们从一些熟悉的事情开始:慢性病。对于像2型糖尿病这样的疾病,过去的方法是给出一套标准的建议,然后期望最好的结果。但人与人是不同的!对一个人有效的方法可能对另一个人失败。适应性治疗给了我们一个行动手册。想象一个糖尿病患者。我们现在可以利用连续血糖监测仪等现代工具,实时获取他们身体对饮食的反应,而不仅仅是一本小册子。如果几周的一种咨询方法后,他们的血糖在目标范围内的时间没有改善,系统不会坐等失败。它会适应。它会触发一个改变,也许是将患者重新随机分配到一种更强化的指导形式或另一种完全不同的行为策略。这就是序贯多次分配随机试验 (SMART) 的精髓,这是一种专门为构建和测试这些适应性策略而设计的强大工具,它不仅让我们了解到哪种初始治疗最好,还能了解哪种治疗序列对不同类型的人是最优的。

这个想法不仅限于血糖。想想一个患有风湿性疾病慢性疼痛的人。对他们来说,認知行為療法 (CBT) 和接納與承諾療法 (ACT) 哪个更好?也许答案是,“视情况而定”。一个适应性的方法会从其中一种开始,可能是随机化的,然后在几周后检查情况。使用一个验证过的衡量疼痛干扰生活程度的指标,我们可以定义“响应”。如果患者有响应,太好了!我们继续。如果没有,我们不会就此放弃他们。方案会适应:我们可能会让他们转换到另一种疗法或加强他们当前的疗法。通过系统地这样做,我们可以为那些一线治疗无效的患者找到最佳的治疗旅程。

我们甚至可以将其 масштабировать到解决重大的公共卫生挑战。考虑一下对抗青少年肥胖的斗争。一个以学校为基础的项目可以从一个新的体育活动模块或一个营养课程开始。两个月后,我们测量学生活动水平的变化。对于那些反应良好的学生,我们坚持计划。对于无响应者,我们引入第二阶段的干预——也许是一个移动健康应用或家庭咨询——将他们随机分组,以找出哪种增强措施最有效。这种SMART设计为我们提供了数据,以建立一个灵活的、多阶段的公共卫生项目,该项目能够适应不同儿童的需求。

但也许这种思维方式最激动人心的前沿是精神健康。想象一种不仅仅发生在每周一次的治疗中,而是与你同在的疗法。这就是即时适应性干预 (JITAIs) 的前景。利用你智能手机中的传感器,一个应用可以推断你何时处于脆弱状态——也许你的情绪低落,你一直不活动,或者你待在家里避免接触。就在那个需要的时刻,应用可以提供一个有针对性的、基于理论的提示:一个简单、有益活动的建议,一个提醒你个人价值观的提醒,或者一个应对退缩冲动的工具。这不是一个预设的警报;它是一个动态系统,其决策规则将你的实时状态(情绪、位置、活动)映射到正确的支持,在正确的时间。这是一场持续的、适应性的对话,旨在温和地将你的行为推向健康。

深入探究:生物标志物与新病理生理学

到目前为止,我们谈论的是适应患者能感觉到或报告的事情——他们的血糖水平、他们的疼痛、他们的情绪。但如果最重要的信号是沉默的呢?如果我们能倾听病理生理学本身的微妙低语呢?这就是适应性治疗变得真正 proactive 的地方。

以一个多发性硬化症 (MS) 患者为例。临床上,他们可能感觉完全正常——没有复发,没有新症状。然而,用核磁共振成像(MRI)观察他们的大脑可能会发现新的炎症病灶。检测一种名为血清神经丝轻链 (sNfL) 的蛋白质的血液测试可能会显示神经细胞仍在受损。这些都是潜在疾病活动的亚临床迹象。一个适应性的“治疗达标”策略不会等待患者病情恶化。它使用这些生物标志物数据作为输入。通过应用一些定量推理,比如使用生物标志物测试的似然比来更新我们对未来风险的估计,医生可以看到患者的复发风险已经超过了一个关键阈值。理性的、适应性的决定是现在就升级到一种更有效的疗法,在不可逆的损害发生之前。这是一个范式转变,从对症状作出反应转变为主动管理潜在的生物学过程 [@problemid:4498936]。

我们可以将这种整合更进一步。对于像重度抑郁症这样复杂的状况,我们正在了解到它不仅仅是“大脑化学物质失衡”。它是一个系统性的紊乱。一个先进的适应性框架不仅仅是跟踪症状。它会构建一个患者状态的多维度图像,整合:​​生物学​​(皮质醇的应激激素节律,C-反应蛋白的炎症水平,心率变异性的自主神经平衡),​​心理学​​(症状评分),和​​社会​​(持续的生活压力)。如果一个患者没有好转,一个真正全面的适应性规则不会只说“增加剂量”。它会查看数据。炎症是否仍然很高?也许我们需要一个生物学靶向的辅助治疗。生活压力是否难以承受?也许我们需要增加社会心理支持和减压疗法。这种方法将著名的生物-心理-社会模型操作化,将其从一个高尚的哲学转变为一个具体的、数据驱动的、适应性的治療計劃。

抗癌战争:一场演化军备竞赛

疾病的动态性在癌症中表现得最为明显,也最为致命。肿瘤不是一团静态的坏细胞;它是一个繁荣、演化的生态系统。如果你试图用单一、压倒性的力量消灭它,你往往会选择出最具抵抗力、最具侵袭性的幸存者。要对抗一个不断演化的敌人,你需要一个适应性的策略。

第一步是侦察。想象一下,在主战之前能够对敌人测试你的武器。这现在通过患者来源的肿瘤类器官成为可能。通过取一小块患者的肿瘤,在培养皿中将其培育成一个三维的“化身”,我们创造了他们特定癌症的一个活体模型。然后我们可以进行高通量筛选:用一个包含不同药物的库来处理数以百计的这些微型肿瘤。但我们可以更聪明。通过首先对类器官的DNA进行测序,我们可以识别驱动癌症的特定突变。这使我们能够理性地选择那些针对这些特定弱点的药物。这个工作流程——扩增、测序、治疗、评估——是一种体外适应性疗法,让我们在治疗患者之前,在实验室里找到敌人的阿喀琉斯之踵。

但是,这些思想在肿瘤学中最深刻的应用来自于借鉴生态学和演化生物学的思想。考虑一种革命性的治疗方法,如嵌合抗原受体 (CAR) T细胞疗法,我们对患者自己的免疫细胞进行工程改造,以寻找并杀死癌细胞。标准方法是释放这个强大的“捕食者”以达到最大杀伤,希望根除每一个癌细胞。但如果肿瘤有两种细胞:CAR T细胞能看到的“敏感”群体和它们看不到的“抵抗”群体呢?消灭所有敏感细胞会创造一个空旷的领域——一种“竞争释放”——让抵抗细胞不受控制地生长,导致复发。

一个适应性治疗策略将此颠倒过来。我们不是试图根除敏感细胞,而是调节CAR T细胞的压力来仅仅控制它们,保持它们的数量低但非零。为什么?因为一个庞大的敏感细胞群体,即使它们是癌性的,也会竞争资源和空间,从而有效地抑制了更危险的抵抗群体的生长。这就像维持一个“作弊者”癌细胞群体来抑制“超级作弊者”抵抗细胞。通过使用反馈——监测肿瘤负荷并滴定CAR T细胞的活性上下——我们的目标可以是长期的控制,而不是短暂的、代价高昂的胜利。这是一个美丽而深刻的想法:将癌症管理不是作为一个要被消灭的东西,而是作为一个要被引导的复杂生态系统。

发现的引擎:新科学的新工具

这一切听起来都很美妙,但我们实际上如何做到呢?这种新的医学范式需要新一代的科学工具。

首先,你如何测试一个对每个人都不同的疗法?以噬菌体疗法为例,我们使用感染细菌的病毒来治疗多重耐药性感染。“最佳”噬菌体混合剂对于感染每个患者的特定细菌菌株是独一无二的。一个传统的、僵化的临床试验将是不可能的。答案是使试验本身具有适应性。一个“主适应性平台试验”可以同时测试多种治疗方法,使用实时数据对患者进行分层,甚至允许“反应适应性随机化”——在严格控制统计错误的同时,合乎伦理地将更多患者分配到正在证明最有效的治疗方法上。这是一种与它旨在评估的疗法一样灵活和智能的试验设计。

其次,那些至关重要的决策规则从何而来?我们如何知道何时适应以及改变什么?这不是猜测。这些规则本身就是科学的产物。从在适应性试验中收集的数据中,我们可以使用强大的统计和机器学习方法来发现最优策略。一种名为Q学习的方法,从最终结果向后工作,以估计在特定状态下采取某个行动的长期价值。通过将一个“Q函数”拟合到数据中,我们可以构建一个个性化的治疗规则——一个数学公式,它接受患者的特征(如他们改善睡眠的睡眠类型或咖啡因摄入量)并输出最大化他们良好结果机会的最佳行动。这是将过去患者的数据转化为未来患者个性化行动手册的引擎 [@problemid:4574995]。

结论

我们所经历的旅程表明,适应性治疗远不止是一种技术技巧。它是一种哲学。它是一种致力于倾听身体的反应并做出智能反应的承诺。它认识到在复杂系统中——无论是一个人、一个社区,还是一个肿瘤中的细胞生态系统——静态的计划是脆弱的。通过联合来自医学、心理学、工程学、统计学甚至演化生物学的见解,适应性治疗为驾驭这种复杂性提供了一个框架。它是个性化、动态和响应性护理的科学。在许多方面,它正是医学的未来,正在此刻成形。