机器学习能够对难以捉摸的全球杀手进行“近乎完美”的诊断
败血症是免疫系统对感染的过度反应,每年造成全球20%的死亡,美国医院死亡人数的20%到50%。然而,尽管其流行和严重程度,这种情况很难诊断和有效治疗。
这种疾病会导致重要器官的血流量减少,全身炎症,以及不正常的血液凝结。因此,如果脓毒症如果不及时发现和治疗,就会导致休克器官衰竭甚至死亡。但是很难确定是哪种病原体导致了败血症,或者是否感染了血液中或者身体的其他部位。在许多症状类似于败血症的患者中,很难确定他们是否真的感染了。
现在,陈-扎克伯格生物中心(CZ Biohub)、陈-扎克伯格倡议(CZI)和加州大学旧金山分校(UCSF)的研究人员开发了一种新的诊断方法,将机器学习应用于来自微生物和宿主的高级基因组数据,以识别和预测败毒症病例。据报道,2022年10月20日微生物学性质在美国,这种方法的准确性令人惊讶,而且有可能远远超过目前的诊断能力。
“败血症是人类面临的十大公共健康问题之一,”资深作者、加州大学旧金山分校传染病学部医学副教授、CZ生物中心研究员Chaz Langelier医学博士说。“败血症的关键挑战之一是诊断。现有的诊断测试无法捕捉到这种疾病的双重性——感染本身和宿主对感染的免疫反应。”
目前的败血症诊断侧重于通过培养细菌来检测细菌,这一过程“对适当的抗生素治疗至关重要,这对败血症的存活至关重要,”这种新方法的研究人员说。但是培养这些病原体是耗时的,而且并不总是能正确地识别出引起感染的细菌。与病毒类似,PCR检测可以检测出感染患者的病毒,但并不总是能识别出导致败血症的特定病毒。
“这导致临床医生在估计30%到50%的病例中无法确定败血症的原因,”Langelier说。“这也导致了抗生素治疗和引起问题的病原体之间的不匹配。”
在没有明确诊断的情况下,医生通常会开一种抗生素的混合物,试图阻止感染,但抗生素的过度使用导致了全球抗生素耐药性的增加。“作为医生,我们不想错过一个感染病例,”加州大学旧金山分校医学和麻醉学教授、新研究的共同资深作者、医学博士、M.A.S Carolyn Calfee说。“但如果我们有一种测试可以帮助我们准确地确定谁没有感染,那么就可以帮助我们限制抗生素的使用在这种情况下,这对我们所有人都有好处。”
消除歧义
研究人员分析了全血和血浆样品从2010年至2018年期间入住加州大学旧金山分校医疗中心或扎克伯格旧金山总医院的350多名危重患者中提取的数据。
但是,由CZ生物中心的科学家Norma Neff博士和Angela Pisco博士领导的团队并没有依赖培养来识别这些样本中的病原体,而是使用了宏基因组下一代测序(mNGS)。这种方法识别样本中存在的所有核酸或遗传数据,然后将这些数据与参考基因组进行比较,以确定存在的微生物有机体。这项技术使科学家能够识别来自完全不同的生物王国的遗传物质——无论是细菌、病毒还是真菌——它们都出现在同一个样本中。
然而,仅检测和识别病原体的存在还不足以准确诊断败血症,因此生物中心的研究人员还进行了转录谱分析——量化基因表达——以捕捉患者对感染的反应。
接下来,他们将机器学习应用于mNGS和转录数据,以区分败血症和其他严重疾病,从而确认诊断。CZI的首席计算生物学家Katrina Kalantar博士和该研究的共同第一作者,创建了一个集成的宿主-微生物模型,训练来自患者的数据,无论是败血症或非传染性全身炎症疾病,使败血症的诊断具有非常高的准确性。
Kalantar解释说:“我们通过观察一系列宏基因组学数据和传统临床测试的结果来开发这个模型。”首先,研究人员确定了确诊的败血症患者和临床表现相似的非传染性全身炎症患者之间的基因表达变化,然后使用机器学习来确定最能预测这些变化的基因。
研究人员发现,当传统细菌培养确定了一种导致败血症的病原体时,在mNGS分析的相应血浆样本中,通常会有过多的来自该病原体的遗传物质。考虑到这一点,Kalantar为模型编写了程序,以识别与样本中其他微生物相比,数量过高的有机体,然后将其与已知的导致败血症的微生物的参考指数进行比较。
卡兰塔尔解释说:“除此之外,我们还注意到检测到的任何病毒,即使它们的水平较低,因为它们真的不应该出现在那里。”“有了这套相对简单的规则,我们就能做得很好。”
近乎完美的表现
研究人员发现,mNGS方法及其相应的模型比预期的工作得更好:它们能够识别99%的确诊细菌败血症病例,92%的确诊病毒败血症病例,并能够预测74%的尚未确诊的临床疑似病例的败血症。
加州理工学院实验室的博士后研究员、该研究的共同第一作者Lucile Neyton博士说:“我们期待的是良好的性能,甚至是卓越的性能,但这几乎是完美的。”“通过使用这种方法,我们可以很好地了解是什么导致了这种疾病,我们可以相对高信心地知道患者是否患有败血症。”
研究小组还兴奋地发现,他们可以使用这种结合宿主反应和微生物检测的方法,利用血浆样本来诊断败血症,血浆样本是作为标准临床护理的一部分从大多数患者中例行收集的。“事实上,你可以从这种广泛获得、易于收集的样本类型中识别出败血症患者,这在实际用途方面具有很大的意义,”兰杰利尔说。
这项工作的想法源于Langelier, Kalantar, Calfee, UCSF研究员和CZ Biohub总裁Joe DeRisi博士及其同事之前的研究,他们在研究中使用mNGS有效地诊断危重患者的下呼吸道感染。Kalantar说,因为这种方法非常有效,“我们想看看同样的方法是否也适用于败血症。”
更广泛的影响
该团队希望在这一成功的基础上进一步发展诊断技术通过开发一个模型,也可以预测用这种方法检测到的病原体对抗生素的耐药性。“我们已经在治疗呼吸道感染方面取得了一些成功,但还没有人提出治疗败血症的好方法,”兰杰利尔说。
此外,研究人员希望最终能够预测脓毒症患者的预后,“例如死亡率或住院时间,这将提供关键信息,使临床医生能够更好地照顾他们的患者,并将资源匹配到最需要它们的患者,”兰杰利尔说。
Calfee补充说:“像这样的新型测序方法有很大的潜力,可以帮助我们更精确地确定患者严重疾病的原因。”“如果我们能做到这一点,这是迈向精准医疗的第一步,也是了解个体患者的情况的第一步。”
进一步探索