机器学习可以帮助预测患者对癌症免疫治疗的反应
预测哪些患者对治疗反应良好是困扰癌症免疫治疗领域40多年的难题。现在,约翰霍普金斯大学坎摩尔癌症中心及其布隆伯格坎摩尔癌症免疫治疗研究所的研究人员离解决这个问题又近了一步。在一项小型研究中,他们成功地训练了一个机器学习算法,可以事后预测哪些黑色素瘤患者对治疗有反应,哪些没有反应。
开源程序DeepTCR被证明是一种有价值的预测临床工具,但它也具有强大的指导作用,向研究人员传授患者对免疫治疗反应的生物学机制。
“DeepTCR的预测能力令人兴奋,”该研究的第一作者、医学博士约翰-威廉·西霍姆(John-William Sidhom)说,“但我发现更令人着迷的是,我们能够看到模型对免疫治疗的免疫系统反应的了解。我们现在可以利用这些信息来开发更可靠的模型,并可能为许多疾病开发更好的治疗方法,甚至是肿瘤学以外的疾病。”
这项研究的摘要发表在该杂志上科学的进步.
深度tcr是西德霍姆在约翰霍普金斯大学医学院开发的,当时他还是医学博士/博士。学生。它使用深度学习(人工智能的一种形式)来识别大量数据中的模式。在这种情况下,数据是称为T细胞受体(TCRs)的蛋白质的氨基酸序列。
TCRs位于免疫系统T细胞的外部,等待着被来自敌人(癌症、细菌或病毒)的蛋白质攻击。tcr就像锁一样,只能用一把钥匙打开。T细胞的外部布满了许多tcr,但它们都是相同的,都是由相同的敌人钥匙打开的。由于不知道哪些敌人存在,许多不同的T细胞在体内游荡。当TCR被激活时,它的T细胞会释放分子来杀死敌人,它会克隆自己来加强反应。
不幸的是,一些肿瘤细胞开发阻断T细胞反应的方法,即使TCRs已经被激活。目前的免疫治疗药物,被称为检查点抑制剂,由阻碍肿瘤这种能力的蛋白质组成,导致T细胞对癌症做出反应。然而,这些药物只能帮助少数患者。
在目前的研究中,Sidhom,现在是一名居民,使用了在CheckMate 038临床试验中收集的材料,该试验测试了一种免疫治疗药物(nivolumab)与两种免疫治疗药物(nivolumab和ipilimumab)的组合对43名不能手术的黑色素瘤患者的疗效。在治疗前和治疗期间对肿瘤进行活检,其中包含一系列浸润性T细胞。
在CheckMate的研究中,单药治疗和双药联合治疗的患者没有明显差异。两组患者中,有些有反应,有些没有反应。
Sidhom使用一种完善的方案,通过确定每个活检组织中TCR的类型和数量,利用高科技基因测序发现每个肿瘤周围的TCR库。然后,他将这些数据输入DeepTCR程序,并告诉它数据集属于反应者和非反应者。然后算法寻找模式。
研究人员首先询问治疗前应答者和无应答者的TCR免疫疗法是否存在差异。算法识别出的差异与已知的生物标记物(用于指导治疗的肿瘤分子特征)一样,可以预测患者的反应。然而,在该算法用于临床指导治疗之前,研究人员需要在更大的患者群体中证实这些发现。
“基于肿瘤中的免疫微环境的精确免疫治疗对于指导每个患者的最佳治疗选择至关重要,”Drew Pardoll医学博士说,他是肿瘤学教授和Bloomberg~Kimmel癌症免疫治疗研究所的主任。
“这些DeepTCR的发现为预测肿瘤对免疫检查点封锁的反应定义了一个新的维度,通过应用一种新的人工智能策略来消除肿瘤浸润T细胞表达的大量受体,T细胞是直接杀死肿瘤细胞的关键免疫成分。”
接下来,Sidhom想知道反应者和无反应者之间的区别是什么。他使用了另一项研究的数据,该研究将特定的TCRs(由它们的氨基酸序列识别)与激活它们的敌人蛋白质联系起来。在数据集中有数千个TCRs,每个TCRs对来自各种入侵者的不同蛋白质有反应:流感病毒、eb病毒、黄热病病毒和肿瘤。
研究发现的结果与直觉相悖:对免疫疗法有反应的患者是肿瘤中病毒特异性T细胞数量较高的患者。无反应者有更多的肿瘤特异性T细胞。
Sidhom观察了治疗开始后每个患者TCR库的变化,了解到无反应者的T细胞周转率更高。他说:“在治疗前和治疗期间,有反应者和无反应者的肿瘤特异性T细胞数量大致相同。”
“在应答者中,这些T细胞的身份保持不变,但在无应答者中,在治疗前和治疗期间,T细胞的种类不同。我们的假设是,无应答者从一开始就有大量无效的肿瘤特异性T细胞。当免疫治疗开始时,他们的免疫系统发送了一批新的T细胞,试图找到一种有效的T细胞,但功能障碍仍然存在。另一方面,应答者从一开始就有有效的T细胞,但它们的抗肿瘤活性被肿瘤阻断。当免疫疗法开始时,它释放了封锁,让它们开始工作。”
的应用深度学习john Hopkins大学医学院病理学副教授、john Hopkins Kimmel癌症中心精确医学信息学主任Alexander Baras医学博士说:“在DeepTCR中描述T细胞TCR库的框架可以改善患者结果的分层,以及在识别预测特征方面的模型解释性。”
Sidhom说,DeepTCR算法的核心是一个“神经网络”,这是最难以解释的人工智能模型之一,这意味着很难学习模型所学到的东西。“这篇论文展示了如何使用甚至一个神经网络为了对其预测背后的生物学进行解释,”他说。“提供‘可解释人工智能’的能力将被证明对癌症生物学和许多其他领域非常宝贵。”