使用可解释的AI进行结肠直肠癌分类的个性化肠道微生物组分析
肠道微生物组由对人体健康至关重要的不同细菌种类的复杂种群组成。近年来,多个领域的科学家发现,肠道微生物组的变化可能与多种疾病有关,尤其是结直肠癌(CRC)。多项研究表明,某些细菌的丰度较高,如核梭杆菌和微微微单胞菌,通常与CRC的进展有关。
基于这些发现,研究人员开发了各种人工智能(AI)模型,以帮助他们分析哪些细菌物种可作为CRC生物标志物。然而,这些模型大多依赖于所谓的“全局解释”,这意味着它们只能考虑输入数据的整体来进行预测。因此,这样的模型无法识别细菌种类,这些细菌种类可能是较小的、代表性较差的患者群体的相关CRC生物标志物。
在这种背景下,来自日本东京工业大学(Tokyo Tech)的一个研究团队决定采用一种能够解决这一限制的不同方法。正如他们最近发表在基因组生物学,该团队采用了一个可解释的人工智能框架,为其CRC预测提供局部而非全局的解释。
该研究的主要作者、副教授Takuji Yamada解释说:“局部解释技术使发现每个CRC患者的最大贡献细菌成为可能,使我们能够检查一个疾病组中受试者之间的个体差异。”
该团队使用了一个名为“沙普利附加解释”(Shapley additive explanation, SHAP)的框架博弈理论叫做沙普利值。简而言之,沙普利值告诉我们如何在联盟或集团的参与者之间分配支出。同样,在他们的研究中,该团队使用SHAP来计算每个人的贡献细菌种类每一个CRC预测。
使用这种方法以及来自五个CRC数据集的数据,研究人员发现,将SHAP值投影到二维(2D)空间,可以让他们看到健康和CRC受试者之间的清晰分离。聚类这种2D信息导致四个不同的CRC受试者亚组,每个亚组在CRC概率和相关细菌上都不同。
此外,研究小组发现,CRC概率最高的CRC亚组的受试者总是具有与CRC典型相关的丰富细菌种群。最值得注意的是,五个数据集的结果是一致的,展示了这种方法的广泛适用性。
有了这些有希望的结果,该团队预计他们的方法将在肠道微生物组研究领域做出坚实的贡献。
“考虑到机器学习在微生物-疾病关联研究中的应用越来越多,我们的新方法可能有利于更加个性化的研究微生物组数据探索,以及帮助发现潜在的疾病亚群及其潜在的相关生物标志物,”山田博士推测。此外,该技术也适用于与脑癌有已知联系的其他疾病肠道微生物组,例如溃疡性结肠炎慢性病和糖尿病
更多信息:Ryza Rynazal等人,利用可解释的人工智能进行基于肠道微生物群的结直肠癌分类,基因组生物学(2023)。DOI: 10.1186 / s13059 - 023 - 02858 - 4