新的神经网络帮助医生解释心力衰竭患者的复发
对于人工智能研究人员来说,患者数据是一个宝库。但有一个问题:许多用于挖掘患者数据的算法就像黑盒子一样,这使得医生很难解释它们的预测。来自埃因霍温理工大学(TU/e)和中国浙江大学的研究人员现在开发了一种算法,不仅可以预测心力衰竭患者的医院再入院,还可以告诉你为什么会发生这种情况。这项工作已发表在BMC医学信息学与决策.
医生越来越多地使用电子医疗记录中的数据来评估患者的风险、预测结果、推荐和评估治疗方法。然而,由于缺乏可解释性,机器学习算法在临床环境中的应用受到了阻碍。这些模型通常充当黑盒你能看到输入的(数据)和输出的(预测),但你看不到中间发生了什么。因此,很难解释为什么模型会说它们所说的话。
这破坏了医疗保健专业人员对机器学习算法的信任,并限制了它们在日常临床决策中的使用。当然,可解释性也是欧盟隐私条例(GDPR)的一个关键要求,因此改善它也有法律上的好处。
基于注意力的神经网络
为了解决这个问题,工业工程与创新科学系的博士候选人陈佩佩(音译)与工业电子和浙江大学的其他研究人员一起测试了一种基于注意力的方法神经网络在中国的心脏病患者身上基于注意力的网络能够利用上下文信息关注数据中的关键细节。
这和人类评估周围世界的方法是一样的。当人们看到达尔马提亚狗的照片时,他们会立即把注意力集中在图像中心的四条腿的黑点白色形状上,并认出它是一只狗。为了做到这一点,他们运用直觉和从上下文收集的信息。基于注意力的神经网络基本上也是这样。
由于它们对上下文的敏感性,这些神经网络不仅擅长做出预测,还可以让你准确地看到什么特征导致了什么结果。当然,这大大增加了您的预测的可解释性。基于注意力的网络传统上用于图像识别和语音识别,其中上下文是理解正在发生的事情的关键。近年来,它们也被应用于其他领域。
实验
陈佩佩和她的同事跟踪了736名来自中国一家医院的心力衰竭患者。基于患者的特征,他们试图预测和解释患者出院后12个月内的再入院情况。研究人员观察了105个特征,包括年龄和性别,血压而且心率、糖尿病和肾脏问题等疾病、住院时间和用药情况。
引起的模型预测了三分之二的再入院率,比其他三种流行的预测模型略有改善。更重要的是,该模型能够详细说明哪些风险因素对每个患者的再入院几率影响最大(见图),使预测对医生更有用。此外,该模型为所有患者样本提供了最重要的危险因素。这样,研究人员确定了三种超声心动图测量方法,这是另一种模型无法识别的。
在医生实施基于注意力的模型之前,它需要在更大的数据集上进行验证。Chen还希望通过在电子健康记录中包括从出院和每日进展记录中获得的文本数据来扩展研究。
进一步探索