数据驱动的自动机器学习系统,用于检测新出现的公共卫生威胁
对公众健康的严重威胁可能来自各种各样的来源——例如,传染病、大量药物过量或接触有毒化学品。联邦、州和地方卫生部门必须迅速应对疾病爆发和其他新出现的生物威胁。虽然目前的“综合征监测”自动化系统可以通过监测健康数据和检测疾病集群来提供帮助,但它们无法检测具有罕见或以前未见症状的集群。
纽约大学机器学习优良实验室(ML4G实验室)与卡内基梅隆大学和纽约市健康与精神卫生部门(NYC DOHMH)的同事们进行的一项新研究解决了这一公共领域的关键差距健康通过提出一种用于“综合征前”监测的新的机器学习方法进行实践。
该方法被纳入一个自动化系统,可以使公共卫生从业人员在未来对快速出现的威胁,包括不寻常或新奇的威胁,作出更快速和有效的反应。
该研究的资深作者、ML4G实验室主任、纽约大学教授丹尼尔·b·尼尔评论说:“现有的系统善于检测我们已经知道并正在积极寻找的疾病爆发,比如流感或COVID。”“但当新的可怕的东西出现时,会发生什么呢?”综合征前监测提供了一个安全网,可以识别其他系统无法检测到的新出现的威胁。”
这项研究发表在科学的进步.
作者的疾病监测方法被称为综合征前监测,因为它依赖于所有患者病情的数字通信文本数据,而不是根据现有疾病综合征(如“流感样”或“胃肠”疾病)对病例数据进行分类。新系统能够快速识别卫生部门尚未意识到的新出现的综合症。
为了实现这一目标,机器学习技术使用了来自医院急诊科(ED)就诊的匿名“主诉”数据。主诉通常由病人用他们自己的话提出(例如,“过去三天我头痛得厉害,现在我耳朵疼”),并由急诊科分诊护士记录下来。
该方法能够识别主诉词汇和短语的趋势和模式,从而能够检测出局部的病例集群。它可以结合从业人员的反馈,自动区分相关和不相关的案例集群。它为医院、地方和州卫生部门提供个性化和可操作的决策支持。
经过设计、开发和测试,城市卫生部门对新系统进行了盲法评估和案例研究,研究人员将其命名为MUSES,或多维语义扫描,证明了综合征前监测识别出更多的事件公共卫生根据研究作者的说法,与传统方法相比,这种方法的假阳性率更低。
因此,MUSES为全国的医院、地方和州卫生部门提供了三个重要的方法进步,如:
- 消除了对预定义综合症类别的需要。
- 通过多维扫描统计确定局部病例群,从而能够发现可能影响某些空间区域或患者人口统计群体的新出现的生物威胁。
- 使用“实践者在循环中”的方法来整合用户反馈,在相关模式上磨炼,减少假阳性,并根据本地用户自己的标准,为他们提供可操作的见解,判断什么是相关的,什么是不相关的。