研究人员使用机器学习系统来诊断遗传疾病
Rady儿童基因组医学研究所(RCIGM)的研究人员利用机器学习过程和临床自然语言处理(CNLP)在创纪录的时间内诊断罕见遗传疾病。这种新方法加快了医生对重症监护室婴儿护理的回答,并为增加基因组测序作为患有隐症婴儿的一线诊断测试的使用打开了大门。
“有些人称之为人工智能我们称之为增强智能,”RCIGM总裁兼首席执行官、医学博士、DSc Stephen Kingsmore说。“病人的护理总是从医生开始到结束。通过利用技术的力量,我们可以快速准确地确定遗传疾病的根本原因。我们迅速将这一关键信息提供给重症监护这样医生就可以专注于为挣扎求生的婴儿提供个性化护理。”
一项记录这一过程的新研究发表在今天的杂志上科学转化医学.工作流程和研究由RCIGM团队与领先的技术和数据科学开发人员(alexion、Clinithink、Diploid、Fabric Genomics和Illumina)合作领导。
Kingsmore博士的团队开创了一种快速的全基因组测序过程,将基因检测结果提供给新生儿和儿科重症监护(NICU/PICU)医生指导医学干预.RCIGM是圣地亚哥雷迪儿童医院的研究部门。
通过减少对基因组数据的劳动密集型人工分析的需要,有监督的自动化管道节省了大量时间。2018年2月,该团队获得了全程最快诊断的吉尼斯世界纪录基因组测序。在自动化运行中,最快的时间(平均19小时)是使用增强智能实现的。
斯克里普斯研究所分子医学教授、新书《深层医学》的作者埃里克·托波尔医学博士说:“这是RCIGM团队真正的开创性工作,通过使用人工智能快速准确地分析他们的整个基因组序列,挽救了病情严重的新生儿的生命。”
RCIGM优化并集成了几种节省时间的技术到快速全基因组测序(rWGS)过程中,从血液样本中筛查儿童的整个基因组成,以发现数千种遗传异常。
rWGS管线中的关键组件来自全球领先的DNA测序公司Illumina,包括Nextera DNA Flex文库制备,通过NovaSeq 6000和S1流细胞格式进行全基因组测序。Illumina的DRAGEN(基因组学动态读取分析)生物it平台提高了速度和准确性。
其他管道元素包括Clinithink的临床自然语言处理平台CliX ENRICH,该平台可以快速梳理患者的电子病历,自动提取关键的表型信息。
机器学习系统的另一个核心元素是Diploid的MOON。该平台使用人工智能自动过滤和排序可能的致病变异,自动化基因组解释。基于医学文献自然语言处理的深度表型整合是驱动这种自动化解释的关键特征之一。MOON花了五分钟时间从整个基因组的450万个变异中找出因果突变。
此外,Alexion的罕见疾病和数据科学专业知识能够将临床信息转换为可计算的格式,用于指导变异解释。
作为这项研究的一部分,基因测序数据在研究人员的监督下被输入自动计算平台。为了进行比较和验证,该团队的临床医学遗传学家使用了Fabric Genomics的基于人工智能的算法——vaast和Phevor集成到临床决策支持软件OPAL(现在称为Fabric Enterprise)——来确认自动化管道的输出。Fabric软件是RCIGM标准分析和解释工作流程的一部分。
这项名为“通过快速全基因组测序和自动化表型和解释来诊断重症儿童的遗传疾病”的研究发现,自动化、回顾性诊断与专家手动解释是一致的(在95名患有97种遗传疾病的儿童中,召回率为97%,准确率为99%)。
研究人员得出结论,具有自动化表型和解释的基因组测序(中位数为20:10小时)可能会刺激重症监护病房的使用,从而实现及时和精确的医疗护理。
“使用机器学习平台并不能取代人类专家。相反,它增强了他们的能力,”RCIGM的统计科学家、该研究的第一作者米歇尔·克拉克博士说。“通过及时提供靶向治疗,快速基因组测序可以改善患有遗传疾病的重症儿童的预后。”
据估计,北美4%的新生儿受到遗传疾病的影响,这是婴儿死亡的主要原因。罕见遗传疾病也约占儿童医院入院人数的15%。
RCIGM工作流程旨在加快和扩大基因组数据解释,以减少全基因组测序的时间和成本。该团队的目标是让任何有需要的孩子都能获得rWGS。
该过程自动化程度的提高消除了扩大WGS临床使用的障碍,减少了由稀缺的认证临床医学遗传学家对数据进行耗时的手工分析和解释的需要。根据美国医学遗传学和基因组学委员会的数据,2017年全国只有不到1600名这样的专家。
雷迪儿童研究所于2016年7月开始进行基因组测序。截至2019年3月底,该团队已经完成了750多名儿童的基因组测试和解读。其中三分之一的儿童接受了基因诊断,其中25%的儿童根据诊断立即受益于临床护理的改变。