研究人员使用新技术来分析5300万点的临床数据
费城儿童医院的研究人员(切)和德雷塞尔大学能够分析5300万病人指出来自150万多个病人个体识别相似的病史,可以帮助确定未来发展中疾病的潜在风险和这些条件的轨迹。
这种方法确定表型相似性超过任何其他电流计算模型的能力。研究结果最近发表在《华尔街日报》人工智能在医学上。
虽然很多技术的进步分析成为可能吗基因数据大规模的,有挑战与应用相同的技术临床数据因为它通常不是标准化的,这意味着研究人员可能有不同的描述或记录相同的症状。人类表型本体(HPO)作为成立超过15000临床术语字典帮助标准化临床信息对病人进行分析,加快一体化的精密医学临床实践。
之前的研究从癫痫神经遗传学倡议(女士)切从成千上万的病人临床资料分析指出,有助于揭示小说在患者不同的遗传基因目标儿童癫痫病。扩张成功,砍的生物医学研究人员卫生信息学(DBHi),德雷塞尔大学的计算和信息,是女士利用Arcus,开发的一套工具和服务切连接生物、临床、研究和环境数据进行创新的目的,数据驱动的研究。Arcus平台旨在帮助揭示如何在大规模数据集的重叠。
“这项工作遵循的趋势人工智能和机器学习领域复杂,不同的信息转换成我们可以表示在一个标准化的方式,从而使机器分类的医疗条件和预测未来的疾病风险,“高级研究作者Scott Haag博士的助理研究教授德雷克塞尔大学的计算机科学计算和信息学Arcus数据科学团队的主管。
在这项研究中,研究人员分析了1504582名患者的数据与各种诊断和症状53955360电子笔记Arcus数据存储库。结果,他们发现了9477个不同的表型。这种技术表现出高度的协议与专家的判断在各种临床领域中表示这些数据。
通过将复杂和多维表型HPO的格式转换为数组,该方法开发的这项研究的研究人员将使这些表型为下游任务需要的有效表示深刻的表现型。HPO常见和使用罕见疾病。例如,这项研究提供了临床数据数组,可以用来区分一个条件自闭症谱系障碍从罕见的神经发育障碍。
“这项研究表明,利用数组由我们确定的临床术语可能超过其他更多的容量计算复杂的表型分析的方法,”第一作者Maryam Daniali说,在德雷克塞尔大学计算机科学博士学位候选人。“这让我们地图表型相似性使用数百万点的数据,大大超过了以前的方法依赖于成千上万的数据点。”
“这项研究中我们开发的算法有可能被利用在寻找相似性临床轨迹和确定新的基因疾病的原因,“说Ingo Helbig,医学博士,小儿神经学家砍的是女士计划和科学Arcus组学项目的主任。“这将使我们能够使用机器学习与现有的方法来分析风险和患者预测在大规模以更有效的方式。”
更多信息:Maryam Daniali et al,丰富表示学习使用5300万病人指出通过人类表型本体嵌入,人工智能在医学上(2023)。DOI: 10.1016 / j.artmed.2023.102523