联邦机器学习实现了迄今为止最大的脑肿瘤研究,而无需共享患者数据

大脑扫描
来源:Unsplash/CC0 Public Domain

宾夕法尼亚大学医学院(Penn Medicine)和英特尔公司(Intel Corporation)的研究人员领导了迄今为止规模最大的全球机器学习工作,安全地汇总了来自全球71个地点的6314名胶质母细胞瘤(GBM)患者的脑部扫描信息,并开发了一种模型,可以在不损害患者隐私的情况下,增强对三个肿瘤亚区边界的识别和预测。他们的研究结果今天发表在自然通讯

宾夕法尼亚大学佩雷尔曼医学院病理学、实验室医学和放射学助理教授、资深作者Spyridon Bakas博士说:“这是文献中所考虑过的最大、最多样化的胶质母细胞瘤患者数据集,并通过联邦学习成为可能。”“我们向机器学习模型输入的数据越多,它们就越准确,这反过来可以提高我们更精确地理解、治疗和切除患者胶质母细胞瘤的能力。”

研究罕见疾病的研究人员,如GBM(一种侵袭性脑肿瘤),患者群体通常仅限于他们自己的机构或地理位置。由于隐私保护立法,如美国1996年的《健康保险携带与责任法案》(HIPAA)和欧洲的《通用数据保护条例》(GDPR),跨机构的数据共享合作无需妥协数据是许多医疗保健提供者面临的主要障碍。

一种新的机器学习方法,称为联邦学习,通过将机器学习算法引入数据,而不是遵循当前将数据集中到算法的范式,为这些障碍提供了解决方案。联邦学习(谷歌首先为键盘的自动更正功能实现的一种方法)跨多个分散的设备或服务器(在本例中为机构)训练机器学习算法,而不实际交换它们。它一直是以前所示允许不同国家机构的临床医生在不共享任何私人患者数据的情况下进行研究合作。

Bakas与第一作者Sarthak Pati(宾夕法尼亚大学生物医学图像计算与分析中心(CBICA)的高级软件开发人员)、Ujjwal Baid博士(CBICA的博士后研究员)、Brandon Edwards博士(英特尔实验室的研究科学家)和Micah Sheller一起领导了这项大规模的合作研究。

“数据有助于推动发现,特别是在可用数据稀缺的罕见癌症中。凯斯西储大学医学院兼职教授Jill Barnholtz-Sloan博士说:“我们概述的联合方法允许最大限度地访问数据,同时降低数据共享的制度负担。”

采用分阶段的方法。第一阶段,称为a公共初始模型的公开数据进行了预训练国际脑肿瘤分割(BraTS)挑战赛.该模型的任务是识别三种GBM肿瘤亚区室的边界:“增强肿瘤”(ET),代表肿瘤内血管血脑屏障的破坏;“肿瘤核心”(TC),包括ET和杀死组织的部分,代表与外科医生移除它们相关的肿瘤部分;“全瘤”(WT)是由TC和浸润组织的结合所定义的,这是将接受放射治疗的整个区域。

首先对来自16个地点的231例患者病例的数据进行了分析,并根据每个地点的本地数据对所得模型进行了验证。第二阶段,叫做初步共识模型,使用公共初始模型,并纳入更多来自35个地点的2471例患者病例的数据,提高了其准确性。最后阶段,或者最终共识模型该研究使用了更新后的模型,并纳入了来自6大洲71个地点的6314例患者病例(3914680张图像)的最大数据量,以进一步优化和测试未见数据的可泛化性。

作为每个步骤的控制,研究人员从模型训练过程中排除了每个参与站点贡献的总案例的20%,并将其用作“本地验证数据”。这使得他们能够衡量协作方法的准确性。为了进一步评估模型的泛化性,6个站点没有参与任何训练阶段,以代表完全看不见的590例“样本外”数据总体。值得注意的是,美国放射学院的网站使用国家临床试验研究的数据验证了他们的模型。

在模型训练之后,最终的共识模型获得了与合作者的局部验证相比的显著性能改进.最终的共识模型在ET边界检测方面提高了27%,在TC边界检测方面提高了33%,在WT边界检测方面提高了16%。改进后的结果清楚地表明,通过访问更多的案例,不仅可以改进模型,而且可以验证模型,可以带来好处。

展望未来,作者希望由于联邦学习的通用方法,其在医学研究中的应用可以是深远的,不仅适用于其他癌症,还适用于其他疾病,如神经退行性疾病等。ob欧宝直播nba他们还预计会有更多的研究来证明联邦学习可以遵守世界各地的安全和隐私协议。

更多信息:联邦学习为罕见癌症边界检测提供大数据,自然通讯(2022)。DOI: 10.1038 / s41467 - 022 - 33407 - 5
期刊信息: 自然通讯

引用联邦机器学习实现了迄今为止最大的脑肿瘤研究,无需共享从//www.puressens.com/news/2022-12-federated-machine-enables-largest-brain.html检索的2022年12月7日的患者数据(2022,12月5日)
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

新的机器学习方法允许医院私下分享病人数据

79股票

对编辑的反馈