机器学习如何帮助诊断出最常见的儿童癌症患者
Peter Mac及其合作者开发的新软件正在帮助被诊断为急性淋巴细胞白血病(ALL)的患者确定他们所患的亚型。
ALL是世界上最常见的儿童癌症,对成年人也有影响。
“占总数的30%到40%童年癌症是ALL,这是一个主要的儿童癌症问题,”彼得·麦克和儿童癌症研究所的副教授保罗·埃克特说,他参与了这项工作。
在澳大利亚,每年有超过300人被诊断出患有这种疾病,其中一半以上是患者年幼的孩子15岁以下。确定ALL患者的亚型可以为他们的预后提供有价值的信息,以及他们应该如何最好地治疗。
“弄清楚基因变化是什么导致了患者的癌症,这是确定治疗强度和使用药物的关键,”埃克特副教授说。
但在RNA测序等基因组技术出现之前,这样做的方法并不精确。
“以前,基因异常通过在显微镜下观察单个染色体并寻找四到五个主要缺陷来检测,”埃克特副教授说。“但我们现在知道,ALL至少有23种亚型。”
在一篇发表于血液的进步上个月底,来自墨尔本大学、默多克儿童研究所和儿童癌症研究所的Peter Mac研究人员和合著者描述了ALLSorts软件,该软件使用RNA测序数据来识别患者的ALL亚型。
该论文的资深作者、彼得·麦克的艾丽西亚·奥什莱克教授说:“ALLSorts增加了一种寻找这些遗传驱动因素的不同方式,并对患者的ALL亚型进行分类。”“它甚至可以用于单个患者样本,所以无论大小的检测中心都可以使用它。”
据研究人员所知,ALLSorts也是同类工具中第一个公开可用的开源工具。
“我们使用了机器学习方法,并在皇家儿童医院和成人的儿童癌症样本上验证了我们软件的准确性癌症来自彼得·麦克的样本,”奥什莱克教授说。
在机器学习,它是计算机把所有的信息从一个大型数据集一起使用数据集中最有信息量的特征,而不是依靠人类研究人员来确定数据的重要部分是什么。
奥什莱克教授说:“希望这个软件可以在世界各地用于测试ALL,并为患者提供治疗选择。”“这也是计算生物学重要性的一个很好的例子癌症研究."