研究人员使用机器学习来解锁临床癌症样品中的基因组代码

研究人员使用机器学习来解锁临床癌症样品中的基因组代码
福尔马林暴露的突变特征。仅C> T FFPE突变计数随福尔马林固定时间增加。我们观察到研究1(固定组)的未修复和修复的FFPE样品的增加。仅FFPE的突变是指仅在FFPE中发现的突变,但在FF样品或已知的种系数据库中没有发现。条高度代表n = 3例患者的平均C> T计数,并且单个计数被标记为黑点。b使用80通道频谱(非T> C)观察到无需修复的FFPE和修复的FFPE样品的一致和可分离的突变模式。我们使用T-SNE聚集了研究1和2的归一化80通道突变曲线(n = 110)(请参阅方法)。C没有观察到T> C突变的一致和可分离的突变模式。我们使用T-SNE聚集了研究1和2的归一化T> C突变曲线(n = 110)。d我们派生的FFPE特征与已知宇宙SBS特征的比较。 e, f Unrepaired signature is highly similar to SBS30 (e) and repaired signature is highly similar to SBS1 (f). We treated T>C features as missing data due to the strong batch-effect found in study 1, which is also observed in a few other studies shown in Supplementary Table 1 and therefore they were assigned to zeros. We noted that zero values are approximately close to the true T>C mutation probabilities in FFPE datasets without this batch-effect (Supplementary Fig. 6f). Error bars indicate the standard deviation in n = 55 independent samples with top 50% density in t-SNE cluster (see Methods). g, h Large variability in T>C mutation channels. We derived the T>C patterns using the same methods applied in (e, f). The error bar showed the standard deviations in n = 55 independent samples with top 50% density within the t-SNE (see Methods). Credit:自然通讯(2022)。doi:10.1038/s41467-022-32041-5

赫尔辛基大学的一篇新论文,今天在自然通讯,提出了一种准确分析癌症档案活检中基因组数据的方法。该工具使用机器学习方法纠正受损的DNA并揭示肿瘤样品中的真实突变过程。这有助于释放数百万档案癌样品中的巨大药物价值。

基于分子的诊断有助于将正确的患者与右患者相匹配治疗。研究人员对临床癌症样品中的DNA分析特别感兴趣。

“由于DNA质量较差,目前该宝贵的来源目前尚未用于分子诊断。福尔马林对DNA造成严重损害,因此,这给分析带来了不可避免的挑战在保存的组织中,”赫尔辛基大学的首席作家Qingli Guo说。

分析癌症基因组中的突变过程可以帮助早期的癌症检测,准确诊断癌症,并揭示某些癌症对治疗有抵抗力的原因。新方法可以极大地加速临床应用的发展,这些应用可能直接影响未来的癌症

新方法预测了90%以上的癌症过程

首席作者Qingli Guo与伦敦癌症研究所(ICR)和伦敦皇后大学的科学家密切合作,开发了名为FFPESIG的机器学习方法,以确切地揭示了福尔马林如何突变DNA。

Qingli说:“我们的结果表明,通常将几乎一半的癌症过程在没有噪声校正的情况下被错过。但是,使用FFPESIG,可以准确预测其中90%以上的过程。”

癌症逐渐发展。纵向样品中的突变过程有助于鉴定临床信息性预测因子并诊断每个肿瘤阶段。

“我们的发现使数十年来存储在​​室温下存储的保存的肿瘤活检中的临床相关特征表征。有了深刻的了解,我们的研究为使用大量成本进行了巨大的机会,开设了一个巨大的机会,可以使用大量的签名检测试验。- 有效的档案样本,”研究人员说。

研究人员指出,该方法目前并未完全删除出现在FFPE样品中显示批处理作用的伪影,以及该工具的性能因癌症类型而变化,因此必须注意解释任何发现。他们还有兴趣将来将其方法进一步应用于更广泛的档案样本。


进一步探索

研究表明,使用基于血液的液体活检补充组织活检的协同作用

更多信息:Qingli Guo等人,福尔马林对人类基因组的突变特征,自然通讯(2022)。doi:10.1038/s41467-022-32041-5
期刊信息: 自然通讯

由...提供赫尔辛基大学
引用:研究人员使用机器学习解锁临床癌症样品中的基因组代码(2022年9月6日),于2022年9月10日从//www.puressens.com/news/news/2022-09-machine-genomic-code-clinical-clinical-clinical-cancer.html检索
本文件受版权保护。除了出于私人研究或研究目的的任何公平交易之外,未经书面许可,不得复制任何部分。内容仅供参考。
42分享

对编辑的反馈