算法揭示了癌症隐藏的基因损失和收益
了解有助于不同形式的癌症的具体突变对于改善诊断和治疗至关重要。但是,DNA测序技术的局限性使得难以检测常与癌症相关的一些主要突变,例如染色体部分的损失或重复。
现在,普林斯顿大学计算机科学家开发的方法将使研究人员能够更准确地识别癌组织中的这些突变,从而对肿瘤的进化和扩散形成比以前更清晰的图像。
已知染色体中的损失或重复发生在大多数实体瘤中,例如卵巢,胰腺,乳腺癌和前列腺肿瘤。随着细胞生长和分裂的,复制和分离DNA过程中的滑动也可以导致染色体上的个体基因的缺失或重复,或者细胞的整个基因组的重复 - 所有23对人染色体。这些变化可以激活癌症- 抑制癌症生长的突出基因或灭活基因。
“他们在癌症中的重要司机事件,他们与癌症中的其他类型的突变相互作用,”计算机科学教授Ben Raphael表示,该研究与莫蒙特拉·研究助理员工的Simone Zaccaria研究在普林斯顿。
虽然医药科学已经认识到这些突变是癌症发展的关键部分,以目前的技术来识别这些染色体的丢失或复制是困难的。这是因为DNA测序技术无法读取全部数据染色体从端到端。相反,技术允许研究人员序列染色体的片段,它们从中组装整个股线的图片。该方法的弱点是它不能容易地识别DNA链中的间隙或重复的区域。
为了解决这个问题,拉斐尔和扎卡里亚创造了新的数学工具,让科学家可以搜索大量的DNA片段,并发现是否有缺失的片段或重复的片段。这两种算法分别被称为“斧头”(HATCHet)和“凿子”(CHISEL)自然通信和自然生物技术。
“您正在排序的所有细胞都来自同一进化过程,因此您可以以利用这种共享信息的方式将序列放在一起,”Zaccaria说,Zaccaria说,Zaccaria表示,Zaccaria表示,伦敦癌症大学学院的主要研究员伦敦弗朗西斯克里克研究所的研究所和访问研究科学家。
“现实是,用于测序DNA的技术单个细胞有局限性,而算法可以帮助研究人员克服这些局限性,”Raphael说。“理想情况下,测序技术和算法将继续同步改进。”
Raphael的研究小组有多种与癌症研究人员的合作,他们开始将斧头和凿子算法应用于各种类型的患者样品和实验模型的序列。
进一步探索
Simone Zaccaria等。准确定量拷贝数像差和多样本肿瘤测序数据中的全基因组重复,自然通信(2020)。DOI: 10.1038 / s41467 - 020 - 17967 - y
用户评论