研究人员开发了一种识别癌症突变信号的新方法
约翰霍普金斯大学金梅尔癌症中心的研究人员使用机器学习技术来检测癌症患者的突变特征。他们的算法超越了当前的分析标准,揭示了与肥胖相关的新突变特征。癌症预防专家认为,肥胖正在成为美国和大多数西方国家导致癌症的最重要的生活方式因素。这项研究发表在1月25日的杂志上eLife。
“突变信号在当前的癌症研究中非常重要,因为它们能让你看到潜在因素留下的迹象,比如衰老、吸烟、使用酒精约翰·霍普金斯大学基梅尔癌症中心肿瘤学副教授克里斯蒂安·托马塞蒂博士在约翰·霍普金斯大学布隆伯格公共卫生学院生物统计学方面获得联合任命。
这项新技术使用了人工智能的应用机器学习,通过一个计算机算法通过访问和分析数据来发现他们所谓的“超级persigs”,这是一种能够揭示癌症潜在诱因的基因影响的突变信号。他们的算法被归类为“有监督的”,因为这是一种包括在癌症遗传分析算法训练期间已知暴露的分析。用于评估基因组数据的最广泛使用的突变签名被归类为“无监督”,因为它们没有将已知的暴露考虑在内。相反,它会记录模式,然后回头把它们与暴露量联系起来。新方法还允许监督和非监督方法的混合,控制或屏蔽已知致癌物质暴露的影响,以探索潜在的未知因素的可能影响。
研究人员发现,新的监督技术在预测精度方面优于无监督方法。有监督的方法中位数曲线下面积(AUC)为年龄0.73,所有其他因素为0.90,而无监督的方法中位数曲线下面积(AUC)为年龄0.57,所有其他因素为0.77。
“AUC为0.5或以下意味着这种方法并不比纯粹碰运气好。”你能得到的最高值是1,”第一作者Bahman Afsari博士说,他是约翰霍普金斯大学Kimmel癌症研究中心的讲师,直到发表前几个月。
他们还揭示了他们认为与肥胖患者癌症相关的第一个突变信号,为肥胖和癌症起源相关的突变机制提供了证据。
托马塞蒂说:“肥胖可以说是导致癌症的最重要的生活方式因素,但它引发癌症的机制还不清楚。”“由于肥胖患者的癌症往往不会出现突变数量的增加,因此人们认为,肥胖增加癌症风险的机制不是通过突变来实现的。”我们的研究结果表明,它至少在一定程度上是突变的。”
他们的方法还表明,病因或潜在因素并不总是对所有组织造成相同的突变效应,这一发现与非监督方法的假设相反。
“老龄化产量不同突变的签名约翰·霍普金斯大学布隆伯格公共卫生学院的博士研究生、共同第一作者艾伯特·郭说。“还有,在肺里签名衰老和吸烟的特征非常不同,但在其他组织中,吸烟的特征相对类似于衰老的特征,这表明炎症是主要的机制。”
此外,该研究还证实了随机突变(细胞复制过程中DNA发生的正常错误)在癌症发展过程中的关键作用。
“每次细胞分裂时,它都必须复制自己的DNA。当复制和修复机器复制数十亿个字母(构成我们dna的分子)时,错误就产生了。据估计,每次细胞分裂都会发生3到6个DNA突变,”托马塞蒂解释说。“导致癌症的突变的一个主要来源似乎是这些内源性过程,与基因缺陷基因或有害接触没有任何关系。”
通过这个算法,托马赛蒂和他的团队确定了69%的突变在癌症患者他说,所有类型的肿瘤都可以归因于随机发生的突变,这表明需要在早期检测上投入更多精力和资源。
“如果我们不能避免癌症的发生,那么退而求其次的办法就是在它太晚之前发现它。”如果我们能找到癌症通常在早期阶段,你可以挽救病人的生命。”他说。
进一步探索
用户评论