新工具使科学家能够解释“暗物质”DNA
格莱斯顿研究所的科学家们发明了一种阅读和解读人类基因组的新方法。这种被称为TargetFinder的计算方法可以预测非编码DNA——不编码蛋白质的DNA——在哪里与基因相互作用。这项技术帮助研究人员将所谓的基因组“暗物质”突变与它们所影响的基因联系起来,有可能揭示基因疾病的新的治疗靶点。
这项研究发表在自然遗传学,研究人员观察了非编码DNA片段增强剂.增强子就像基因的说明书,指示基因何时何地被打开。基因可以通过含有许多其他基因的DNA长链与增强子分离基因.
“大多数与疾病相关的基因突变都发生在增强子中,这使它们成为一个非常重要的研究领域,”Gladstone研究所的高级研究员、资深作者Katherine Pollard博士说。“在此之前,我们一直在努力理解增强子是如何找到它们所作用的远方基因的。”
科学家最初认为增强子主要影响离它们最近的基因。然而,新的研究表明,在一条DNA链上,增强子可能与它们所影响的基因有数百万个字母的距离,而跳过中间的基因。当增强子远离它所影响的基因时,这两个增强子通过形成一个三维环连接起来,就像基因组上的弓。
利用机器学习技术,研究人员分析了来自六种不同细胞类型的数百个现有数据集,以寻找识别基因和增强子相互作用的基因组模式。他们发现了几个模式存在于连接增强子和基因的循环中。这种模式在85%的情况下准确预测了基因增强子之间是否发生相互作用。
“我们可以从相对简单的数据中预测复杂的三维相互作用,这是很了不起的,”Gladstone的生物统计学家,第一作者Sean Whalen博士说。“以前没有人看过存储在循环中的信息,我们惊讶地发现这些信息有多么重要。”
在实验室里进行实验以确定所有这些基因增强剂之间的相互作用可能需要数百万美元和多年的研究。新的计算方法是一种更便宜、更省时的方法来识别基因组中的基因增强子连接。这项技术还提供了对DNA环如何形成以及它们如何在疾病中断裂的洞察。科学家们在网上免费提供了TargetFinder上的所有代码和数据。
“我们能够如此精确地预测增强子的基因目标,这使我们能够将增强子的突变与它们的目标基因联系起来,”Pollard说。“有了这种联系是利用这些联系治疗疾病的第一步。”