复杂的大规模基因组分析变得更加容易

复杂的大规模基因组分析变得更加容易
EMBL-EBI的Oliver Stegle的mSet算法使大规模、复杂的基因组分析更容易。资料来源:Spencer Phillips, EMBL-EBI

EMBL-EBI的研究人员开发了一种新方法来研究多种遗传变异对不同性状的影响。新的算法,发表在自然方法这项技术可以同时对多达50万个个体以及许多性状进行基因分析。

基因与特定性状之间的关系比基因与疾病之间简单的一对一关系要复杂得多。全基因组关联研究(GWAS)表明,许多遗传因素对任何特定的特征都起着作用,但科学家们才刚刚开始探索遗传变异是如何具体地影响健康和疾病的。发现这些联系的两个主要统计挑战包括分析许多不同遗传变异和多种特征之间的关联,以及充分利用包括数十万人在内的大型队列数据。

EMBL-EBI研究小组负责人Oliver Stegle解释说:“识别表型或性状基础的遗传变异非常具有挑战性,通常我们通过逐个分析每种表型和每种变体来做到这一点。”“但我们用来做这件事的简单模型太简单了,无法揭示一系列遗传变异和疾病表型之间的复杂依赖关系。”

复杂的模型可以让你看到许多不同变量的组合作用,到目前为止,涉及到如此多的计算,以至于运行一个复杂的查询需要一年的时间。

奥利弗说:“这里的突破是,我们已经有可能以与现有方法相同的速度进行涉及许多变体和表型的综合分析。”

研究人员测试了他们的基于来自公共数据库的两项研究的数据,并将结果与现有的最先进工具进行了比较。他们对四种脂类相关特征(低密度脂蛋白和高密度脂蛋白胆固醇水平、c反应蛋白、甘油三酯)的研究证明,新方法大大加快了速度,并且可以从驱动这些特征的遗传方面解释更大比例的特征。

奥利弗说:“我们希望能够从两个方向来看待这些问题。”“一方面,我们想看看单个基因中可能参与调节一种特定脂质特征的所有变体。另一方面,我们想看看在更大的脂质水平上的综合影响,例如,找出一些关于脂质调节的一般情况。”

使用新方法,GWAS研究人员可以同时探索一个基因的几个变体,同时将它们与几个相关的表型进行比较。这使得我们更容易确定哪些基因或基因上的位置参与了特定的功能,比如脂质调节。

奥利弗说:“这项工作的重要之处在于,它提高了统计能力,并提供了人们在非常大的群体中分析多种特征所需的工具。”“我们的算法可以用来研究多达50万人——这在目前为止是不可能的。”

“目前,人们要么在一种表型上使用多种变异方法,要么在一种表型上使用多种方法,但一次只研究一种变异。Oliver的新方案是一个真正的进步,因为它可以让你同时做这两件事,并且可扩展到我们开始在英国生物银行等项目中看到的非常大的队列中使用,”EMBL-EBI副主任Ewan Birney说。

新的算法为基因组学提供了急需的方法,使大规模、复杂的分析成为可管理和实际的努力。

“我们的方法,我们称之为mSet,提供了一种有原则的方法来测试多个遗传变异和性状组之间的统计关系。这些方法将帮助研究人员确定我们生物学的哪些特定方面是遗传的,并揭示我们无数生物过程背后的遗传学新见解。”

更多信息:Casale FP等(2015)。相关性状遗传分析的高效集试验。自然方法.6月15日在线发布;DOI: 10.1038 / nmeth.3439
期刊信息: 自然方法

引用:复杂的大规模基因组分析变得更容易(2015年6月16日),检索于2022年12月27日从//www.puressens.com/news/2015-06-complex-large-scale-genome-analysis-easier.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

大规模荟萃分析发现了10个调节胆固醇水平的新基因

One hundred.股票

对编辑的反馈