对确定遗传祖先的算法的改进可以帮助确定疾病中的遗传因素
A*STAR研究人员改进了一种确定遗传祖先的统计算法,这一进展可能会提高旨在将遗传与疾病联系起来的研究的灵敏度和准确性。
基因测序技术的发展加快了收集遗传信息,为识别疾病的遗传机制提供了新的机会。然而,研究设计必须考虑遗传祖先包括个人。
新加坡A*STAR基因组研究所的王朝龙解释说:“遗传关联研究寻求识别与遗传疾病或性状有关的基因。”“由于不同人群具有不同的遗传背景,研究样本中潜在的遗传祖先可能会使这种努力变得复杂。”
这些遗传背景以及环境因素可以影响疾病易感性,而研究人群中准确的祖先信息有助于避免基因与疾病之间的联系被遗漏或错误识别。“对个体祖先的了解可以帮助研究人员更好地查明真正与疾病相关的基因,”王说。
Wang和他的同事之前开发了一种算法,可以从一个人的一小部分基因序列中确定他的祖先。该算法被称为“从序列读取中定位祖先”,或“激光”1.0,可以建立大陆祖先,例如区分欧洲和亚洲祖先。然而,当每个人的基因信息都很少时,它还不足以精确地定位精确的祖先,比如欧洲的原籍国。该团队现在已经开发了激光2.0,它比较了来自广泛的祖先参考数据集中个体的遗传信息。
该团队使用激光2.0进行分析基因数据之前用LASER 1.0进行过研究。新算法能比原算法更准确地估计出细尺度的欧洲祖先。研究人员还表明,当可用的基因数据不足时,激光2.0可以使用参考数据“猜测”一些缺失的数据,有效地增加了可供分析的信息量。
激光2.0还可以利用不同来源或不同技术生成的遗传数据准确地确定祖先。这种能力是与LASER 1.0相比最显著的改进,因为它可以整理和分析更多的数据,从而增加了对疾病遗传关联的敏感性。
“激光2.0可以帮助减少通过建模差异而产生的虚假关联祖先王解释说。“促进对来自不同来源的遗传数据的整合分析应该会加快大规模疾病相关性研究的发现。我们的方法还可以为研究古代和现代人类DNA之间的关系提供见解。”
进一步探索
用户评论