通过遗传学阅读历史:新方法分析德系犹太人和马赛人的近代史
哥伦比亚大学工程与应用科学学院的计算机科学家在2012年11月的《科学》杂志上发表了一项研究美国人类遗传学杂志(AJHG),展示了一种用于分析遗传数据的新方法,以更多地了解种群的历史。作者首次开发了一种方法,可以详细描述过去2000年的近代史事件。他们在两个群体中展示了这种方法,德系犹太人和肯尼亚的马赛人,他们代表了两种历史和与邻近人群的关系:一种是与周围群体隔离的,另一种是在附近村庄频繁的交叉迁移中发展起来的。
“通过这项工作,我们已经能够恢复最近的和精炼的人口的历史领导这项研究的计算机科学副教授Itsik Pe'er说:“在过去的几个世纪里,与以前的方法相比,我们只能描绘几千年前更深刻的过去。”“这意味着我们现在可以将遗传学作为关于历史的客观信息来源,而不是主观的书面文本。”
Pe'er的团队使用计算遗传学来开发分析DNA序列变异的方法。他解释说,了解一个群体的历史,了解哪些人群在何时有共同的起源,哪些群体已经被隔离了很长时间,或者是由多个原始群体的混合造成的,并能够充分描述他们的遗传特征,“对于个性化医疗的铺平道路至关重要。”
为了这项研究,研究小组开发了数学框架以及软件工具来描述和分析这两个群体的历史,并发现,例如,德系犹太人是一小部分人的后代——数百人——来自晚期中世纪从那时起,它们就一直保持着基因隔离,而它们的数量迅速扩大到今天的数百万。
Pe'er指出:“知道德系犹太人的人口从一个非常小的数量增长到如此之快,具有实际意义。”“如果我们能从这个群体中获得几百人的数据,这在今天的技术中是完全可行的任务,我们就能有效地收集数百万当前德系犹太人的基因组。”他和他的团队现在正在这样做,并且已经开始分析第一组大约150个德系犹太人的基因组。
的基因数据显示了半游牧民族马赛人的村庄人口结构。与孤立的德系犹太人不同,马赛人住在小村庄里,但经常跨村庄互动和通婚。因此,每个村庄的祖先通常来自许多不同的地方,一个村庄拥有一个比村庄本身大得多的有效基因库。
研究人员说,以前在种群遗传学方面的工作主要集中在很久以前发生的突变上,因此只能描述在那个时间尺度上发生的种群变化,通常是在农业革命之前。Pe'er的研究改变了这一点,使科学家们能够更多地了解最近种群的变化,并开始研究,例如,如何精确定位特定个体的个人基因组中的严重突变,这些突变更有可能与疾病有关。
Pe'er补充道:“这是一个在计算遗传学领域工作的激动人心的时刻,”他引用了数据获取的速度正在加快;比计算硬件处理这些数据的能力快得多。“虽然大量的大数据迫使我们开发更好的算法来分析它们,但它也让我们获得了前所未有的理解水平。”