新的在线资源有助于将罕见的基因变异与人类健康和疾病联系起来
2006年,研究人员发现,携带PCSK9基因某些变体的人胆固醇水平显著低于普通人群。拥有两个破碎的基因拷贝(分别来自父母)的人比PCSK9正常的人患冠心病的可能性低88%。在这些发现的12年里,科学家们已经开发出了模仿关闭该基因效果的药物,医生们开始开这些药物的处方,以降低患者的胆固醇。
现在,麻省理工学院和哈佛大学布罗德研究所的研究人员创建了一个资源,可以帮助揭示潜在的治疗靶基因,如PCSK9。研究小组扫描了来自英国生物银行的近40万人的外显子体——基因组中编码蛋白质的部分,寻找它们之间的联系罕见的遗传变异以及疾病或性状。他们还开发了一个可公开访问的浏览器,叫做Genebass,总结他们的分析。他们的发现发表在今天的细胞基因组学.
这篇论文的共同第一作者、布罗德大学的计算科学家康拉德·卡尔切夫斯基说,其他研究人员正在研究特定的基因可以使用Genebass来了解更多与之相关的性状或疾病,反之亦然。
建立这个数据集,并把它发布到公众令人兴奋的是,虽然我们还没有发现下一个PCSK9,但其他人可能会利用这种资源,”Karczewski说。
马修·所罗门森(Matthew Solomonson)是这项研究的共同第一作者,也是布罗德大学基因组数据可视化的副主任,他领导了Genebass浏览器的开发。他说:“自去年6月推出以来,已有1.8万名用户尝试使用这款浏览器,世界各地仍有用户访问它来查找基因。”
这项研究也是由Katherine Chao领导的,她是Broad的共同第一作者和软件产品经理;本雅明·尼尔,布罗德大学医学和人口遗传学项目的共同资深作者和联合主任;艾伯维、百健和辉瑞的研究人员。
系统的研究
在全基因组关联研究在美国,科学家们梳理一个人群的整个基因组,寻找与疾病相关的基因变异。这些分析对解释从人类身高到精神分裂症等各种特征的基因产生了有价值的见解,但主要是探索常见的变异。通常情况下,一个变异越常见,它对一个性状的影响就越小。许多已知的导致疾病的基因变异是罕见的,但系统地研究罕见的变异需要巨大的数据集和处理能力。
使用一个大规模计算系统该研究由布罗德大学的Hail团队建立,研究人员在英国生物银行中寻找了4500多个性状和罕见基因变异之间的联系。该系统利用了云计算的强大处理能力,在几周的时间内分析了一台128核计算机需要15年才能完成的工作。他们的分析显示,在罕见的变异中,最严重的变异——如完全使基因失效的功能丧失变异——与疾病和性状有更多的联系。
研究小组还发现了与生物过程有关的罕见变异。例如,他们在SCRIB基因的功能缺失突变与大脑内部特定部分的白质(被认为支持大脑功能的神经纤维)完整性之间发现了一种此前未被报道的关联。Karczewski说,Genebass可以帮助其他用户识别类似的生物联系,为未来的疾病研究提供新的途径。
接下来,Karczewski和Solomonson希望将他们的浏览器扩展到越来越多的数据集,这些数据来自血统更加多样化的人群,比如来自美国国立卫生研究院的“我们所有人”研究项目。Karczewski说:“使用这些更完整、更广泛的数据集可能会给我们提供很多有趣的信息,比如更好的表达和更好的基因发现能力。”