最大的人体Exome序列数据集合产生前所未有的工具来诊断稀有疾病

最大的人体Exome序列数据集合产生前所未有的工具来诊断稀有疾病
ExAC资源包含了60,706名来自不同种族背景的人的外显子组序列(基因组的蛋白质编码部分)的数据。信贷:广泛的通信/ iStockphoto

基于其种类的最大资源,由科学家们在广泛的麻省理工学院和哈佛大学的科学家领导的exome聚合财团(EXAC)从60,706人提出了从exome序列(蛋白质编码部分)的数据来自不同的民族背景。含有超过1000万DNA变体 - 许多非常罕见和最初的最罕见的 - EXAC数据集是一种自由的高分辨率,高分辨率的人类遗传变异目录,已经对稀有遗传疾病的临床研究和诊断产生了重大影响。

8月18日发行自然,数据分析揭示的性质例如,在较小的数据集中不可检测,例如,在样本中独立地在多次出现多次的突变直接观察 - 所谓的“突变复发”。该工作还揭示了一类含有比预期更少变化的基因,代表可能导致人群中罕见或缺乏的DNA变异,因为它们对人体健康如此不利。目前研究进一步表明,EXAC数据库改善了评估候选病原体的能力

“EXAC的成功是通过我们的同事在许多大型疾病的联盟的愿意公开份额分享测序数据,”医学和人口遗传学计划的联合主任Daniel Macarthur表示,丹尼尔·麦克阿瑟说在广泛的研究所,马萨诸塞州综合医院和哈佛医学院的助理教授。以前的资源含有远远少的兴奋剂,没有太多的祖先多样性,因此他们对稀有疾病变异的研究不足。“EXAC资源的规模和多样性是宝贵的,”麦克阿瑟补充道。“它使我们能够发现极其罕见的变种,并提供一个无与伦比的窗口进入稀有遗传疾病的根源。”

在从全球研究合作者中收集来自数万人的展开的原始数据后,该联盟依赖于广泛研究所的基因组学平台和数据科学和数据工程组的分析和计算能力,以生产目录前所未有的分辨率 - 大致占DNA的每八个碱基或字母的一个变种。许多这些变种从未报道过,大多数是非常罕见的,在10,000人中不到1人出现。

通过手中的患者的基因组序列,临床医生可以比较他或她的基因组中发现的任何罕见突变与EXAC数据库中的那些,脱落在可能提出患者病症的基因和蛋白质上。在患者的DNA序列中发现的变体,其在exac中极其罕见,特别是预测破坏所得蛋白质的功能的序列,然后成为引起罕见疾病的关键嫌疑人。自2014年10月的科学界释放以来,EXAC资源在网上有超过500万页,并允许临床医生为成千上万的罕见疾病患者提供更准确的遗传诊断。

信贷:广泛的麻省理工学院和哈佛大学

“EXAC资源在评估诊所评估患者的基因组序列时给予我们令人难以置信的洞察力,”伴侣个性化医学的分子医学实验室首席实验室主任Heidi Rehm说。在临床测序中,许多DNA变体都是罕见的或解读的,因此如果它们对疾病风险有任何影响,并且在诊断和治疗患者时是否应考虑它们。通过查看EXAC数据库中患者变体的频率,REHM和她的团队可以排除那些相对普遍的人,让他们更快地在真正的疾病导致的变体中回家,并避免在良性人员上进行昂贵的随访。

研究人员也使用了资源来识别数十种新的稀有遗传障碍。“在我们自己的研究中,使用EXAC资源使我们申请新颖的统计方法来识别几个新的严重发育障碍,”Wellcome Trust Sanger Institute和EXAC数据库的频繁用户的研究员Matthew Hurles。“exac等资源举例说明,由于许多研究参与者的大规模利他主义,允许其数据汇总和共享的许多研究参与者的大规模利他主义,所以可以获得稀有遗传疾病的益处。”

研究人员还正在使用EXAC数据库,例如,遗传变异的更基本的影响,例如,看着转录因子蛋白的变化及其对蛋白质 - 蛋白质相互作用网络的影响。

有趣的是,在这些数据中,人们所预期但未发现的变化提供了新的见解。一些基因被发现有少于预期数量的错义突变,改变蛋白质序列,或“功能丧失”突变,消除蛋白质功能。有了如此大的样本规模,研究人员能够量化每个基因的这些类型的突变的不足,识别出几千个“高度受限”的基因,因为它们的影响如此有害,自然选择已经淘汰了这些突变。由于对它们引起的疾病一无所知,而且在ExAC数据库中往往没有这些突变的实际实例,“缺失的变异”表明,这些高度受限的基因很可能导致严重的疾病。如果临床或研究测序显示患者基因组中这些基因中的一个功能缺失或错义突变,它就成为导致其罕见疾病的有力候选基因。

EXAC数据还显示出100多个先前报告的疾病导致突变实际上是良性的,减少了临床实验室广泛使用的数据库中这些假阳性结果的数量。该发现证明了EXAC数据库在评估特定突变引起疾病的权利要求中的价值。

“大样本大小和高分辨率在许多人口,ExAC数据库提供了更大的权力来解释罕见的比以往致病变种,即使是常见疾病,”穆Florez说,协会成员广泛,糖尿病的单位在马萨诸塞州综合医院,还是哈佛医学院的副教授


进一步探索

揭示了人类遗传变异的新见解

更多信息:Lek M等。60,706人的蛋白质编码遗传变异分析。自然。2016年8月18日。DOI:10.1101 / 030338
信息信息: 自然

引文:最大的人类Exome序列数据集合产生前所未有的诊断稀有疾病(2016年8月18日)从//www.puressens.com/news/2016-08-largest-human-exome-sequence-yields检索稀有疾病(2016年8月18日)。HTML.
本文件受版权保护。除了私人学习或研究目的的任何公平交易外,没有书面许可,没有任何部分。内容仅供参考。
52.分享

反馈到编辑

用户评论