科学家发布一个新的人类“pangenome”参考
![Researchers have released a new high-quality collection of reference human genome sequences that captures substantially more diversity from different human populations than what was previously available. Credit: Darryl Leja, National Human Genome Research Institute, NIH 科学家发布一个新的人类“pangenome”参考](https://scx1.b-cdn.net/csz/news/800a/2023/scientists-release-a-n.jpg)
研究人员发布了一个新的高质量的人类基因组参考序列集合了来自不同人群的多样性大大超过以前。领导的工作是国际人类Pangenome参考财团,一组由国家人类基因组研究所(NHGRI),美国国立卫生研究院的一部分。
包括新的“pangenome”引用基因组序列的47人,研究人员追求的目标,这一数字增加到350到2024年中期。与每个人拿着一个配对的染色体组,实际上当前的参考包括94个不同的基因组序列,达到700的目标截然不同的基因组序列的完成项目。
工作,出现在《华尔街日报》自然生物技术,是联盟成员发表的数篇论文之一。
基因组DNA的指令集是帮助每个生物发展和函数。略有不同个体基因组序列。在人类的情况下,任何两国人民的基因组,平均超过99%相同。小的差异导致每个人的独特性和可以提供关于他们的健康的见解,帮助诊断疾病,预测结果和指导医学治疗。
了解这些基因差异,科学家创造人类基因组参考序列作为“标准”——人类基因组序列的数字融合可以用作比较一致,组装和研究其他人类基因组序列。
原始人类基因组参考序列近20岁,一直定期更新随着技术的进步和研究人员修复错误和发现更多地区的人类基因组。然而,它根本上是有限的在其表示人类物种的多样性,它由基因组从只有20人,和大部分的参考序列是只有一个人。
“每个人都有一个独特的基因组,所以使用一个参考基因组序列每个人可以在基因组分析导致不公平现象,”亚当Phillippy说,博士,高级调查员在计算和统计基因组学分支NHGRI的校内研究项目,主要研究的合作者。“例如,预测基因疾病可能不会工作的人的基因组与参考基因组不同。”
当前人类基因组参考序列差异,反映信息缺失,特别是在地区是重复的和难以阅读。最近的技术进步如读DNA测序,读取时间的DNA,帮助研究人员填补这些空白来创建第一个完整的人类基因组序列。这个完整的人类基因组序列,去年发布的一部分结果Telomere-to-Telomere (T2T)财团,纳入当前pangenome参考。事实上,许多T2T人员也人类Pangenome参考财团的成员。
![The new pangenome reference is a collection of different genomes from which to compare an individual genome sequence. Like a map of the subway system, the pangenome graph has many possible routes for a sequence to take, represented by the different colors. The detouring paths at the top of the image represent single nucleotide variants (SNVs), which are single letter differences. The yellow path that loops around itself and repeats the same nucleotides represents a duplication variant. The pink path that loops counterclockwise and follows the nucleotide sequence backwards represents an inversion variant. At the bottom, the green and dark blue paths miss the C nucleotide in its route and represent a deletion variant. The light blue path, which has extra nucleotides in its route, represents an insertion variant. Credit: Darryl Leja, National Human Genome Research Institute, NIH 科学家发布一个新的人类“pangenome”参考](https://scx1.b-cdn.net/csz/news/800a/2023/scientists-release-a-n-1.jpg)
利用先进的计算技术使不同的基因组序列,研究人员建造了一个新的人类pangenome参考与每个装配pangenome覆盖超过99%的预期的序列有超过99%的准确率。
它也建立在先前的参考基因组序列,增加超过1亿新基地,或在DNA“字母”。虽然前面的参考基因组序列是单一的和线性的,新pangenome代表许多不同版本的人类基因组序列在同一时间。这使研究人员更广泛的选项使用pangenome分析其他人类基因组序列。
“通过使用pangenome参考,我们可以更准确地识别大基因组变异称为结构的变异,“Mobin Asri组织说,博士生在加州大学圣克鲁斯和co-first该论文的作者之一。“我们能够发现变异没有确定使用之前的方法取决于线性参考序列。”
结构变异可能涉及成千上万的基地。直到现在,研究人员无法识别大多数结构性变异存在于每一个人类基因组测序使用短内容由于使用一个单一的参考序列的偏差。
“人类pangenome引用小说将使我们能够代表成千上万的基因变异在以前无法进入的基因组区域,”廖wen wei说,耶鲁大学博士生和co-first该论文的作者之一。“pangenome参考,我们可以加速临床研究通过改善我们的理解基因和疾病特征之间的联系。”
支持工作的总成本的人类Pangenome参考财团预计在5年内约4000万美元,其中包括努力创造人类Pangenome参考,提高DNA测序技术,运营一个协调中心,进行推广和创建资源研究社区使用pangenome参考。
许多个人的基因组测序为建设新人类pangenome参考最初招募的一部分1000人基因工程,一个协作和国际努力国家卫生研究院提供一部分经费,旨在提高基因组变异在不同人群的目录。因为人类pangenome参考是一个正在进行的工作,研究人员从国际人类pangenome参考财团继续添加更多的基因组序列的质量日益提高pangenome参考。
“基础研究人员和临床医师使用基因组学需要访问一个参考序列,反映了人口的显著的多样性。这将有助于使参考有用的所有人,从而有助于减少传播健康差异的可能性,”医学博士Eric Green说美国国家人类基因组研究所主任,博士。“人类创造和提高pangenome参考美国国家人类基因组研究所追求的目标与全球多样性在基因组学研究的各个方面,这是至关重要的促进基因组知识和实现基因组医学以公平的方式。”
符合这一努力,人类Pangenome参考财团包括嵌入式伦理组织正在努力预测挑战问题和帮助指导知情同意,优先考虑不同样本的研究,探索可能的监管问题相关的临床应用,并与国际和当地社区将基因组序列在这些更广泛的努力。
更多信息:教皇本笃祭碟,人类pangenome草案参考,自然生物技术(2023)。DOI: 10.1038 / s41586 - 023 - 05896 - x。www.nature.com/articles/s41586 - 023 - 05896 - x