人类基因组中结构变异的彻底表征
人类的基因组因人而异。这些差异包括DNA序列中单个核苷酸的变化或“拼写错误”,但更多的差异来自于结构变异,包括DNA大片段的添加、删除和重排。最近的一项研究使用了多种先进技术,比以往任何时候都更深入地研究了三种家庭中存在的结构变异,以及它们的功能后果可能是什么。
在过去的十年里,基因组测序已经变得更快、更准确、更便宜。结果,越来越多的人类基因组被测序,而我们对这些序列对功能和疾病的实际意义的认识也在迅速增长。
还有清楚的是,我们学到的越多,我们就越多欣赏我们仍然了解人类基因组学。虽然ATGCS的线性序列看起来整洁,但我们的基因组实际上是具有相当大的差异之间的动态实体,其差异可以改变促进正常功能和疾病的特征。
这遗传差异人与人之间有助于我们的个性。这些差异包括数以百万计的单核苷酸变异——例如,一个人可能在某个位置有A,另一个人可能在某个位置有C。还有成千上万的结构变体(sv)。svv包括插入或删除的DNA片段基因组,复制的段和倒置的段。SVS比单一核苷酸变体更难以识别,因此它尚不清楚在给定的人类基因组中真正存在的SVS。
一篇名为“人类基因组单倍型结构变异的多平台发现”的论文发表在自然通信,比以往任何时候都更深入地研究个体基因组差异。
这项工作涉及来自人类基因组结构变异联盟(HGSVC)的大型研究人员,由Co-First作者Mark Chaisson,Ph.D.,Ashley Sanders,Ph.D.和Xuefang Zhao,Ph.D。他们使用全套基因组技术,以广泛地分析三个家庭三人(父母和儿童)的基因组。使用的技术包括长读,短读和股线特定的测序技术,光学映射和用于SV检测的多台计算机算法。结果在儿童基因组中显示了迄今为止的SV最全面的SV目录,包括在每个SV的各组染色体上存在的信息。
总之,研究人员平均鉴定了818,054个小的插入和缺失(每个基因组改变,每个受影响的DNA碱基)和每种基因组的27,622 svs(受影响50个碱基或更多DNA的基因组改变)。值得注意的是,每个基因组也发现平均156个倒置,其中许多与遗传疾病综合征相关的基因组区域相交。研究人员发现,常规测序技术和常用的计算机算法实际上错过了每个人以上100,000个变体。例如,标准的短读取算法错过了83%的插入识别。事实上,给定的SVS的真实数量人类基因组似乎是大多数研究通常确认的3到7倍。
因此,svv构成了目前不常见的大量遗传变异基因组测序技术和分析方法。这意味着SVS对人类疾病的贡献尚未得到良好量化,并且扩展的SV曲目可以帮助识别新的遗传关联,并改善未来遗传测试中的诊断产量。
进一步探索
用户评论