新的基因组变异图谱将使疾病研究成为可能
遗传学研究人员为研究人类疾病的科学家和健康提供者提供了一个强大的新资源——人类基因组中DNA缺失和复制的参考标准。这项研究来自2000多名健康人,提供了迄今为止最深入、最广泛的一组拷贝数变异(CNVs),同时也为诊断和识别患者的遗传问题提供了一个新的研究工具。
费城儿童医院的一个团队在7月10日的杂志网络版上发表了对人类基因组中cnv的高分辨率地图和分析基因组研究.
相比之下,DNA单个碱基的改变单核苷酸多态性或snp,通常被称为“片段”,cnv是一种更大的变异DNA结构.当单个DNA字母发生变化时,snp可能被认为是拼写错误或单词的替代拼写,而cnv则是整个短语、段落甚至页面的丢失(删除),或者是重复的部分(重复)。一些CNVs是插入基因组其他部分的DNA片段。snp和cnv都通过改变DNA携带编码指令的基因的作用,促进了遗传多样性和疾病。
“在我们自己的基因组中,我们都携带着一些这样的变异,”该研究的共同领导者Peter S. White博士说,他是儿童医院生物医学信息学中心的分子遗传学家和主任。“一些cnv会导致某种疾病,但大多数不会,而且通常很难确定哪些是重要的。一种方法是将健康个体的CNVs与患有某种疾病的患者的CNVs进行比较,以找到那些似乎主要发生在患有某种疾病的人身上的CNVs。我们的地图提供了一个大而统一的基线标准,以表明哪些CNVs代表正常变化。”
研究人员分析了来自2026名受试者的血液样本的DNA。研究对象是健康儿童和他们的父母,他们都来自儿童医院卫生保健网络的初级保健和健康儿童诊所。在样本中,65%来自白种人,34%来自非裔美国人。研究对象的数量使这次CNV收集成为迄今为止报道的最大的收集之一,因为所有的样本都是在相同的协议下,使用相同的技术收集和分析的,并且在同一个机构,结果具有一致性,这增加了其作为基准的价值。
这组作者说,CNV图谱的分辨率比以前的大多数工作都要高,在整个基因组中有超过5万个CNV被编目。其中四分之三是“非独特的”,发生在多个不相关的个体中。大多数(51.5%)的非独特CNVs是新发现的。研究中健康的受试者平均每人大约有27个cnv。
研究人员已经在医院的网站上发布了完整的CNV数据库,该数据库以可搜索的形式免费提供给全世界的基因研究人员。该网络浏览器还使研究人员能够将特定的cnv与从其他机构的公共数据库中收集的数据进行比较。
儿童医院的分子遗传学家Tamim H. Shaikh博士说:“这种资源对于实现由CNVs引起的罕见疾病的快速和准确诊断非常重要。”这类遗传疾病可能个别罕见,但总体发生的频率与众所周知的唐氏综合症等疾病的发病率相当,这常常令医生感到困惑。“为了查明导致疾病的一种CNV,关键是要迅速消除那些属于人类正常变异谱的一部分基因组.这就是CNV数据和其他类似资源允许我们做的。”谢赫补充说。
作为他们数据库的临床用途的一个例子,作者分析了一个患有多种先天性问题的儿童的DNA,包括发育迟缓和大脑畸形。他们发现了35个CNVs,其中32个之前在健康对照组中检测到。患者的三个独特的CNV中有两个相对较小,但第三个CNV是17号染色体上的缺失,包含51个基因,包括几个在产前早期发育中活跃的基因。与其他大多数CNVs不同的是,它并没有发生在孩子的父母身上,这有力地支持了染色体缺失在病人身上自发发生并导致孩子患病的结论。
为了在数千个样本中检测CNVs,研究人员使用了儿童医院应用基因组学中心的高度自动化基因分析技术,该技术由Hakon Hakonarson博士指导,他是这项研究的共同领导者。Hakonarson说:“尽管这些CNVs在健康儿童中被检测到,但它们可能有严重的疾病影响,可能直到生命的后期才会显现出来。”今年早些时候,Hakonarson和他的同事发表了突破性的研究,研究了自闭症谱系障碍和注意缺陷多动障碍中的CNVs。两项研究都在儿童早期神经发育相关的基因区域发现了CNVs。
Shaikh补充说,新的数据库还有另一个优势。由于它分析了来自白种人和非裔美国人的大量样本,它测量了两个种族之间不同的CNV水平,使临床医生能够做出更精确的诊断。Shaikh补充说,研究人员希望通过更大的样本量和更多种族人口的数据来扩大数据库。
怀特说,除了用于诊断之外,该数据库还可以帮助研究分子进化的人员,例如,研究人类在跨大陆传播时基因变异是如何发生的。