2019年7月10日

有助于在人类基因组中找到删除和重复的新方法

一种新的机器学习方法准确地识别出人类基因组中被复制或删除的区域——称为拷贝数变异——这通常与自闭症和其他神经发育障碍有关。这种新方法是由宾夕法尼亚州立大学的研究人员开发的，它整合了几种算法的数据，这些算法试图从外显子组测序数据中识别拷贝数变异——仅对人类基因组蛋白质编码区域进行高通量DNA测序。一篇描述该方法的论文，它可以帮助临床医生提供更准确的诊断基因疾病，出现在7月的期刊杂志基因组研究。

“外显子组测序正迅速成为临床环境中识别基因变异的金标准，因为它比其他方法更快、更便宜，”宾夕法尼亚州立大学生物化学和分子生物学副教授、该论文的主要作者Santhosh Girirajan说。然而，目前从外显子组测序数据中识别拷贝数变异的算法存在非常高的假阳性率——他们识别的许多变异实际上不是真实的。通过我们的新方法，称为“CN-Learn”，我们报告的拷贝数变异大约90%是真实的。

人类基因组通常包含每个基因的两个副本，染色体对的每个成员都有一个副本。当一个细胞分裂成两个时，基因组就会被复制，使得每个子细胞得到一个完整的补充基因但在基因组复制过程中偶尔会出现错误，这些错误出现在精子或卵细胞中，可能导致个体获得多于或少于两个基因副本。

为了从外显子组测序数据中识别拷贝数变异，研究人员观察了每个基因产生的DNA序列的相对数量。如果一个个体中只有一个基因的拷贝，他们期望看到的测序读取量比有两个拷贝时要少，而一个基因的三个拷贝会导致更多的读取量。但这并没有那么简单，因为许多其他因素可以影响每个基因产生多少测序reads。因此，研究人员开发了几种算法来尝试正确识别复制数字变体从外显子组测序数据。然而，单独来看，这些算法并不是特别可靠。

“通常，通过使用多种算法并仅计算由多种算法计算的副本 - 变体算法的大量误报，并仅计算由所有方法鉴定的venn图所识别的变体，”研究生vijaykumar pounraja说宾夕法尼亚州的第一个作者。“这种方法具有多种缺点和局限性，因此我们决定制定新的机器学习方法。”

CN-GROEWS集成来自四种不同副本的数据 -数量-Variant算法，并使用一小部分生物学验证的删除和重复来学习这些基因组事件的签名。这学习过程通过机器学习促进算法被称为随机森林，它使用数百人决策树建立缺失和重复的遗传背景与验证它们的可能性之间的关系模型。然后，CN-Learn使用这个模型来预测没有验证的其他样本中的删除和重复。

“关于患者诊断和最终治疗的决定是根据这些信息制定的，因此让他们对此非常重要，”格里拉泽说。“因为这一点，我们制作了CN-GROUSE和所有必要的支持程序可在一个简单的包装中下载。”

进一步探索

在一些遗传学研究中，疾病相关基因常规错过

信息信息： 基因组研究

所提供的宾夕法尼亚州立大学

引文：新方法有助于在HTTPS://medicalXpress.com/news/2019-07-methodions-duplications-human -genome.html中找到人类基因组（2019年，7月10日）检索到的人类基因组（2019年7月10日）检索删除和重复

本文件受版权保护。除了私人学习或研究目的的任何公平交易外，没有书面许可，没有任何部分。内容仅供参考。

98分享

反馈给编辑

有助于在人类基因组中找到删除和重复的新方法

FDA将在10年空白后审查未经验证的癌症药物

雌激素靶向耐药乳腺癌

身体的天然止痛药可以增强

使用人工金属酶递送药物的成功癌症治疗

'Creative'基因在Neanderthals上给了Homo Sapiens Edge：学习

在子宫内不动后，骨骼缺陷可得到改善

COVID-19母婴感染率较低，但存在间接风险

在一些遗传学研究中，疾病相关基因常规错过

人类基因组中结构变异的彻底表征

研究人员使用优化的单细胞多OMICS测序来更好地理解结肠癌肿瘤异质性

自闭症的共同病因背后隐藏的复杂性

全基因组或外壳测序：个人洞察力

最大的对其同类的研究发现稀有与精神分裂症相关的遗传变异

'Creative'基因在Neanderthals上给了Homo Sapiens Edge：学习

科学家发现了由基因突变引起的新的神经发育疾病

锂治疗Bardet-Biedl综合征小鼠模型的智力缺陷

基因治疗的新方法可以纠正基因内的任何疾病突变

“信息理论”招募以帮助科学家发现癌症基因

研究人员发现与阿尔茨海默病相关的“激发因子”基因

用户评论

phys.org.

科技Xplore.

科学X.

有助于在人类基因组中找到删除和重复的新方法

FDA将在10年空白后审查未经验证的癌症药物

雌激素靶向耐药乳腺癌

身体的天然止痛药可以增强

使用人工金属酶递送药物的成功癌症治疗

'Creative'基因在Neanderthals上给了Homo Sapiens Edge：学习

在子宫内不动后，骨骼缺陷可得到改善

COVID-19母婴感染率较低，但存在间接风险

有关的故事

在一些遗传学研究中，疾病相关基因常规错过

人类基因组中结构变异的彻底表征

研究人员使用优化的单细胞多OMICS测序来更好地理解结肠癌肿瘤异质性

自闭症的共同病因背后隐藏的复杂性

全基因组或外壳测序：个人洞察力

最大的对其同类的研究发现稀有与精神分裂症相关的遗传变异

推荐给你

'Creative'基因在Neanderthals上给了Homo Sapiens Edge：学习

科学家发现了由基因突变引起的新的神经发育疾病

锂治疗Bardet-Biedl综合征小鼠模型的智力缺陷

基因治疗的新方法可以纠正基因内的任何疾病突变

“信息理论”招募以帮助科学家发现癌症基因

研究人员发现与阿尔茨海默病相关的“激发因子”基因

用户评论

时事通讯注册

你的隐私