新的计算方法预测疾病可能是因果的基因
来自芝加哥大学的科学家开发的一种新的计算方法改善了对复杂疾病和生物学性状有因的基因的检测。该方法,Predixcan,估计整个基因组的基因表达水平 - 更好地测量生物动作而不是单一突变 - 并与基因组 - 宽协会研究(GWAS)数据集成。Predixcan有可能更快地识别治疗应用的基因靶,比传统方法更高。它在线描述自然遗传学2015年8月10日
PrediXcan告诉我们是哪个基因更有可能通过了解基因型、基因表达水平研究负责人Hae Kyung Im博士说,他是芝加哥大学遗传医学研究助理(助理教授)。“这是第一个解释基因调控机制的方法,可以应用于任何遗传疾病或表型。”
基因组 - 范围的协会研究是检测参与复杂疾病的基因的关键工具,例如糖尿病和癌症或高度和肥胖等特征。Gwass通过鉴定单个字母DNA变体来确定这些链接,所述单字母DNA变体更频繁地在具有疾病或特征的个体中出现。但是,需要进行明显的后续工作来了解这些变体的作用机制。大多数疾病相关的变体不改变基因的功能,而是改变在细胞中复制的基因的量。由于诸如此类的因素,这些研究无法确定因果关系基因调节- 遗传变体可以促进促进变化的真实因果基因的表达水平,这仍然被GWAs未被发现。
转录组研究,如国家卫生研究所的基因型组织表达(GTEx)计划,旨在通过研究基因表达水平和调控机制及其与疾病的关系,而不是仅仅研究DNA序列,来克服这一限制。但是转录组研究也有明显的局限性,比如无法确定反向因果关系——基因表达水平是否因疾病而改变,或者疾病是否因基因表达的改变而发生。
开发一种检测基因和特征之间的关联的方法,避免这些问题,IM和她的同事将转录组和GWAS数据集成到单个计算框架中,它们名为PredixCan。该方法使用计算算法来了解基于GTEX的大规模转录组数据集的基因组序列如何影响基因表达。然后可以用于从任何全基因组序列或芯片数据集创建基因表达水平的计算估计。
作为GWAS一部分已测序的基因组可以通过PrediXcan生成基因表达水平谱,然后分析基因表达水平谱以确定基因之间的关联表达水平和正在研究的疾病状态或兴趣的特征。
该方法不仅可以识别潜在的因果基因,它可以确定方向性 - 无论是高还是低水平的表达可能导致疾病或特征。随着计算的基于DNA序列数据而不是物理测量,可以从特征本身(避免逆向因果关系)和其他因素如环境的影响,使基因表达的遗传确定的基因表达组分分开。利用Predixcan,验证研究只需要最多测试几千个基因,而不是数百万个潜在的单一突变。此外,该方法可用于重新分析现有的基因组数据集,以高吞吐量的方式侧重于机制,解决了GWAS研究中的主要差距。
“为了发现基因,这项研究整合了我们对转录组中基因变异后果的了解,而不是仅仅观察突变,”伊姆说。“在某种程度上,我们正在建立一种基因影响疾病或性状的机制,即基因表达水平的调控。”
虽然PrediXcan可以以高通量的方式发现基因和性状之间的联系,但我指出,这是因为它是基于基因组序列数据,它最准确地具有强烈的遗传性状。然而,几乎每一个复杂的特征或疾病都有遗传组成部分。该方法可用于预测该组分的影响,降低了后续研究的复杂性。
IM现在正在努力改善预测的预测,并将其施加到心理健康障碍。此外,她正在努力扩展超越基因表达水平,用来预测疾病或性状与蛋白质水平之间的联系,表观遗传学和其他可以根据基因组数据估计的测量方法。
“GWAS研究在找到遗传联系时一直非常成功疾病,但他们无法解释机制,“我说。”我们现在有一种计算方法,使我们能够了解GWAS研究的后果。“
进一步探索
用户评论