大数据为日语中的免疫特征提供了线索
![Next generation sequencing of the HLA genes and application of machine learning. Credit: Osaka University 大数据为日语中的免疫特征提供了线索](https://scx1.b-cdn.net/csz/news/800a/2019/bigdataprovi.jpg)
虽然基因在染色体上广泛分布,但许多与免疫系统相关的基因聚集在人类第6号染色体上一个称为主要组织相容性复合体(MHC)的区域。那里的基因密度使研究人员难以描述它们及其影响,但新技术和拥有大量人口数据的大型生物样本库为更深入地了解这一地区打开了大门。
发表在该杂志上的一项重大新研究自然遗传学美国大阪大学(Osaka University)的研究人员及其同事对日本人的MHC区域进行了专门调查,揭示了不同基因变异的存在及其与疾病和其他特征的联系。
该团队基于三组数据进行分析。其中一项是通过高通量测序获得的超过1000名日本人的33个决定白细胞类型的基因的测序信息。第二个数据来自全基因组关联研究研究了超过17万名日本人的整个基因组以及性状和疾病之间的区域联系。第三组数据来自医疗记录超过100个表型反映了临床状态和其他特征。
“我们的多重分析首先揭示了基因多态性的水平人类白细胞抗原(HLA)基因,然后使用机器学习方法将这种多态性的总体模式划分为11个不同的群体,遍布日本人口,”第一作者Jun Hirata说。“这为MHC区域的遗传景观提供了见解,并向我们表明,‘非经典’HLA基因也应该被包括在这一基因组区域的功能影响的研究中。”
![大数据为日语中的免疫特征提供了线索](https://scx1.b-cdn.net/csz/news/800/2019/1-bigdataprovi.jpg)
在调查了日本人MHC区域的全部变异后,研究小组专注于澄清这些变异与不同特征和疾病之间的联系。为此,他们使用了来自超过17万日本人的106种不同表型的医疗记录数据,其中包括46种复杂疾病。这些表型中大约有一半显示出与所研究的基因显著相关。研究结果显示,MHC区域的单个基因通常会影响多个性状,这种现象被称为“多效性”。
资深作者冈田幸则说:“我们的研究显示了日本人白细胞类型的差异对健康的重要性。”“我们构建的交叉表型网络也显示出健康状况之间的相关性,而这些健康状况之前并不知道存在相关性。”
这项工作的关键发现,包括非经典HLA的临床重要性基因以及MHC单倍型内基因变异的影响,应该为今后研究与这部分基因组相关的危险因素提供坚实的基础。
进一步探索
用户评论