如何分析你的基因组;第一部分线粒体DNA

MT-Cyb结构-原生结构
人MT-Cyb蛋白亚基的原生结构。来源:proteinmodelportal.org

今天的基因组分析基本上是盲目的。它通常通过随机检查与某些疾病或身体特征只有松散关联的少数可能变异来进行。除非你已经有了严重的健康问题,否则这种狭隘的赌博不太可能改变你的游戏规则。

在这一空白中,我们希望提供一种更有条理的方法——一个简单的公式,在关键点上逻辑地解析基因组,并建立与任何人相关的可靠的生理预测因子。但首先,需要一些背景知识。

我们的基因组是由病毒和细菌组成的杂交体。我们有两个基因,一个大的,一个小的。一般来说,生物信息学大多忽略了简单的16500个位置的线粒体DNA (mtDNA),而几乎只关注复杂的30亿个位置的核DNA (nucDNA)。正如我们将要看到的,这是完全落后的。

除了一种叫做humanin的小肽,在微小的人类有丝分裂基因组中编码的所有蛋白质都专门用于呼吸复合体I到v。位于双线粒体膜系统两侧的两个决斗的3-D打印头(见下图)协同挤压并将每个亚基部署到适当的组装室中。一旦到了那里,每个复杂的特定组装因素依次缝合在一起。该膜的线粒体基质侧是有丝核糖体,而细胞侧是胞质核糖体。

细胞质和线粒体
双线粒体膜两侧的胞浆体和线粒体糖体串联工作。来源:Wikipedia.org

线粒体作为细菌内共生体进化而来。他们利用从病毒那里借来的复制-粘贴-修改硬件,构建了第一个真核细胞核,以及此后的每一个细胞核。核苷酸磁带是使用线粒体特异性DNA和RNA聚合酶来读取、写入和修改的,这些聚合酶和大多数其他基本蛋白质早已被卸载到细胞核中存储。理解这个线粒体构建项目将是我们解开整个基因组的关键。

原子核dna中至少有1500个我们所关注的位点。这些是编码蛋白质和一些rna的位置,它们在线粒体中使用。识别这些基因的技巧是,它们通常从一个线粒体定位序列开始,将它们定位到正确的细胞器。并非所有这些被文化同化进细胞核的基因都是类核的迁移体。许多人只是简单地从现有的核基因复制自己,随后想出了另一种方法来拼接细胞器定位母题。

虽然这些基因的完整列表(“有丝核基因组”)尚未被完全发现,但迄今为止,许多已被挖掘的基因都存在于MitoCharta网站.研究人员继续发现更多的有丝核基因组公民。这些并非在所有组织中表达,也不总是包含定位基序,但可以进入线粒体。总的来说,这些是杂交基因组的关键点。

换句话说,基因组学的最佳点位于两个基因组的交叉点。为了分析它们,我们必须在扩展的有丝分裂核基因组和微小的有丝分裂基因组中寻找多态性之间的相关性。更具体地说,当>1500强有丝分裂核基因组中的变体与13强有丝分裂基因组中的特定变体同时被发现时,我们需要创建一个可能预期的影响小组。

直到最近,在疾病数据库中搜索可能与患者匹配的单一变异是分析风险或诊断许多罕见疾病的唯一方法。线粒体疾病,曾经被认为是极其罕见的,实际上是一种以某种形式影响每个人的疾病。虽然有可能创造细胞杂交或“杂交”来探索特定mtDNA突变在研究环境中的影响,但这通常不会用于个人。幸运的是,现在有了另一种方法,即结构建模和分子动力学模拟。

这种方法的美妙之处在于,它可以优于对其他人(通常是其他生物)的业务进行粗略的数据库搜索,后者只返回一个分散的、糟糕的匹配到个人特定变体集的大杂烩。现在,任何基因图谱都可以直接进行逆向工程。换句话说,我们可以单独标记所有的变体,然后在一个复复数的基础上探索每个变体的含义。

每个复合体都嵌入在有丝核武器库的相关导入、复制、翻译和代谢周期组件的外围,这些组件在不同条件下组织成不同的宏观复合体。除了改变单个亚基核心催化活性的突变外,现在人们广泛认识到,亚基相互作用的外周氨基酸的变化通常会产生最明显的影响。这些边界氨基酸是最直接控制亚基组装成高阶结构的氨基酸——一直到难以捉摸的呼吸超复合体。

开始分析的一个好方法是使用一个真正的mtDNA的例子。我最近从Dante实验室获得了一个全基因组测序(WGS),对mtDNA测序的特殊要求仅花费了几百美元。几周后,我收到了mtDNA结果,其中有两份文件,格式为FASTQ。每个文件包含通过单向测序DNA片段获得的测序数据。为了将结果与剑桥参考线粒体序列(CRS)进行比较,并提取我的特定变体,我将我的文件上传到一个名为mtDNA-Server,并使用“单端”作为文件类型。

除了列出你所提交的样本中最丰富的“同质”序列,你还会收到关于异质性的结果。这些数据包括额外的低丰度读数,主要来自所谓的核线粒体DNA片段(NUMTs)。这些大多是mtDNA在许多染色体上的无功能残余副本。展望未来,从唾液以外的区域分析mtDNA,以更好地处理不同线粒体内的实际异质性,将是很重要的。

例如,心肌细胞或成纤维细胞可以优先积累突变和缺失的mtDNA。在其他情况下,不同的组织故意维持不同的异质线粒体种群。以我为例,我收到了以下同质变异:

11788 c > t mt-nd4
1438 A>G MT-CYB(应该是MT-RNR2)
15326 a > g mt-cyb
16519 t > c mt-dloop1
263 a > g mt-dloop2
4769 a > g mt-nd2
750 a > g mt-rnr1
8860a >g mt-atp6

好消息是,虽然不是每个人都是基因重组的赢家,但每个拥有线粒体的人都可以被分配到一个特定的单倍型。这大致告诉了它们在人类族谱中的位置,并在较小程度上告诉了它们的线粒体所适应的环境类型。使用如下工具MitoMap在宾夕法尼亚儿童医院的研究人员玛丽·洛特和张世平的专家帮助下,我发现我完全属于h单倍群。这是因为我和这组人共享所有非常常见的263G、750G、1438G、4769G、8860G、15326G和16519C标记。我有一个罕见的等位基因,在11788T,在MitoMap数据库的45,000个序列中只发现了25个,这使我跻身于H56亚群。这种单倍型是一个主要的北欧亚群,据信起源于最后一个冰河时代后不久。

我马上注意到的一件事是,在我的检查中,明显有大量的A>G变体。>G似乎在已知的严重线粒体疾病突变中也被过度代表,例如MELAS。Marie和Shiping指出,虽然>G在统计学上绝对是一种有利的转变(G>A与A>G的转变以2.26比1的比例发生),但它们的丰度可以部分解释为转变的流行胜于颠倒和mtDNA内的天然链不对称;从有丝分裂基因组编号的光链中,有~ 30%的A,但只有~ 13%的G。此外,已知A和G变体优先定位于特定区域mtDNA。

沿着变体列表向下走,我们发现一些蛋白质编码变体,如MT-ND2中的4769A>G或MT-ND4基因中的11788 C>T是“同义的”。这些基因编码NADH脱氢酶复合体i的亚基,同义性意味着尽管核苷酸发生了变化,但新的密码子仍然会被相同的mt-tRNA或相似的trna家族识别。因此,这些变异不太可能影响蛋白质序列本身。翻译的速度或准确性仍有可能发生一些小的变化。

8860a >g过渡MT-APT6,另一方面,是一个非同义的替代。更具体地说,这种来自A >G的错义突变改变了密码子的特异性,从T到A。重要的是要认识到,在密码子世界中,T是氨基酸苏氨酸而不是核苷胸苷,而A是丙氨酸,而不是腺苷。为了确定这种突变发生在V复合体的f - atp酶蛋白6亚基中,我们可以使用Mitomap将8860 mtdna参考坐标转换为蛋白质参考坐标112。

使用蛋白质结构数据库Uniprot还有交互式建模网站蛋白质模型传送门,我们可以在112号位置输入丙氨酸变体,看看它在蛋白质的各种环和褶皱中的位置。上面的主要文章图像显示了整个ATP6蛋白,下面的图像突出显示了112号位置。

MT-Cyb变种位于112号位置(绿色突出显示)
MT-Cyb变种在112号位置(绿色突出显示)。来源:proteinmodelportal.org

搜索dbSNP短核苷酸变异数据库显示,一些MT-CYB变体与肥厚性心肌病相关,所以我想在那里做一些更深入的分析。一篇论文在他们的研究中包括了我的15326A>G变体,它提供了一个极好的配方。2013年这项研究的作者使用了PolyPhen分析MT-CYB的血红素结合氧化还原中心附近的保守功能突变。尽管Polyphen提供了基于感觉的指标,将各种突变评分为“可能非常具有破坏性”,但它也可以将这些主观描述归因于实际的功能参数,如蛋白质中隐藏的位置过度填充。

根据人类蛋白质的晶体结构是否具有足够高的分辨率,人们可以使用I-TASSER和Swiss-PDB Viewer等预测软件来引入氨基酸变化并评估所有可能的旋转蛋白。氢键的变化,大分子相互作用和能量最小化可以通过GROMOS力场来实现。

完整的分子动力学模拟仍然不适合胆小的人。例如,NAMD和CHARMM22程序通常需要大量的计算能力。MT-Cyb亚基与复合体III中的11个亚基中的几个相互作用。像STRIDE模拟器这样的包可以在连续的时间点上计算二级结构,以揭示相互作用的alpha螺旋转变和交替转变为随机线圈以破坏复合物的结构的位置。

我们将在本系列的下一篇文章中结束对有丝分裂基因组的分析,并在我可以获得有丝分裂核基因组时开始研究它。我正试图追随开放基因组学早期先驱的脚步,布莱恩肯定他是第一批将自己的全部作品制作成电影的人之一任何有兴趣使用它进行分析的人都可以免费使用。我自己的信息和文件都是在这个博客


进一步探索

更多的线粒体dna分子可以弥补突变的负面影响

更多信息: us.dantelabs.com/

©2018 M欧宝娱乐地址edical Xpress

引用:如何分析你的基因组;Part i -线粒体DNA(2018, 5月2日)检索自2022年5月26日//www.puressens.com/news/2018-05-genome-imitochondrial-dna.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
88股票

对编辑的反馈