人工智能有助于从空间分辨转录组学中识别组织子结构
中国科学院数学与系统科学研究院张世华教授领导的研究团队提出了一种新的计算工具STAGATE,用于破译空间分辨转录组学(STs)中的组织亚结构。
该模型利用人工智能技术将空间点的空间位置信息和基因表达谱进行整合。该算法引入了一种图注意自编码器,在中间隐层中引入了图注意机制,自适应学习相邻点间的异质相似性。研究结果发表于自然通讯.
破译组织子结构或空间域(即具有相似空间表达模式的组织区域)是STs面临的巨大挑战之一。例如,人类大脑皮层的层流组织尤其与它有关生物功能其中,位于不同皮层层的细胞在表达、形态和生理上往往存在差异。然而,大多数现有的聚类方法都不能有效利用现有的空间信息,导致组织子结构离散。此外,它们很容易受到技术噪音的影响。
据研究人员介绍,新模型将空间位置信息转换为空间点之间的空间邻居网络,然后将基因表达信息和空间网络输入到图注意自编码器中,以学习点的低维表示。
此外,结合10x Visium数据的特点,提出了基于表达信息预聚类的细胞类型感知模块,以更好地描述细胞空间域的边界。
有趣的是,新模型可以通过在相邻部分之间引入空间网络来减少不同部分之间的批处理效应,并提高三维组织子结构的性能。
STAGATE在破译组织子结构或空间域方面的优势已在不同的数据集中得到验证。值得注意的是,它可以用于分析不同空间分辨率的不同测序技术平台(包括10x Visium、Slide-seq、Stereo-seq等)的空间转录组数据。
“随着空间组学技术的快速发展和数据的不断积累,这种新的模型STAGATE可以促进大规模空间转录组数据的精确分析,促进我们对组织亚结构的理解,”机器学习和研究专家张世华说计算生物学他是这项研究的主要作者。