聚类有助于解锁人类大脑的秘密
环境科学和神经科学在研究上似乎截然不同,但两者都需要分析和解释捕捉复杂时空过程的庞大数据集。
在统计上,寻找这种数据集中的模式和关系非常相似,无论是整个大脑中全球的温度还是电气活动的测量。这种共同的目的已经汇集了英孙和埃尔纽托·赫伯德在大数据统计中领先的研究人员。
这一切都始于天气
在环境监测数据中,每个气象学参数 - 温度,风速或降水 - 以及每个测量站代表整合的adimence数据集。结果是一个非常大的数据集,其复杂性无视传统的分析方法。
“我们专注于开发新的统计方法,用于分析通常遇到的复杂高维数据环境科学,”太阳说。
Sun和她的团队提出了一套新的统计方法来处理这些数据,包括用于处理非常大的数据集的高度灵活性和计算有效的方法。
进入大脑
受到神经影像动物问题的启发,Imboo的集团一直在开发类似的统计工具,以更好地了解时空信号之间的关系和依赖性。技术,如功能磁共振成像(FMRI)和脑电图(EEG),其在时间和高维度的时间和空间中捕获大脑活动的不同方面在许多方面都是类似于Sun的团队工作的环境数据的类型;因此,许多相同的统计方法适用。
“我们的重点是了解大脑连接的作用及其与精神和神经疾病的联系,”Ombao说。“当看大脑的活动,不同的区域被激活为人处理信息,并且一些区域以有组织或同步的方式响应。我们最近的工作的目标是开发一个新的统计聚类方法这识别具有同步行为的大脑区域,并发现脑信号之间的共同特征和组模式,可以帮助我们理解大脑功能连通性。“
把它一起
Ombao认为,当将聚类方法应用于脑信号数据时,最大的挑战是如何定义时间序列的特征,然后如何量化它们的相似性。该团队的研究考虑了两种不同的相似性度量来识别簇——光谱同步性和簇的相干性。这导致了脑电图数据的层次聚类算法的发展。
“研究大脑功能连接的一种方法是在不同的区域寻找相似的激活模式,”Ombao说。“现代脑电图技术允许我们在数百个通道中记录每一毫秒的数据,这意味着即使是几分钟的记录也可以产生一个非常大的数据集。为了更有效地分析这些数据集,我们开发了两种聚类算法,它们计算速度快,并提供了准确和可解释的脑区连接摘要。”
EEG信号通常通过分析它们的频率组成来研究,类似于挑选出不同乐器的谐波他们独特的声音。频率组成的高度相似意味着两个信号在功能上连接。
与墨西哥数学调查中心合作,Carolina Euan的博士后研究员从墨西哥的数学调查中心合作,开发了分层谱合并聚类方法,以快速识别与离散频带的类似信号组。然而,这些簇不一定依赖于功能性连接意义。为了优化分析,Euan,Imboao和Sun在分层集群相干方法中共同努力,以识别在特定频带内高度依赖的那些集群。
“通过将我们的方法应用于EEG数据,我们可以挑选脑区域,这些区域是相互依存的,并识别它们在功能上同步的底层频段,”Euan说。
接下来是什么?
“到目前为止,我们一次只考虑了一个主题,”Immao说。“接下来,我们计划在不同测试对象之间模拟聚类变异性,并了解在一系列刺激上的聚类演变。这种方法也可用于比较健康受试者和患者的脑网络聚类。脑疾病。”
进一步探索
Carolina Euan等。基于连贯的时间序列聚类,用于大脑连接可视化。arxiv:1711.07007 [stat.ap]。Arxiv.org/abs/1711.07007
用户评论