基因组数据共享提供前所未有的癌症数据资源
美国国家癌症研究所的基因组数据共享(环球数码创意),2016年由时任美国副总统的拜登和芝加哥大学主办,已成为其中一个最大的和最广泛使用的资源在癌症基因组学、有超过3.3 pb的数据来自65多个项目和超过84000个匿名病人的情况下,每月服务5万多名独立用户。
在2月22日发表的新论文中自然通讯和自然遗传学基于Uchicago的研究团队分享了有关GDC的新细节,该细节由国家癌症研究所(NCI)提供资助,通过与弗雷德里克国家实验室进行癌症研究,目前由Leidos Biomedical Research,Inc。其中一篇论文ob欧宝直播nba描述GDC的设计和操作。另一个描述了GDC用于协调提交给GDC的数据以及GDC研究界使用的数据集的产生的管道。
GDC的目标是提供癌症研究具有均匀加工基因组和相关的数据储存库的社区临床数据这使得数据共享综合医学支持的协作分析。
2015年6月,GDC开始使用私有云进行数据生产。仅仅一年之后,GDC就分析了5万多个原始测序数据输入。GDC包括基因组、转录组、表观基因组、蛋白质组、临床和成像数据。在《自然》杂志上发表的论文中描述的处理管道已经产生了超过1660 TB的关于二十多种原发性癌症的数据。这些数据存储在GDC数据门户中,可供查看和下载。
除了数据门户,GDC还提供了额外的用户资源,包括GDC数据分析、可视化和探索(DAVE)工具,用于通过基因组变体或特定修改进行数据交互探索;用于提交数据的GDC数据提交门户;下载大型基因组数据集的GDC数据传输工具(DTT);以及GDC数据协调系统,该系统允许用户运行通过协调处理管道提交给GDC的数据。
“这些数据有巨大的作用,”罗伯克·格洛斯曼,博士博士·格洛斯曼,博士博士,乌奇卡戈的翻译数据科学中心主任。“随着数据累积,新信号将变得更容易识别为理解的重要目标癌症生物学。此外,数据共享基础设施可以为研究研究提供信息,为个人之间的遗传变异以及其可能影响癌症患者结果的遗传变异提供新的洞察力。“
Allison P. Heath等人。NCI基因组数据共享平台,自然遗传学(2021)。DOI: 10.1038 / s41588 - 021 - 00791 - 5
用户评论