芝加哥大学的基因组数据共享推出了癌症数据共享的新时代
基因组数据共享平台(GDC)于6月6日在芝加哥大学(University of Chicago)公开启动,为癌症研究提供了前所未有的数据访问、分析和共享平台,为这一系列复杂疾病的发现打开了大门。
GDC与国家癌症研究所支持的研究计划中的大约4.1个卑鄙的数据一起生活,包括世界上一些最大和最全面的癌症基因组学数据集 - 例如癌症基因组地图集和治疗适用的研究,以产生有效的治疗 - 以及超过14,000个匿名患者案例。一只Petabyte等于100万千兆字节。
6月6日,美国副总统Joe Biden在美国临床肿瘤学会年会上宣布了GDC项目,并在此之前参观了芝加哥大学的GDC运营中心。
数据共享集中,标准化和协调基因组和临床数据在统一的、可互操作的平台上。癌症研究人员可以访问这些数据进行分析,并提交他们自己的数据集与研究社区共享。通过使高质量的数据广泛可得,GDC提供了急需的工具,以加速癌症生物学机制的研究和针对个别患者的个性化治疗的开发。
与安大略癌癌症研究所合作,Uchicago在弗雷德里克国家实验室的雷迪斯生物医学研究中开发并经营了NCI资金的数据共同。ob欧宝直播nba
GDC的发展于2014年在Uchicago的数据密集科学(CDIS)中开始。在过去两年中,该团队创建了一种创新的工具套件,软件和基础架构 - 基于CDIS开源项目,如BionimBus保护的数据云 - 以策划GDC持有的大量数据。
“今天,从癌症中有所发现基因数据GDC的首席研究员Robert Grossman说,他是芝加哥大学的医学教授和CDIS主任。“基因组数据共享将基因组数据集汇集在一起,并使用一套通用的方法分析数据,这样研究人员就可以更容易地做出发现,从这个意义上说,也使大型癌症基因组数据集的分析大众化。”
“大数据”被认为是理解和治疗癌症的努力至关重要。癌症和它一样复杂。它涉及许多遗传,生活方式和环境因素,现在已知有数百个疾病 - 每个疾病都具有独特的功能,驱动力和脆弱性治疗。需要大的样品尺寸来提供统计能力,以了解哪些药物组合是有效的,突破癌症的突变组合。
打破贸易壁垒
虽然nci资助的研究已经收集了大量的基因组和临床数据,但有一些障碍阻碍了研究人员充分利用这些数据。来自不同项目、临床试验和癌症类型的基因组数据被隔离在不同的地方,使用当地的管理系统,这使得数据共享变得困难。这些大型数据集可能需要几个月的时间才能下载,而且并不是所有的研究人员都能获得研究它们所需的复杂工具。此外,不同研究小组的不同收集和分析方法阻碍了合作工作。
GDC打破了这些障碍,将癌症基因组数据集和相关临床数据带到一个位置,任何研究者都可以访问。它使用一组通用的分析管道来协调数据,使信息更容易研究,在过去,这些信息通常是通过单独的管道分析的独立数据集。通过使用现代计算和网络技术提供这些数据,GDC使任何研究人员都有可能提出有关癌症的新的基本问题。
GDC是由Grossman在芝加哥大学的团队所创造并管理的。
- 作为癌症基因组数据和相关临床数据的中央统一存储库。
- 清洁、标准化和协调数据,以及提供质量控制,以便使用通用算法和管道进行分析。
- 通过使数据易于访问、查找、互操作和可重用来支持基础研究和临床试验。
- 免费为研究人员提供强大的数据传输、搜索、应用程序编程接口(API)和分析工具。
未来的基础
作为下一代癌症知识体系的第一步,GDC能够并加速努力识别高频率和低频率癌症驱动突变,帮助揭示对治疗反应的遗传决定因素,并告知临床试验队列的组成。
GDC将帮助研究人员获得高质量的数据,提供共享和研究这些数据所需的工具,并支持他们提交自己的数据。它将保存来自新时代项目的数据,这些项目将对NCI临床试验登记的患者进行DNA测序。这些数据集将使我们更深入地了解哪种疗法对不同的癌症最有效。GDC将支持针对单个患者的临床试验,即所谓的“n of 1”临床试验它将成为精准医疗如何用于治疗个别患者的一个重要组成部分。
GDC还为未来基于云的技术奠定了基础,这些技术可以让研究人员分析大规模数据集并远程进行实验,比如通过NCI的癌症云试点项目。此外,CDIS正在开发的开源软件有可能成为其他疾病(如阿尔茨海默氏症和糖尿病)的数据密集型研究工作的一个模型,这将极大地受益于类似的大规模、数据驱动的开发治疗方法。
“我们今天在十字路口,我们是否将拥有强大的癌症相关的癌症相关数据,以便为新发现和改进提供癌症关心的,”格罗斯曼说。“随着时间的推移,我希望GDC能够在提供所需规模的数据方面发挥越来越重要的作用,从而实现精准医疗的承诺。”
进一步探索
用户评论