脑癌数据可用

乔治敦隆巴迪综合癌症中心的研究人员说,全世界的研究人员都可以免费获得一份有价值的脑癌生物医学数据。该数据集名为REMBRANDT (Molecular BRAin Neoplasia REpository),由乔治敦大学托管和支持,是全国仅有的两个此类大型数据集之一。

关于脑癌数据收集的信息,包括从14个贡献机构收集的671名成年患者的信息,详细信息见科学数据,一份开放存取的期刊(自然).乔治敦大学医学中心首席数据科学家、乔治敦隆巴迪生物医学信息创新中心(ICBI)主任Subha Madhavan博士说,目前已经有成千上万的美国和国际研究人员每天登录这个数据网站,有关该资源的消息预计会增加其使用。

乔治城的数据资源在几个方面是独一无二的。其一,它包含基因组信息,这些信息是从自愿接受肿瘤采样的患者那里收集的,此外还有诊断(包括脑部扫描)、治疗和结果数据。大多数集合要么包含其中一个,要么包含另一个。

此外,Madhavan说,数据收集界面非常易于使用。

“它位于亚马逊网络服务上,有一个简单的网络界面来访问数据和分析工具。研究人员所需要的只是一台电脑和一个互联网连接,登录到这个界面来选择、过滤、分析和可视化脑肿瘤数据集。

“我们希望这些数据能被最广泛的受众——整个生物医学研究界——广泛使用,这样想象力和发现就能得到最大限度的发挥,”该论文的第一作者、副教授、ICBI教员尤里·古谢夫博士说。“我们的共同目标是梳理隐藏在这些生物医学和临床信息中的线索,以便找到推进这些患者的诊断和临床结果的方法。”

Madhavan说:“我们刚刚开始了解这些癌症如何演变以及如何最好地治疗它们的科学,像这样的数据集可能会非常有帮助。”

伦勃朗数据集最初是在美国国家癌症研究所创建的,由纽约长老会医院的Howard Fine医学博士和美国国家癌症研究所的Jean-Claude Zenklusen博士共同领导的胶质瘤分子诊断计划资助。他们收集了2004-2006年的数据。

NCI于2015年将数据转移到乔治敦,现在它的物理位置在乔治敦癌症数据库(G-DOC)这是一个癌症数据整合和共享平台,可以与其他癌症研究一起托管。由Madhavan领导的G-DOC调查人员开发了新的分析工具来重新处理这些信息。

基因组数据包括个别肿瘤中过度表达或表达不足的特定基因,以及该基因在染色体内重复的次数。

“我们继承了一个基因的两个拷贝——一个来自母亲,一个来自父亲——但在癌细胞中,含有重要肿瘤抑制基因或致癌基因的DNA片段可以完全删除或扩增。她说:“在肿瘤中看到有11个基因副本的染色体并不罕见,每个基因副本都可能产生一种有毒的蛋白质,帮助癌症不受控制地生长。”

数据收集还包括RNA的信息,RNA是由基因(DNA)产生的,可以通过测量来评估失调的基因。

Madhavan说,研究人员可以搜索他们感兴趣的基因,检查它们的表达和扩增状态,并将其与临床结果联系起来。他们可以将他们的发现保存到G-DOC网站上的工作区,并与他们的合作者分享。考虑到人类基因组中大约有2万个蛋白质编码基因,以及脑癌肿瘤类型的多样性,“要了解这些肿瘤的基础,并有效地开发针对它们的治疗方法,将需要一个大村庄——实际上是一个巨大的都市区——的研究人员。”

REMBRANDT包括来自261个胶质母细胞瘤样本、170个星形细胞瘤样本、86个少突胶质细胞瘤组织和一些混合或未知亚类样本的基因组数据。结果数据包括超过13000个数据点。

-资料来源:乔治敦隆巴迪综合癌症中心