3月2017

个性化癌症治疗的发展
苏珊·查普曼
郑重声明
第二十九卷第三页

癌症治疗的进步寻求适应患者独特的身体化学和基因,HIT正在发挥重要作用。

在过去的几十年里,癌症治疗中的个性化治疗一直在逐步发展,早期的方法比今天的方法粗糙得多。一个恰当的例子是分期,这是一种反映癌症进展的解剖形式,随着时间的推移,分期变得越来越复杂。确定病人的癌症阶段现在更加细分,在每个阶段,医生考虑个性化的因素,如分子和基因测试。

在过去,放射肿瘤学家仅仅依靠x光作为他们的指导,并相应地标记皮肤。因为人体解剖学是动态的——器官可以移动,因此肿瘤也可以移动——这种方法并不精确。今天的医生能够更好地理解和集中注意力,并指导治疗疾病存在的地方,确保这些区域被根除,同时尽可能避免正常组织。

许多用于放射治疗的直线加速器都配备了CT扫描仪,使医生能够在治疗开始前确定肿瘤的位置。然而,使用这些基本的扫描仪,医生只能看到这么多。一种更加个性化的治疗方法是核磁共振成像,它利用强磁场对患病和正常组织进行成像。结合线性加速器发出的辐射,可以实时看到二维、三维或四维图像,从而提高了治疗精度。

Elekta AB公司医疗事务高级副总裁Joel Goldwein博士解释说:“磁共振技术可以让你看到软组织,这是目前最好的技术。”“这项最新技术超越了解剖成像。模式的转变是,有了磁共振,你可以做定量成像。你可以确定活跃的肿瘤细胞在集群中的位置。你可以确定活跃的肿瘤群在哪里,然后关注它们或者不活跃的肿瘤群在哪里,然后少关注那些。我很肯定,25年后,我们会有更好的东西,让我们几乎在细胞水平上看到和治疗。”

如果医生每天都要看特定的病人,这种技术使他们能够在每天的基础上调整治疗,为他们提供基于治疗过程中的反应以及病人的实际解剖结构的个性化护理的机会。因此,放射治疗是分段进行的,允许医生调整治疗,而不是解剖变化,而是关注患者的功能和生物学变化。

“总的来说,解剖和定量成像将导致范式的转变,这将推动新工具的发展,为那些正在接受治疗的人提供个性化的护理,”戈德温说。“我预计在我的职业生涯中,也许再过10年,我们将看到重大进展。”

收集和利用数据
放射治疗是数据密集型领域的一个例子。每次治疗都会产生大量的信息,这些信息被保留下来以调整未来的护理计划。研究人员还通过其他途径收集数据,包括电子病历和癌症登记,所有这些都可能带来挑战。“每天都有大量的数据被收集,”戈德温说。“在这些数据中,有时很难分离出宝石。我们需要一些与长期结果相关的数据。然而,这些长期结果更难收集。然后,还有收集、储存和分析这些数据的问题,这将需要学者们并不总是准备好的投资。此外,由于我们通常是在很长一段时间内进行研究,因此对该分析感兴趣的人可能在几十年后就不再可以这样做了。”

另一个挑战是数据质量,这在各个医疗保健环境中各不相同。橡树岭国家实验室(Oak Ridge National Laboratory)健康数据科学研究所(Health Data Sciences Institute)所长乔治亚•图拉西(Georgia Tourassi)表示:“这是关于四个v:数量(volume)、准确性(veracity)、多样性(variety)和速度(velocity)。”“医疗保健数据在不断变化和发展。与基因组测序数据相比,处理流数据正在成为实时临床决策的主要挑战,后者提出了不同的大数据分析挑战。这些概念在社区中得到了很好的确立。我们正在寻找能够整合和理解异构大数据的大数据平台。作为一个社区,我们习惯于查看一种类型的数据,但为了将整体视图整合到个性化护理中,我们需要同时处理所有数据。”

Tourassi表示,随着许多用于患者监测、诊断和治疗的新数字技术的出现,生物医学和医疗保健领域正在发生颠覆性的变化。“这场数据驱动的革命始于上世纪90年代末,”她说。“它开始了我们从基于人群的疾病理解和循证医学向个性化、数据驱动的精准医学的转变。现在的情况是,从理论上讲,我们可以收集大量关于病人的信息——比如基因组、表型和环境特征。所谓环境概况,不仅指环境暴露,还包括个人的生活方式、行为、社会支持网络以及医疗环境。然而,并非所有的数据都是有用的,也不能转化为可操作的见解。数据分析扮演着一个重要而困难的角色。我们如何收集信息,然后以一种有意义的方式进行分析,这是目前的一个大问题。”

Tourassi认为,研究人员必须确定哪些数据是有用的,哪些应该保留,哪些必须丢弃。“这些都是开放式的问题,但非常重要,”她说。“我们需要尽早考虑这一挑战。哪些数学和统计方面的进步可以有效地指导我们,哪些数据源有用,哪些没用。”

存储数据的基础设施类型是一个值得关注的问题——也就是说,它是否能够支持异构信息的仔细集成。“我们正在寻找协调数据的方法,以便以最有效的方式进行分析,”Tourassi说。“不同的任务需要不同类型的分析。在数据中寻找模式(描述性分析)不同于为未来预测(预测性分析)开发数据的统计模型,也不同于为不同可能的行动制定处方(规定性分析)。一些计算基础设施更适合于一种类型的数据分析,而不是另一种。我们知道哪些环境更适合描述性、预测性和规定性分析。我们现在正在寻找计算基础设施,以支持所有这些分析功能与大型异构数据并行。”

“最大的障碍是收集和分析这些数据的成本,”戈德温解释说。“理解什么是重要的,什么是不重要的是个大问题。就人员而言,收集这些数据是有成本的。”

除此之外,Goldwein还指出,随着时间的推移,分析所需的机器可能会过时。例如,数据可能存储在特定类型的计算机驱动器上,或者以不再存在的格式存储。

金州的癌症治疗
加州癌症登记处(CCR)正在推动实时收集癌症数据。去年,它成为第一个进行此类尝试的州。“实现‘个性化’癌症治疗的承诺需要各种癌症治疗的有效性的综合信息,不仅针对特定类型的癌症,如黑色素瘤,而且还针对患者癌症的特定遗传,”加州公共卫生部(CDPH)主任和州公共卫生官员Karen Smith医学博士说。“一个主要障碍是以结构化格式实时收集数据。CCR的最新数据大约是18到24个月前的。临床试验需要更多及时的信息,以实现更个性化和更好的癌症治疗。CDPH正在与病理学家、医院、医生和其他报告来源等合作伙伴合作,通过实施最近通过的立法和利用美国病理学家学会开发的一系列结构化模板,实现实时、结构化癌症病例数据收集的目标。”

这些举措表明了科技在抗击癌症中的作用。CDPH的一位发言人说:“癌症登记处正在扩大,记录了更多关于癌症诊断发病率的信息,甚至是用于跟踪治疗结果的遗传信息。”“研究人员可以将这些额外的信息与生命统计数据联系起来,随着治疗和暴露的变化,跟踪癌症患者预后的变化。通过分析几十年来癌症死亡的大量信息和不同的地理位置,研究人员可以确定可能表明暴露增加或减少癌症风险的模式,为测试提供假设。”

项目的蜡烛
美国能源部与美国国家癌症研究所(NCI)合作,努力促进对大量癌症数据的分析。这项合作的组成部分是一个为期三年的试点项目,即“癌症高级计算解决方案联合设计”,该项目利用超级计算机建立计算模型,从分子、患者和人群三个层面解决癌症问题。这一合作的目标是向更加个性化的癌症治疗迈进。

合作的关键是一个被称为癌症分布式学习环境(CANDLE)的计算框架,它可以使用机器学习或人工智能算法来检测大型数据集中的模式。人们希望这些模式能够为如何改善治疗和/或促进新的实验提供见解。

“CANDLE的独特之处在于它在多个层面上解决了计算癌症研究的挑战,”Tourassi说。一名飞行员在分子水平上探索癌症。该试点项目的目标是开发ras驱动的癌症启动和生长的预测性分子尺度模型,为加速最具侵袭性癌症的诊断和靶向治疗设计提供所需的见解。”

Tourassi继续说道:“第二个试点的目标是通过使用先进的计算来快速开发、测试和验证精确肿瘤学的预测临床前模型,从而确定有希望的新治疗方案。”

作为第三个试点项目的基础,癌症监测收集了人群的信息,以帮助临床医生了解临床试验结果在现实世界中的转化效果。由Tourassi领导的NCI监测、流行病学和最终结果(SEER)项目提供有关癌症统计信息,以努力减少美国各地的疾病发病率。自1973年以来,SEER项目一直是支持癌症诊断、治疗和预后研究的国家资源。

这种以人群为基础的努力体现了使用高性能计算和大数据分析从根本上改变癌症监测的方法。Tourassi说:“我们的首要目标是提供先进的计算解决方案,能够全面监测和更深入地了解人口癌症结果的关键驱动因素。”

SEER试点项目有四个注册中心:路易斯安那州、肯塔基州、乔治亚州和大西雅图地区。图拉西说:“还有更多的项目正在筹备中。”“癌症登记处收集的大部分信息来自非结构化的临床文本。CANDLE项目的重点是临床报告,这样我们就可以自动分析它们,提取可以支持癌症监测项目的数据元素。

她继续说道:“在人群层面上了解癌症是将所有事情结合在一起的努力。”“这就是我们试图理解肿瘤学研究在现实医学中所扮演的角色的地方。我们收集的信息可以帮助我们更好地了解临床试验之外癌症治疗的有效性。这一点尤其重要,因为95%的癌症患者不参加临床试验。此外,这些人代表了一个高度偏倚的患者样本,由更年轻、更健康的志愿者组成。虽然临床试验代表了一种新疗法在最佳情况下的疗效,但基于人群的监测通过告知现实世界中的效果来补充这些信息。”

随着癌症诊断和治疗复杂性的增长,SEER项目在获取基本患者信息方面面临越来越多的挑战。Tourassi说:“我们的团队被要求开发先进的机器学习算法,比如深度学习,以高可靠性自动提取重要的患者信息。”“癌症监测项目目前还没有收集到疾病进展的全面信息,比如复发和转移。因为专家癌症登记员收集病人的信息,手工提取临床报告,这个过程是费力和耗时的。随着越来越多的人患癌症的时间越来越长,癌症监测项目必须对人们进行更长时间的监测。手动模型是不可扩展的。”

根据NCI的说法,CANDLE的目标是提供新的计算能力,以支持三个试点项目,同时提供可扩展的机器学习工具(深度学习、模拟和分析)的洞察力,以减少解决方案的时间,并为探索开辟新的途径。在三个试点项目中已经开展的工作旨在确定新的治疗方法,扩大对癌症生物学的了解,并了解新的诊断方法、治疗方法和患者因素对癌症结果的影响。

“CANDLE将开发一个百亿亿次的深度学习环境来支持癌症研究,”Tourassi说。“我们将推动计算的前沿,以提高我们对癌症生物学的理解,并最终改善个性化的癌症治疗。”

-苏珊·查普曼是洛杉矶的自由撰稿人。