2010年4月26日

从DNA到仪表板——数据挖掘在突破的边缘
作者:格雷格·哥特
郑重声明
第二十二卷第八页

数据挖掘最有趣的应用之一是范德比尔特大学医学中心的一个项目,该项目结合了电子病历技术和DNA数据库。

医学博士迈克·芬利(Mike Finley)看到了医疗数据可访问性的精神和文字的未来,它预示着临床医生在他们的护理中必须考虑信息的方式的明显转变。芬利说,随着新一代精通技术的患者进入需要更多医疗保健服务的人群,他们也要求拥有更多使用自己健康记录的权利,医疗行业必须适应。

德克萨斯州特克萨卡纳市CHRISTUS St. Michael健康系统的医务人员事务副总裁芬利说:“美国将会远离那些不愿熬夜陪伴病人的医生。”“我们曾经是知识的拥有者和守护者,现在我们是知识的组织者。”

随着越来越多的数据以数字方式输入到集体记录中,数据挖掘这个术语变得越来越流行,因为提供者试图组织来自多个来源的所有信息,以更好地诊断和治疗患者。但是,正如芬利所说,提供者不再是知识无可争议的“所有者”;新一代患者可以从广泛不同的来源获得一系列信息。对于临床医生来说,更大的问题可能是确定哪些类型的数据挖掘与临床相关,然后如何评估或建立平台,以便在整个连续护理过程中与各种用户共享。

例如,将电子病历系统与未识别的DNA库连接起来,以提供有关基因突变等因素的新信息,这可能会预测针对特定患者群体的有效治疗和结果。但也可以考虑其他应用。例如,一个通过竞争保险计划扫描支付决策的计费平台,并迅速告诉业务经理,编码错误导致所有付款人错误地向患者收取余额账单,这可能不会被严格地视为临床数据挖掘,也不会与患者护理本身有任何关系。然而,患有慢性和昂贵疾病的患者可能不同意。

在床边
CHRISTUS Health是Humedica于2009年9月推出的一个新的临床数据挖掘平台的开发合作伙伴。该平台包括一个核心“数据工厂”,用于收集来自不同应用程序的信息并创建标准本体。随后,一个名为Minedshare的回顾性比较临床分析工具和一个名为MinedStream的实时预测工具可以检索和呈现整合的数据,帮助供应商找到高成本和高风险的患者。所有的应用程序都是由Humedica以软件即服务的模式托管的,根据一个组织内的离职量和/或全职员工的数量来定价,并通过浏览器访问。

医学博士、公共卫生博士、Humedica的副总裁兼供应商市场总经理a . G. Breitenstein说,这些工具背后的核心思想是,让护理人员能够利用基于人口的纵向数据来预测“这位病人将多待三天,花费是他的三倍,结果不好的可能性是他的四倍,所以这里有17件事我们希望在出院前确保完成。”让我们实时跟踪这些事情,这样我们就可以减少任何不良事件发生的机会。”

到目前为止,Finley对Humedica平台很满意;他说,随着病床上护理人员数量的增加,这些工具可能会变得越来越重要。

他说:“我们可以提高效率和准确性,因此我们可以更好地覆盖所有这些核心措施的患者。”“很多医疗保健工作正在从床边的一位医生手中转移。我们有医院医生、执业护士、医师助理——很多人。你的工具越好,在病床旁给你提供好的信息,你就越好。有了Humedica,我看到了一些东西,可以让我们更有效率,为患者提供更安全的环境。”

然而,Finley也警告说,数据驱动医疗保健的泛滥将使决定部署哪些应用程序和平台成为一个极其困难的问题。随着用于电子病历的联邦刺激资金开始流入医疗系统,这一选择将变得更加困难。

“我们有一场完美风暴,”芬利说。“数据库公司正在挖掘数据,向我们展示报告、饼状图和简洁的东西。在过去的六个月里,我办公室里有六个这样的人想卖东西给我。你可能会被它淹没。”

预测药物反应可能是第一步
无论挖掘个人和人口统计数据以帮助临床医生提供更安全、更有效的护理的前景多么光明,目前的现实是,电子记录的总体采用率很低,尤其是在初级保健机构。许多电子病历的实施彼此孤立,即使在同一机构内也是如此,而且支付激励机制仍然没有协调一致,以充分利用数字临床智能。

布莱滕斯坦说:“支付系统是这个国家激励机制的最终驱动因素,它奖励他们一次又一次地重复测试。”“我们没有负责任的医疗机构,所以医疗机构没有动力去协调护理。在许多情况下,协调护理是一种金钱上的阻碍。”

芬利认为,联邦政府的刺激资金可能会在10到15年内推动数据挖掘的广泛应用,但布莱滕斯坦表示,技术本身的存在可能并不意味着要安装能够改善和更有效地协调交付的系统。

布莱滕斯坦说:“在短期内,刺激资金是一个很好的激励因素,可以让人们在技术上疯狂消费,但要让所有这些技术一起工作来降低成本,除非医疗支付系统能够真正关注结果,而不仅仅是一个收费的自动取款机,提供更多的测试和程序。”

因此,现有的大规模临床数据挖掘的先锋可能存在于已经将电子病历功能与DNA数据库连接起来的集成提供商组织中。这些组织经常得到美国国立卫生研究院(NIH)的资助,他们认为药物遗传学可能是临床数据挖掘的第一受益者。例如,2009年,美国国立卫生研究院向Kaiser Permanente和加州大学旧金山分校的研究人员提供了2480万美元,用于对Kaiser Permanente 10万名会员的DNA样本进行全基因组分析。这项分析将与这些参与者几十年的历史临床和其他健康相关信息联系起来,这些信息是从健康调查和凯撒医疗健康档案中挑选出来的。在宣布该奖项时,凯泽指出,该项目产生的遗传信息将包括有关药物代谢和药物反应的新数据,这些信息可能有助于研究人员发现遗传因素,解释为什么人们对药物的反应不同。

先进的药物基因组学也可能是范德比尔特大学医学中心(Vanderbilt University Medical Center)的BioVU DNA数据库(目前拥有78000个独立样本)和范德比尔特大学的电子病历(EHR)(包含190万名患者的数据)结合技术的第一个回报。

范德比尔特大学生物医学信息学主席Dan Masys医学博士说,临床医生可以在那些“服用特定药物效果很好或很差”的人的未识别临床数据中寻找故事,然后获得相应的DNA样本。

“然后我们可以进行全基因组扫描,看看我们是否可以预测哪些人会受到好的影响,哪些会受到坏的影响。因此,我们预计我们将在基因组中有少量的点,如果改变,将标志着一个好或坏结果的可能性,”Masys说。“我们希望,在我们个性化医疗的愿景中,让每个人都有这样的面板,这样医生甚至在看到病人之前就已经记录下来了。这样一来,决策支持规则就可以说,‘这个人有这种DNA变异需要考虑。’”

Masys估计该大学花费了200万美元建造BioVU。

他说:“在运营的头两年,我们已经从基因组学和药物基因组学领域的研究资助中收回了很多倍的资金。”他补充说,资金包括直接和间接资助,赞助商为研究支付费用。“但我们更感兴趣的是科学的力量,而不是金钱上的取舍。”

通过健康来做善事
具有社会意识的投资银行家们开始喜欢用“做得好做得好”来形容他们的投资风格。新一代精通科技的患者也愿意效仿,将他们的数据提供给研究人员和临床医生,希望这样的数据库也能帮助研究他们的病情。例如,Masys说,范德比尔特的电子病历系统和DNA银行的结合将深刻地改变医学试验的进行方式。患者可以选择不向银行提供他们的DNA数据,但必须主动选择退出。(Masys表示,只有约5%的人选择这样做。)

他表示:“这不仅使我们能够建立一个大型研究数据库,还使我们能够以一种公正的方式进行研究。”“走进范德比尔特大学大门的任何健康状况都可能有可用的数据和组织,因此历史上没有参与研究的群体将被代表。传统上,报名参加试验的人通常受过更好的教育,并且更多地参与到医疗保健环境中。从某种意义上说,这几乎是一种对科学的偏见,因为它使结果偏向或偏向特定的人口群体。这使我们能够研究几乎所有的健康状况,无论哪个人群可能患有这种疾病,而且增量成本相对较低。与填充数据库的传统队列方法相比,将样本添加到生物库中是微不足道的。”

Masys指出,前列腺癌治疗是这种技术组合的潜在受益者。

“我们是少数几个能够提出这个问题的机构之一,基因组学能否预测一个特定的故事?”他说。“我们是否可以进入已确定的电子病历数据,找到每个患有早期前列腺癌的人及其治疗方法,然后跟踪查看该组发生了什么,并查看DNA,看看我们是否可以预测结果的差异?”我们已经处于一个可以开始建立这些关联的地方,当有像前列腺癌这样的常见疾病时,任何拥有丰富电子病历和生物库的机构都可以进行这些关联。”

Masys说,实现这种系统工程方法有两个先决条件。一是能够从数据库中获取数据,寻找具有预测性的模式;另一个是拥有必要的计算机决策支持,将收集到的指导信息发回给临床医生。

他指出:“全国只有不到10%的医疗机构安装了这种基础设施。”“其他人都有专业的证书模式——你的医生,根据他们读过的、记住的和他们得到的数据,每次都能做正确的事情,你只知道人类不是这样设计的。”我们需要某种帮助来解释数据的复杂性和数量。”

但病人必须多耐心?
Finley、Masys和Breitenstein都预测,新一代精通技术的患者,具有共生思维,也将开始要求获得各种决策支持工具。
Masys说,在短期内,通过患者门户网站向患者提供数据驱动信息的大型组织可能会比那些不这样做的组织有优势,但联邦政府推动采用电子病历将缩小这一差距,特别是当供应商达到刺激资金的有意义使用门槛时。他说,美国国立卫生研究院资助的研究已经在范德比尔特大学和五个研究伙伴运营的新兴网络中显示出了希望。

他说:“这五家机构发现,尽管它们的电子病历设计大相径庭,但它们能够重复使用彼此的表型定义,而很少进行调整。”“只要能够从结构化和非结构化来源进行数据挖掘,重点就不是真正严格地放在数据模型上。因此,这是互操作性的一个非常有希望的预兆。”

最终,临床数据挖掘的圣杯可能不会涉及将所有内容放在一个单一的表示层上,为提供者和患者提供服务,而是部署类似于足球剧本和比赛电影的技术,其中医生充当教练,患者充当完全参与的运动员。患者自己的纵向数据和类似患者的基于人群的数据可以作为预测的可能性,而像Humedica这样的实时仪表板将作为游戏计划正在执行的保障。

布莱滕斯坦说:“如果我们能制作出一份消费者友好型的、与风险相关的数据摘要,并能根据你的记录进行预测,那就比简单地收集你的数据来来回回有用得多。”“在患者层面上帮助人们进行预测分析将是一个真正的突破,因为这样一来,患者就可以成为他们自己或他们所爱的人的真正监督者。”

她说,这样的产品不是科幻小说。

“我们的MinedStream产品是关于患者层面的,并对提供者说,‘你有17名患者走在门口,他们面临着不良结果的风险。这是你应该做的15件事,而你在其中的5件事上偏离了轨道。”

“我设想,在不久的将来,我们会推出消费者版本的游戏。病人最好的支持者是病人的家人,”布莱滕斯坦补充道。“它们是防止有人进来时不洗手或挂七袋液体而不监控输出的最佳保险措施。”

- Greg Goth是来自康涅狄格州奥克维尔的自由撰稿人,专注于技术和医疗政策问题。