10月2016

通过预测分析获得洞察力
朱莉·克努森著
郑重声明
第二十八卷第十期,第16页

利用大数据的力量可以带来更好的结果,并可能减少错误。

在数据分析的世界里,医疗保健经常发现自己落后于其他行业。例如,零售商知道消费者可能在店内和网上购买什么。餐馆可以根据顾客会员卡中存储的历史来猜测顾客会点什么。

Allscripts Analytics首席医疗官、医学博士、公共卫生硕士法蒂玛·帕鲁克(Fatima Paruk)说:“然而,在医疗保健领域,我们仍然无法利用这些技术。”庞大的监管网络和隐私问题阻碍了一些分析工作。同样,医生自己也没有什么分析经验可以依靠。“医生被训练成医生,在他们面前治疗病人。他们没有接触大数据领域,”帕鲁克说。

然而,电子病历的发展正开始改变这一切,为供应商提供了一个令人垂涎的机会,让他们了解分析可以把他们带到哪里。

驾驭数据海洋
现在,数据可以用于审查和分析,卫生保健组织面临着一个全新的问题:确定哪些数据集可能有用。找到正确的数据就像大海捞针一样。Ayasdi副总裁兼医疗保健产品主管Prashanth Kini表示,这是大数据增长连续体中出现的下一个自然问题。他表示:“对于我们的许多客户来说,这也是他们开始高级分析之旅时感到不安的一个原因。”

Kini认为分析是一个学习和成长的机会,她鼓励供应商采用同样的观点。“我们认为没有必要等待得到完美的数据。相反,从你现有的开始,开始着眼于可操作的分析。”

识别将推动组织获得有用知识的数据通常始于了解要解决的难题。海耶斯管理咨询公司(Hayes Management Consulting)产品开发总监丽莎•英格利希(Lisa English)表示:“你必须首先了解自己的关键问题是什么。”“根据你试图解决的问题,你需要不同的数据来解决问题。”

例如,以索赔数据和汇款数据为例,每个数据都将提供对支付过程不同领域的洞察。英格利希说:“有了索赔数据,你就可以开始在具有相似专长的不同医疗服务提供者之间进行比较分析,试图找出哪里有异常值。”

另一方面,汇款信息虽然可能会与有关索赔的信息共享数据点,但可以提供有关拒付模式或其他付款人趋势的有用视角。

帕鲁克说,与其在这个过程中过早地缩小数据范围(这是组织经常倾向于做的事情),不如试试另一种策略。“你现在可以采用大数据方法。把所有的数据都放进去,”她说。

在云计算平台和其他服务于分析市场的技术的强大支持下,医疗保健组织可能不需要在将所有信息放入混合之前减少记录数量或信息类型。“如果你应用了所有这些工具,你就能以前所未有的方式探索你的数据,”帕鲁克说,并补充说数据实际上可以成为指南。“你可能会发现,一半的病人患有一种你不知道的慢性疾病,或者一半的病人有三种慢性疾病,如果你不去看,你就不会知道。”

每个病人都是独一无二的
当考虑到病人的独特性——他们的病史,他们的并发症,他们对治疗的反应——时,审查病人的数据变得更加复杂。在如此多变的环境中执行预测分析本身就是一个挑战。范德比尔特大学医学院的Daniel W. Byrne,硕士,生物统计学系质量改进和项目评估主任,著有发表你的医学研究论文:医学院不教的东西他的团队从该组织的医院系统中选取了10万名患者,并选择了大约400个患者变量进行分析,解决了独特特征的问题。

伯恩解释说:“我们研究了每个变量——年龄、不同的血型、性别,看看有无并发症的结果是否不同。”数据被放置在一个多变量模型中——在本例中是30天内再入院的逻辑回归模型——以确定哪些变量是不同的。伯恩说:“然后我们选取了其中的十几个,并使用逻辑回归对它们进行加权。”“这给了我们一个特定病人再次入院的可能性。”

在这种情况下,每个患者的独特性有助于确定如何部署预测分析。伯恩解释说:“我们将患者的这些差异纳入这个公式,然后将其转化为他们出现并发症的可能性。”

CloudMedx的首席执行官兼联合创始人塔什芬·苏莱曼(Tashfeen Suleman)表示,尽管患者(及其结果)可能具有内在的独特性,但分析仍然可以帮助识别一些趋势。“如果你看一下经验数据,大多数病人——他们的症状、结果和诊断——总是在一定的范围内,”他说,并补充说,异常值很少,相差很远,差异可能相当小。“当你看生命体征,你看某些血液测试和其他某些东西时,它们总是指向一个范围。用它,如果你有X,那么你就有y。”

Suleman认为,通过研究大量数据并确定相似性存在的地方,有可能首先预测差异发生的原因。

不必要的临床变异
知道毫无疑问会有一些不想要的临床变化,提供者可能会选择在预测建模过程中考虑它们。“这归结为统计分析,”帕鲁克说。

医疗保健组织可以选择对可用的EHR信息进行规范化,以确保数据相对标准。帕鲁克说:“这必须是第一件事,要知道你是在比较来自不同医院或实验室的患者群体中的相同数据。”

她说,一旦数据被标准化(有时被称为“清理”),医院可能不会发现那么多异常值。Paruk指出:“如果你能克服这个挑战,你基本上就能在整个油田看到类似的数据。”

伯恩强调,即使存在差异,预测分析也不会在真空中发生。通过在分析过程中加入人的视角和专业人员运用统计思维的能力,可以对异常值进行检查,并根据分析的目标,将其作为重要数据纳入或作为不相关数据丢弃。伯恩解释说:“一旦你知道一个人有很高的再住院风险,计算机就不能做更多的事情来解决这个问题,但是一个有经验的临床医生可以利用他们的知识和经验为这个高风险的病人找到解决方案。”他把这个过程称为“临床医生-计算机共生”,在这个环境中,计算机和人类都不一定更擅长或更聪明地做出决定。相反,他认为,当分析充分利用计算机和临床医生的优势时,就会出现最佳决策和结果。

将社会和行为数据整合到谜题中
血型和诊断之外的其他因素通常会影响患者的预后。可以在预测模型中发挥作用的数据包括社会和行为因素。

根据Suleman的说法,社会经济问题现在是预测建模中使用的许多算法的关键组成部分。他说:“有许多研究表明,如果患有抑郁症或独自生活,心脏病患者或其他慢性病患者再入院的风险很高。”他指出,缺乏家庭支持结构——可以提供药物提醒或监测护理计划遵守情况的结构——是一个可能严重影响结果的社会经济因素。“我认为将这些因素纳入算法是非常重要的。”

家庭问题、保险状况,甚至病人的邮政编码只是预测分析中经常考虑的数据点中的一小部分。然而,确定如何以及是否将这些因素包括在建模工作中可能会令人困惑。英格利希说,将这些数据纳入更广泛的图景是一个反复的过程,这应该是主题专家而不是数据科学家的责任。“你把你的结果带回给专家,也就是那些本来会看到并使用它的临床医生,然后说,‘这对你有用吗?’”她说。

然后,团队可以评估哪些因素有助于或阻碍进展。“然后你问:‘为什么这对你没用呢?’你必须不断完善你的模型,”英格利希说。这些答案可能会因分析而异,但在每个周期中,另一端的数据会更有用,趋势也会更有洞察力。

虽然行为和社会数据通常很重要,但伯恩警告说,不要简单地遵循传统思维。有很多神话,其中一些可能在推动更好的结果方面适得其反。他说:“当我们第一次开始对医院再入院进行预测建模时,专家告诉我们,再入院的原因可能是没有保险的病人。”

这一假设被证明与范德比尔特团队的发现相反。而不是看到高再入院率在低健康素养和缺乏或没有保险的人群中-被认为是经典的再入院风险因素-数据描绘了一个不同的画面。伯恩说:“在有良好保险、受过良好教育的人群中,再入院率最高。社会和行为因素确实影响了再入院,但与研究人员预期的方式不同。

机器会统治世界吗?
关于机器学习及其在预测建模领域的地位,人们众说纷纭。Suleman说,这项技术允许增加模式识别,从而更新算法。然而,他强调了有监督和无监督机器学习之间的区别。苏莱曼说:“我认为我们正处于这样一个阶段,特别是在医疗保健领域,监督式机器学习是一个很好的开始。”

他预测,无监督学习将会取得进展,有希望实现这样一个过程:机器不仅可以自己学习,还可以识别模式,并根据自学的知识触发警报。Suleman说:“这就是圣杯,机器很聪明,它们可以捕捉或突出医生由于缺乏时间或信息而无法做到的事情。”

苏莱曼说,机器可以填补空白。他认为,随着更好的技术的开发和新算法的引入,机器学习将在医疗保健领域发挥关键作用。

Byrne承认机器学习的吸引力,但仍然倾向于逻辑回归方法。“有一所学校更喜欢让计算机查看所有的数据和可能性,并学习这些数据和可能性如何驱动结果。但在大多数比较中,标准逻辑回归模型做得更好,它给你一个公式,你可以使用并放入电子病历,”他说。

一些用例需要高水平的科学严谨性,这是由随机临床试验测试和相关方法支持的。伯恩说:“建立一个预测模型并宣称胜利是很诱人的,但我们正在努力提高标准,我们真的想证明我们正在改善患者的治疗效果。”

Paruk说,即使技术不断发展,机器变得更快、更智能,最好的策略可能仍将依赖于有监督和无监督的方法。她说:“你需要一个知道如何查看数据的人,但你没有理由不能训练一台机器,让它在稍加监督的情况下,通过算法自己识别事物。”

计算机擅长以闪电般的速度筛选大量数据,而人类则擅长评估这些数据,并确定哪些是有意义的和可操作的。帕鲁克说:“我们可以教机器检查并识别在不同人群中一致的模式,然后临床医生就可以看到这些模式意味着什么。”

预防医疗事故
预测建模领域的大部分重点是改善患者的治疗效果,但其中的一部分工作也可能涉及减少医疗差错。伯恩说,分析可以帮助临床医生避免忽视病人治疗计划中的重要因素。他说:“如果我们知道哪些患者出现并发症的风险最高,就可以帮助医院的临床工作人员对这些患者每天采取的已知预防措施进行双重、三次或四次检查。”

每天预防每个病人的每一种并发症是一项广泛的策略,可能会导致最需要它的高危人群错过。伯恩说:“使用预测模型,你可以对高危患者进行必要的预防,并改善结果。”

苏莱曼认为,预测分析可以在减少误诊和错误方面发挥关键作用,特别是在医生需要额外帮助的领域。他说:“例如,当你给一个病人做病历时,分析系统可以利用经验数据自动找出医生没有注意到的问题。”

预测建模可以根据可用数据的范围建议寻找其他测试或项目。Suleman解释说:“有了机器,你可以根据经验数据看到1000名患者有这种诊断,其中90%的患者接受了这种药物治疗,结果非常好。”他补充说,医生不太可能知道这些细节。

在其基础层面上,相对较新的预测建模概念可能与更传统的临床决策支持概念完全吻合。“医生们希望能够识别出那些有风险的病人,”帕鲁克说。

分析系统可以解析大量的数据,找到成千上万的其他病人,就像医生正在看的那个病人一样,查看类似的药物组合和健康史,并标记出有关不良结果或其他风险的问题。帕鲁克说:“它说,‘嘿,还有2万名患者出现了不良后果,所以请在开处方时考虑到这一点。’”

如果预测分析可以被设计成在医生面对病人做出护理决定时向医生提供数据,帕鲁克认为这项技术有可能彻底改变医疗保健。

Julie Knudson是西雅图的一名自由撰稿人。