10月2018

隐藏的宝藏:非结构化文档的价值
Selena Chavis著
郑重声明
第30卷第9页

自然语言处理可以帮助医疗机构定位看不见的离散数据。

存在于非结构化电子病历文档中的丰富信息及其对医疗服务产生积极影响的潜力并未在医疗保健行业中丢失。多年来,通过自然语言处理(NLP)来发现免费文本中的宝藏(目前包含80%的临床文档)的机会已经成为许多行业讨论的素材。

NLP将非结构化文档转化为可以分析和采取行动的可共享数据。最近的一份Chilmark Research报告《自然语言处理:释放数字医疗时代的潜力》调查了该行业与自然语言处理相关的现状,并提出了推进这些技术实施的建议。该报告的结论是,目前的驱动程序正在将NLP应用从传统的文档和索赔提交用例扩展到涵盖文本和语音的更广泛的应用范围,以支持人口健康和精准医疗。

“我过去对NLP的个人经验是,它不是万灵药。有很多事情它做得很好,而且已经有20年了。这些东西需要很长时间才能发展到可以在临床环境中使用的水平,”Chilmark Research的副分析师、该报告的作者之一布莱恩·爱德华兹(Brian Edwards)说。他指出了NLP的主要趋势,比如将语音和文本与人工智能(AI)结合使用,并补充说:“不同类型的NLP语音识别和临床文件改进(CDI)的融合可以为医生节省每天许多小时的工作,这对(HIM)专业人士来说真的很重要。”这可能会改变游戏规则。

Linguamatics的医疗保健高级主管西蒙·博拉(Simon Beaulah)指出,NLP传统上支持以报销为中心的计划,或与大型学术医疗中心的临床研究相关的计划。他解释说:“计算机辅助编码(CAC)和CDI方面的成熟产品已经确立了NLP作为一种可行的人工智能技术,并将其应用范围扩大到其他领域。”“例如,追求基于价值的护理目标的组织正在使用NLP和人口管理分析来实现每个患者的360度视图。”

根据Beaulah的说法,利用NLP的机会通常分为两大阵营:直接影响患者护理的和非临床领域的,如质量测量、质量改进和事先授权。他指出:“在这两种情况下,NLP都提供了智能增强功能,在保持决策过程中人为因素的同时,显著提高了生产力。”

展望未来,Health Catalyst产品开发高级总监迈克•道(Mike Dow)表示,随着医疗保健数据变得越来越非结构化,NLP的重要性将继续增长。“在今天的医疗保健中,关于病人的很多信息都不在电子病历中。当我们寻找其他数据来源,如索赔、移动设备或患者报告的非结构化数据时,能够了解患者的整体情况将越来越依赖于NLP的使用,”他说。

不断发展的用例
Chilmark的报告描述了十几个重要的NLP医疗用例,包括CAC、语音识别和数据挖掘。作者指出,其中五种解决方案“已经证明了投资回报率(ROI),并且可以从众多成熟的供应商那里获得商业供应”,而“另外四种解决方案正在经历采用周期的初始阶段,并准备在新的基于价值的护理范式下产生直接影响。”

报告中展示的NLP平台clininthink在报告的主流类别自动注册报告、临床试验招募的新兴领域和下一代计算表型和生物标志物发现的类别中找到了自己的定位。NLP对临床试验招募的潜在影响在西奈山伊坎医学院进行的一项研究中得到了证明,该公司的NLP引擎在四分之一的时间内生成了10倍以上的患者匹配。

在表现型方面,clininthink与圣地亚哥雷迪儿童医院合作,以最快的速度筛查新生儿罕见疾病,在19.5小时内完成了完整的基因组和表现型分析,获得了吉尼斯世界纪录。

“我们已经查看了超过30亿个单词、同义词或相关配对的信息,以建立一个表型库,”Clinithink生命科学高级副总裁萨拉·比比(Sarah Beeby)说。“我们能够在24小时内处理整个人群,而人工搜索可能需要临床医生三周的时间。从节省时间的角度来看……对罕见疾病的了解要快得多。”

Health Fidelity的MedLEE NLP引擎集成了一个全面的医疗保健特定本体和规则引擎,以解决风险调整和分层条件类别的新用途。该报告详细说明了2016年UPMC健康计划将该解决方案归功于6200万美元的年收入增长。该引擎也在同行评议期刊上得到了研究人员的验证。

Linguamatics是NLP领域的一个重要而成熟的参与者,它正在下一代用例中取得进展,这些用例涉及生命科学、人口健康管理和精准医疗的文本挖掘。该报告称,包括20家最大制药公司中的18家以及支付方和供应商在内的客户报告称,在进行队列发现方面节省了高达85%的时间。

Beaulah指出,拥有成熟的电子病历部署和以价值为基础的护理重点的资源短缺的HIT和分析团队越来越多地寻求NLP来提高效率。他说:“使NLP能够与其他技术集成是关键,例如与EHR、Hadoop等大数据功能以及分析工具无缝协作。”

Health Catalyst在2017年宣布与Regenstrief Institute合作,提供nDepth NLP引擎,该引擎具有数据操作系统,可在单一平台和数据流中实现实时分析和工作流应用程序开发。nDepth可以应用于大多数基于文本的用例。该组合功能有望为许多当前和下一代用例提供支持,例如从非结构化文本中提取离散的定量值,并将这些数据输入预测分析模型。

“随着近年来整合NLP的障碍降低,我们看到更多的NLP嵌入到其他产品领域,”陶氏说,并指出最近将NLP嵌入到Health Catalyst的患者安全监测产品中,以通过主要离散的数据点跟踪患者跌倒等不良事件。“这不是一款依赖于自然语言处理的产品,但它可以从嵌入自然语言处理中获益。”

Beeby认为,NLP的采用速度正在迅速提高,并表示该行业将继续在各种计划中扩大使用。她说:“它似乎已经从‘我必须明白我为什么需要它’转变为战略计划和重要项目的一部分。”“在6个月里,知识库的速度和对数据来源的认识(显著提高了)。每个人似乎都知道那里有什么数据,以及我们都需要有一种机制来与他们合作并分享见解。”

爱德华兹认为,即将出现的最令人兴奋的发展之一是使用环境抄写员来改善电子病历体验。这些NLP应用程序的操作类似于亚马逊的Alexa或谷歌的Assistant,使医生能够在患者就诊期间使用智能扬声器捕捉对话,并自动将其解析为结构化的电子病历格式。“我认为医生会为这项技术掏腰包。忘掉IT部门吧,”爱德华兹说。“这还有很长的路要走——也许需要五年。但(这个行业)肯定正朝着这个方向发展。”

成功实施的障碍
Health Fidelity的创始人兼首席开发官阿南德•什罗夫(Anand Shroff)表示,要成功实施NLP,组织必须解决三个关键挑战。首先是数据的可用性和通过NLP处理数据的基础设施。他指出:“组织从多个数据源和许多不同的电子病历系统获取数据。”“如今,能够组织这些数据,然后通过NLP处理它们并不是一件容易的事。”

Dow对此表示赞同,并指出NLP数据管道的创建——消费文本数据的过程,将其引入NLP解决方案,并提供结果——对许多医疗机构来说是一项复杂的工作。他说:“这个数据管道与我们在医疗保健领域使用的其他数据管道有很大不同。”他补充说,这个数据集比大多数必须从电子健康档案系统中拼凑起来的数据集都要大。“这是一个技术问题;这是可以解决的。这并非不可能。”

另一个挑战集中在围绕优先级用例和预期结果的组织一致性上。Shroff指出:“除非在哪些用例能为组织带来最大价值的问题上达成一致,否则很难找到在企业中使用NLP的长期资金。”他指出,最常见的举措集中在护理质量、文件改进、风险分层以及临床试验和结果研究的调整队列选择上。

第三个挑战是将结果整合到组织工作流中。为了克服这个障碍,Shroff建议组织计划将nlp生成的结果集成到现有的工作流程中。

他说,一个高性能的NLP引擎可以通过两个主要特征来衡量:准确率和召回率。“准确性与NLP引擎准确检测临床结果的能力有关。例如,如果患者的记录表明患者患有糖尿病性神经病变,如果NLP引擎只显示糖尿病而不是糖尿病性神经病变,其精度就很低,”Shroff解释说。“召回与NLP引擎检测尽可能多的临床发现的能力有关。例如,NLP引擎可能无法检测到医疗记录中25%的临床发现,在这种情况下,它的召回率很低。”

Shroff说,最好的NLP引擎拥有大量的词汇,包括常用的缩写词、速记和其他术语。它们还包括语法和消歧义模块,使它们能够成功地驾驭不同的写作风格。Shroff说:“最近,机器学习使得NLP引擎能够更快地学习语言特性,并且即使在输入不熟悉的情况下也能表现良好。”

最佳实践实现注意事项
Chilmark Research的报告为采用和实施NLP提供了以下建议:

此外,Beaulah建议瞄准高价值的应用领域,如临床决策支持、风险调整和事先授权,以确保NLP项目的正确支持。他说:“技术和临床支持显然对实施成功至关重要,让跨职能团队评估该倡议的影响并计划其推出也是如此。”“从小处开始并展示早期成功也是有益的,这样团队就可以看到技术如何影响工作流程。”

Beaulah提供了一个高价值项目的例子,指出NLP在患者安全网倡议中的作用,例如确定需要随访肺结节、PSA(前列腺特异性抗原)水平或结肠镜检查的高危患者。他说:“人工实时进行如此大规模的筛查是不可能的,但通过自动化的NLP流程,我们可以快速识别合适的患者,以便临床医生可以开始治疗,从而获得更好的结果。”

陶氏强调平衡案例发现与人类分析的重要性。例如,在CAC的情况下,供应商正在使用NLP来查找您需要计费的内容。一旦确定,信息将被提交给人工审阅人员进行质量控制。

对于诸如跌倒之类的患者安全倡议,目标是使用NLP来查找可能表明患者已经发生跌倒的笔记。仍然需要一个人来检查这个记录,并确认病人是否真的摔倒了。道指出:“人们在使用技术来做理解语言等复杂的事情时确实会感到有点紧张。”“NLP在案例查找方面做得很好。然后人类来跟进它。”

根据Beeby的说法,最重要的是NLP正在提供一个新的理解水平。她说:“NLP对使用现实世界患者数据的大型数据集的洞察力是令人着迷的。”“我们看到了(以前没有的)趋势和有趣的相关性。这种能力超出了我们迄今为止看到的任何东西。”

- Selena Chavis是佛罗里达州的一名自由撰稿人,她的文章经常出现在各种贸易和消费者出版物上,内容涵盖从企业和管理到医疗保健和旅游的所有主题。