9月2019

图表难题:人工智能计划从数据资产中提取价值
作者:克里斯·芬克博士
郑重声明
第三十一卷第八页

支付方和提供者正在使用临床自然语言处理来降低管理成本并提高分析的准确性。

随着利益相关者试图加速劳动密集型流程并实现先进技术的承诺,人工智能(AI)的成功案例开始充斥医疗保健行业。数据是这些举措的核心,然而,医疗保健组织都非常熟悉如何从电子病历和其他临床系统中快速扩展的信息库中获取最大价值的挑战。

人工智能是一大类技术的总称,这些技术可以根据数据进行学习、推理和适应。人工智能是一个连续体。狭义的人工智能可以用来自动化帮助人类的简单任务,而通用人工智能可以以认知的方式用于决策和模仿人类行为。

出于医疗保健的目的,人工智能通常用于通过帮助临床工作人员专注于需要他们专业知识的事情来增强人类工作流程。例子包括机器人、机器学习、图像识别、语音技术和临床自然语言处理(cNLP)。

审查患者记录的繁琐过程是人工智能技术提供显着价值的一个主要例子。进行医疗记录审查是为了通知各种组织举措并推动患者护理。这些审查通常以人工过程为特征,需要高薪的主题专家仔细研究记录,这些审查旨在将原始数据从信息转化为知识,最终转化为智慧,为分析计划和决策提供信息。

此外,与手动患者记录审查相关的耗时工作往往达不到最终目标:使数据具有可操作性。为了释放人工智能的潜力,医疗保健组织必须整合、标准化和丰富其数据资产。这需要将不同的源集中在一个集中的存储库中,同时将所有形式的数据(包括非结构化注释)规范化到一个确定的标准,以支持互操作性。它还包括将数据分类为临床概念,以支持关键任务活动,如质量测量报告、风险分层、医疗必要性和预测分析。如果没有这个基础,即使是最先进的人工智能工具也会产生欠佳的见解,影响有限。

创建可操作数据的挑战
不同的数据驻留在医疗保健领域的各种位置,这意味着提供商必须准备好从从索赔和临床系统到新兴数据存储库等来源提取数据。索赔中的账单数据以ICD-10、CPT、HCPCS和诊断相关组代码的形式呈现,通常已经干净、编码,并准备好用于人工智能。不幸的是,该数据源本身在临床上不够丰富,无法为数据科学和质量测量报告等高级人工智能项目提供动力。

在电子病历或实验室、药物、影像、行为健康或其他临床记录中发现的临床数据改善了这一前景,但对于机器学习/人工智能模型来说,这些数据更加混乱,不够干净。它可能来自半结构化的EHR下拉菜单,也可能是非结构化的,比如自由文本字段——很少有组织以有意义的方式利用临床文档的一个领域。

值得注意的是,一些估计表明,非结构化文本占临床文件的80%。

新兴的数据来源包括远程医疗、基因组学、患者报告的生活方式工具和健康的社会决定因素。这些领域以各种形式存在,医疗保健组织需要解决这些问题,以实现准确、完整的人工智能。

当前以完整和准确的方式提取有价值的患者信息的方法受到各种陷阱的损害。由于许多医疗保健组织仍然通过手动流程进行患者记录审查,因此他们遇到了资源挑战。简单地说,这是一个昂贵的提议,因为审查过程通常是由医生团队完成的,他们利用关键词来梳理患者的图表和文档。根据收集的信息,单个患者记录的审查需要30分钟到3个小时不等,这并不罕见。

此外,手工流程本身就容易出错。当面对与记录审查相关的数量和要求时,人类不可能始终保持高水平的准确性。人工智能可以有效地识别关键的临床信息,并将结构化和非结构化数据以统一的方式呈现给审稿人,从而帮助解决这些问题。

从自由文本中提取更大的价值
与传统的自然语言处理不同,cNLP处理临床数据的复杂性和细微差别,如物理术语、否定和模棱两可的陈述、短语与完整句子、重复数据和时间方面的问题(即时间)。

因为它将非结构化文档转化为更可计算的信息,可以分析和采取行动,这种形式的人工智能正变得越来越重要。由于基础设施缺乏从自由文本中提取关键信息所需的功能,当前的分析策略中缺少许多这些丰富的数据。

cNLP可以通过减少审查时间、提高员工效率、降低管理成本以及通过解锁数据并使其可操作来提高分析的准确性来增加价值。它很容易与其他人工智能技术集成,可以直接部署到数据仓库或分析引擎中。

当cNLP应用于医生记录的遭遇时,它可以识别临床概念,并帮助提供根据行业标准编码数据的建议,如LOINC(实验室)、RxNorm(药物)、SNOMED CT和ICD-10(问题/诊断)。

它还可以根据上下文对元素进行分组,以确保完全捕获信息。例如,考虑到准确识别分层病情代码(HCCs)糖尿病患者严重程度的挑战,这是衡量患者风险以进行风险调整的一种方法。患者的信息可以来自电子病历或索赔中的结构化ICD-10代码,并显示为E11.9,糖尿病无并发症。通过了解HCC的内容和结构,cNLP可以用于帮助确定是否有其他非编码并发症,如笔记中出现的口干。

一旦确定,这一信息授权正确指定HCC18,糖尿病慢性并发症。这一过程不仅提高了HCC报告的准确性,而且根据病情严重程度将报销提高到适当的水平。

质量测量报告是cNLP可以提供价值的另一个领域。PQRS 116 (NQF 58),成人急性支气管炎患者避免抗生素治疗的质量指标,就是一个很好的例子。当患者因急性支气管炎而接受抗生素治疗时,医生质量报告系统中的这一全国性措施的表现得分较低,因为有证据表明,这种治疗方法不会改善病情,而且可能造成伤害。

然而,对于有继发性疾病的患者,如囊性纤维化或艾滋病毒,存在排除标准。通常,证明二次诊断的文档是在自由文本中找到的,而不是电子病历的结构化区域。如果没有支持cnlp的数据挖掘,提供者没有办法在不手动查看图表的情况下识别符合这一标准的患者。在这种情况下,cNLP提高了准确性,这有助于医疗保健组织计算准确的分数并避免负支付。

展望未来
在实现人工智能战略的全部潜力方面,医疗保健行业只是触及了表面。正在交付价值的新兴用例包括以下内容:

•构建智能内容库(例如,文章和药物警戒用例的搜索索引);

•降低再入院风险(例如,使用出院后护理管理数据和电子病历数据来评估风险和干预机会);

•进行鉴别诊断(例如,使用患者在摄入时报告的症状来发现潜在的诊断);

•提供临床决策支持(例如,结合结构化和非结构化患者数据来定制临床决策支持);

•预测疾病的发作(例如,提高败血症检测的速度和准确性);和

•以人口健康倡议为目标(例如,阿片类药物滥用和干预服务以及对健康的社会决定因素的支持)。

AI入门
希望采用人工智能战略的医疗机构采取慎重的方法是明智的。作为第一步,临床和财务领导者应确保系统到位,以丰富他们的数据,以便人工智能由所有关键任务信息的完整和准确汇总提供动力。

一项涉及技术、专业知识和正确流程的多方面战略对于确保一个清晰、丰富的数据框架至关重要。综合战略必须从三个有利的角度解决术语管理和数据治理问题:通过参考数据管理建立单一的事实来源,自动映射非标准数据以支持数据规范化,以及通过cNLP处理非结构化数据。

当提供商实施实践以实现高数据质量时,他们可以更有效地从数据资产中提取价值并推进人工智能计划。因此,利用术语和数据管理解决方案(使用结构化数据流程来提取、规范化所需数据并将其映射到与cNLP相结合的适当行业标准)的业务案例很容易实现。

-克里斯·芬克博士,是威科健康语言公司的高级医学信息学家。