11月2016

语音识别的未来
贝丝·w·奥伦斯坦著
郑重声明
第二十八卷第十一页

从虚拟助手到环境智能,下一代语音识别技术必将引人入胜。

语音识别技术自上世纪60年代问世以来,已经走过了漫长的道路;当时,系统只能识别数字。Voicebrook是一家为自动临床记录提供集成语音识别和数字听写解决方案的公司,该公司总裁约瑟夫•德西德里奥表示,在医疗保健领域,毫无疑问,今天的语音识别版本比那些最初的模型领先了“好几光年”。

WahlScribe公司为医院、诊所和团体提供量身定制的转录服务,其运营副总裁Jay Vance是CMT、CHP、ahi -f,他说,尽管语音识别技术还不能100%防错,但它比以往任何时候都更加准确和用户友好。然而,这项技术还有更多的优势。

专家表示,未来的版本将提供增强的功能,使临床医生更有效率,并使他们更加以病人为中心。“对于语音识别和相关技术来说,这是一个非常非常激动人心的时刻,尤其是在医疗保健信息方面——大量的技术正在发展,”Peter Mahoney说,他是Dragon的高级副总裁兼总经理,同时也是Nuance Communications医疗保健部门临床文档的总经理。

语音识别引擎的许多改进都与电子病历的日益普及相吻合。ARRA要求所有公共和私人医疗保健提供者以及其他符合条件的专业人员采用并证明有意义的使用,以维持现有的医疗补助和医疗保险报销水平。电子病历的采用率已经在以令人印象深刻的速度下降,预计到2018年,随着对不采用该技术的供应商的处罚大幅增加,电子病历的采用率将继续增长。

马奥尼说,电子病历的目的是提高医疗服务的效率,这是正确的,“但实际上,它阻碍了医疗实践。”他说,医生和其他医疗服务提供者已经成为电脑的奴隶,因为他们必须在病人就诊之前、期间和之后输入病人的医疗记录。马奥尼说:“他们变成了数据录入员,这让他们远离了与病人的互动。”

他说,随着语音识别技术的进步,它可以在这方面发挥重要作用。语音识别可以帮助医生“把椅子转过来”,这样他或她就可以面对病人,而不是电脑。“这需要一段时间,”马奥尼说,“但随着语音识别行业专注于这个问题,并正在寻找能够提供帮助的具体应用,你将在未来几年看到越来越多的语音识别技术。”

尽管如此,在语音识别占据主导地位的未来,人为因素将发挥关键作用,万斯说,他是医疗保健文档完整性协会(Association for Healthcare Documentation Integrity)的前任主席,他认为,在任何技术生成的文档成为患者病历的永久记录之前,对其进行审查是至关重要的。他警告说,电子病历中的一个错误可能会被重复多次,因为它会与其他医生和医院共享。

万斯说:“不管采用什么方法来记录病人的遭遇,如果没有一个适当的流程来让医疗记录专家审查报告的准确性,那就太危险了。”

即将到来的前端改进
如何部署语音识别基本上归结为两个选项:后端和前端。当在后端使用时,提供者的口述被转换为电子文本,然后由医疗保健文档专家(HDS)编辑。HDS可以向医生寻求澄清或获取缺失的信息,医生必须在完成文件后签名。

万斯认为,后端语音识别技术已经相当成熟,除了可能提高准确性之外,不会有太多进展。他说:“我想不出还有什么能让后端语音识别技术更有用的东西了。”他还指出,自己在这种形式的语音识别方面有多年的个人经验。

然而,万斯说,前端语音识别——一种由医生口述、自我编辑文本并在其上签字的版本——还有很大的改进空间。“我相信,”他说,“每天都有人在研究它,想办法让这台电脑变得更有文化、更流畅,从而更好地识别和准确地再现人类的语言。”

随着前端语音技术的成熟和改进,行业专家期望看到的一些功能包括集成更多模板、虚拟辅助和人工智能。例如,为病理部门提供服务的Voicebrook正在开发一种附加组件,允许用户通过语音调用并完成结构化数据模板。

Desiderio说,语音驱动工作流程的能力在病理学实验室是一个巨大的优势,因为病理学家和他们的助手需要腾出双手来处理标本。此外,美国病理学家学beplay最新备用网站会(CAP)的新法规要求,当发现癌症阳性时,病理学家必须在患者记录中创建癌症检查表,每个数据元素都保存在CAP指定的结构中。检查表中需要的一些信息已经在病理学家口述的报告中了。Desiderio说,将两者与语音命令合并将使工作流程更自然,整个过程更高效。他指出:“这种额外的报告要求会增加大量的时间,并重复已经记录的数据。”

Desiderio说,Voicebrook正在构建新的结构化数据模板工具,以语音优化结构化数据输入(包括CAP电子癌症检查清单),并减少重复的数据输入。

马奥尼说,几十年来,语音识别技术不仅变得更加准确,而且能够更好地理解用户口述的上下文。在不久的将来,他相信这种自然语言理解将会更进一步,并能够为用户提供建议,使他们的工作更容易。

事实上,Nuance的龙医学顾问要求医生在必要时更具体。例如,如果在口述报告时,医生描述了患者的糖尿病,但忽略了指出是1型还是2型,或其严重程度,该工具会提示他们提供缺失的信息。获得这样的数据可以改善病人的护理,也可以提高图表被正确编码的几率。

另一款名为Florence的产品可以理解口头请求,如药物、实验室和诊断成像程序的订单。弗洛伦斯不仅是一名虚拟助理,也是一名医生教育家。例如,Florence可以提醒医生为特定患者订购某种药物的潜在影响,无论该患者是87岁的女性还是21岁的健康男性。

马奥尼说,利用语音识别功能可以提高医生的工作效率。如果没有语音识别,医生可能会在电子病历中多花10到15分钟输入数据。他说:“但是,如果你有一个系统,它可以问你后续问题,并提供你需要的信息,它可以让你更快地完成任务。”

下一个:环境智能
马奥尼说,创新和改进不会就此止步。下一步,也是Nuance和其他公司正在努力的方向,是环境智能。

马奥尼解释说:“在医疗保健领域,环境智能的概念是语音识别技术一直在倾听医生和他们与病人的互动。”希望这项技术能够从医患对话中提取关键的医学事实,以帮助改进文档和促进护理计划。环境智能软件甚至应该能够主动向医生提出建议。马奥尼说:“它会以一种非常自然的、环境的方式这样做,这意味着它就在背景中,以一种不引人注目的方式倾听。”

很难说环境智能何时会在医疗保健领域成为现实,但马奥尼认为,这是在不久的将来。他指出:“在接下来的几年里,你会看到一些迹象开始显现。”尽管Nuance正积极与一些感兴趣的医疗保健系统合作,为其语音识别技术开发环境智能,但马奥尼表示:“能够实现整个愿景可能需要五年多的时间。”

M*Modal公司为所有医疗专业提供基于云的语音识别解决方案。该公司首席技术官兼联合创始人德特勒夫•科尔(Detlef Koll)也认为,环境智能在后台帮助临床决策支持和指导的那一天“不会太遥远,但仍在不断发展”。

他说,虽然语音识别已经发展成为一种辅助系统,但它很快就能根据现有的文件向医生提出建议。例如,语音识别可能能够识别患者的肺炎是在住院期间获得的,还是由感冒恶化引起的。它甚至可以建议最好的抗生素,科尔说,但补充说,“治疗的决策支持是在路上。”

钱包的影响
这些创新会增加语音识别技术的成本吗?Vance说,答案是有争议的,但是,就像许多新产品一样,供应商可以预期价格会随着时间的推移而下降。他指出,一旦供应商找到更有效的生产方法,竞争就会加剧,市场就会趋于稳定。

他认为,任何新的创新都不会对定价产生什么影响。万斯说:“可能会有这样或那样的小幅波动,但如果看到价格大幅上涨,我会感到震惊。”他补充说,在一个让人们采用这项技术已经存在障碍的市场上,更高的成本只会制造另一个障碍。他预测,成本将保持稳定,甚至可能变得更容易负担。万斯指出:“即使有新的创新,如果价格大幅上涨,我会感到震惊,因为从长远来看,这将适得其反。”

马奥尼说,即使新的语音识别功能使这项技术更加昂贵,但从长远来看,医疗保健系统可能会节省资金,一个经济等式将使它成为一个有吸引力的选择。“最终,他们可能会把更多的预算花在这类技术上,因为应用越来越广泛。但如果我们的工作做得好,他们将花费更少的钱,因为应用程序将使用户更有生产力和效率,”他说。

——来自宾夕法尼亚州北安普顿的Beth W. Orenstein是一名自由医学作家,也是Great Valley Publishing旗下杂志的定期撰稿人。