2月2015

现实的期望是语音识别成功的关键
苏珊·查普曼
郑重声明
第二十七卷第二卷第16页

这项技术有其缺点,但增加一位经验丰富的转录员可以改善其前景。

没有技术是绝对正确的,但这并不妨碍用户对完美的期望。无论是电子病历还是计算机辅助编码,医疗保健专业人员经常需要工具来解决他们的所有问题。语音识别也是如此。

的问题
语音识别可以成为医疗保健组织和从业人员满足其工作流程需求的有效工具。然而,一些医疗转录服务组织报告了后端转录的问题,包括缺少文本块和其他错误。

NEMT首席执行官琳达•M•沙利文表示:“我们公司通过一家平台提供商与M*Modal合作。“这项技术一直在进步。然而,最近我们注意到我们接收成绩单的方式发生了变化。那些在语音识别方面做得很好的医生不得不被我们的转录员排除在外。他们听写时缺了几块文字。他们的解释是,音频听不清,但我们重新听了音频文件,它们看起来很好。”

M*Modal首席科学家于尔根•弗里奇(Juergen Fritsch)指出,总体而言,这项技术已经非常成熟,如果使用得当,它的准确性很高。他说:“你不存在5年或10年前的老问题。”不过,弗里奇承认这项技术并非没有缺陷。他说:“如果我们直接与转录员合作,有时在音频文件听不见或难以破译的情况下,把文本删掉比发回错误的文本要好。”

弗里奇说,由于转录员与他们的医生试图说的话更加协调一致,这项技术不会填补空白,以免将转录员指向错误的方向。M*Modal可以应用信心度量,并且该技术可以自我评估它创建的文档的质量。他说:“如果音频不清晰且低于一定的置信度,那么我们就会留下空白,而不是发送错误的内容。”“相反,医生可能会对此感到恼火。”

M*Modal还使用颜色编码系统来指示可能转录错误的术语。弗里奇说:“这让医生有机会关注这些词,看看他们是否需要修改或纠正。”“一些医生喜欢它,认为它很有用,而另一些医生则认为它会分散注意力。”M*Modal提供此功能作为用户偏好。
弗里奇说:“在企业对企业的环境中,我们基本上提供底层技术,但中介机构根据自己的需要应用它,而组织不一定要向用户展示所有可用的信息。”

研究语音识别软件多年的医学博士Claudia Tessier指出,在20世纪80年代,业界认为这项技术将在大约五年内取代转录。她说:“曾有naïve期望这是文档的解决方案。”“但这既不快速也不容易。文档不仅仅是口头和书面的文字。不管怎么做,整个记录都需要准确和完整。”

PA-C, DF-AAPA, CHDS, AHDI-F的Sherry Roth说:“一段听写,甚至一个字都可以改变整个记录的意思。”“如果我们不纠正错误,我们就是在伤害病人。记录中的错误可能会传播,并可能导致严重的医疗事故。”

医疗保健顾问卡伦·戴维斯指出了对医生进行语音识别能力教育的重要性。“从医生的角度来看,他们相信他们可以购买语音识别软件,这样他们就可以获得准确的记录。他们低估了转录员的工作,”她说。“他们买了一个套餐,却不评估它如何提高了他们的工作流程。他们倾向于把工作流程中的任何变化都交给转录员,这些转录员现在拿更少的钱去做更困难的事情。”

戴维斯补充说,医生无法分析结果,同时指出98%的准确率意味着大约每50个单词中就有一个没有被识别出来。她说:“医生们不知道这一点,就把责任推给了转录员,医生们相信他们只需付出一点点努力就能得到完美的准确性和格式。”

Tessier说,语音识别在包含审查和编辑组件时效果最好。“这不是一个独立的解决方案,”她说。“有些系统在某些人群中比其他系统更有效。有些环境为成功使用该技术做了更好的准备。语音识别的成功部分归功于软件,部分取决于工作文化。医生的口述可能会受到抵制,转录员也可能会感到工作受到威胁。”

转录员的角色
沙利文说,对转录员来说,转换到编辑的角色可能具有挑战性,因为转录员的技能完全不同。她说:“许多转录员无法完成这种转换。”编辑的收入大约是传统转录员的一半。他们不是靠打字来挣钱的,但是——特别是在缺少文本的情况下——他们必须通过重新听音频并自己输入缺失的段落来重新创建整个段落。”

Tessier说,转录员必须融入语音识别过程。她说:“如果一个软件系统证明自己具有它所宣称的潜力,那么我们就必须找到一种方法来适应它。”“在医疗保健专业社区,越来越多的人愿意采用语音识别技术。许多临床医生更喜欢点击,转录员的作用正在减弱。好的语音识别可以更快地实现我们改进文档的目标,这意味着我们可以利用转录员的思想和经验来增强软件的功能。”

Tessier指出,转录员可以利用他们的医学、术语和语法知识来补充语音识别。她指出:“才华横溢的转录员与优秀的语音识别软件的结合可以带来巨大的好处。”

尽管有这些才能,转录员已经在越来越多的组织中逐渐被淘汰。戴维斯说:“一些机构完全取消了转录员,现在依靠他们的QA(质量保证)人员来发现错误。”“由于承诺不再需要转录员,许多销售宣传都包括不切实际的投资回报率统计数据。但现实需要介于两者之间,在人们意识到这一点之前,他们在语音识别环境中犯了很多错误。”

错误发生的原因
如何以及在哪里捕获音频对语音识别是否成功起着主导作用。例如,通过电话捕获的听写可能产生较低质量的样本。一般来说,噪声条件可能是另一个问题。弗里奇说:“如果你在一个安静的办公室里,而不是在嘈杂的地板上,这可能是个问题。”“如果你知道这会影响语音识别结果,那么你会选择一个安静的地方。这项技术在处理背景噪音时效果不太好。”

他说,许多客户的抱怨源于缺乏基本培训,而麦克风摆放等很多问题都很容易解决。例如,医生将麦克风放置得太远或角度错误,或者在听写过程中改变距离,都会导致听写效果不佳。另一个问题是“相声”,当医生在旁边做同样的事情时,就会发生这种情况。

“有必要教育每个人,让他们知道这项技术能做什么,不能做什么,”弗里奇说。“如果你让一个用户提前思考他说的话,然后记录下来,他将一直获得近乎完美的准确性。如果你找一个边说话边思考、改变事物、造不符合语法的句子的人,那么结果就会不同。该技术可以听到结构良好的英语句子。说话前先想想自己想说什么,效果会更好。”

Roth对此表示赞同:“因为我知道转录端发生了什么,所以我知道该怎么做才能得到好的语音识别文档。这个程序非常忠实于我所说的,因为我在录制之前会思考。另一方面,如果有人不知道自己要说什么,并记录自己的想法,口音很重,正在吃东西,处于嘈杂的环境中,或者含糊不清,那么结果就不太理想。”

改善结果
为了使语音识别最有效,它必须是一个综合的过程,其中包括在无噪声环境中清晰说话的临床医生,识别和纠正错误的转录员,以及合适的电子病历。Tessier说:“如果你没有让所有这些因素一起工作,那么你就有问题了。”“我认为培训临床医生最大限度地使用软件和培训语音识别系统识别医生的声音都是至关重要的。”

戴维斯认为,组织必须评估他们的报告类型,并确定医生对处理文件要求的态度。她说:“一些医生宁愿看更多的病人,也不愿每天花一个小时来编辑。”“很多软件包都是模板驱动的,直接输入电子病历,这意味着它们的叙述可能会丢失,必须进行编辑以配合记录。”

罗斯说,受过良好教育的转录员可以帮助减少电子病历错误的数量。为了鼓励继续教育,一些行业组织提倡一种许可证或认证,以迫使转录员及时了解药物名称、设备、诊断和其他重要信息。

“转录员肯定需要跟上时代,”她说。“如果你想在转录公司工作,你必须能够使用这项技术,并理解你必须以不同于传统转录的方式倾听。例如,当我编辑时,我会大声朗读报告。如果与录音不符,我就知道该修复它。你的眼睛很容易滑过一些东西。如果你不大声说出来,你可以认为你看到了你所听到的。”

戴维斯说,许多程序不保存语音文件,这意味着如果医生在一个月后编辑了录音,就没有录音记录可以将书面记录与音频文件进行比较。她说:“许多语音识别软件程序并没有像传统听写那样设置为保存语音文件。”“这是一个空间问题,基于将文件保存到电脑上。这样的程序不是基于云的。因此,一旦它认为你已经完成,编辑和签名,语音文件将被删除。

“由于这一关键问题和其他问题,医疗机构需要确保该软件具有基于云的漫游语音配置文件和计算机辅助的医生文档,”她继续说道。“允许你发送给转录和编辑的包是必经之路,设施必须有一个针对重大错误的编辑计划。”

弗里奇说,演讲者培训是医疗机构可以加强的另一个领域,以增加成功实施语音识别的机会。他说:“训练越多越好,但基本技能可以在30到60分钟内掌握。”“我们正在努力让人们意识到这一点。人们仅仅购买技术并将其安装在电脑上是不够的;他们需要接受培训,让他们知道自己能做什么,不能做什么,以及如何正确地发号施令。当出现错误时,这不是技术或用户的过错。它更多地与期望设定和适当的培训有关。

“你有很多非技术用户,他们可能对这项技术的工作原理不感兴趣,所以他们需要接受培训,了解如何获得最佳结果,以及为什么语音识别对他们的工作流程来说比没有语音识别更有效。”

弗里奇说,对语音识别的期望合理可以提高它的效率。“有一种错误的期望,认为语音识别会像它现在这样工作《星际迷航》特别是在医学界,”他说。“我的意思是,一些医生试图通过他们的声音来做任何事情。然而,有些任务用键盘和鼠标来完成会更好。例如,语音识别是否比键盘和鼠标更适合输入生命体征,这是值得怀疑的。我的建议是把这项技术用在正确的事情上。不要什么都用它。需要锤子的时候就用锤子。有时它适合语音,而其他输入方式则更有帮助。”

-苏珊·查普曼,洛杉矶作家。