2010年10月25日

搜索和享受
作者:Sandra Nunn, MA, RHIA, CHP
郑重声明
第二十二卷第十九页

医疗保健组织探索其数据存储库最深处的能力可以使其获得大量有价值的信息。

任何坐在电脑前进行互联网搜索的人都熟悉搜索工具和技术。从寻找新食谱的妈妈到收集统计数据的办公室职员,浏览信息已经成为日常生活的一部分。

在这方面的新情况是,医疗保健组织对利用这项技术改善运营很感兴趣。医疗保健领导者设想在内部使用搜索功能来支持患者安全工作、增强研究能力、促进知识工作者的创新工作,并允许管理人员跨越信息孤岛,利用临床医生和员工的想法。

在互联网上进行的搜索与在医疗保健环境中进行的搜索有相似之处。众所周知,人们必须在互联网上搜索的信息量正在迅速增长。在2003年一篇名为“多少信息”的文章中,加州大学伯克利分校指出,“1999年至2002年间,新存储的信息每年增长约30%,未来几年可能会增长得更快。”此外,每天发送的电子邮件约为310亿封,预计2006年这一数字将翻一番。”

一份名为《医生和Web 2.0:关于医生在线发展趋势你应该知道的5件事》的白皮书指出,就搜索工具的使用而言,“美国有多达24.5万名医生在执业中使用Web 2.0,这表明他们已经超出了早期采用者的阶段”。最近,医疗保健组织已经开始意识到,其企业内的信息增长速度超过了目前管理和搜索信息的速度。

搜索如何帮助医疗保健
信息过载和信息不足概括地描述了医疗保健组织对搜索技术实现有浓厚兴趣的原因。企业寻求使用搜索工具的主要原因是能够提高员工的生产力,而不仅仅是通过六西格玛和精益丰田等方法获得的收益。随着医院中数据和文档存储库数量的增加,可以在无数的地方找到内容。查找这些信息通常需要临床医生或工作人员单独搜索每个存储库。这种方法需要花费大量的时间,并且不能确保最好的结果,因为员工可能不知道要搜索的所有存储库。此外,知识工作者接触到他们所寻找的信息的大量版本,却无法确定哪一个是最新的、最有效的。

在企业搜索模型中,员工可以在众多存储库中“爬行”以产生准确的结果。如果没有这个特性,知识工作者可能不知道在哪里查找,或者无法正确访问所有存储库。并且他们可以访问的存储库将不得不手动搜索。

鼓励实体开发企业搜索的其他问题包括在不受控制的环境(如SharePoint、文件共享和电子邮件应用程序)中不断增加的内容。另一个特别适用于医疗保健的问题是建立安全性的复杂性。每个临床医生和医疗保健员工都必须开发提供上下文搜索的配置文件(即,对他们需要了解信息的存储库的搜索权限,但不包括具有特殊许可豁免的其他存储库)。

internet类型的搜索和能够跨越整个组织的更高级的搜索技术之间有几个明显的区别。员工,包括临床医生,习惯于在他们自己的特定存储库中搜索,但是当他们需要可能存在于组织内其他地方的信息时,他们会感到困惑。他们通常不知道在哪里搜索,是否拥有访问其他存储库的正确访问权限,以及是否能找到所需信息的最新版本。大型医疗保健企业可能拥有数百个数据库和IT系统,其中一些是遗留系统,其中包含研究或准备审计所需的更多历史信息。

信息缺乏
在2006年微软CEO峰会上的演讲中,比尔·盖茨承认了组织中包含的巨大数据,但也承认了开发和应用工具的商业价值,这些工具将揭示大多数组织中隐藏的知识。

如何处理这些数据的问题是双重的。首先是信息超载。面对每天每秒钟产生的无尽的数据洪流,我们怎么能希望跟上呢?在努力跟上的过程中,我们如何才能专注于最重要的任务,并提供最大的价值?

另一个问题可以被称为“信息负荷不足”。企业充斥着信息,但这并不意味着他们拥有有效利用这些数据的工具。

在他的演讲中,盖茨强调了微软对搜索工具和技术领域的积极兴趣和进入,这个领域由谷歌和其他在互联网上提供高级搜索功能的公司主导。然而,企业内部的搜索功能市场对所有能够为客户提供跨组织信息孤岛“了解”自己知识的人都是开放的。

有远见的组织已经开始进行某种形式的搜索。针对单个数据存储库(即针对包含编码数据的结构化数据库)进行搜索是非常常见的。在更高级的水平上,临床医生经常在处理难以捉摸的诊断或在研究工作中查询临床数据库,例如当他们访问肿瘤登记处以确定可能是最有效的治疗方法时。拥有更多资源的组织可能已经开发了临床数据存储库(cdr),其中包含来自许多临床来源的数据源,为信息搜索者提供更丰富的体验。然而,这些存储库通常仅限于结构化数据响应。

互联网的比较
在处理Internet时,搜索引擎由三部分组成:Web文档的数据库,对这些文档进行操作的搜索引擎,以及决定如何显示或报告搜索结果的程序。

开发企业范围搜索的努力必须考虑许多与Internet搜索相同的因素,但还要超越Internet搜索的范围。Internet搜索技术的一个关键考虑因素是提供相关性的能力。这些搜索是由关键字的输入控制的,这些关键字将触发消费者认为最相关的结果。

当然,此逻辑也适用于医疗保健组织的内部搜索。但是,在医疗保健实体中使用关键字方法需要组织努力开发具有标准化语言术语的受控词汇表。例如,医疗保健实体必须标准化组织中所有存储库中组成患者标识符的基本人口统计字段。

使用除患者标识符以外的关键字段进行搜索的不同信息库必须开发标准化的定义和字段。例如,访问财务或人力资源领域(如企业资源规划系统)下的数据库或非结构化文档和图像存储库,将需要对“雇员”等术语进行标准化定义,并在整个系统的数据库和存储库中对名为“雇员”标识符的字段进行标准化定义。

企业搜索还意味着全面的搜索。这就要求供应商能够提供跨数百个存储库的搜索功能,这些存储库包含多达400种不同的文档类型、多种数据类型和需要标准化索引的图像。供应商必须能够与实体一起工作,以设计跨多个存档发送查询的用户可以理解的信息层次结构。

到达联邦搜索
大多数互联网用户都没有意识到,他们无法通过谷歌或任何其他流行的搜索引擎访问数百万甚至数十亿的文件。谷歌和其他搜索产品能访问的文件只有那些内部员工编制了索引的文件,或者那些内部有链接的文件,这些链接将用户带到无法通过互联网直接搜索到的文件。

相反,通过信息治理,医疗保健组织可以控制自己的数据库和存储库,并应用标准使其信息更易于搜索。一般来说,医疗保健实体和其他企业一样,在资本总额允许的情况下,将以分阶段的方式进行企业搜索。以下步骤演示了一种分阶段的方法,该方法将逐步允许临床医生和其他知识工作者访问许多存储库中的信息:

阶段1:搜索CDR(如果已开发)的能力、管理文档的企业内容管理存储库(例如,控制感染的政策和程序)、文件共享(220种不同的文件格式,包括HTML、PDF、Microsoft Office、Open Office,在台式机上使用)、内部网内容、选定的数据库以及针对具有健康计划的实体的客户关系管理系统。

阶段2:搜索阶段1目标加上两个临床内容存储库、电子邮件存档、其他内容存储库、ERP系统和协作站点内容的能力。

阶段3:将整个企业的搜索(联邦搜索)扩展到Web内容、任何剩余的临床存储库、数据仓库和结构化数据存储库以及博客和wiki的能力。

其他技术创新也在不断发展,以提高搜索效率。例如,自动摘要使用一个计算机程序,它可以创建文本的缩短版本,允许那些从查询中收到多个结果的人快速扫描它们的相关性。协同过滤包括使用现有数据将查询用户与类似用户进行匹配,以确定用户相对于自己的特定搜索将找到的内容的可能性。这意味着将志同道合的用户相互关联,以支持更好的搜索结果。

搜索分析降低风险
除了减轻临床医生和知识工作者查找相关信息的工作量外,搜索工具还允许法律服务和合规人员查找法院命令或传票要求的所有必要信息,从而保护处于发现情况下的组织。beplay最新备用网站通过搜索方法,高风险文件可以被隔离在只有授权搜索者才能访问的关键字墙后面。对所有企业信息的分配所有权和管理权进行有效联合搜索的需求,要求组织的法律辩护人支持其医疗保健提供者,并证明组织在信息管理方面采用了最佳实践。

最后但并非最不重要的是,企业搜索的成功实现转化为通过访问多个存储库中的综合生产力信息来管理组织成本的能力,通过更好的信息访问来控制组织风险,以及通过访问多个数据存储库和以前不可用的记录来增强知识工作者创建创新解决方案的能力。

- Sandra Nunn, MA, RHIA, CHP,是新墨西哥州阿尔伯克基Melinunn咨询公司的顾问,也是郑重声明