2012年4月23日

识别HIEs患者
朱莉·克努森著
郑重声明
第二十四卷第八页

主患者索引保持准确的记录,并向整个交易所的提供者提供最新信息。

问任何一个医疗保健提供者,他们会很快告诉你:每个病人都是独一无二的。现在考虑在一年中最繁忙的一天创建新的病人记录,将这些新的入院记录与所有现有病人的记录进行比较,并在发现重复记录时删除记录。当你是一个健康信息交换中心(HIE),每年可能有数百万患者涌进你的提供者的大门时,你如何跟踪所有这些独特的个体?

这就是主病人指数(MPI)发挥作用的地方。

许多医院维护自己的MPI,但是HIE通过系统范围的企业MPI (EMPI)处理患者身份管理。医疗数据集成咨询公司Just Associates的总裁兼首席执行官、MBA、RHIA和FHIMA Beth Just表示:“所有患者的身份信息,如姓名、出生日期、社会安全号码、地址和电话号码,都存储在一个中央数据表中。”

EMPI将所有患者信息(其中一些已经连接到单个设施或系统中的患者身份号码)链接到跨越整个HIE的唯一标识符。“核心信息的准确性和完整性是准确识别患者身份的基石,”贾斯特说。患者的记录、临床信息和个人信息必须与每个人的唯一标识号相关联,并且每个人只能存在一个标识号。贾斯特说,EMPI的完整性和实用性几乎完全取决于“记录和临床信息是否正确地附加到正确的病人的医疗记录上”。

这些信息的准确性在很大程度上始于登记时,Karen Gallagher Grant说,她是注册会计师、卫生防护中心主任,同时也是马萨诸塞州韦尔斯利市Partners HealthCare的健康信息服务企业主管和首席隐私官。她的团队相信“第一次就把事情做好”的方法,这使他们建立了一个流程,在患者最初进入系统时收集尽可能多的可靠信息。

格兰特说:“当我们试图在整个企业范围内识别患者时,我们提出了如何登记患者的标准。”因为另一个目标是让病人迅速入院,所以存在第二层来查找错误。格兰特说:“(患者)的变化非常快,所以另一点是要确保从质量改进的角度对数据进行审查。”

这听起来可能很简单,但由于重症患者从急诊室被紧急送往医院的其他区域,而其他患者则通过救护车运送,因此很难找到时间和资源来收集必要的信息,以创建一个新的、准确的患者记录或与现有记录进行交叉核对。

Scott Afzal是马里兰州Chesapeake地区患者信息系统的项目主管,也是Audacious Inquiry LLC(一家技术和管理咨询公司)的负责人,他认为,主要的挑战是HIE的主要功能之一是能够访问不同设施的临床数据。“核心要求是有能力匹配身份,”阿夫扎尔解释说,并补充说,HIE内的许多设施可能不会共享相同的医疗记录号码。

HIE必须能够匹配患者身份,并在整个企业中链接这些唯一的医疗号码,以便一个机构的医疗记录可以与另一个机构的记录相关联,并且可以快速访问所有内容。“随着信息来源的增加,这一挑战也在增加,”阿夫扎尔说。

确定性vs.概率
在卫生保健系统中,有两种基本方法可以准确识别患者并发现错误或重复记录。

使用确定性方法的算法可以匹配个人信息。IBM全球医疗保健信息治理大使、注册会计师洛林•费尔南德斯(Lorraine Fernandes)表示:“如果你使用这种确定性方法,那就是字节对字节的比较。”“我们不能容忍人为错误、排版错误或数据捕获错误。”

在确定性系统中,不匹配的信息(如昵称、不正确的出生日期、新家庭住址以及娘家姓和已婚姓)可能会导致拒绝,从而可能导致整个企业中出现更多的假阴性和更多的重复记录。

俄亥俄州健康信息合作组织(Ohio Health information Partnership)的安全和隐私官迈克尔•萨维兹恩(Michael Sawczyn)说,第二种方法是概率算法,在这种算法中,病人记录中的各种信息都被赋予了一个权重。然后使用这些权重对两个或更多记录实际上是同一个人的可能性进行评分。

Sawczyn说:“你知道名字、姓氏、地址、出生日期,如果有的话,可能还有社会安全号码,但你不能指望其中任何一个都是正确的。”他解释说,EMPI首先寻找精确匹配,然后“它尝试接近匹配,然后为这些匹配分配权重,以确定这个人已经在你的系统中存在的概率。”

确定性技术已经存在了十多年,但专家表示,它正在逐渐消失,取而代之的是更全面的概率方法。甚至更新的算法也有不同程度的复杂性和灵活性。专家敦促在选择时要谨慎。

Just说:“如果你在记录匹配中使用不那么复杂的算法,就可能会有更多的误报。”结果是,来自多个个体的记录被合并到一个HIE记录中。“你要不惜一切代价避免这种情况。”

然而,Just指出,尽管许多不那么复杂的系统不像结构更为复杂的系统那样带有价格标签,但它们通常都有内置的保障措施,以确保在将交易链接到错误的患者记录之前符合特定的标准。

大多数HIEs采用一种或另一种方法,通常根据系统内可用的资源(无论是财务还是人员)的数量来确定他们的方法。或者,可以将该方法构建到选择用于管理组织的任何平台中。

当HIE向交换技术合作伙伴发出提案请求时,Afzal说,“你会得到一堆公司的回应,这些公司在他们的整体解决方案中内置了主患者索引解决方案。”此时,HIE必须考虑其选项,并确定平台的算法和索引方法是否符合其需求,或者独立的EMPI解决方案是否更适合它。在这些情况下,安装速度通常是一个因素。阿夫扎尔说:“许多HIEs需要迅速展示价值,以努力推动可持续发展。”这往往导致人们偏爱“预先整合并已经开始工作”的模式。

混合技术以获得最佳解决方案可能是一些HIEs的答案。“你必须使用所有可用的工具,”Sawczyn说。“你不能只是说我们要做这个,而不是这个。”俄亥俄州的合作伙伴利用一个平台,首先尝试创建一个确定性匹配,然后在必要时诉诸概率算法。他表示:“我们会从概率的角度告诉(供应商)我们将接受什么样的匹配。”这个数字会根据hie的不同而有所不同——有些人可能对94%的确定度感到满意,而另一些人则倾向于98%的确定度——但最终的目标是在不增加假阳性的情况下限制假阴性。“我们目前正在调查算法,并为我们董事会的HIE委员会提出建议,以确定这些阈值将是什么。”

专家建议,如果卫生保健专家认为主患者索引是一个自动化的过程,或者认为任何特定的协调方法都可以消除人为因素,那将是错误的。医疗保健专业人员负责评估最困难的身份错误和潜在的重复记录情况,并在EMPI系统遇到障碍时应用更高层次的思维。“我一直致力于数据完整性,”格兰特说,他的团队不断监测匹配规则,以确定算法是否可以调整。“这就像人工智能可以帮助我们解决问题,但关键在于细节,你要确保你一直在关注数据的完整性。”

随着HIEs继续将患者和提供者纳入其中,迅速增长的数据集将使数据完整性更加困难。Just说:“记录的数据库越大,通常重复问题就越大。”他补充说,如果一个HIE从40万条记录开始,但这个数字增长到400万条,那么潜在的重复泛滥可能会造成问题,除非它得到积极的管理。她说,虽然算法技术是必要的基础,但“它并不是数据治理和数据管理问题的全部解决方案。”

需要注意的是,数据捕获策略需要与通过HIE的信息过程的严格监控相结合,以确保数据的完整性。她预测,在解决差异时,仍然需要密切的人为监督,“因为算法仍然只能和数据一样好”。

病人的记录不会长苔藓
一旦创建了一个医疗记录,并与系统中的其他记录进行比较,它就不会被搁置。生活在继续,人们所做的事情不断地影响着EMPI的准确性和完整性。他们搬家、结婚、领养孩子或放弃昵称,有时真的会忘记配偶的出生日期。

病人记录的这种动态方面经常导致重复。甲骨文医疗保健产品战略副总裁克里斯•乔希表示:“MPI无疑是一个活生生的东西。“它从来都不是一成不变的。”每当添加一个患者时,就有可能忽略现有的记录。虽然EMPI中的重复记录会产生更麻烦的数据集,但Joshi说,重要的是要记住,在计算机屏幕上的影响不仅仅是1和0。

他指出:“如果同一个人有两份不同的记录,一份记录了病人的病史,另一份没有病史,而医生提出了没有病史的记录,这可能会对病人的治疗产生影响。”他补充说,EMPI应该被视为一项积极的服务,数据质量是至关重要的。

在录取过程中准确地获取信息是第一道防线,但人们有时确实会犯错误。无论是心事连天的父母错误地给了招生台孩子的昵称,还是接待员在繁忙的夜晚无意中弄错了孩子的出生日期,持续不断地捕捉、纠正和传播最新信息都是至关重要的。

作为这场持续斗争的一部分,俄亥俄州的合作伙伴关系正在创建一种结构,当发现潜在的不准确时,将报告发回医院进行澄清。Sawczyn说:“一旦他们做出纠正,这些纠正将自动回流到HIE中。”MPI随后会据此进行调整。”

该系统保持数据的准确性,以便将来的查询将访问每个患者的最新信息。

- Julie Knudson是西雅图的一名自由商业作家。

语言障碍
维护准确的主患者索引可能在几个层面上具有挑战性,以至于甚至健康信息交换(HIE)的位置也很重要。甲骨文医疗保健产品战略副总裁克里斯•乔希表示:“语言和本地化是非常大的不确定性因素。他说,根据HIE的人口统计数据,算法可能会“围绕语音拼写和名称识别来构建,而不仅仅是基于声音,而是基于声音加拼写”。

该算法的细节高度依赖于所涉及的语言,因为名字可能因来源而异。像名字后面的“e”这样的怪癖可以帮助确定病人是否已经在系统中,或者是否有人犯了数据输入错误。

对算法检查患者数据的方式进行微调可能会极大地限制或扩大其有效性。IBM信息治理全球医疗保健大使、注册会计师洛林•费尔南德斯(Lorraine Fernandes)表示:“我将以自己为例。“我的姓以an结尾。“世界上99%的人认为我的名字以‘z’结尾,我丈夫是西班牙人。但我丈夫是葡萄牙人,而费尔南德斯在葡萄牙文化中以“s”结尾。我的娘家姓是Grunewaldt,没人会拼。这些都是复杂的算法可以处理的日常挑战。”

管理HIE算法如何处理和权衡这些类型的语言和文化相关数据集的强大的、实际操作的方法,通常是阻碍重复的速度有多快的决定性因素。

——JK

为什么不用社会安全号码?
对于不了解情况的人来说,如何正确识别个别患者的答案似乎就在钱包和钱包里:社会安全号码。专家说,还没那么快。

马里兰州切萨皮克地区患者信息系统项目主管、Audacious Inquiry LLC公司负责人斯科特•阿夫扎尔表示:“(为什么不使用社保号码)的核心答案是,社保号码已经成为财务数据的代名词,如果这个号码被泄露,将其与个人的其他敏感信息联系在一起,可能会带来更大的风险。”

法律通常不要求病人向医院提供他们的社会安全号码,但当他们提交时,往往不是整个号码,阿夫扎尔说。他指出:“在我们只得到最后四位数字的情况下,我们仍然会使用它。”“如果我们把它归档,我们可以把它与整整九个进行比较,但我们给它分配的权重较小。”

尽管如此,当至少有部分社会安全号码可用时,它可以极大地帮助调和潜在的重复记录,作为更大数据集的一部分,Beth Just说,MBA, RHIA, FHIMA, Just Associates Inc.总裁兼首席执行官。“社会安全号码的最后四位数字与患者的其他人口统计数据相结合的准确性是巨大的。”她补充说,这可能意味着健康信息交换在寻求准确识别的同时解决患者隐私问题方面取得了胜利。“这确实增加了找到合适病人的可能性,而且病人不必提供完整的社会安全号码。”

——JK