32021

锁定和加载对抗COVID-19
Selena Chavis著
郑重声明
第三十三卷第二页

预测分析工具如何为医疗机构提供应对COVID-19的见解。

近年来,医疗保健行业在改进数据挖掘技术方面取得了显著进展。以预测分析、人工智能和机器学习为形式的技术进步正在引领从医疗机构积累的大量数据中提取见解的新时代。

在2019冠状病毒病疫情席卷全球的2020年,使用这些工具的风险再高不过了。Guidehouse卫生保健实践主任、RHIA工商管理硕士艾莉森·维奥拉(Allison Viola)说,大流行要求全国各地的卫生保健机构报告数据,其规模与该行业近年来经历的任何一次都不同。

因此,这一过程揭示了该行业的能力。维奥拉说,这并不一定是一幅美丽的画面。她说:“不幸的是,这凸显了在方法、执行和能力上的一些漏洞。”“然而,这次大流行也为支持它的卫生保健界和其他利益攸关方提供了改进数据整理和报告方式的机会。数据不应被视为事后的想法。相反,通过标准化和治理,仔细规划和有意采取全面方法,对于获得高质量数据至关重要。”

值得注意的是,预测分析工具的使用案例几乎是无限的,因为医疗保健管理人员创造性地利用数据,在从患者护理和供应链管理到收入完整性的各个方面变得更加主动。

Pivot Point咨询公司数据分析实践主管凯尔·麦卡利斯特(Kyle McAllister)说:“实际上,只要你认为卫生系统需要数据来应对COVID,预测算法就有支持这一点的空间。”“因此,从用例的角度来看,目前该行业正在关注疫苗管理、选择性手术的收入回收,甚至是过去9个月左右发生的一些自费事情。显然,一个非常常见的因素是阳性检测、利用率和容量管理的收缩率。”

在管理床位容量方面,McAllister指出了西南部一家大型多州医院系统客户。该组织分布在广泛的地理位置,需要一种方法来集中管理来自本地设施的数据。为了满足这一需求,开发了一个预测分析模型,为领导层提供诸如测试量和阳性案例数量等信息的可见性。

当前的状态床容量可以被监控,未来的容量需求可以在几天内根据自身环境的情况进行预测。仅仅在十年前,数据洞察还需要大量的人力资源,而现在,整个网络都可以在一个仪表板上获得数据洞察,从而在供应需求和员工资源方面提高了对未知情况的准备程度。

“这对他们来说意义重大,”麦卡利斯特指出。“即使预测模型并不完美,他们至少可以在潜在风险领域之前做出反应,甚至可能错过将这些资源送到正确地方的机会。”

Viola说,由于寻找治疗COVID-19的一致方法的挑战,预测分析在医疗保健系统应对大流行方面变得至关重要。由于患者对疾病的反应因健康因素和合并症而异,提供者很难根据标准化的治疗过程创造一个准备就绪的环境。

维奥拉说:“医院正在使用电子病历中的数据来预测病人激增、急诊科人满为患和呼吸机库存。”他补充说,各种数据点可以帮助预测病人何时需要呼吸机或死亡。“电子病历数据也与人员配备数据相结合,这使医院能够在患者入院后几分钟内预测过度拥挤的统计数据,从而使医院能够应对COVID-19造成的激增。”

有多少数据?
根据McAllister的说法,使用多少数据的问题很难回答,他指出,答案通常来自对特定用例的理解。

他解释说:“这在不同的用例中会有很大的不同。”“我们花了很多时间与与我们一起工作的人一起努力了解他们正在尝试解决的用例以及对该用例真正重要的数据。然后,数量会在一定程度上自我管理,因为在某种程度上,你也会受到卫生系统现有资源的限制。”

麦卡利斯特补充说,医疗机构经常试图积累尽可能多的数据,以备将来需要。他将这些信息称为“惰性数据”,并警告说,这些资产通常会加剧分析的挑战。“这只会让维护变得更加困难,而且会占用空间,”麦卡利斯特说。

Viola强调数据质量比数据量更重要。她说:“我们正在经历来自各种来源的海量数据,我们可以根据这些数据做出决策。”“确保数据完整性是做出必要决策的关键一步——无论是临床还是非临床决策。”

确保数据可靠性
维奥拉说:“确保数据的准确代表性和可靠性,以支持COVID-19应对工作,对于国家、州和地方的规划、决策以及政策实施至关重要。”这些数据还确保了对COVID应对工作的准确了解。”

在大流行期间,人们吸取了许多关于准确数据报告的关键性质的教训。2020年8月,政府问责局发布了一份报告《COVID-19:联邦政府对大流行初步反应的简要更新》,该报告除其他评估外,评估了疾病控制和预防中心(CDC)国家卫生统计中心高于预期死亡人数的可靠性,该中心旨在监测和报告。

Viola指出,2020年5月的一项发现是,疾病预防控制中心将病毒和抗体测试的测试结果混为一谈,尽管这两种测试代表不同的信息,用于不同的目的。自那以后,美国疾病控制与预防中心采取措施,将检测结果分开,以便更准确地描述疫情,但这无疑是吸取重要教训的一个领域。

维奥拉说:“区分这两者是至关重要的,因为病毒检测呈阳性表明有潜在的病毒活跃病例,抗体检测呈阳性表明以前感染过,并且患者已经康复。”“通过结合两种测试结果,它可能会描绘出大流行严重程度的非常不同的情况,并可能导致与大流行的真实情况不充分一致的任务和限制。”

McAllister强调,即使面对时间敏感的数据需求,预测分析的最佳方法也必须始终包括测试和验证期。值得注意的是,在大多数与数据相关的项目中,这些努力往往是最耗时的,尤其是在开发机器学习或预测算法时。

McAllister解释说:“从本质上讲,构建机器学习算法的整个过程是从使用验证和训练数据来构建自己的算法开始的。”“这些都包含在工作的数据收集和争论部分,以及实际的培训或开发阶段。”

McAllister继续指出,分析的测试和验证组件的参数,类似于数据量需求,实际上取决于每个算法的意图和开发,以确定“多么可靠才足够可靠”,以及组织需要从验证的角度进行多深入的研究。他指出,根据所回答的问题,有时验证过程可能会稍微宽松一些。

麦卡利斯特说,创建算法的最大挑战之一是人类和组织的偏见。例如,在一个多医院组织中,不同机构的患者数量可能差别很大。因此,在一家机构创建的算法可能不适用于另一家机构。他说:“人类开发了这些算法,他们编写代码,把自己的偏见带到桌面上。”“研究这些(算法)的一个主要部分是试图理解并真正测试这些偏见——试着真正注意它们。”

医疗保健的数据科学家难题
在预测分析的数据挖掘方面有很多专业人士的名字——数据科学家、数据工程师、统计学家等等。不过,不管如何鉴定,有一个事实是肯定的:它们供不应求。

维奥拉说:“近年来,数据科学的工作岗位爆炸式增长,公司和个人都有机会走上这条道路。”“然而,尽管需求不断增长,数据科学家仍然供不应求。”

其结果是,政策制定者、公共卫生专业人员、研究人员、卫生保健系统和业余数据爱好者正在开发自己的解决方案和工具,以满足和支持各种数据需求,例如跟踪和可视化,以帮助监测COVID的传播。

麦卡利斯特承认,由于顶尖科技公司和其他行业往往优先获得顶尖人才,医疗保健行业面临着明显的劣势。他指出,与硅谷大公司合作所带来的观感和实际好处相比,很难与之竞争。

在与医疗机构合作方面,Pivot Point的优势之一是帮助招聘这一领域的人才,这往往是数据科学家之外的难题。McAllister表示:“我们的工作涉及数据分析领域的所有领域,数据空间中有很多角色,甚至不仅仅是开发算法。”他指出了数据分析和项目管理等角色。“真正强大的项目经理通常很难找到,特别是对于那些希望人们能够随时随地定位的人来说。”

预测分析的未来
维奥拉认为,大流行暴露出缺乏支持电子病例报告和其他电子公共卫生数据需求的基础设施。因此,今后将更加重视公共卫生数据基础设施及其交换数据的能力。

美国疾病控制与预防中心最近发起了数据现代化倡议,旨在“同时实现数据、技术和劳动力能力的现代化”。美国疾病控制与预防中心声称,该倡议将支持公共卫生监督、研究,并最终支持决策制定。
维奥拉说:“为了支持这一努力,并鉴于医疗保险和医疗补助服务中心和国家卫生信息技术协调员办公室最近发布的监管变化,疾病预防控制中心于2020年7月举办了一次听证会,并发布了一份报告,概述了2022年将发生的事情以及公共卫生存在的机遇。”

McAllister指出,目前人们对预测分析的前景感到非常兴奋,这将在未来几年推动这些技术的发展。他说:“这一领域发展迅速,有许多组织,包括传统的电子病历公司,开始构建这些东西,并将它们整合到自己的平台中。”

McAllister指出了国家层面上与互操作性和患者可及性相关的关键举措。他说:“实际上,我觉得医疗保健正处于重大积极变化的边缘。”“我预计,在流程和开发方面,医疗保健IT将会有相当快速的发展、颠覆和成熟,尤其是在大型科技公司开始进入这个领域的时候。我们已经看到谷歌(Google)、亚马逊(Amazon)和其他公司真的加入了进来,我认为这将给这个行业带来很大变化。”

- - - - - -Selena Chavis是佛罗里达州的一名自由撰稿人,她的文章经常出现在各种贸易和消费者出版物上,内容涵盖从企业和管理到医疗保健和旅行的所有主题