冬天2022

使癌症数据的聚合和可用性现代化
伊丽莎白·s·高尔著
郑重声明
第34卷第1页

好消息是,可能有多方面的解决方案可以解决多方面的挑战。

自1992年以来,由疾病控制和预防中心的国家癌症登记项目建立的以人口为基础的癌症登记监测系统一直在收集和分享有关癌症病例的详细信息,以确定趋势和治疗方法。然而,它一直在努力跟上关键数据数量和范围的爆炸式增长——电子病历和其他临床信息系统作为信息来源的局限性加剧了这一挑战。

虽然癌症登记员从电子病历中推断出大量信息,包括患者人口统计、癌症类型、治疗和随访,但“我们面临的最大障碍是医疗记录中缺乏提供的文件,”医疗记录协会癌症登记主任、RHIA、CTR的Suzanne Neve说。

更复杂的问题是,需要手动梳理整个医疗记录,以确定他们需要的数据,所有这些数据都“由[癌症登记员]手动进入癌症登记数据,”Neve说。

事实上,根据美国临床肿瘤学会(ASCO)的非营利附属机构CancerLinQ的医学主任、医学博士、FACP、FASCO、FAMIA的说法,文档化和自动化是基于人群和基于医院的癌症登记处共同面临的问题,这些障碍影响了临床医生的可用性和获取纵向数据的能力。

“当有人第一次被诊断出来时,登记处将获得有关患者、癌症、癌症阶段、肿瘤细胞类型和癌症组织学的信息。你可以接受初步治疗。但通常在最初的治疗之后就没有更新了,”他说。“电子健康记录并不特别适合临床护理。它们的设计更多是为了计费和管理目的。在真正了解癌症患者的诊疗过程方面,电子病历做得并不好。”

多管齐下的挑战
癌症登记的两种主要类型是基于人口的和基于医院的。两者都接收和收集癌症患者的数据,但目的不同。基于人群的登记是为了流行病学和公共卫生目的记录特定地理人群中的所有病例,而基于医院的登记是为了改善结果而维护设施或卫生系统特定患者人群的数据。然而,它们都面临着同样的数据问题。

“部分挑战在于(数据抽象)在很大程度上仍然是一个人工过程,因此进入其中的数据通常不是实时的。它被推迟了好几个月,在某些情况下,一年或更长时间,”米勒说。“登记处很清楚这一点,他们正在努力解决这个问题,但我们需要更多的自动化数据在这些不同的电子系统之间流动。然后我们将获得更多关于人群和个别医院情况的信息。”

当涉及到消除涉及抽象的艰苦手工过程时,癌症登记处面临的挑战是多方面的。一个是识别病人医疗记录中包含的所有信息,这些信息应该被外推到注册表中。除了患者人口统计数据外,目标数据还包括组织学类型(例如,小细胞癌与肺癌)、行为代码(恶性或良性)、TNM分期、基因组数据和健康的社会决定因素。

Wolters Kluwer健康语言解决方案工程师Celeste Adams博士表示,挑战在于这些数据必须从多个电子病历和其他临床系统中进行汇总和规范化。

她说:“病理和放射学报告、病程记录和手术记录等非结构化笔记很难手动提取数据。”她补充说,电话和传真仍然是常见的检索方法,导致数据不标准化。

亚当斯说:“一旦收集到数据,它们通常会以电子方式共享,但我们首先需要一种更有效的方法来管理数据。”

另一个挑战是,即使在数据可以被整理之前,它们也必须以可用的格式进入电子病历。一个问题是缺乏互操作性,导致信息仍然通过电话或传真和/或以pdf格式传递。另一个原因是,电子病历本身并没有跟上肿瘤学对先进疗法的数据需求,包括驱动分子医学和免疫疗法的基因组数据。

根据米勒的说法,“电子病历目前在获取结构化遗传信息方面做得不是很好,至少以其原有的形式是这样。不幸的是,由于许多[基因]测试是在卫生系统之外的第三方参考实验室完成的,因此数据返回电子病历的方式通常是pdf格式的。或者它有时会以传真的形式返回,上帝保佑,这种传真仍然存在。它通常是不可计算的;它不能进入任何电子健康记录,这样就可以很容易地检索、查询或排序。电子病历面临的最大挑战之一是,重要的肿瘤学数据并不是以结构化的方式开始的。”

Neve说,不断发展的癌症登记规则和条例加剧了从电子病历中提取癌症数据的问题。例如,她指出,对2018年病例生效的代码和指令进行了彻底改革,“这使得全国各地的许多注册中心在一年多的时间里无法提取病例并将其提交给各州,因此使癌症注册中心积压大量病例,并使EMR开发人员极难跟上这一需求。”

“我们面临的最大障碍是行业标准的年度变化。这将使及时推断相关信息变得困难。”

多方面的解决方案
在讨论数据收集和共享挑战的解决方案时,标准是不可或缺的。例如,Adams指出互操作性的可用格式因机构和EHR而异。此外,报告给注册中心的数据需要以特定的格式进行编码和结构化,编码系统通常与ehr捕获数据的方式不一致。

她指出,注册要求使用ICD-0-3报告组织学类型和行为代码。虽然在大多数电子病历中不经常捕获,但它“对于注册中心报告、互操作性;内部和外部;在设计合适的治疗方案时不仅要考虑肿瘤的部位还要考虑特定的组织学。同时,获取最具体的ICD-10-CM代码用于计费和其他管理目的是至关重要的,”Adams说。

同样有问题的是,关于肿瘤分期和分级的信息通常来自放射学或病理报告。Adams说,这些“是非结构化的,通常需要人工干预来提取数据”,然后“必须转换(因为)虽然标准确实存在,但它们还不成熟”。

ASCO正在通过CancerLinQ寻求解决方案,该公司目前与全国约110家癌症中心和肿瘤诊所合作,从他们的电子病历中提取数据,清理数据,并以可用的格式返回所有数据。该服务包括访问报告和仪表板,帮助实践人员使用asco批准的临床质量指标来跟踪绩效,其中一些指标得到了国家质量论坛的认可,并将绩效与国家基准进行比较。

CancerLinQ的一个重要方面是与各种标准组织(如HL7)合作,“试图定义和支持完善的、有用的和临床相关的数据标准,”Miller说。“我们正在采取多管齐下的方法,但现在还有一个空白”,CancerLinQ正在填补这个空白,直到标准和电子病历功能到位,以满足肿瘤学和癌症登记处的独特需求。

“我们并不渴望取代电子健康记录,”他说。“我们有一个多管齐下的方法,我们正在努力定义正确的标准是什么,这是我们在HL7和其他方面所做的一些工作。一旦电子健康档案的客户、医院和卫生系统明确需要以某种方式传递数据,生态系统的其他成员——生产遗传信息的实验室和与电子健康档案相连的辐射等各种机器——就有责任更多地利用这些标准。”

米勒说,目标是使用一套通用数据标准将数据过滤到电子病历中,“这样每个人都说同一种语言。”然后我们可以从专业的角度来做一些额外的翻译。电子病历需要更好地捕获所有类型的结构化数据,以及从外部输入的数据,需要对这些数据给予同样多的关注,就像在办公室提供护理期间发生的事情一样。”

定制策略
除了标准之外,对电子病历设计的一些调整可能会对负责提取癌症数据的注册商产生巨大影响。Neve说,在理想情况下,文本、人口统计和外科领域将通过直接从医疗记录中导入数据而自动完成。

她说,最好的办法是在电子病历中增加一个专门用于癌症登记信息的部分——类似于Epic系统中可以输入肿瘤委员会和幸存者信息的部分。

Neve说,为了避免多余的文件,可以在病历中设置一个复选框,触发自动上传到一个特殊文件夹,该文件夹“将包含所有必要的文件,实验室,手术笔记,病理笔记,病史和与该患者癌症有关的身体检查。”

她还建议,医院的医疗记录委员会在指导癌症数据收集和共享方面的任何改进方面处于最佳位置,并指出“他们是电子病历背后的声音,并推动医务人员全面完成每个病人的记录。”确保从电子病历中推断出充分和适当信息的唯一方法是确保记录的数据完整和准确。”

亚当斯说,自然语言处理(NLP)也可以在改善癌症数据的捕获和提取方面发挥重要作用。病理报告、进展记录、手术记录和放射学报告通常作为自由文本输入,因此需要人工干预或自动干预,如NLP或临床NLP (cNLP),这减少了所需的人工工作量。

亚当斯引用了MD安德森癌症中心的例子,该中心与健康语言合作开发了一种术语策略,以提高临床数据的质量和深度。它涉及具有专门术语的NLP、非标准化源术语的大容量语义映射,以及编写和维护专有术语或本体。

通过专注于高级术语服务,MD Anderson提高了数据质量的几个维度。例如,专门的肿瘤学术语现在可以在组织的电子病历中获得,以便在护理点访问。这允许在标准化术语(ICD-O-3)中捕获癌症的位置和组织学,减少了为注册中心报告目的手工抽象的需要。来自不同来源的数据也可以进行协调,从而为数据洞察提供单一视图。

利用技术改进癌症数据分析的另一个例子是COTA Healthcare,它为供应商和付款人组织提供真实的肿瘤学数据和分析。该公司为每位患者的癌症历程创建了一个“数字代码”,以汇总患者,并通过以下综合手段查看治疗计划、结果和成本方面的不合理变化:

•来自HemOnc的标准化代码,以表示数据中的治疗方案;

•观察性医疗成果伙伴关系共同数据模型,从不同来源获取数据,并将其转化为共同的分析格式;和

•来自威科健康语言的cNLP,用于标准化本体和管理ICD-10代码的更新。

Adams指出,这只是NLP在肿瘤学领域的几个用例之一。她说,cNLP和NLP在从电子病历中提取数据用于登记报告和临床决策支持、研究结果报告和毒性/症状/副作用方面发挥了重要作用。

Adams说:“通过将自由文本提取、转换和映射到行业标准的功能,cNLP确保了数据资产的互操作性和有意义的交换。”

——Elizabeth S. Goar是威斯康星州的一名自由撰稿人。