[发明专利]一种电子病历文本摘要抽取方法有效

专利信息
申请号: 202110010116.3 申请日: 2021-01-04
公开(公告)号: CN112732900B 公开(公告)日: 2022-07-29
发明(设计)人: 张述睿;吴军;樊昭磊;桑波;李福友 申请(专利权)人: 山东众阳健康科技集团有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06F40/30;G06F16/31;G06K9/62;G16H10/60
代理公司: 济南泉城专利商标事务所 37218 代理人: 支文彬
地址: 250001 山东省济南市市辖区*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电子 病历 文本 摘要 抽取 方法
【说明书】:

一种电子病历文本摘要抽取方法,通过定义语义覆盖度损失函数,可以将以往医师总结出的抽象式摘要用作训练自动抽取式摘要模型,避免了数据标注。从原始电子病历文本中筛选出比较重要的句子作为候选集,缩小自动抽取式摘要的搜寻范围,再通过罗列候选集中句子的不同组合方式,找出对原始电子病历中语义覆盖度最高的句子组合作为抽取式摘要,在判定语义覆盖度时,结合候选集中所有句子的语义信息做出判断,降低了自动抽取式摘要中信息冗余和信息缺失的可能,提升了自动抽取式摘要的质量。

技术领域

发明涉及医疗信息化技术领域,具体涉及一种电子病历文本摘要抽取方法。

背景技术

电子病历是病人在医院诊疗全过程的原始记录,也是为医师提供临床决策支持的重要系统。虽然电子病历取代纸质病历,方便了相关数据的存储和查找,但是电子病历很多重要的信息仍然深深埋藏在大量的文本内容当中。医师在临床工作中如果需要全面阅读一个病人的电子病历,往往需要花费很长时间。所以,对电子病历进行摘要提取,对增加医师在临床中的工作效率有重要意义,尤其是在出院病历的录入当中,医师需要阅读病人该次入院以来所有的电子病历记录,然后总结病人该次入院的状况和治疗情况,并录入到出院病历当中,整个过程会花费医师很大的时间和精力,尤其是在出院病人众多的情况下,并且在电子病历的阅读和总结的过程中容易遗漏电子病历中的重要信息。

目前机器摘要抽取主要分为两种技术,分为自动抽象式摘要和自动抽取式摘要,抽象式摘要指的是对原文内容进行抽象总结,形成更简短的文本。但是自动抽象式摘要任务面临着很大的挑战,目前的技术瓶颈主要是生成的抽象式摘要与原文事实冲突和摘要生成的篇幅不可控,即使最领先的科研成果也无法避免该问题。医疗工作的容错率是很低的,自动抽象式摘要可能造成的与原文事实冲突,可能造成医疗后果,是无法接受的。所以使用自动抽取式摘要技术对电子病历的文本进行摘要生成是当前最稳妥的方法。

但是目前一般的抽取式摘要技术面临以下问题:1)目前常用的抽取式摘要技术一般以文本中的句子为抽取单位,依赖于文本相似度的判断,从而获取文本中比较重要的句子,即从原文的所有句子中抽取一个子集,但抽取的摘要中句子与句子之间语义上的联系较弱,所以抽取出的句子组合对原始文本的覆盖度不一定是最高的,仍然会产生信息冗余或关键信息缺失的情况。2)一般的无监督摘要抽取模型性能往往不理想,如果想获取高性能抽取式模型则需要数据标记,数据标记的目的是从原始电子病历中标记出重要的句子,医疗文本的数据标记是一项专业性强、成本高、费时、而且质量难以管理的工作。

发明内容

本发明为了克服以上技术的不足,提供了一种不需要数据标注、自监督、且可以从电子病历中抽取出高覆盖度摘要,且提升医师的工作效率,并可以控制抽取内容的多少的方法。

本发明克服其技术问题所采用的技术方案是:

一种电子病历文本摘要抽取方法,包括如下步骤:

a)获取整篇电子病历的文本内容,使用D表示一篇电子病历中除出院病历以外的文本内容,D∈{di=1,di=2,...,di=|D|},di为D中的一句话,|D|为D的总句数,使用S表示一篇电子病历出院病历,S∈{sj=1,sj=2,...,sj=|S|},sj为S中的一句话,|S|为S的总句数;

b)使用医学教科书语料训练BERT语言模型,训练完成后通过公式使用该模型获取电子病历文本中di的向量表达式中BERT(di)[CLS]为使用BERT模型对di进行建模并获取向量表达,得到向量化表达矩阵

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众阳健康科技集团有限公司,未经山东众阳健康科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110010116.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top