[发明专利]基于功能结构的中文电子病历命名实体识别方法及系统在审

专利信息
申请号: 202110212911.0 申请日: 2021-02-25
公开(公告)号: CN112949308A 公开(公告)日: 2021-06-11
发明(设计)人: 胡吉明;钱玮;吕晓光;付文麟;吕浩 申请(专利权)人: 武汉大学
主分类号: G06F40/295 分类号: G06F40/295;G16H10/60;G06N3/04
代理公司: 湖北武汉永嘉专利代理有限公司 42102 代理人: 唐万荣
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 功能 结构 中文 电子 病历 命名 实体 识别 方法 系统
【权利要求书】:

1.一种基于功能结构的中文电子病历命名实体识别方法,其特征在于,包括以下步骤:

S1、获取电子病历数据,对电子病历数据进行结构化处理;

S2、依据功能结构,对结构化的数据进行内容抽取;

S3、对抽取的各功能结构内容进行人工标注,并分为训练集和测试集;

S4、利用各功能结构下的训练集训练BiLSTM-CRF模型;

S5、通过测试集验证各模型效果并对模型进行调优,最后利用模型对未标注文本进行命名实体识别。

2.根据权利要求1所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,电子病历数据为电子病历中的临床住院记录,包括入院情况、入院诊断、治疗经过、出院情况和出院诊断。

3.根据权利要求1所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,步骤S2包括:

S21、确定功能结构,包括入院情况、入院诊断、治疗经过、出院情况和出院诊断五个模块;

S22、根据模块对结构化的电子病历数据进行内容抽取。

4.根据权利要求1所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,步骤S3中,采用YEDDA标注工具进行人工标注,将实体类型信息和实体边界信息组合形成完整的标注体系,将识别任务转化为字粒度的标记。

5.根据权利要求4所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,实体类型包括:症状(SYMPTOM)、身体部位(BODY)、化验和检查(TESTEXAMINATION)、疾病(DISEASE)、体征(SIGN)、治疗(TREATMENT)、药物(DRUG)。

6.根据权利要求4所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,实体边界界定采用BIO标注模式,其定义如下:B表示实体首部字,I表示实体内部字,O表示非实体构成字。

7.根据权利要求1所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,步骤S4包括:

S41、加载字向量表,获得语料中每个字符的字向量表示,生成训练用的字向量矩阵;

S42、将字向量矩阵作为模型输入,通过BiLSTM层实现上下文信息特征提取,经tanh层输出字符对应各标签的置信度;

S43、利用CRF层在所有可能标记路径中解码出最优标记集。

8.根据权利要求1所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,

S51、将测试集对应的原始文本输入到模型进行预测,输出对应的标签预测结果;

S52、对比预测结果与测试集人工标注结果,计算正确率、召回率、F值三个指标;

S53、根据F值结果调优BiLSTM-CRF模型参数;

S54、将调优后的模型应用到未标注数据样本上实现命名实体的自动识别。

9.根据权利要求1-8中任一项所述的基于功能结构的中文电子病历命名实体识别方法,其特征在于,该方法还包括步骤:

S6、对电子病历各功能结构下文本字符及其标签进行实体合并和统计,构建出电子病历功能结构下的命名实体集。

10.一种基于功能结构的中文电子病历命名实体识别系统,其特征在于,包括:

数据获取模块,用于获取电子病历数据,对电子病历数据进行结构化处理;

内容抽取模块,用于依据功能结构,对结构化的数据进行内容抽取;

人工标注模块,用于对抽取的各功能结构内容进行人工标注,并分为训练集和测试集;

模型训练模块,用于利用各功能结构下的训练集训练BiLSTM-CRF模型;

实体识别模块,用于通过测试集验证各模型效果并对模型进行调优,最后利用模型对未标注文本进行命名实体识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110212911.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top