[发明专利]体检报告信息结构化提取方法、装置及计算机设备有效

专利信息
申请号: 202011149638.3 申请日: 2020-10-23
公开(公告)号: CN112257613B 公开(公告)日: 2023-08-08
发明(设计)人: 欧光礼 申请(专利权)人: 中国平安人寿保险股份有限公司
主分类号: G06V30/40 分类号: G06V30/40;G06V30/14;G06V30/146;G06V30/148;G06V30/19
代理公司: 深圳市精英专利事务所 44242 代理人: 李翔宇
地址: 518000 广东省深圳市福田区益田路5033号*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 体检 报告 信息 结构 提取 方法 装置 计算机 设备
【权利要求书】:

1.一种体检报告信息结构化提取方法,其特征在于,包括:

接收用户端上传的体检报告影像图片集,通过OCR识别获取所述体检报告影像图片集对应的报告来源信息;其中,所述报告来源信息包括体检报告出具机构名称和体检报告类型;

调用预先存储的体检报告样本集,获取每一体检报告样本对应的样本报告来源信息和样本体检数据分布区域;

若所述体检报告样本集中存在有体检报告样本对应的样本报告来源信息与所述体检报告影像图片集的报告来源信息相同,获取该体检报告样本的样本体检数据分布区域,以定位所述体检报告影像图片集中的待识别区域组成待识别区域图片集;

将所述待识别区域图片集依次进行去除透视形变及文字识别,得到所述待识别区域图片集对应的识别文本;

通过语义分析定位获取所述识别文本中目标字段及目标字段取值,以组成目标文本集;

调用预先存储的标准字段集,获取所述目标文本集中各目标字段在所述标准字段集中对应的近似字段,对所述目标文本集中各目标字段进行校正,以得到校正后目标文本集;以及

将所述校正后目标文本集存储至对应创建的存储区域,以得到体检报告结构化信息。

2.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述通过OCR识别获取所述体检报告影像图片集对应的报告来源信息,包括:

获取所述体检报告影像图片集的首页上半部区域,通过OCR识别获取所述首页上半部区域对应的前三行文字,以获取所述体检报告影像图片集对应的报告来源信息。

3.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述将所述待识别区域图片集依次进行去除透视形变及文字识别,得到所述待识别区域图片集对应的识别文本,包括:

通过Warping算法对所述待识别区域图片集去除透视变形,得到第一处理图片集;

对所述第一处理图片集中各第一处理图片进行字符切割,得到多个字符切割子图片,以组成字符切割子图片集;

调用预先训练的CRNN-CTC文字识别模型,通过所述CRNN-CTC文字识别模型对所述字符切割子图片集中各字符切割子图片进行文字识别,得到与各字符切割子图片分别对应的字符识别结果;

将与各字符切割子图片分别对应的字符识别结果依序进行串接组合,得到所述待识别区域图片集对应的识别文本。

4.根据权利要求3所述的体检报告信息结构化提取方法,其特征在于,所述通过Warping算法对所述待识别区域图片集去除透视变形,得到第一处理图片集,包括:

通过Warping算法中的单应性矩阵将所述待识别区域图片集中各待识别区域图片所有的相交线段转变成平行线段以去除透视变形,得到第一处理图片集。

5.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述通过语义分析定位获取所述识别文本中目标字段及目标字段取值,以组成目标文本集,包括:

将所述识别文本根据分隔符划分为多个待识别语句;

通过语义分析获取每一待识别语句分别包括的目标字段及目标字段取值,以组成目标文本集。

6.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述获取所述目标文本集中各目标字段在所述标准字段集中对应的近似字段,对所述目标文本集中各目标字段进行校正,以得到校正后目标文本集,包括:

获取所述目标文本集中各目标字段与所述标准字段集中各标准字段的字符串编辑距离,以将与各目标字段有最小字符串编辑距离的标准字段作为各目标字段分别对应的近似字段;

判断各目标字段与相对应的近似字段是否相同;

若有目标字段与相对应的近似字段不相同,将该目标字段替换为对应的近似字段,以得到校正后目标文本集。

7.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述将所述校正后目标文本集存储至对应创建的存储区域,以得到体检报告结构化信息之后,还包括:

将所述体检报告结构化信息上传至区块链网络。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011149638.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top