[发明专利]体检报告信息结构化提取方法、装置及计算机设备有效
| 申请号: | 202011149638.3 | 申请日: | 2020-10-23 |
| 公开(公告)号: | CN112257613B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 欧光礼 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/14;G06V30/146;G06V30/148;G06V30/19 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
| 地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 体检 报告 信息 结构 提取 方法 装置 计算机 设备 | ||
1.一种体检报告信息结构化提取方法,其特征在于,包括:
接收用户端上传的体检报告影像图片集,通过OCR识别获取所述体检报告影像图片集对应的报告来源信息;其中,所述报告来源信息包括体检报告出具机构名称和体检报告类型;
调用预先存储的体检报告样本集,获取每一体检报告样本对应的样本报告来源信息和样本体检数据分布区域;
若所述体检报告样本集中存在有体检报告样本对应的样本报告来源信息与所述体检报告影像图片集的报告来源信息相同,获取该体检报告样本的样本体检数据分布区域,以定位所述体检报告影像图片集中的待识别区域组成待识别区域图片集;
将所述待识别区域图片集依次进行去除透视形变及文字识别,得到所述待识别区域图片集对应的识别文本;
通过语义分析定位获取所述识别文本中目标字段及目标字段取值,以组成目标文本集;
调用预先存储的标准字段集,获取所述目标文本集中各目标字段在所述标准字段集中对应的近似字段,对所述目标文本集中各目标字段进行校正,以得到校正后目标文本集;以及
将所述校正后目标文本集存储至对应创建的存储区域,以得到体检报告结构化信息。
2.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述通过OCR识别获取所述体检报告影像图片集对应的报告来源信息,包括:
获取所述体检报告影像图片集的首页上半部区域,通过OCR识别获取所述首页上半部区域对应的前三行文字,以获取所述体检报告影像图片集对应的报告来源信息。
3.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述将所述待识别区域图片集依次进行去除透视形变及文字识别,得到所述待识别区域图片集对应的识别文本,包括:
通过Warping算法对所述待识别区域图片集去除透视变形,得到第一处理图片集;
对所述第一处理图片集中各第一处理图片进行字符切割,得到多个字符切割子图片,以组成字符切割子图片集;
调用预先训练的CRNN-CTC文字识别模型,通过所述CRNN-CTC文字识别模型对所述字符切割子图片集中各字符切割子图片进行文字识别,得到与各字符切割子图片分别对应的字符识别结果;
将与各字符切割子图片分别对应的字符识别结果依序进行串接组合,得到所述待识别区域图片集对应的识别文本。
4.根据权利要求3所述的体检报告信息结构化提取方法,其特征在于,所述通过Warping算法对所述待识别区域图片集去除透视变形,得到第一处理图片集,包括:
通过Warping算法中的单应性矩阵将所述待识别区域图片集中各待识别区域图片所有的相交线段转变成平行线段以去除透视变形,得到第一处理图片集。
5.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述通过语义分析定位获取所述识别文本中目标字段及目标字段取值,以组成目标文本集,包括:
将所述识别文本根据分隔符划分为多个待识别语句;
通过语义分析获取每一待识别语句分别包括的目标字段及目标字段取值,以组成目标文本集。
6.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述获取所述目标文本集中各目标字段在所述标准字段集中对应的近似字段,对所述目标文本集中各目标字段进行校正,以得到校正后目标文本集,包括:
获取所述目标文本集中各目标字段与所述标准字段集中各标准字段的字符串编辑距离,以将与各目标字段有最小字符串编辑距离的标准字段作为各目标字段分别对应的近似字段;
判断各目标字段与相对应的近似字段是否相同;
若有目标字段与相对应的近似字段不相同,将该目标字段替换为对应的近似字段,以得到校正后目标文本集。
7.根据权利要求1所述的体检报告信息结构化提取方法,其特征在于,所述将所述校正后目标文本集存储至对应创建的存储区域,以得到体检报告结构化信息之后,还包括:
将所述体检报告结构化信息上传至区块链网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011149638.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于实现微孔锥度可调加工的光学系统及加工方法
- 下一篇:一种汽车举升装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





