[发明专利]医疗票据版面识别的方法、装置及计算机设备在审
| 申请号: | 202010896878.3 | 申请日: | 2020-08-31 |
| 公开(公告)号: | CN112036304A | 公开(公告)日: | 2020-12-04 |
| 发明(设计)人: | 黎安;王航 | 申请(专利权)人: | 平安医疗健康管理股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/62 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 200001 上海市黄浦*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 医疗 票据 版面 识别 方法 装置 计算机 设备 | ||
1.一种医疗票据版面识别的方法,其特征在于,包括:
标记样本医疗票据的版面信息;
基于标注版面信息的样本医疗票据训练语义分割模型;
利用符合预设训练标准的语义分割模型计算待识别医疗票据的目标矩阵;
根据所述目标矩阵确定所述待识别医疗票据中各个版面区域的位置信息。
2.根据权利要求1所述的方法,其特征在于,所述版面信息包括各个版面区域对应的标注矩阵,所述版面区域包括字段区域和背景区域;
所述标记样本医疗票据的版面信息,具体包括:
确定所述样本医疗票据中各个版面区域的位置坐标;
为各个所述版面区域分别配置独立的矩阵通道,并根据所述位置坐标确定各个所述矩阵通道对应的标注矩阵;
基于各个所述标注矩阵标注所述样本医疗票据。
3.根据权利要求2所述的方法,其特征在于,所述确定所述样本医疗票据中各个版面区域的位置坐标,具体包括:
确定所述字段区域和所述背景区域对应的最小检测框;
将所述最小检测框对应的四个顶点坐标确定为所述所述字段区域和所述背景区域对应的位置坐标。
4.根据权利要求3所述的方法,其特征在于,所述为各个所述版面区域分别配置独立的矩阵通道,并根据所述位置坐标确定各个所述矩阵通道对应的标注矩阵,具体包括:
为各个所述字段区域配置第一矩阵通道;
基于所述第一矩阵通道的第一预设规则,确定所述各个字段区域的第一标注矩阵,所述第一预设规则对应所述字段区域外像素点的像素值设置为0,所述字段区域内像素点的像素值设置为1;
为所述背景区域配置第二矩阵通道;
基于所述第二矩阵通道的第二预设规则,确定所述背景区域的第二标注矩阵,所述第二预设规则对应背景区域外像素点的像素值设置为1,背景区域内像素点的像素值设置为0。
5.根据权利要求4所述的方法,其特征在于,所述基于各个所述标注矩阵标注所述样本医疗票据,具体包括:
为各个所述字段区域标注对应的所述第一标注矩阵,为所述背景区域标注所述第二标注矩阵。
6.根据权利要求5所述的方法,其特征在于,所述基于标注版面信息的样本医疗票据训练语义分割模型,具体包括:
将标注各个版面区域对应标注矩阵的样本医疗票据输入所述语义分割模型中,以便利用所述语义分割模型识别各个所述版面区域内的像素信息,并确定各个所述版面区域对应的二值化矩阵;
计算各个所述版面区域对应二值化矩阵与标注矩阵之间的误差值;
根据各个所述版面区域的预设权重,计算各个所述版面区域关于误差值的加权平均值;
将所述误差值的加权平均值与预设阈值进行比较,若判定所述误差值的加权平均值小于所述预设阈值,则判定语义分割模型通过训练;
若判定所述误差值的加权平均值大于或等于所述预设阈值,则判定所述语义分割模型未通过训练,利用所述样本医疗票据重新训练所述语义分割模型,和/或更新各个所述版面区域的预设权重,以使所述语义分割模型符合预设训练标准。
7.根据权利要求6所述的方法,其特征在于,所述利用符合预设训练标准的语义分割模型计算待识别医疗票据的目标矩阵,具体包括:
将待识别医疗票据输入所述符合预设训练标准的语义分割模型,获取得到各个目标矩阵通道,以及所述目标矩阵通道对应的目标矩阵;
所述根据所述目标矩阵确定所述待识别医疗票据中各个版面区域的位置信息,具体包括:
基于所述目标矩阵确定各个所述目标版面区域对应的连通域;
根据所述连通域的最小外接矩形确定各个目标版面区域的位置坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安医疗健康管理股份有限公司,未经平安医疗健康管理股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010896878.3/1.html,转载请声明来源钻瓜专利网。





