[发明专利]票据信息处理方法、系统及计算机可读存储介质有效
| 申请号: | 201811032403.9 | 申请日: | 2018-09-06 |
| 公开(公告)号: | CN109308476B | 公开(公告)日: | 2019-08-27 |
| 发明(设计)人: | 邬国锐;王庆庆;朱亚卓 | 申请(专利权)人: | 邬国锐 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06K9/20 |
| 代理公司: | 北京致科知识产权代理有限公司 11672 | 代理人: | 魏红雅 |
| 地址: | 100871 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 票据 目标文本 信息处理 计算机可读存储介质 定位模型 属性分类 文本区域 神经网络模型 相对位置关系 定位目标 定位属性 多个目标 机器学习 票据信息 分类 纠偏 准确率 核验 | ||
1.一种票据信息处理方法,其特征在于,包括:
对特定类型票据上待提取的目标文本区域对应的矩形框进行坐标标注,形成模板图;
对该特定类型票据样本采用深度神经网络模型进行训练提取图像特征,计算每个像素为文本和非文本的概率,以及计算每个像素与其临近像素是否为相同类别的概率,形成待提取的目标文本区域对应的样本图像概率图;
计算训练特定类型票据样本生成的样本图像概率图和坐标标注的矩形框对应的模板图之间的图像损失,基于图像损失调整模板图,当样本图像概率图和模板图之间的误差保持稳定时,以调整后的模板图作为该特定类型待处理票据上待提取的多个目标文本区域的定位模型;
根据定位模型对待处理票据上目标文本区域进行定位;
利用机器学习形成属性分类模型并对待处理票据上已定位的目标文本区域进行分类,确定至少一个目标文本区域的属性;
根据已确定目标文本区域的属性、已定位目标文本区域之间的相对位置关系及属性分类模型,获取待处理票据上属性未确定的目标文本区域的属性,和/或对待处理票据上已确定目标文本区域的属性进行第一核验纠偏。
2.根据权利要求1所述的方法,其特征在于,获取待处理票据上属性未确定的目标文本区域的属性,和/或对待处理票据上已确定目标文本区域的属性进行第一核验纠偏之后,还包括:
采用光学字符识别对待处理票据上已定位和属性分类的目标文本区域进行文本内容识别,获取目标文本区域的文本内容;
根据目标文本区域的属性及相应的文本内容,获取待处理票据上票据信息的结构化数据。
3.根据权利要求2所述的方法,其特征在于,采用光学字符识别对待处理票据上已定位和属性分类的目标文本区域进行文本内容识别,获取目标文本区域的文本内容之后,还包括:
根据待处理票据上至少一个目标文本区域的文本内容核验相应目标文本区域的属性,并根据目标文本区域之间的相对位置关系对其他目标文本区域的属性进行第二核验纠偏;
相应地,根据目标文本区域的属性及相应的文本内容,获取票据信息的结构化数据,具体为:
根据第二核验纠偏后的目标文本区域属性及相应的文本内容,获取待处理票据上票据信息的结构化数据。
4.根据权利要求1-3中任一项所述的方法,其特征在于,根据定位模型对待处理票据上目标文本区域进行定位,具体为:
根据定位模型对待处理票据进行图像特征提取;
预测识别图像的文本像素和非文本像素;以每个像素为中心像素对周围像素进行预测识别,确定周围像素与中心像素是否为同一文本区域;
将属于同一文本区域的像素进行融合,获取一个目标文本区域;
获取每个目标文本区域对应的矩形框的定位坐标。
5.一种票据信息处理方法,其特征在于,包括:
对特定类型票据上待提取的目标文本区域对应的矩形框进行坐标标注以及属性分类标注,形成模板图;
对该特定类型票据样本采用深度神经网络模型进行训练提取图像特征,计算每个像素为文本和非文本的概率,以及计算每个像素与其临近像素是否为相同类别的概率,形成待提取的目标文本区域对应的样本图像概率图;
计算训练特定类型票据样本生成的样本图像概率图和坐标标注的矩形框对应的模板图之间的图像损失,基于图像损失调整模板图,当样本图像概率图和模板图之间的误差保持稳定时,以调整后的模板图作为该特定类型待处理票据上待提取的多个目标文本区域的定位分类模型,所述定位分类模型包含各目标文本区域的定位信息及对应的属性信息;
根据定位分类模型中的定位信息对待处理票据上目标文本区域进行定位;
根据定位分类模型中的属性信息对待处理票据上已定位的目标文本区域进行属性分类,确定至少一个目标文本区域的属性;
根据已确定目标文本区域的属性、已定位的目标文本区域之间的相对位置关系及定位分类模型,获取待处理票据上属性未确定的目标文本区域的属性,和/或对待处理票据上已确定目标文本区域的属性进行第一核验纠偏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邬国锐,未经邬国锐许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811032403.9/1.html,转载请声明来源钻瓜专利网。





