[发明专利]一种基于人工智能的单据检测识别方法在审
申请号: | 202110265829.4 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113076944A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 陈曦;刘义江;魏明磊;侯东梁;范辉;辛锐;赵小萌;彭姣;张鹏飞;杨力平 | 申请(专利权)人: | 国家电网有限公司;国网河北省电力有限公司信息通信分公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 石家庄德皓专利代理事务所(普通合伙) 13129 | 代理人: | 王梦幻 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 单据 检测 识别 方法 | ||
本发明涉及一种人工智能的单据检测识别方法,方法包括:获取单据的图像,对所述图像进行处理得到目标文本候选框,将所述目标文本候选框输入至文本识别模型中,输出目标文本行,其中,对所述图像进行处理得到目标文本候选框过程包括:对所述图像上的像素点进行预测,根据预测结果将所有像素点划分为文字类别和背景类别,将所述背景类别中包含的像素点设为预设像素值,得到单据概率图;利用边界信息对所述单据概率图进行分割,将所述单据概率图划分为多个目标文本区域;利用opencv的方法生成多个分别与所述目标文本区域一一对应的目标外接多边形,根据每个所述目标外接多边形内每个像素点的概率值得到所述目标文本候选框,其精确度高,适用范围广。
技术领域
本发明涉及文件识别与处理技术领域,尤其涉及一种基于人工智能的单据检测识别方法。
背景技术
目前在市场交易过程中,交易双方都存在种类繁多的纸质销售和收购单据,对中大型交易双方来说,这些单据的重要性不言而喻。目前,常需要将单据的以光学扫面仪等仪器读入,从图像数据中读出单据上记载的重要信息。
随着社会发展和科技进步,人工智能的出现给人们的生活带来了翻天覆地的变化,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,目前,亟需提供一种基于人工智能的方法来实现单据检测识别,以提高获取单据中重要信息的效率。
发明内容
本发明所要解决的技术问题是提供一种基于人工智能的单据检测识别方法,以解决上述背景技术中的问题。
为解决上述问题,本发明所采取的技术方案是:
一种基于人工智能的单据检测识别方法,所述方法包括:
获取单据的图像;
对所述图像进行处理得到目标文本候选框;其包括:对所述图像上的像素点进行预测,根据预测结果将所有像素点划分为文字类别和背景类别,将所述背景类别中包含的像素点设为预设像素值,得到单据概率图;利用边界信息对所述单据概率图进行分割,将所述单据概率图划分为多个目标文本区域;利用opencv的方法生成多个分别与所述目标文本区域一一对应的目标外接多边形,根据每个所述目标外接多边形内每个像素点的概率值得到所述目标文本候选框;
将所述目标文本候选框输入至文本识别模型中输出目标文本行。
作为本发明的进一步改进,所述对所述单据上的像素点进行预测,根据预测结果将所有像素点划分为文字类别和背景类别,包括:
预先训练得到金字塔特征提取模型,从获取数据中提取特征;
对所述图像上的像素点分别输入所述金字塔特征提取模型中提取文本特征,通过多尺度检测网络对不同尺度输入图像的文本特征进行融合,处理后得到特征图,并进行预测,判断所述像素点属于为文字类别还是背景类别;
根据预测结果将所有像素点划分为文字类别和背景类别,根据所述文字类别与所述背景类别得到边界信息。
作为本发明的进一步改进,所述预先训练得到金字塔特征提取模型,从获取数据中提取特征,包括:
利用backbone的数层卷积操作提取所述图像的特征,得到特征金字塔;
特征金字塔依次通过自顶向下和自底向上两条路径,将回向传递的高层语义信息和经过数层卷积操作被丢失的低层位置信息进行融合,对文本特征进行补充增强,得到这一阶段的最后特征。
作为本发明的进一步改进,将所述目标文本候选框输入至文本识别模型中输出目标文本行,包括:
通过所述文本识别模型提取出模板文本和所述目标文本候选框的特征,通过编码器计算输入所述目标文本候选框与所述模板文本的第一相似性矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国网河北省电力有限公司信息通信分公司;国网河北省电力有限公司雄安新区供电公司,未经国家电网有限公司;国网河北省电力有限公司信息通信分公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265829.4/2.html,转载请声明来源钻瓜专利网。