[发明专利]一种基于人工智能的单据检测识别方法在审
申请号: | 202110265829.4 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113076944A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 陈曦;刘义江;魏明磊;侯东梁;范辉;辛锐;赵小萌;彭姣;张鹏飞;杨力平 | 申请(专利权)人: | 国家电网有限公司;国网河北省电力有限公司信息通信分公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 石家庄德皓专利代理事务所(普通合伙) 13129 | 代理人: | 王梦幻 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 单据 检测 识别 方法 | ||
1.一种基于人工智能的单据检测识别方法,其特征在于,所述方法包括:
获取单据的图像;
对所述图像进行处理得到目标文本候选框;其包括:对所述图像上的像素点进行预测,根据预测结果将所有像素点划分为文字类别和背景类别,将所述背景类别中包含的像素点设为预设像素值,得到单据概率图;利用边界信息对所述单据概率图进行分割,将所述单据概率图划分为多个目标文本区域;利用opencv的方法生成多个分别与所述目标文本区域一一对应的目标外接多边形,根据每个所述目标外接多边形内每个像素点的概率值得到所述目标文本候选框;
将所述目标文本候选框输入至文本识别模型中,输出目标文本行。
2.根据权利要求1所述的一种基于人工智能的单据检测识别方法,其特征在于,所述对所述单据上的像素点进行预测,根据预测结果将所有像素点划分为文字类别和背景类别,包括:
预先训练得到金字塔特征提取模型,从获取数据中提取特征;
对所述图像上的像素点分别输入所述金字塔特征提取模型中提取文本特征,通过多尺度检测网络对不同尺度输入图像的文本特征进行融合,处理后得到特征图,并进行预测,判断所述像素点属于为文字类别还是背景类别;
根据预测结果将所有像素点划分为文字类别和背景类别,根据所述文字类别与所述背景类别得到边界信息。
3.根据权利要求2所述的一种基于人工智能的单据检测识别方法,其特征在于,所述预先训练得到金字塔特征提取模型,从获取数据中提取特征,包括:
利用backbone的数层卷积操作提取所述图像的特征,得到特征金字塔;
特征金字塔依次通过自顶向下和自底向上两条路径,将回向传递的高层语义信息和经过数层卷积操作被丢失的低层位置信息进行融合,对文本特征进行补充增强,得到这一阶段的最后特征。
4.根据权利要求1所述的一种基于人工智能的单据检测识别方法,其特征在于,将所述目标文本候选框输入至文本识别模型中输出目标文本行,包括:
通过所述文本识别模型提取出模板文本和所述目标文本候选框的特征,通过编码器计算输入所述目标文本候选框与所述模板文本的第一相似性矩阵;
通过相似度计算模块编码器对所述第一相似性矩阵进行歧义消除,得到第二相似性矩阵;
通过类集合器将所述第二相似性矩阵映射成概率矩阵,进行文本行的输出。
5.根据权利要求4所述的一种基于人工智能的单据检测识别方法,其特征在于,所述通过所述文本识别模型提取出模板文本和所述目标文本候选框的特征,通过编码器计算输入所述目标文本候选框与所述模板文本的第一相似性矩阵,包括:
通过所述文本识别模型中的共享的卷积神经网络提取出模板文本和所述目标文本候选框的特征;
在所述编码器中采用下述公式得到所述第一相似性矩阵:
其中,x表示所述目标文本候选框中,且x∈RH*W*C,{gi}代表所述模板文本中的字符,且
6.根据权利要求4所述的一种基于人工智能的单据检测识别方法,其特征在于,通过相似度计算模块编码器对所述第一相似性矩阵进行歧义消除,得到第二相似性矩阵,包括:
通过所述相似度计算模块编码器,将字符宽度、位置编码以及所述第一相似性矩阵整合起来,通过多层感知器和多层自注意力机制进行相似性矩阵的增强,得到所述第二相似性矩阵。
7.根据权利要求4所述的一种基于人工智能的单据检测识别方法,其特征在于,所述通过类集合器将所述第二相似性矩阵映射成概率矩阵,包括:
根据所述模板文本的字符分布构建转换矩阵M;
采用公式:P=MS*得到所述概率矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国网河北省电力有限公司信息通信分公司;国网河北省电力有限公司雄安新区供电公司,未经国家电网有限公司;国网河北省电力有限公司信息通信分公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265829.4/1.html,转载请声明来源钻瓜专利网。