[发明专利]一种文本识别方法、装置、设备及存储介质在审
| 申请号: | 202111137451.6 | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113887375A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 刘秩铭;邵明 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张洁 |
| 地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 识别 方法 装置 设备 存储 介质 | ||
1.一种文本识别方法,其特征在于,所述方法包括:
根据已训练的文本检测模型,确定待识别图像的多个目标文本区域;
根据已训练的第一文本识别模型,对所述多个目标文本区域进行文本识别,获取所述多个目标文本区域各自对应的第一文本识别结果;其中,所述第一文本识别模型根据文本语义信息确定所述第一文本识别结果;
根据已训练的第二文本识别模型,对所述多个目标文本区域进行文本识别,获取所述多个目标文本区域各自对应的第二文本识别结果;其中,所述第二文本识别模型根据文本长度和文本语义信息确定所述第二文本识别结果;
根据多个第一文本识别结果和多个第二文本识别结果各自包含的第一置信度,确定所述待识别图像对应的多个目标文本识别结果;其中,所述第一置信度用于指示文本识别结果所对应的目标文本区域中存在特定字符的概率;一个目标文本区域对应多个识别结果,且所述多个识别结果中置信度最大的识别结果,为所述一个目标文本区域的目标文本识别结果。
2.如权利要求1所述的方法,其特征在于,所述根据已训练的文本检测模型,确定待识别图像的多个目标文本区域,包括:
根据所述已训练的文本检测模型,确定所述待识别图像中的各个像素点为单个字符的中心点的第一概率,以及所述各个像素点为任意相邻两个字符之间的中心点的第二概率;
根据所述第一概率,得到多个局部图像区域;
针对每一个局部图像区域,根据所述第二概率,对所述每一个局部图像区域进行分割,确定所述每一个局部图像区域对应的多个候选文本区域;
根据所述多个局部图像区域各自对应的多个候选文本区域,确定待识别图像的多个目标文本区域。
3.如权利要求2所述的方法,其特征在于,所述根据所述多个候选文本区域,确定待识别图像的多个目标文本区域,包括:
确定所述多个候选文本区域各自对应的第二置信度;其中,所述第二置信度用于指示所述候选文本区域中存在本文的概率;
针对所述多个候选文本区域中的一个候选文本区域,确定所述一个候选文本区域对应的第二置信度是否大于设定的第二置信度阈值;
在确定大于设定的第二置信度阈值时,将所述一个候选文本区域确定为目标文本区域。
4.如权利要求3所述的方法,其特征在于,所述在确定大于设定的第二置信度阈值时,将所述一个候选文本区域确定为目标文本区域,包括:
在确定大于设定的第二置信度阈值时,将所述一个候选文本区域进行二值化处理,获得第一候选文本区域;
对所述第一候选文本区域进行连通域分析,确定所述第一候选文本区域是否为连通区域;其中,所述连通区域为具有相同像素值且位置相邻的非背景像素点组成的图像区域;
若确定为连通区域,则将所述第一候选文本区域确定为目标文本区域。
5.如权利要求4所述的方法,其特征在于,所述若确定为连通区域,则将所述第一候选文本区域确定为目标文本区域,包括:
在确定为连通区域后,确定所述第一候选文本区域中多个文本子区域与预设的第一坐标轴之间的多个夹角;其中,一个夹角对应一个文本子区域;所述多个夹角中的任意两个相邻夹角不相同时,则确定所述第一候选文本区域中,所述任意两个相邻夹角各自对应的文本子区域所共同组成的文本区域部分存在弯曲现象;
依次确定所述多个夹角中的两个相邻夹角之间的差值是否大于设定的角度阈值;
在确定两个相邻夹角之间的差值大于设定的角度阈值时,将所述第一候选文本区域中,大于设定的角度阈值的差值所对应的两个相邻夹角各自对应的文本子区域之间的分界线确定为分割线;
根据所述分割线,获取多个目标文本子区域,并将所述多个目标文本子区域确定为目标文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111137451.6/1.html,转载请声明来源钻瓜专利网。





