[发明专利]基于目标检测的文本分类识别方法及装置在审
| 申请号: | 202010922482.1 | 申请日: | 2020-09-04 |
| 公开(公告)号: | CN112036395A | 公开(公告)日: | 2020-12-04 |
| 发明(设计)人: | 李辉;武亚强;蔡明祥;罗英文 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34;G06K9/46;G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 姚璐华 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 目标 检测 文本 分类 识别 方法 装置 | ||
本申请提出了一种基于目标检测的文本分类识别方法及装置,在获取预览图像中目标对象的目标区域之后,可以分别对其目标区域进行文本识别处理和图像特征提取,得到该目标对象包含的多个文本子区域各自的文本位置信息和文本内容信息,及该目标区域的特征图,再依据这多个文本位置信息,从该特征图中确定出相应文本子区域的文本图像特征,从而可以依据多个文本子区域各自的文本位置信息、文本内容信息及文本图像特征,对这多个文本子区域进行分类处理,得到目标对象的分类识别结果。在需要确定该目标对象的排版信息时,由于本申请识别出目标对象包含的更细粒度的多个文本子区域各自的分类信息,从而保证了据此所得目标对象的排版信息足够精细准确。
技术领域
本申请主要涉及图像处理技术领域,更具体地说是涉及一种基于目标检测的文本分类识别方法及装置。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。图像分割作为图像识别应用中的重要处理环节,通常是把图像分成若干个特定的、具有独特性质的区域,以提出感兴趣目标。
以文档版面识别应用场景为例,现有技术通常采用语义分割模型,对文档图像进行语义分析,确定构成该文档的各文本区域的语义类别,从而据此得到该文档的排版信息,但这种方式只能识别出该文档排版的基本区域类别,如标题区域、姓名区域、题目区域等文本区域,无法满足实际对文档排版信息识别的精细化要求。
发明内容
有鉴于此,为了实现对目标对象包含的各区域的精细化分类,以据此满足实际对目标对象板式分析的精细化要求,本申请提供了一种基于目标检测的文本分类识别方法,所述方法包括:
获取预览图像中目标对象的目标区域;
对所述目标区域进行文本识别处理,得到所述目标对象包含的多个文本子区域各自的文本位置信息和文本内容信息,其中,所述目标对象的文本内容能够划分成具有嵌套关系的多个文本区域,每一个所述文本区域包含至少一个所述文本子区域,且所述多个文本区域之间不存在重复的所述文本子区域;
对所述目标区域进行图像特征提取,利用得到的特征图及所述多个文本子区域各自的文本位置信息,得到相应文本子区域的文本图像特征;
依据所述多个文本子区域各自的所述文本位置信息、所述文本内容信息及所述文本图像特征,对所述多个文本子区域进行分类处理,得到所述目标对象的分类识别结果;其中,所述分类识别结果包含所述多个文本子区域各自的分类信息,所述分类信息能够用于确定相应所述文本子区域所属的所述文本区域。
在一些实施例中,所述依据所述多个文本子区域各自的所述文本位置信息、所述文本内容信息及所述文本图像特征,对所述多个文本子区域进行分类处理,得到所述待处理文档的分类识别结果,包括:
由任一所述文本子区域对应的所述文本位置信息、所述文本内容信息和所述文本图像特征,构成一个网络节点特征;
利用所述多个文本子区域各自对应的所述文本位置信息,得到不同所述文本子区域之间的位置偏移信息;
利用所述位置偏移信息,获得相应两个所述文本子区域之间的网络边特征;
依据多个所述网络节点特征和多个所述网络边特征,对所述多个文本子区域进行分类处理,得到所述目标对象的分类识别结果。
在一些实施例中,所述方法还包括:
对所述目标区域进行语义分割处理,得到所述目标对象的语义分割信息;
利用所述多个文本子区域各自的分类信息及所述语义分割信息,得到所述多个文本子区域组成的多个文本区域各自的位置信息,以及所述多个文本区域之间的嵌套关系;
由所述多个文本区域各自的位置信息及所述嵌套关系,获得所述目标对象的排版信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010922482.1/2.html,转载请声明来源钻瓜专利网。





