[发明专利]识别文本的方法、装置、识别设备和存储介质有效
| 申请号: | 201911147915.4 | 申请日: | 2019-11-21 |
| 公开(公告)号: | CN112825141B | 公开(公告)日: | 2023-02-17 |
| 发明(设计)人: | 乔梁 | 申请(专利权)人: | 上海高德威智能交通系统有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V10/44;G06V30/19 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李珂珂 |
| 地址: | 201821 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 文本 方法 装置 设备 存储 介质 | ||
本公开提供了一种识别文本的方法、装置、识别设备和存储介质,属于文本检测领域。所述方法包括:识别设备可以根据提取待识别图像的特征图,然后使用预设的分割网络和待识别图像,确定待识别图像的文本区域的分割信息,然后根据分割信息,确定文本区域的边界关键点,使用边界关键点,将文本区域中的文本转换为目标排列顺序的文本,将转换得到的文本输入到预设识别模型,进行识别处理。采用本公开,可以提升弯曲文本的识别效率。
技术领域
本公开涉及文本检测领域,特别涉及一种识别文本的方法、装置、识别设备和存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)技术作为一种重要的信息采集或录入的手段,可以代替人工输入,解放人力,从而被应用于多个场景。例如,可以应用于车牌识别、身份证信息识别、PDF(Portable Document Format,便携式文档格式)文本解析等。一般的流程是先进行检测后进行识别,即先对传入的图像进行文本区域的检测,再针对于检测区域内进行文本识别。
相关技术中,在对传入的图像进行文本区域检测时,得到的输出结果为一个四边形文本框(如矩形文本框或凸四边形框),然后对矩形文本框或凸四边形框中的内容进行检测。
由于在许多场景中均存在弯曲的文本,例如,发票章、广告牌等,所以仅使用四边形作为检测结果,这样,四边形中有可能不会包含弯曲文本,进而会导致弯曲文本的识别率比较低。
发明内容
为了解决弯曲文本的识别效率比较低的问题,本公开实施例提供了一种识别文本的方法、装置、识别设备和存储介质。所述技术方案如下:
第一方面,提供了一种识别文本的方法,所述方法包括:
根据预设的特征提取网络和待识别图像,提取所述待识别图像的特征图;
根据所述预设的分割网络和所述特征图,确定所述待识别图像的文本区域的分割信息;
根据所述分割信息,确定所述文本区域的边界关键点;
根据所述边界关键点,将所述文本区域中的文本转换为目标排列顺序的文本;
将转换得到的文本输入到预设识别模型,进行识别处理。
可选的,所述根据所述分割信息,确定所述文本区域的边界关键点,包括:
根据所述分割信息中第一边界区域中各像素点与所述第一边界区域的两个边界关键点之间的偏移,确定所述第一边界区域的两个边界关键点的位置信息;并根据所述分割信息中第二边界区域中各像素点与所述第二边界区域的两个边界关键点之间的偏移,确定所述第二边界区域的两个边界关键点的位置信息,其中,所述第一边界区域位于所述文本区域的头部,所述第二边界区域位于所述文本区域的尾部;
根据所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息,确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点。
可选的,所述方法还包括:
确定所述文本区域中的文本的排布信息;
所述根据所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息,确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点,包括:
根据所述文本的排布信息、所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息,确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海高德威智能交通系统有限公司,未经上海高德威智能交通系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911147915.4/2.html,转载请声明来源钻瓜专利网。





