[发明专利]一种流式文字识别方法、装置、电子设备和存储介质在审
| 申请号: | 202111250985.X | 申请日: | 2021-10-26 |
| 公开(公告)号: | CN113971808A | 公开(公告)日: | 2022-01-25 |
| 发明(设计)人: | 刘青松;刘高成;聂金苗;梁家恩 | 申请(专利权)人: | 福建云知声智能科技有限公司 |
| 主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/148;G06V10/28 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 362012 福建省泉州市洛江区双阳街*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 识别 方法 装置 电子设备 存储 介质 | ||
本发明涉及一种流式文字识别方法、装置、电子设备和存储介质,该方法包括:获取当前流式图;确定当前流式图的空白候选区域;根据空白候选区域的阈值参数和策略参数确定当前流式图的切图起始点和切图结束点;根据切图起始点和切图结束点切图输出当前流式图的切图结果;识别当前流式图的切图结果和上一次流式图的切图结果,拼接得到最终结果。本申请确定空白候选区域后,通过空白候选区域的阈值参数和策略参数确定当前流式图的切图起始点和切图结束点,提高了确定空白候选区域的准确率;通过确定切图起始点和切图结束点得到当前流式图的切图结果,解决了直接切图的文字识别错误问题;识别拼接确定最终结果,提高了流式文字识别结果的准确性。
技术领域
本发明涉及文字识别技术领域,具体涉及一种流式文字识别方法、装置、电子设备和存储介质。
背景技术
目前,在确定流式图的边界过程中,依赖于上一次或者上几次的OCR的识别结果,通过历史OCR的识别结果,确定边界的长宽比例与阈值参数,以此来控制和确定流式图的边界。通过流式图的重叠匹配策略,拼接最终流式识别的结果。
存在问题:流式图的边界与OCR的结果耦合,在离在线环境下,本地确定流式图的边界无法获得OCR的结果,所以无法确定流式图的边界;目前流式图的边界逻辑,在某些情况下存在强制切除,导致文字被切断,影响最终文字识别效果。目前的拼图策略,对于一些错误输入,无法得到正确的拼接结果。
发明内容
本发明提供一种流式文字识别方法、装置、电子设备和存储介质,能够解决上述技术问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明实施例提供一种流式文字识别方法,包括:
获取当前流式图;
确定当前流式图的空白候选区域;
根据空白候选区域的阈值参数和策略参数确定当前流式图的切图起始点和切图结束点;
根据切图起始点和切图结束点切图输出当前流式图的切图结果;
识别当前流式图的切图结果和上一次流式图的切图结果,拼接得到最终结果。
进一步地,上述一种流式文字识别方法中,确定当前流式图的空白候选区域,包括:
获取当前流式图的待切分的图片区域以及空白候选区域的阈值参数;
对待切分的图片区域进行前处理并计算二值化图;
根据二值化图和所述空白候选区域的阈值参数确定空白候选区域。
进一步地,上述一种流式文字识别方法中,对图片区域进行前处理并计算二值化图,包括:
按照垂直投影和水平投影计算直方图。
进一步地,上述一种流式文字识别方法中,根据空白候选区域的阈值参数和策略参数确定当前流式图的切图起始点和切图结束点,包括:
根据空白候选区域的阈值参数和策略参数确定空白候选区域的边界信息;
根据空白候选区域的边界信息确定当前流式图的切图起始点和切图结束点。
进一步地,上述一种流式文字识别方法,还包括:更新当前空白候选区域的阈值参数。
进一步地,上述一种流式文字识别方法中,空白候选区域的阈值参数至少包括:空白宽度阈值、上一帧结束位置最远阈值和上一帧结束位置最近阈值;
策略参数包括上一次切图的起始位置和上一次切图的结束位置。
进一步地,上述一种流式文字识别方法中,识别当前流式图的切图结果和上一次流式图的切图结果,拼接得到最终结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建云知声智能科技有限公司,未经福建云知声智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111250985.X/2.html,转载请声明来源钻瓜专利网。





