[发明专利]一种基于移动设备的文本检测和识别方法与系统有效

专利信息
申请号: 201910663009.3 申请日: 2019-07-22
公开(公告)号: CN110533027B 公开(公告)日: 2022-09-02
发明(设计)人: 陈曦;龚小龙;陈奕臻;麻志毅 申请(专利权)人: 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院
主分类号: G06V20/62 分类号: G06V20/62;G06V10/774;G06V30/19;G06V10/764;G06K9/62;G06V10/82;G06N3/04
代理公司: 北京辰权知识产权代理有限公司 11619 代理人: 刘广达
地址: 311200 浙江省杭州市萧*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 移动 设备 文本 检测 识别 方法 系统
【说明书】:

本申请公开了一种基于移动设备的文本检测和识别方法与系统,包括:预处理RGB图像,得到第一图像;计算第一图像中的多组坐标;提取与各组坐标对应的各第二图像;使用MobileNet卷积网络提取第二图像的图像特征;使用特征映射函数将所述图像特征转换成特征序列;使用DropConnect对所述特征序列进行正则化处理后,使用双向长短时记忆单元提取特征序列的文本预测值;使用softmax函数处理文本预测值,得到文本概率分布数据;使用argmax函数从所述文本概率分布数据中提取文本内容后输出。通过预处理RGB图像,能够有效减少在各种场景下,由于复杂环境而产生的文本背景干扰,更有利于真实应用场景下的文本识别;使用MobileNet能够在移动平台上实现快速的文本检测和识别,且功耗低。

技术领域

本申请应用于移动互联网行业,尤其涉及一种基于移动设备的文本检测和识别方法与系统。

背景技术

现有类似的技术方案一般只提及了文本识别和相关算法,无法减少文本在复杂场景下的干扰,然而场景干扰在各种场景中是比较常见的问题。在复杂的自然场景下进行文本识别通常会随着环境因素的影响而导致识别准确率降低,例如灯光的照射角度,画面曝光度以及图片背景颜色和文本字体对文本识别的影响。并且无法对复杂场景中的文本进行更精确的文本识别,以避免识别非文本对象。与此同时,目前现有的诸多神经网络文本识别处理技术再处理时长,功耗高,无满足在移动端的更快速以及低功耗的运行要求。

综上所述,需要提供一种能够在复杂场景下识别文本的准确率高,且在移动端上运行速度快,功耗低的方法与系统。

发明内容

为解决以上问题,本申请提出了一种基于移动设备的文本检测和识别方法与系统。

一方面,本申请提出一种基于移动设备的文本检测和识别方法,包括:

预处理RGB图像,得到第一图像;

计算第一图像中的多组坐标;

提取与各组坐标对应的各第二图像;

使用MobileNet卷积网络提取第二图像的图像特征;

使用特征映射函数将所述图像特征转换成特征序列;

使用DropConnect对所述特征序列进行处理后,使用长短时记忆单元提取特征序列的文本预测值;

使用softmax函数处理文本预测值,得到文本概率分布数据;

使用argmax函数从所述文本概率分布数据中提取文本内容后输出。

优选地,在所述使用长短时记忆单元提取特征序列的文本预测值之后,还包括:

使用CTC损失函数计算文本预测值和与其对应的标签文本之间的识别损失;

若识别损失小于等于识别损失阈值,则得到训练好的文本识别模型;

若识别损失大于识别损失阈值,根据识别损失自动调整文本识别模型中的权重参数,继续使用训练集中的图像训练文本识别模型,得到新的识别损失,若新的识别损失小于等于识别损失阈值,则得到训练好的文本识别模型,若新的识别损失大于上一步得到的识别损失,且新的识别损失无法下降,则输出识别损失最小的文本识别模型。

优选地,在所述计算第一图像中的多组坐标之后,还包括:

计算所述多组坐标和与其对应的标签坐标之间的坐标损失;

若坐标损失小于等于检测损失阈值,则得到训练好的文本检测模型;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910663009.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top