[发明专利]用于生成图像识别模型的方法和装置有效

专利信息
申请号: 201811072105.2 申请日: 2018-09-14
公开(公告)号: CN109214386B 公开(公告)日: 2020-11-24
发明(设计)人: 郁昌存;王德鑫;安耀祖 申请(专利权)人: 京东数字科技控股有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06N3/04
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;马晓亚
地址: 100176 北京市大兴区经济*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 生成 图像 识别 模型 方法 装置
【权利要求书】:

1.一种用于生成图像识别模型的方法,包括:

获取第一样本集合,第一样本包括随机文字和利用随机文字生成的文字图像;

基于初始神经网络和所述第一样本集合,利用机器学习的方法训练得到预训练的初始神经网络,使得将第一样本的文字图像输入到预训练后的初始神经网络得到的识别结果中相应随机文字的概率值大于或等于预设概率值;

获取第二样本集合,第二样本包括文字图像和与文字图像对应的标注信息,标注信息用于指示文字图像中包含的文字;

基于预训练的初始神经网络和所述第二样本集合,利用机器学习的方法训练得到二次训练的初始神经网络,使得将第二样本的文字图像输入到二次训练后的初始神经网络得到的识别结果中相应标注信息中的文字的概率值大于或等于预设概率值,将二次训练后的初始神经网络作为图像识别模型,其中,二次训练的学习率小于预训练的学习率。

2.根据权利要求1所述的方法,其中,第一样本通过如下步骤生成:

创建随机文字;

将所述随机文字转换为文字图像;

将所述文字图像与预设的背景图像融合,得到融合后的文字图像;

基于所述随机文字和融合后的图像生成第一样本。

3.根据权利要求1所述的方法,其中,所述第二样本集合中第二样本的数量小于所述第一样本集合中第一样本的数量。

4.根据权利要求1所述的方法,其中,初始神经网络为卷积循环神经网络。

5.一种用于识别图像的方法,包括:

将待识别图像输入采用如权利要求1-4之一所述的方法生成的图像识别模型中,生成所述待识别图像的第一识别结果,所述待识别图像包括至少一个字符图像,所述第一识别结果包括对所述至少一个字符图像中的字符图像识别出的至少一个候选文字以及字符图像中的文字为相应候选文字的概率值;

对于所述至少一个字符图像中的字符图像,确定该字符图像与相邻字符图像具有最大组合概率值时对应的候选文字组合,字符图像之间的组合概率值用于表示字符图像的候选文字之间一起出现的概率值;

基于确定的候选文字组合,生成所述待识别图像的第二识别结果。

6.根据权利要求5所述的方法,其中,所述将待识别图像输入采用如权利要求1-4之一所述的方法生成的图像识别模型中,生成所述待识别图像的第一识别结果,包括:

将所述待识别图像输入所述图像识别模型中,得到初始识别结果,所述初始识别结果包括对所述至少一个字符图像中的字符图像识别出的至少一个文字以及字符图像中的文字为识别出的相应文字的概率值;

对于所述至少一个字符图像中的字符图像,从所述初始识别结果中选取概率值大于或等于预设概率阈值的不超过预设数量个文字作为该字符图像的候选文字。

7.根据权利要求6所述的方法,其中,所述该字符图像与相邻字符图像具有最大组合概率值时对应的候选文字组合,包括:

确定该字符图像的候选文字在相邻字符图像的候选文字条件下的条件概率值;

基于该字符图像的候选文字在相邻字符图像的候选文字条件下的条件概率值以及字符图像中的文字为相应候选文字的概率值,确定该字符图像与相邻字符图像之间的最大组合概率值;

将该字符图像和相邻字符图像之间具有最大组合概率值时各自的候选文字确定为该字符图像和相邻字符图像的候选文字组合。

8.根据权利要求7所述的方法,其中,在确定该字符图像与相邻字符图像具有最大组合概率值时对应的候选文字组合之前,所述方法还包括:

基于预设的语料库、所述至少一个字符图像的候选文字,构建n元语言模型,其中,n为自然数,所述n元语言模型用于确定相邻的字符图像的候选文字之间的条件概率值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811072105.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top