[发明专利]一种文本数据处理方法、装置和相关设备在审

专利信息
申请号: 202110400491.9 申请日: 2021-04-14
公开(公告)号: CN113705552A 公开(公告)日: 2021-11-26
发明(设计)人: 刘皓 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06K9/20 分类号: G06K9/20;G06K9/62;G06N3/04;G06N3/08
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强;杜维
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 数据处理 方法 装置 相关 设备
【说明书】:

本申请实施例公开了一种文本数据处理方法、装置和相关设备,该方法包括:获取用于训练初始网络模型的第一样本碎片和第二样本碎片;通过递归注意力网络确定第一样本碎片与样本图片之间的第一图文关系特征,基于第一图文关系特征输出用于添加至记忆网络的第一预测文本;将第一预测文本作为第二样本碎片的训练辅助文本,且通过递归注意力网络确定第二样本碎片与样本图片之间的第二图文关系特征,基于第二图文关系特征输出用于添加至记忆网络的第二预测文本;基于记忆网络中的第一预测文本和第二预测文本,训练初始网络模型,以得到用于对目标图片进行文本识别的目标网络模型。采用本申请,可以提高对文本识别的准确度。

技术领域

本申请涉及计算机技术领域,尤其涉及一种文本数据处理方法、装置和相关设备。

背景技术

目前,在对某些图片进行文本识别的过程中,往往会使用基于深度学习的文本识别方法。但是,在使用基于深度学习的识别方法(例如,使用循环神经网络)对文本进行识别的过程中,文本识别的准确度往往会受限于文本区域中的文本内容的长度。

比如,一旦整个图片的文本区域中的文本内容过长,则会因为循环神经网络自身固有的属性问题,造成文本区域的后半段文本内容中的信息的丢失,且信息的丢失会随着文本内容的长度的增长而越发严重。由此可见,在使用基于深度学习的识别方法(例如,使用循环神经网络)对文本进行识别的过程中,会出现长时遗忘的问题,进而导致文本识别错误的现象,以至于降低了对图片中的文本进行识别的准确度。

发明内容

本申请提供一种文本数据处理方法、装置和相关设备,可以提高对图片进行文本识别的准确率。

本申请实施例一方面提供一种文本数据处理方法,包括:

获取携带样本训练标签的样本图片,对训练样本标签所指示的训练文本信息进行文本切分,得到用于训练初始网络模型的第一样本碎片和第二样本碎片;第二样本碎片为第一样本碎片的下一样本碎片;

将第一样本碎片的第一样本文本特征与样本图片的样本图像特征输入初始网络模型中的递归注意力网络,通过递归注意力网络确定第一样本碎片与样本图片之间的第一图文关系特征,基于第一图文关系特征输出第一样本碎片的第一预测文本,将第一预测文本添加至初始网络模型中的记忆网络;

将记忆网络中所存储的第一预测文本作为第二样本碎片的训练辅助文本,将训练辅助文本所对应的第一样本文本特征、第二样本文本特征、以及样本图像特征输入递归注意力网络,通过递归注意力网络确定第二样本碎片与样本图片之间的第二图文关系特征,基于第二图文关系特征输出第二样本碎片的第二预测文本,将第二预测文本添加至记忆网络;

基于记忆网络中的第一预测文本和第二预测文本,确定训练文本信息的样本预测标签,基于样本训练标签和样本预测标签,对初始网络模型进行迭代训练,将迭代训练后的初始网络模型作为用于对目标图片进行文本识别的目标网络模型。

本申请实施例一方面提供一种文本数据处理装置,包括:

样本图片获取模块,用于获取携带样本训练标签的样本图片,对训练样本标签所指示的训练文本信息进行文本切分,得到用于训练初始网络模型的第一样本碎片和第二样本碎片;第二样本碎片为第一样本碎片的下一样本碎片;

第一关系确定模块,用于将第一样本碎片的第一样本文本特征与样本图片的样本图像特征输入初始网络模型中的递归注意力网络,通过递归注意力网络确定第一样本碎片与样本图片之间的第一图文关系特征,基于第一图文关系特征输出第一样本碎片的第一预测文本,将第一预测文本添加至初始网络模型中的记忆网络;

第二关系确定模块,用于将记忆网络中所存储的第一预测文本作为第二样本碎片的训练辅助文本,将训练辅助文本所对应的第一样本文本特征、第二样本文本特征、以及样本图像特征输入递归注意力网络,通过递归注意力网络确定第二样本碎片与样本图片之间的第二图文关系特征,基于第二图文关系特征输出第二样本碎片的第二预测文本,将第二预测文本添加至记忆网络;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110400491.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top