[发明专利]一种文本数据处理方法、装置和相关设备在审
申请号: | 202110400491.9 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113705552A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 刘皓 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 数据处理 方法 装置 相关 设备 | ||
本申请实施例公开了一种文本数据处理方法、装置和相关设备,该方法包括:获取用于训练初始网络模型的第一样本碎片和第二样本碎片;通过递归注意力网络确定第一样本碎片与样本图片之间的第一图文关系特征,基于第一图文关系特征输出用于添加至记忆网络的第一预测文本;将第一预测文本作为第二样本碎片的训练辅助文本,且通过递归注意力网络确定第二样本碎片与样本图片之间的第二图文关系特征,基于第二图文关系特征输出用于添加至记忆网络的第二预测文本;基于记忆网络中的第一预测文本和第二预测文本,训练初始网络模型,以得到用于对目标图片进行文本识别的目标网络模型。采用本申请,可以提高对文本识别的准确度。
技术领域
本申请涉及计算机技术领域,尤其涉及一种文本数据处理方法、装置和相关设备。
背景技术
目前,在对某些图片进行文本识别的过程中,往往会使用基于深度学习的文本识别方法。但是,在使用基于深度学习的识别方法(例如,使用循环神经网络)对文本进行识别的过程中,文本识别的准确度往往会受限于文本区域中的文本内容的长度。
比如,一旦整个图片的文本区域中的文本内容过长,则会因为循环神经网络自身固有的属性问题,造成文本区域的后半段文本内容中的信息的丢失,且信息的丢失会随着文本内容的长度的增长而越发严重。由此可见,在使用基于深度学习的识别方法(例如,使用循环神经网络)对文本进行识别的过程中,会出现长时遗忘的问题,进而导致文本识别错误的现象,以至于降低了对图片中的文本进行识别的准确度。
发明内容
本申请提供一种文本数据处理方法、装置和相关设备,可以提高对图片进行文本识别的准确率。
本申请实施例一方面提供一种文本数据处理方法,包括:
获取携带样本训练标签的样本图片,对训练样本标签所指示的训练文本信息进行文本切分,得到用于训练初始网络模型的第一样本碎片和第二样本碎片;第二样本碎片为第一样本碎片的下一样本碎片;
将第一样本碎片的第一样本文本特征与样本图片的样本图像特征输入初始网络模型中的递归注意力网络,通过递归注意力网络确定第一样本碎片与样本图片之间的第一图文关系特征,基于第一图文关系特征输出第一样本碎片的第一预测文本,将第一预测文本添加至初始网络模型中的记忆网络;
将记忆网络中所存储的第一预测文本作为第二样本碎片的训练辅助文本,将训练辅助文本所对应的第一样本文本特征、第二样本文本特征、以及样本图像特征输入递归注意力网络,通过递归注意力网络确定第二样本碎片与样本图片之间的第二图文关系特征,基于第二图文关系特征输出第二样本碎片的第二预测文本,将第二预测文本添加至记忆网络;
基于记忆网络中的第一预测文本和第二预测文本,确定训练文本信息的样本预测标签,基于样本训练标签和样本预测标签,对初始网络模型进行迭代训练,将迭代训练后的初始网络模型作为用于对目标图片进行文本识别的目标网络模型。
本申请实施例一方面提供一种文本数据处理装置,包括:
样本图片获取模块,用于获取携带样本训练标签的样本图片,对训练样本标签所指示的训练文本信息进行文本切分,得到用于训练初始网络模型的第一样本碎片和第二样本碎片;第二样本碎片为第一样本碎片的下一样本碎片;
第一关系确定模块,用于将第一样本碎片的第一样本文本特征与样本图片的样本图像特征输入初始网络模型中的递归注意力网络,通过递归注意力网络确定第一样本碎片与样本图片之间的第一图文关系特征,基于第一图文关系特征输出第一样本碎片的第一预测文本,将第一预测文本添加至初始网络模型中的记忆网络;
第二关系确定模块,用于将记忆网络中所存储的第一预测文本作为第二样本碎片的训练辅助文本,将训练辅助文本所对应的第一样本文本特征、第二样本文本特征、以及样本图像特征输入递归注意力网络,通过递归注意力网络确定第二样本碎片与样本图片之间的第二图文关系特征,基于第二图文关系特征输出第二样本碎片的第二预测文本,将第二预测文本添加至记忆网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110400491.9/2.html,转载请声明来源钻瓜专利网。