[发明专利]文本处理模型的训练方法、文本处理方法、装置及存储介质有效

申请号：	201911158483.7	申请日：	2019-11-22
公开（公告）号：	CN110956018B	公开（公告）日：	2023-04-18
发明（设计）人：	李少波	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F40/126	分类号：	G06F40/126;G06F40/289;G06N3/0455;G06N3/08
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	刘晖铭;张颖玲
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本处理模型训练方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种文本处理模型的训练方法，包括：获取第一训练样本集合；对所述第一训练样本集合进行去噪处理，形成相应的第二训练样本集合；通过文本处理模型对所述第二训练样本集合进行处理，以确定所述文本处理模型的初始参数；响应于所述文本处理模型的初始参数，通过所述文本处理模型对所述第二训练样本集合进行处理，确定所述文本处理模型的更新参数；根据所述文本处理模型的更新参数，通过所述第二训练样本集合对所述文本处理模型的编码器参数和解码器参数进行迭代更新。本发明还提供了文本处理方法、装置及存储介质。本发明能够使得文本处理模型的泛化能力更强，提升文本处理模型的训练精度与训练速度，提升生成文本的准确性与可读性。

技术领域

本发明涉及信息处理技术，尤其涉及文本处理模型的训练方法、文本处理方法、装置及存储介质。

背景技术

相关技术中，动态商品广告生成过程中，实现长文本到短文本的文本内容压缩主要的文本处理方式包括：基于RNN的生成式处理，另一种则是基于RNN的生成式与抽取式相结合的文本处理，但是，上述两种处理方式中RNN作为语义特征和综合特征抽取器，其性能较弱，因此，RNN能力的限制，使得文本处理模型难以产生高质量的文本处理结果，进而影响动态商品广告生成。

发明内容

有鉴于此，本发明实施例提供一种文本处理模型的训练方法、文本处理方法、装置及存储介质，本发明实施例的技术方案是这样实现的：

本发明提供了一种文本处理模型的训练方法，包括：

获取第一训练样本集合，其中所述第一训练样本集合包括至少一组表征商品名称的语句样本；

对所述第一训练样本集合进行去噪处理，以形成相应的第二训练样本集合；

通过文本处理模型对所述第二训练样本集合进行处理，以确定所述文本处理模型的初始参数；

响应于所述文本处理模型的初始参数，通过所述文本处理模型对所述第二训练样本集合进行处理，确定所述文本处理模型的更新参数；

根据所述文本处理模型的更新参数，通过所述第二训练样本集合对所述文本处理模型的编码器参数和解码器参数进行迭代更新。

本发明实施例还提供了一种文本处理模型的文本处理方法，所述方法包括：

获取视频中的动态多媒体信息，并将所述动态多媒体信息转换为相应的可识别文本信息；

通过文本处理模型的编码器，确定与文本信息所对应的至少一个词语级的隐变量；

通过所述文本处理模型的解码器，根据所述至少一个词语级的隐变量，生成与所述词语级的隐变量相对应的文本处理词语以及所述文本处理词语的被选取概率；