[发明专利]文本风格迁移系统的训练方法及装置在审

专利信息
申请号: 202010639197.9 申请日: 2020-07-06
公开(公告)号: CN111767744A 公开(公告)日: 2020-10-13
发明(设计)人: 何苏;王亮;赵薇;刘金龙;柳景明;郭常圳 申请(专利权)人: 北京猿力未来科技有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/253;G06N3/04
代理公司: 北京智信禾专利代理有限公司 11637 代理人: 刘晓楠
地址: 100102 北京市朝阳区广顺南大*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 风格 迁移 系统 训练 方法 装置
【说明书】:

本申请提供一种文本风格迁移系统的训练方法及装置,所述训练方法包括:获取训练样本,其中,所述训练样本包括第一风格文本和所述第一风格文本对应的第二风格文本;将所述第一风格文本和所述第二风格文本输入至文本风格迁移模型的编码器和解码器进行训练,将所述第一风格文本输入至文本风格分类模型的编码器和分类器进行训练,直至达到训练停止条件,两个模型同时学习与更新,在共用的编码器中共享文本风格的特征,使得编码器输出的编码结果更接近于第二风格文本,模型训练效果更好,BLEU分值更高。

技术领域

本申请涉及计算机技术领域,特别涉及文本风格迁移系统的训练方法及装置、文本风格迁移方法及装置、计算设备和计算机可读存储介质。

背景技术

随着科学技术的不断发展,人工智能领域也取得了长足的进步,目前人工智能技术在智能出行、智能家居等领域都得到了具体落地应用。然而目前在于文本相关的领域仍未取得较大的突破,比如对文本的风格进行转换,将口语化的英语句子转化为更加规范的表达等。

在现有的文本风格迁移过程中,通常采用的方法包括人工手动对文本进行修改或采用循环神经网络(RNN)或长短期记忆神经网络(LSTM)进行文本生成,但是人工对文本风格进行修改需要消耗大量的人力,并且不同的人对同一文本进行风格改写时,改写的结果受人为影响较大,对改写结果的评估也造成了很大的困难,另外一种通过RNN或LSTM等网络模型对文本风格进行转换在训练过程中都是单任务学习,简单的用一个神经网络模型对文本进行改写以达到修改文本风格的目的,但是不能直接控制生成的文本的风格,无法对改写后的文本是否达到了风格的转换进行验证。

因此,如何解决上述问题,可以更好的控制改写后文本的风格就成为技术人员亟待解决的问题。

发明内容

有鉴于此,本申请实施例提供了文本风格迁移系统的训练方法及装置、文本风格迁移方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。

根据本申请实施例的第一方面,提供了一种文本风格迁移系统的训练方法,所述文本风格迁移系统包括文本风格迁移模型和文本风格分类模型,所述文本风格迁移模型和所述文本风格分类模型包括同一个编码器,所述训练方法包括:

获取训练样本,其中,所述训练样本包括第一风格文本和所述第一风格文本对应的第二风格文本;

将所述第一风格文本和所述第二风格文本输入至所述文本风格迁移模型的编码器和解码器进行训练,将所述第一风格文本输入至所述文本风格分类模型的编码器和分类器进行训练,直至达到训练停止条件。

可选的,将所述第一风格文本和所述第二风格文本输入至所述文本风格迁移模型的编码器和解码器进行训练,包括:

将所述第一风格文本输入至所述编码器,获得所述编码器输出的与所述第一风格文本对应的编码向量;

将所述第二风格文本和所述编码向量经过所述文本风格迁移模型的解码器处理获得所述文本风格迁移模型输出的迁移文本;

根据所述迁移文本和所述第二风格文本计算损失值;

根据所述损失值调整所述文本风格迁移模型的模型参数以训练所述文本风格迁移模型。

可选的,将所述第一风格文本输入至所述文本风格分类模型的编码器和分类器进行训练,包括:

将所述第一风格文本输入至所述编码器,获得所述编码器输出的与所述第一风格文本对应的编码向量;

将所述编码向量经过所述文本风格分类模型的分类器处理获得所述文本风格分类模型输出的正例概率;

根据所述正例概率调整所述文本风格分类模型参数以训练所述文本风格分类模型。

可选的,所述编码器包括第一嵌入层和n个依次连接的编码层;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010639197.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top