[发明专利]建立文本生成模型的方法、装置、介质和计算设备有效
| 申请号: | 201910690023.2 | 申请日: | 2019-07-29 |
| 公开(公告)号: | CN110414003B | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 黄民烈;柯沛;朱小燕 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/35;G06K9/62 |
| 代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 韩雪梅 |
| 地址: | 100084 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 建立 文本 生成 模型 方法 装置 介质 计算 设备 | ||
本发明的实施方式提供了一种建立文本生成模型的方法。该方法包括:将基于真实数据采样生成的至少一个训练样本输入鉴别器,以得到所述训练样本的奖励分数;基于所述训练样本及其奖励分数训练生成器。通过基于真实数据获得的训练样本以及鉴别器输出的奖励分数训练生成器,本发明的方法使得训练过程更加稳定,并且显著地提升了生成文本的质量。此外,本发明的实施方式提供了一种建立文本生成模型的装置、介质和计算设备。
技术领域
本发明的实施方式涉及自然语言处理领域,更具体地,本发明的实施方式涉及一种建立文本生成模型的方法、装置、介质和计算设备。
背景技术
文本自动生成是自然语言处理领域的一个重要研究方向,实现文本自动生成也是人工智能走向成熟的一个重要标志。我们期待未来有一天计算机能够像人类一样写作,撰写出高质量的自然语言文本。文本生成的应用在生活中十分广泛,例如机器翻译、智能问答、对话系统、文本摘要和诗歌创作。利用文本生成,我们可以实现更加智能和自然的人机交互,我们也可以通过文本自动生成系统替代编辑,实现新闻的自动撰写与发布。
在早期,使用循环神经网络语言模型来进行文本生成,使用最大似然估计来进行训练,该方法在训练时根据真实数据的上文信息生成下文,测试时则根据模型生成的上文信息来生成下文,训练和测试的不一致性影响了生成效果。后面使用强化学习和对抗网络来进行文本生成,解决了这个问题,虽然改进之后,可以生成质量比较高的文本,但是由于强化学习训练算法(如策略梯度)的不稳定性,模型的性能容易出现较大波动。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,该概述并不是关于本发明的穷举性概述,它并非意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为后文的具体实施方式部分的铺垫。
鉴于以上提出的问题,本发明提出了一种建立文本生成模型的方法,包括:
将基于真实数据采样生成的至少一个训练样本输入鉴别器,以得到所述训练样本的奖励分数;
基于所述训练样本及其奖励分数训练生成器。
在本发明的一个实施例中,基于真实数据以及生成器生成的数据以为真实数据分配更高的奖励分数为目标训练所述鉴别器。
在本发明的一个实施例中,基于所述真实数据采样生成训练样本,包括:
基于真实数据构建静态分布并从中获取训练样本。
在本发明的一个实施例中,训练样本包括从所述静态分布中获得的多个以真实数据样本为基础生成的新样本。
在本发明的一个实施例中,所述新样本由以下步骤获得:
获取一个真实数据文本;
从所述真实数据文本中选取至少一个可替换词/字;
确定替换每一个可替换词/字的候选替换词/字;
采用候选替换词/字替换所述真实数据文本中相应位置的可替换词/字,以生成所述新样本。
在本发明的一个实施例中,根据所述真实数据文本与待生成新样本之间的编辑距离确定所述真实数据文本中的可替换的位置。
在本发明的一个实施例中,基于所述真实数据文本的长度确定编辑距离。
在本发明的一个实施例中,基于每一个可替换位置的上下文确定候选替换词/字。
在本发明的一个实施例中,从词汇表中进行采样以替换相应的可替换词/字。
在本发明的一个实施例中,采样的策略至少包括随机采样和约束采样中的一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910690023.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于统计和深度学习的智能中文分词方法
- 下一篇:一种核心信息提取的方法和系统





