[发明专利]建立文本生成模型的方法、装置、介质和计算设备有效
| 申请号: | 201910690023.2 | 申请日: | 2019-07-29 |
| 公开(公告)号: | CN110414003B | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 黄民烈;柯沛;朱小燕 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F16/35;G06K9/62 |
| 代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 韩雪梅 |
| 地址: | 100084 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 建立 文本 生成 模型 方法 装置 介质 计算 设备 | ||
1.一种建立文本生成模型的方法,包括:
将基于真实数据采样生成的至少一个训练样本输入鉴别器,以得到所述训练样本的奖励分数;
基于所述训练样本及其奖励分数训练生成器;
其中,基于所述真实数据采样生成训练样本,包括:
基于所述真实数据构建静态分布并从中获取训练样本,其中,训练样本包括从所述静态分布中获得的多个以真实数据样本为基础生成的新样本;
其中,所述新样本由以下步骤获得:
获取一个真实数据文本;
从所述真实数据文本中选取至少一个可替换词/字;
确定替换每一个可替换词/字的候选替换词/字;
采用候选替换词/字替换所述真实数据文本中相应位置的可替换词/字,以生成所述新样本;其中,根据所述真实数据文本与待生成新样本之间的编辑距离确定所述真实数据文本中的可替换的位置;所述编辑距离基于所述真实数据文本的长度确定。
2.如权利要求1所述的方法,其中,基于真实数据以及生成器生成的数据以为真实数据分配更高的奖励分数为目标训练所述鉴别器。
3.如权利要求1所述的方法,其中,基于每一个可替换位置的上下文确定候选替换词/字。
4.如权利要求1所述的方法,其中,从词汇表中进行采样以替换相应的可替换词/字。
5.如权利要求4所述的方法,其中,采样的策略至少包括随机采样和约束采样中的一个。
6.如权利要求1所述的方法,其中,采用含奖励的最大似然的方法基于所述训练样本及其奖励分数训练生成器。
7.如权利要求6所述的方法,其中,采用强化学习的理论从现有的生成式对抗网络中导出所述生成器的训练目标。
8.如权利要求7所述的方法,其中,所述生成器的训练目标被配置为生成能够获得更高奖励分数且多样化的文本。
9.如权利要求8所述的方法,其中,引入指数收益分布来连接训练所述生成器时强化学习的目标函数与含奖励的最大似然方法的目标函数。
10.如权利要求9所述的方法,其中,通过重要性采样将鉴别器输出奖励分数的过程从所述指数收益分布采样的过程中分离。
11.如权利要求6-10任一所述的方法,其中,基于所述训练样本及其奖励分数训练生成器,包括:
基于所述静态分布以及鉴别器输出的奖励分数设计奖励函数;
基于所述训练样本以及根据所述奖励函数得到的奖励训练所述生成器。
12.如权利要求11所述的方法,其中,所述奖励函数被设计为鼓励所述生成器生成采样概率高且能够获得鉴别器的高奖励分数的文本。
13.如权利要求1所述的方法,其中,所述真实数据为对话文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910690023.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于统计和深度学习的智能中文分词方法
- 下一篇:一种核心信息提取的方法和系统





