[发明专利]提升回复生成模型抗噪能力的方法及系统有效
| 申请号: | 202010664792.8 | 申请日: | 2020-07-10 |
| 公开(公告)号: | CN111783434B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 朱钦佩;缪庆亮;俞凯 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G06F40/232 | 分类号: | G06F40/232 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 提升 回复 生成 模型 能力 方法 系统 | ||
1.一种提升回复生成模型抗噪能力的方法,所述回复生成模型采用编码-解码架构,所述方法包括:
对训练样本进行加噪处理,以得到混合训练样本;
将所述混合训练样本输入至所述回复生成模型;
至少在所述回复生成模型的编码端输出层通过对每个字符做二分类识别噪声字符进行噪声字符识别训练;
其中,所述至少在所述回复生成模型的编码端输出层通过对每个字符做二分类识别噪声字符进行噪声字符识别训练包括:
采用多任务训练的方式,在所述回复生成模型的编码端输出层通过对每个字符做二分类识别噪声字符进行噪声字符识别训练,同时对所述回复生成模型做回复生成训练。
2.根据权利要求1所述的方法,其中,所述训练样本包括多个时刻的多个输入字符,所述对训练样本进行加噪处理,以得到混合训练样本包括:
按照预设概率在所述多个时刻中的至少一个时刻对所述多个输入字符进行加噪处理,以得到混合输入序列。
3.根据权利要求2所述的方法,其中,所述按照预设概率在所述多个时刻中的至少一个时刻对所述多个输入字符进行加噪处理包括:
按照预设概率在所述多个时刻中的至少一个时刻增加噪声字符,和/或
按照预设概率将所述多个时刻中的至少一个时刻所对应的输入字符替换为噪声字符,和/或
按照预设概率删除所述多个时刻中的至少一个时刻所对应的输入字符。
4.根据权利要求2或3所述的方法,其中,将所述混合训练样本输入至所述回复生成模型包括:根据所述混合输入序列生成编码端输入状态,并输入至所述回复生成模型。
5.一种提升回复生成模型抗噪能力的系统,所述回复生成模型采用编码-解码架构,所述系统包括:
样本加噪模块,用于对训练样本进行加噪处理,以得到混合训练样本;
样本输入模块,用于将所述混合训练样本输入至所述回复生成模型;
模型训练模块,用于至少在所述回复生成模型的编码端输出层通过对每个字符做二分类识别噪声字符进行噪声字符识别训练;
其中,所述模型训练模块进一步配置为:
采用多任务训练的方式,在所述回复生成模型的编码端输出层通过对每个字符做二分类识别噪声字符进行噪声字符识别训练,同时对所述回复生成模型做回复生成训练。
6.一种终端设备,其配置有采用权利要求1-4中任一项所述的方法得到的回复生成模型。
7.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任意一项所述方法的步骤。
8.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010664792.8/1.html,转载请声明来源钻瓜专利网。





