[发明专利]标准回复确定方法、装置、设备及存储介质在审
| 申请号: | 202010806312.7 | 申请日: | 2020-08-12 |
| 公开(公告)号: | CN111930910A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 王可心;李直旭;刘庆升 | 申请(专利权)人: | 安徽淘云科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 付丽 |
| 地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标准 回复 确定 方法 装置 设备 存储 介质 | ||
本申请公开了一种标准回复确定方法、装置、设备及存储介质,针对待预测标准回复的目标项目,获取目标项目的候选回复集合,以及目标项目相关的背景知识、目标项目的项目数据,基于背景知识和项目数据,可以确定关注于项目数据的背景知识的第一特征表示,基于背景知识、项目数据和每一候选回复,确定关注于背景知识和项目数据的第一候选回复的第二特征表示,确定项目数据的第三特征表示,并基于第三特征表示、第一特征表示及每一候选回复的第二特征表示,确定每一候选回复作为标准回复的概率,依据此概率来选取标准回复。本申请实施例中引入并挖掘背景知识、项目数据与候选回复间的潜在联系,辅助筛选标准回复,能够大大提高标准回复的质量。
技术领域
本申请涉及机器语言处理技术领域,更具体的说,是涉及一种标准回复确定方法、装置、设备及存储介质。
背景技术
随着人工智能领域的不断壮大,越来越多的人工智能算法诞生出来,帮助机器更好地理解和处理人类的自然语言。
在现实应用中,存在多种不同的项目需要进行标准回复内容的预测,示例如人机对话项目中,需要预测机器的标准回复,机器阅读理解以及知识问答项目中,需要预测对给定问题的标准回复(又可称为标准答案)等。以人机对话为例,目前,研究者们已经研发出许多人机对话系统,在人工客服、家庭助手、学习指导等方面广泛应用。然而,当前的对话系统仍处于初步阶段,人机交互过程中,机器仅能够依据人机对话历史来预测标准回复,使得预测的标准回复质量不高。
发明内容
鉴于上述问题,提出了本申请以便提供一种标准回复确定方法、装置、设备及存储介质,以解决现有技术预测的标注回复质量不高的问题。具体方案如下:
一种标准回复确定方法,包括:
获取待预测标准回复的目标项目的候选回复集合、所述目标项目相关的背景知识,及所述目标项目的项目数据;
基于所述背景知识和所述项目数据,确定关注项目数据的背景知识的第一特征表示;
基于所述背景知识、所述项目数据和所述每一候选回复,确定关注背景知识及项目数据的每一候选回复的第二特征表示;
确定所述项目数据的第三特征表示,并基于所述第三特征表示、所述第一特征表示及所述每一候选回复的第二特征表示,确定每一候选回复作为标准回复的概率;
基于各候选回复的概率,从中选取标准回复。
优选地,所述第一特征表示、所述第二特征表示及所述第三特征表示的确定过程,包括:
确定所述背景知识的编码特征、所述项目数据的编码特征及每一候选回复的编码特征;
将所述项目数据的编码特征作为所述项目数据的第三特征表示;
基于所述背景知识的编码特征和所述项目数据的编码特征,确定关注项目数据的背景知识的第一特征表示;
基于所述背景知识的编码特征、所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注背景知识及项目数据的每一候选回复的第二特征表示。
优选地,所述基于所述背景知识的编码特征、所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注背景知识及项目数据的每一候选回复的第二特征表示,包括:
基于所述背景知识的编码特征和所述每一候选回复的编码特征,确定关注背景知识的每一候选回复的第四特征表示;
基于所述项目数据的编码特征和所述每一候选回复的编码特征,确定关注项目数据的每一候选回复的第五特征表示;
将每一候选回复的第四特征表示与第五特征表示进行拼接,得到关注背景知识及项目数据的每一候选回复的第二特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽淘云科技有限公司,未经安徽淘云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010806312.7/2.html,转载请声明来源钻瓜专利网。





