[发明专利]意图识别模型的训练方法及装置、存储介质及电子设备在审
申请号: | 202010191431.6 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111400473A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 刘硕;杨玉树 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F40/205;G06F40/279;G06K9/62 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 模型 训练 方法 装置 存储 介质 电子设备 | ||
本公开提供了一种意图识别模型的训练方法及装置、存储介质及电子设备。意图识别模型的训练方法,包括:获取存储的交互日志数据,所述交互日志数据包括多组用户交互数据,每组用户交互数据包括:用户查询数据、推荐意图数据列表及用户从所述推荐意图数据列表中选择的用户选择数据;基于各组用户交互数据,生成第一正样本数据及第一负样本数据;基于预设的第一配置信息,获取知识库中的第二正样本数据及第二负样本数据;以及基于所述第一正样本数据、第一负样本数据、第二正样本数据及第二负样本数据,对意图识别模型进行训练;其中,所述意图识别模型用于对用户输入的查询语句进行意图识别。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种意图识别模型的训练方法及装置、存储介质及电子设备。
背景技术
随着人工智能技术的不断发展,用户意图识别被广泛应用于诸如智能客服、客服机器人等场景中。机器通过分析用户意图,使用自然语言与用户进行交互,为其提供服务。
图1是根据一示例示出的智能客服交互页面的示意图。如图1所示,机器通过意图识别模块对用户输入的查询(query)进行分析,与候选意图进行相似度匹配,并从中选取出用户想要表达的真正意图,反馈给用户。
在相关技术中,使用了基于模型的意图识别方法,如基于一些相似度模型,将用户输入的查询与候选意图进行相似度计算,通过评分并排序的方法来判别用户意图。该方法虽然具有泛化能力强,无需人工配置相关规则等优点,但基于模型识别的准确度严重依赖于训练数据。因此,如何为相似度模型提供精确的训练数据,成为提升意图识别准确度的关键技术。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种意图识别模型的训练方法及装置、存储介质及电子设备,至少在一定程度上克服相关技术中意图识别准确度低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种意图识别模型的训练方法,包括:获取存储的交互日志数据,所述交互日志数据包括多组用户交互数据,每组用户交互数据包括:用户查询数据、推荐意图数据列表及用户从所述推荐意图数据列表中选择的用户选择数据;基于各组用户交互数据,生成第一正样本数据及第一负样本数据;基于预设的第一配置信息,获取知识库中的第二正样本数据及第二负样本数据;以及基于所述第一正样本数据、第一负样本数据、第二正样本数据及第二负样本数据,对意图识别模型进行训练;其中,所述意图识别模型用于对用户输入的查询语句进行意图识别。
在本公开一个实施例中,基于各组用户交互数据,生成第一正样本数据及第一负样本数据,包括:将所述用户查询数据与所述用户选择数据组成第一正样本数据;及基于预设的第二配置信息,将所述用户查询数据分别与所述推荐意图数据列表中未被选择的全部或部分意图数据,组成第一负样本数据。
在本公开一个实施例中,所述交互日志数据不包括用户从所述推荐意图数据列表中选择所述用户选择数据后,再转入人工操作的用户交互数据。
在本公开一个实施例中,所述第二配置信息用于配置所述第一负样本数据的比例,所述比例包括选取用于组成所述第一负样本数据的、所述推荐意图数据列表中未被选择的意图数据的选取比例。
在本公开一个实施例中,所述第二正样本数据包括:所述知识库中各意图分别与各意图下不同表述数据组成的样本数据及各意图下不同表述数据相互组成的样本数据;所述第二负样本数据包括:所述知识库中各意图分别与预选的其他意图下不同表述数据组成的样本数据及各意图下不同表述数据分别与预选的其他意图下不同预选表述数据相互组成的样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010191431.6/2.html,转载请声明来源钻瓜专利网。