[发明专利]交互意图路径的挖掘方法以及装置有效
申请号: | 201911337912.7 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111046145B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 严文君;潘岩;高俊鑫;刘磊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G10L15/26 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 310013 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互 意图 路径 挖掘 方法 以及 装置 | ||
本说明书实施例提供交互意图路径的挖掘方法以及装置,其中所述交互意图路径的挖掘方法包括:获取交互过程中用户输入的用户语音信息对应的文本数据;对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着人工智能的发展,智能机器人以更低的成本和更高的产能,进一步地推动了营销业务的发展。然而智能机器人的智能系统的质量极大地取决于知识库对于可能发生的用户提问的覆盖程度,由于每日会从业务场景中新增大量用户的用户语音信息,这些语料可以作为扩充知识库的重要来源。而这些用户语音信息有着严重的同质性,不同的语句可能包含着相同的意图,另一方面,过多冗余语料的引入不利于知识库的构建和维护,因此如何构建以及有效更新知识库成为一个亟待解决的重要问题。
发明内容
有鉴于此,本说明书实施例提供了一种交互意图路径的挖掘方法。本说明书一个或者多个实施例同时涉及一种交互意图路径的挖掘装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种交互意图路径的挖掘方法,包括:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
可选的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
可选的,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,将所述任意一个交互意图路径加入所述意图知识库。
可选的,所述将所述任意一个交互意图路径加入所述意图知识库步骤执行之后,还包括:
获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立所述回复信息与所述新增的交互意图路径的关联关系。
可选的,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。
可选的,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911337912.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种以胶基为载体的槟榔的制作方法
- 下一篇:一种工业大麻的种植方法