[发明专利]交互意图路径的挖掘方法以及装置有效
申请号: | 201911337912.7 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111046145B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 严文君;潘岩;高俊鑫;刘磊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G10L15/26 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 310013 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互 意图 路径 挖掘 方法 以及 装置 | ||
1.一种交互意图路径的挖掘方法,包括:
获取交互过程中用户输入的用户语音信息对应的文本数据;
对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元;
将所述词单元依次与多个词桶规则匹配,根据匹配结果提取与所述词桶规则匹配的词桶词单元;
按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径。
2.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
统计更新周期内生成的全量交互意图路径中各个交互意图路径的频次;
在所述各个交互意图路径中筛选出所述频次大于路径频次阈值的交互意图路径;
针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为所述更新周期内更新的交互意图路径。
3.根据权利要求2所述的交互意图路径的挖掘方法,所述针对筛选出的交互意图路径进行去重,将去重后的交互意图路径作为更新周期内更新的交互意图路径步骤执行之后,还包括:
通过将所述更新周期内更新的交互意图路径中任意一个交互意图路径与意图知识库中的交互意图路径进行对比的方式,判断所述任意一个交互意图路径是否存在于所述意图知识库;
若否,将所述任意一个交互意图路径加入所述意图知识库。
4.根据权利要求3所述的交互意图路径的挖掘方法,所述将所述任意一个交互意图路径加入所述意图知识库步骤执行之后,还包括:
获取所述意图知识库中新增的交互意图路径对应的回复信息;
建立所述回复信息与所述新增的交互意图路径的关联关系。
5.根据权利要求1所述的交互意图路径的挖掘方法,所述按照所述词桶规则的规则顺序对所述词桶词单元进行串联,生成所述语句对应的交互意图路径步骤执行之后,还包括:
根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表。
6.根据权利要求5所述的交互意图路径的挖掘方法,所述根据所述语句中未与所述词桶规则匹配的词单元,更新词单元频次表步骤执行之后,还包括:
提取更新周期内所述词单元频次表中频次大于频次阈值的词单元;
将所述频次大于频次阈值的词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径。
7.根据权利要求6所述的交互意图路径的挖掘方法,所述将所述词单元作为新词单元嵌入包含所述新词单元的语句对应的交互意图路径步骤执行之后,还包括:
根据所述新词单元创建新词桶规则;
按照所述新词单元的频次从高到低将对应的新词桶规则进行排序,获得新词桶规则的新规则顺序;
将所述新规则顺序嵌入所述规则顺序。
8.根据权利要求1所述的交互意图路径的挖掘方法,所述获取交互过程中用户输入的用户语音信息对应的文本数据,包括:
获取交互过程中用户输入的超过一轮交互的用户语音信息;
通过语音识别将所述用户语音信息转化为文本数据。
9.根据权利要求8所述的交互意图路径的挖掘方法,所述获取交互过程中用户输入的用户语音信息对应的文本数据步骤执行之后,并所述对所述文本数据中包含的语句进行分词处理,获得所述语句的词单元步骤执行之前,还包括:
根据预设词典对所述文本数据进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911337912.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种以胶基为载体的槟榔的制作方法
- 下一篇:一种工业大麻的种植方法