[发明专利]文本相似度的计算、智能客服系统的实现方法和装置在审
| 申请号: | 201811548126.7 | 申请日: | 2018-12-18 |
| 公开(公告)号: | CN110059155A | 公开(公告)日: | 2019-07-26 |
| 发明(设计)人: | 曹绍升;张建海;周俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F17/27 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 文本相似度 向量集合 方法和装置 计算相似度 客服系统 笔画 算法 词语 分词处理 粒度计算 输入参数 文本生成 智能 相似度 分词 向量 | ||
1.一种文本相似度的计算方法,包括:
对待计算相似度的文本进行分词处理,将所述文本划分为一个或多个词语;
采用cw2vec算法为分词后的文本生成对应的向量集合,所述向量集合包括所述文本中各词语的N元笔画向量;
将待计算相似度的文本所对应的向量集合作为输入参数,采用IWAN算法以N元笔画为粒度计算所述文本之间的相似度。
2.根据权利要求1所述的方法,
所述N元笔画向量是将所述词语基于笔画进行拆分后,连续N个笔画对应的向量。
3.一种智能客服系统的实现方法,包括:
对用户提交的客服问题进行分词处理,将所述客服问题划分为一个或多个词语;
采用cw2vec算法为分词后的客服问题生成对应的向量集合,所述向量集合包括所述客服问题中各词语的N元笔画向量;
将所述客服问题的向量集合分别和各标准问题的向量集合作为输入参数,采用IWAN算法以N元笔画为粒度计算所述客服问题和所述标准问题的相似度;
确定与所述客服问题的相似度满足预定相似度条件的标准问题,并将所述标准问题的答案返回给所述用户。
4.根据权利要求3所述的方法,还包括:
根据所述客服问题的分词结果判断所述客服问题与各标准问题之间的词语匹配率;
当不存在词语匹配率满足预定匹配条件的标准问题时,执行采用cw2vec算法为分词后的客服问题生成对应的向量集合的步骤。
5.根据权利要求4所述的方法,还包括:
当存在词语匹配率满足预定匹配条件的标准问题时,将所述标准问题对应的答案返回给所述用户。
6.一种文本相似度的计算装置,包括:
分词处理单元,对待计算相似度的文本进行分词处理,将所述文本划分为一个或多个词语;
向量生成单元,采用cw2vec算法为分词后的文本生成对应的向量集合,所述向量集合包括所述文本中各词语的N元笔画向量;
相似度计算单元,将待计算相似度的文本所对应的向量集合作为输入参数,采用IWAN算法以N元笔画为粒度计算所述文本之间的相似度。
7.一种智能客服系统的实现装置,包括:
分词处理单元,对用户提交的客服问题进行分词处理,将所述客服问题划分为一个或多个词语;
向量生成单元,采用cw2vec算法为分词后的客服问题生成对应的向量集合,所述向量集合包括所述客服问题中各词语的N元笔画向量;
相似度计算单元,将所述客服问题的向量集合分别和各标准问题的向量集合作为输入参数,采用IWAN算法以N元笔画为粒度计算所述客服问题和所述标准问题的相似度;
答案返回单元,确定与所述客服问题的相似度满足预定相似度条件的标准问题,并将所述标准问题的答案返回给所述用户。
8.根据权利要求7所述的装置,还包括:
匹配率计算单元,根据所述客服问题的分词结果判断所述客服问题与各标准问题之间的词语匹配率;
所述向量生成单元,在不存在词语匹配率满足预定匹配条件的标准问题时,执行采用cw2vec算法为分词后的客服问题生成对应的向量集合的步骤。
9.根据权利要求8所述的装置,
所述答案返回单元,在存在词语匹配率满足预定匹配条件的标准问题时,将所述标准问题对应的答案返回给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811548126.7/1.html,转载请声明来源钻瓜专利网。





