[发明专利]一种智能问答系统知识-问题匹配的方法及装置有效
申请号: | 201710513108.4 | 申请日: | 2017-06-29 |
公开(公告)号: | CN107239574B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 陈飞;崔培君;乔思龙;王萌萌 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 问答 系统 知识 问题 匹配 方法 装置 | ||
本申请公开了一种智能问答系统的知识‑问题匹配方法及装置,在所述匹配方法中融合了权重相似度和向量相似度两种相似度评价体系,弥补了单一相似度评价方式存在的系统误差,而且,本申请的方案在计算权重相似度和向量相似度之前,对分词结果进行了预处理,去除分词结果中的停用词,减小了误触率,此外,对预处理后得到的知识词的权重进行了归一化处理,使其阈值在[0,1],减小了由于不同知识词权重差别大而导致的权重相似度计算偏差,从而使得问题与备选知识的权重相似度更加准确,进而提高了总相似度的准确性,进一步提高了智能问答系统知识‑问题匹配的准确性。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种智能问答系统知识与问题匹配的方法及装置。
背景技术
智能问答系统是一种通过人机互动客户自助查询问题答案的系统,通常包括网络连接的客户端和服务器,服务器中预置有知识库和与知识库对应的答案库,知识库中的知识与答案库中的答案一一对应,服务器根据从客户端获取的问题的文本,匹配预置知识库中的知识,再将所述知识对应的答案返回给客户端以解答客户的问题。
匹配问题文本与预置知识通常有两种方法,第一种是基于用户输入问题的文本与预置知识库中知识相同,第二种是基于用户输入问题的文本与预置知识库中知识的相似度最高。对于第一种方式,用户提出的问题与数据库中的问题往往不完全相同,例如,预先建立的知识库中包含四条知识:1.信用卡办理流程、2.信用卡注销流程、3.公交卡办理流程和4.公交卡注销流程,当客户输入“信用卡办理流程”时,智能问答系统则会匹配知识1,当客户输入“信用卡怎么办理”时,智能问答系统则无法匹配成功。对于第二种方式,常用的相似度计算方法存在系统性的偏差,经常出现问题与对应知识的相似度并不是最大值,可能导致问题与知识匹配错误,进而导致出现答非所问的情况,如上述示例中,当客户输入“信用卡怎么办理”时,智能问答系统认为该问题与3的相似度最高,而为客户提供了3相对应的答案,即,该方法的准确性差。
因此,亟待开发一种用于智能问答系统,根据用户的模糊提问能够准确匹配相关知识的方法及装置。
发明内容
本申请提供了一种智能问答系统知识-问题匹配的方法以及装置,以解决智能问答系统问题与知识匹配不准确,导致提取的答案准确率低的问题。
本发明的目的在于提供以下几个方面:
第一方面,本申请提供了一种智能问答系统知识-问题匹配的方法,该方法包括:
获取客户端发送的问题;
利用知识词和问题词分别获取每一条备选知识与所述问题的权重相似度;
利用知识词和问题词分别获取每一条所述备选知识与所述问题的向量相似度;
利用所述权重相似度和所述向量相似度,分别计算每一条备选知识与所述问题的总相似度;
获取总相似度符合预设规则的备选知识,作为与所述问题相匹配的知识。
可选地,在所述分别获取每一条备选知识与所述问题的权重相似度之前还包括:
生成知识库,所述知识库中包含至少一条所述备选知识;
知识预处理,对所述备选知识进行分词处理,去掉分词处理结果中的停用词,从而获得所述备选知识中的知识词。
可选地,所述知识词通过以下方法获得:
对所述备选知识进行分词处理;
去掉分词处理结果中的停用词,从而获得所述备选知识中的知识词;
可选地,所述问题词通过以下方法获得:
对所述问题进行分词处理;
去掉分词处理结果中的停用词,从而获得所述问题中的问题词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710513108.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据过滤方法
- 下一篇:城市道路暴雨内涝风险分析与预警智联网服务系统及方法