[发明专利]智能问答方法及系统在审
| 申请号: | 201610125795.8 | 申请日: | 2016-03-04 |
| 公开(公告)号: | CN107153639A | 公开(公告)日: | 2017-09-12 |
| 发明(设计)人: | 卢菁;马佳乐;叶茂;汤帜;黄肖俊;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李相雨 |
| 地址: | 100871 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 问答 方法 系统 | ||
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种智能问答方法及系统。
背景技术
智能问答系统是基于海量互联网数据推理和对语言深度语义理解的智能系统。智能问答机器系统不仅可以回答知识类的问题,还可用于医疗、教育、生活、科技等各种与人们生活息息相关的领域,大幅提升人们获取信息的效率。
现有的智能问答系统主要是基于社区的问答,通过对历史用户问题/回答数据进行挖掘,计算用户问题与问答站点中已有的问题之间的相似度,返回相似度高的用户回答。
上述智能问答系统存在的缺陷在于:语句被当成词袋模型进行处理,导致缺乏对句法结构的理解;对一些特殊情况缺乏有效的处理能力,使得系统缺乏鲁棒性。
发明内容
针对现有技术中的缺陷,本发明提供一种智能问答方法及系统,通过对字词进行处理可以提高对特殊情况的处理能力,提高方法的鲁棒性。
第一方面,本发明提供了一种智能问答方法,包括:
从用户终端获取用户输入的问题并使用分词器对其分词;
将分词后的用户输入的问题与问答库中的每个问题依次比较,以获取所述问答库中的每个问题的相似度;所述问答库通过选取预设数量的由一一对应的问题与答案构成的问答对构建;
对所述问答库中的每个问题的相似度进行排序,将相似度排序靠前的N个问答对传输至所述用户终端,N为正整数。
可选地,所述相似度是通过对词义相似度、语序相似度和句子长度维数加权求和所得到的数值。
可选地,所述将分词后的用户输入的问题与问答库中的每个问题依次比较,以获取所述问答库中的每个问题的相似度的步骤包括:
根据所述分词在所述问答库中检索候选问题,并对所述候选问题进行排序;
从排序后的候选问题中取前M个问答对与所输入的问题进行相似度计算,M>N。
可选地,使用分词器对所述输入的问题进行分词的步骤之后,所述方法还包括:
将所述输入的问题的分词与停用表进行匹配,去除上述分词中的停用词。
可选地,采用TF-IDF算法检索候选问答对并对候选问答对进行排序。
可选地,所述从排序后的候选问题中取前M个问答对与所输入的问题进行相似度计算的步骤包括:
从输入的问题与问答库中每个问题选择连续出现的至少两个分词;
计算所述至少两个分词的内聚程度;所述内聚程度InnerLevel通过以下公式计算:
式中,P(A)表示分词A出现的概率;P(B)表示分词B出现的概率;P(AB)表示分词A与分词B同时出现的概率;
将内聚程度超过预设内聚程度值的分词进行合并。
可选地,所述将内聚程度超过预设内聚程度值的分词进行合并的步骤之后,所述方法还包括:
采用TF-IDF算法对M个问答对进行排序,并且每个分词的得分作为词语相似度权重。
可选地,本发明实施例提供的智能问答方法还包括:
当从所述问题库中找到的候选问答对为N1个时,N1<N,采用拒绝算法对该N1个问答对进行剔除;
所述拒绝算法为:
除去形容词与副词后,若第一候选问答对中不包含词语动态权重排序靠前的前N2个分词及其扩展词时,拒绝该问答对;
或者,
计算该N1个候选问答对中前面一个与后面一个候选问答对的得分差值百分比;
当该得分差值百分比小于预设得分差值百分比时,则拒绝后面一个候选问答对以其之后的所有问答对。
第二方面,本发明实施例还提供了一种智能问答系统,基于上文所述的智能问答方法实现,所述系统包括:
问答库构建模块,用于选取预设数量的由一一对应的问题与答案构成的问答对构建问答库;
分词获取模块,用于从用户终端获取用户输入的问题并使用分词器对其分词;
相似度计算模块,用于将分词后的用户输入的问题与问答库中的每个问题依次比较,以获取所述问答库中的每个问题的相似度;
问答对返回模块,用于对所述问答库中的每个问题的相似度进行排序,将相似度排序靠前的N个问答对传输至所述用户终端。
可选地,所述相似度计算模块用于执行以下步骤:
根据所述分词在所述问答库中检索候选问题,并对所述候选问题进行排序;
从排序后的候选问题中取前M个问答对与所输入的问题进行相似度计算,M<N。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司,未经北大方正集团有限公司;北京方正阿帕比技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610125795.8/2.html,转载请声明来源钻瓜专利网。





