[发明专利]智能问答方法及系统在审
| 申请号: | 201610125795.8 | 申请日: | 2016-03-04 |
| 公开(公告)号: | CN107153639A | 公开(公告)日: | 2017-09-12 |
| 发明(设计)人: | 卢菁;马佳乐;叶茂;汤帜;黄肖俊;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李相雨 |
| 地址: | 100871 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 问答 方法 系统 | ||
1.一种智能问答方法,其特征在于,包括:
从用户终端获取用户输入的问题并使用分词器对其分词;
将分词后的用户输入的问题与问答库中的每个问题依次比较,以获取所述问答库中的每个问题的相似度;所述问答库通过选取预设数量的由一一对应的问题与答案构成的问答对构建;
对所述问答库中的每个问题的相似度进行排序,将相似度排序靠前的N个问答对传输至所述用户终端,N为正整数。
2.根据权利要求1所述的智能问答方法,其特征在于,所述相似度是通过对词义相似度、语序相似度和句子长度维数加权求和所得到的数值。
3.根据权利要求1或2所述的智能问答方法,其特征在于,所述将分词后的用户输入的问题与问答库中的每个问题依次比较,以获取所述问答库中的每个问题的相似度的步骤包括:
根据所述分词在所述问答库中检索候选问题,并对所述候选问题进行排序;
从排序后的候选问题中取前M个问答对与所输入的问题进行相似度计算,M>N。
4.根据权利要求3所述的智能问答方法,其特征在于,使用分词器对所述输入的问题进行分词的步骤之后,所述方法还包括:
将所述输入的问题的分词与停用表进行匹配,去除上述分词中的停用词。
5.根据权利要求3所述的智能问答方法,其特征在于,采用TF-IDF算法检索候选问答对并对候选问答对进行排序。
6.根据权利要求3所述的智能问答方法,其特征在于,所述从排序后的候选问题中取前M个问答对与所输入的问题进行相似度计算的步骤包括:
从输入的问题与问答库中每个问题选择连续出现的至少两个分词;
计算所述至少两个分词的内聚程度;所述内聚程度InnerLevel通过以下公式计算:
式中,P(A)表示分词A出现的概率;P(B)表示分词B出现的概率;P(AB)表示分词A与分词B同时出现的概率;
将内聚程度超过预设内聚程度值的分词进行合并。
7.根据权利要求6所述的智能问答方法,其特征在于,所述将内聚程度超过预设内聚程度值的分词进行合并的步骤之后,所述方法还包括:
采用TF-IDF算法对M个问答对进行排序,并且每个分词的得分作为词语相似度权重。
8.根据权利要求1所述的智能问答方法,其特征在于,所述方法还包括:
当从所述问题库中找到的候选问答对为N1个时,N1<N,采用拒绝算法对该N1个问答对进行剔除;
所述拒绝算法为:
除去形容词与副词后,若第一候选问答对中不包含词语动态权重排序靠前的前N2个分词及其扩展词时,拒绝该问答对;
或者,
计算该N1个候选问答对中前面一个与后面一个候选问答对的得分差值百分比;
当该得分差值百分比小于预设得分差值百分比时,则拒绝后面一个候选问答对以其之后的所有问答对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司,未经北大方正集团有限公司;北京方正阿帕比技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610125795.8/1.html,转载请声明来源钻瓜专利网。





