[发明专利]一种智能问答系统知识-问题匹配的方法及装置有效
申请号: | 201710513108.4 | 申请日: | 2017-06-29 |
公开(公告)号: | CN107239574B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 陈飞;崔培君;乔思龙;王萌萌 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 问答 系统 知识 问题 匹配 方法 装置 | ||
1.一种智能问答系统的知识-问题匹配方法,其特征在于,该方法包括:
获取客户端发送的问题;
利用知识词和问题词分别获取每一条备选知识与所述问题的权重相似度;
利用知识词和问题词分别获取每一条所述备选知识与所述问题的向量相似度;
利用所述权重相似度和所述向量相似度,分别计算每一条备选知识与所述问题的总相似度;
获取总相似度符合预设规则的备选知识,作为与所述问题相匹配的知识;
所述利用知识词和问题词分别获取每一条所述备选知识与所述问题的权重相似度包括:
获取备选知识中知识词的权重;
根据预设的权重赋予规则给问题中问题词赋予权重;
利用知识词的权重与问题词的权重计算所述权重相似度;
所述获取备选知识中知识词的权重,包括:
获取每个知识词的权重,所述知识词的权重为所述知识词在本条知识中的权重;
对所述每个知识词的权重进行归一化处理;
其中,所述总相似度根据下述公式I进行计算:
D总=a*D权重+b*D向量 公式I
其中,D总表示总相似度,
D权重表示权重相似度,
D向量表示向量相似度,
a表示第一预设系数,
b表示第二预设系数,
并且,0<a<1,a+b=1。
2.根据权利要求1所述的方法,其特征在于,
所述知识词通过以下方法获得:
对所述备选知识进行分词处理;
去掉分词处理结果中的停用词,从而获得所述备选知识中的知识词;
所述问题词通过以下方法获得:
对所述问题进行分词处理;
去掉分词处理结果中的停用词,从而获得所述问题中的问题词。
3.根据权利要求1或2所述的方法,其特征在于,所述利用知识词和问题词分别获取每一条所述备选知识与所述问题的向量相似度,包括:
获取所述备选知识的向量;
获取所述问题的向量;
利用所述备选知识的向量和所述问题的向量计算所述向量相似度。
4.一种智能问答系统的知识-问题匹配装置,其特征在于,该装置包括:
问题获取单元,用于获取客户端发送的问题;
权重相似度获取单元,用于利用知识词和问题词分别获取每一条备选知识与所述问题的权重相似度;
向量相似度获取单元,用于利用知识词和问题词分别获取每一条所述备选知识与所述问题的向量相似度;
总相似度计算单元,用于利用所述权重相似度和所述向量相似度,分别计算每一条备选知识与所述问题的总相似度;
知识-问题匹配单元,用于获取总相似度符合预设规则的备选知识,作为与所述问题相匹配的知识;
所述权重相似度获取单元包括:
知识词权重获取子单元,用于获取备选知识中知识词的权重;
问题词权重赋予子单元,用于根据预设的权重赋予规则给问题中问题词赋予权重;
权重相似度计算子单元,用于利用知识词的权重与问题词的权重计算所述权重相似度;
所述知识词的权重获取子单元包括:
普通权重获取从单元,用于获取每个知识词的权重,所述知识词的权重为所述知识词在本条知识中的权重;
归一化处理从单元,用于对所述每个知识词的权重进行归一化处理;
其中,所述总相似度根据下述公式I进行计算:
D总=a*D权重+b*D向量 公式I
其中,D总表示总相似度,
D权重表示权重相似度,
D向量表示向量相似度,
a表示第一预设系数,
b表示第二预设系数,
并且,0<a<1,a+b=1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710513108.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据过滤方法
- 下一篇:城市道路暴雨内涝风险分析与预警智联网服务系统及方法