[发明专利]实现智能问答的方法和系统有效
| 申请号: | 201510017563.6 | 申请日: | 2015-01-14 |
| 公开(公告)号: | CN104573028B | 公开(公告)日: | 2019-01-25 |
| 发明(设计)人: | 马艳军;李国华;孙兴武;李兴建;张伟萌;韦豪杰;廖梦;宗明;张希娟;吴华;王海峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F17/27 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 路凯;胡彬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检索处理 检索系统 语义分析 知识库 准确度 结果返回 挖掘系统 语义关系 智能 问答库 有效地 正文库 查询 答案 | ||
1.一种实现智能问答的方法,其特征在于,包括:
接收待查询的问题;
对所述问题进行语义分析;
根据所述语义分析的结果对所述问题进行相应的检索处理,其中,所述检索处理包括:基于预设分发策略,将所述问题分发到语义关系挖掘系统、正文库检索系统、知识库检索系统和问答库检索系统中至少一个系统进行检索处理,所述语义关系挖掘系统对所述问题进行检索处理,包括:从三元关系库中查找得到所述问题的答案,所述三元关系库中的三元关系涵盖了以动词为核心的依存关系、实体与属性的依存关系以及不同实体之间的依存关系,所述三元关系库的建立,包括:
对网络中的原始网页进行语法分析,得到具有依存关系的句子;
提取依存关系的节点,得到三元关系对;
对所述三元关系对进行合理性验证,利用验证通过的三元关系对建立所述三元关系库;
根据检索处理结果返回答案。
2.根据权利要求1所述的方法,其特征在于,对所述问题进行语义分析,包括:
识别所述问题的焦点、观点及观点类型。
3.根据权利要求2所述的方法,其特征在于,识别所述问题的观点类型之后,所述方法还包括:
对所述问题的观点类型进行归一化处理。
4.根据权利要求1-3任一项所述的方法,其特征在于,根据所述语义分析的结果对所述问题进行相应的检索处理,包括:
当分析的问题类型为结构上的依存类型时,所述语义关系挖掘系统对所述问题进行检索处理,否则,所述正文库检索系统、知识库检索系统和问答库检索系统对所述问题进行检索处理。
5.根据权利要求1所述的方法,其特征在于,得到具有依存关系的句子之前,还包括:
去除句子中的括号内的内容。
6.根据权利要求1所述的方法,其特征在于,得到三元关系对之前,还包括:
补充所述具有依存关系的句子中缺失的主语、状语和宾语中的至少一项。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述正文库检索系统对所述问题进行检索处理,包括:
搜索出与所述问题相关的文档集合;
从所述文档集合中查找候选片段,其中,所述候选片段中包含有候选答案;
从所述候选片段中抽取所述候选答案,并进行第一次排序。
8.根据权利要求7所述的方法,其特征在于,进行第一次排序,包括:
根据统一资源定位符URL权值、偏移权值和问题匹配度中的至少一个特征进行排序,其中,所述URL权值为所述候选答案所属文档所属站点和URL链接的权值,所述偏移权值为所述候选答案在不同候选片段中与所述问题中关键词的距离系数,所述问题匹配度为所述候选答案与所述问题的观点类型的语义匹配度。
9.根据权利要求1-3任一项所述的方法,根据检索处理结果返回答案,包括:
利用领域内知识对所述检索处理结果进行过滤;
根据过滤结果返回答案。
10.根据权利要求9所述的方法,根据过滤结果返回答案,包括:
对所述过滤结果进行第二次排序;
将排序后的过滤结果返回。
11.根据权利要求10所述的方法,根据过滤结果返回答案,对所述过滤结果进行第二次排序,包括:
使用有监督的机器学习模型对所述过滤结果进行排序。
12.根据权利要求9所述的方法,根据过滤结果返回答案,包括:
对所述过滤结果进行第三次排序;
将排序后的过滤结果返回。
13.根据权利要求12所述的方法,对所述过滤结果进行第三次排序,包括:
验证候选答案与所述问题的匹配程度;
根据所述匹配程度对所述候选答案进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510017563.6/1.html,转载请声明来源钻瓜专利网。





