[发明专利]一种自适应不同领域知识图谱的智能问答系统及其构建方法在审
| 申请号: | 202210199670.5 | 申请日: | 2022-03-01 |
| 公开(公告)号: | CN115080710A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 徐永林;文辉;王文广;纪达麒;陈运文 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/35;G06F40/289 |
| 代理公司: | 上海智力专利商标事务所(普通合伙) 31105 | 代理人: | 周涛 |
| 地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自适应 不同 领域 知识 图谱 智能 问答 系统 及其 构建 方法 | ||
1.一种自适应不同领域知识图谱的智能问答系统构建方法,其特征在于,该方法具体包括以下步骤:
S1,通过利用命名实体识别技术、结巴切词技术、全文检索技术、语义匹配技术和同义词策略进行用户问句分析;
S2,获取知识图谱中的图谱数据和图谱模式,所述图谱数据包括实体值和属性值,基于S1中得到的用户问句分析结果,通过对图谱数据和图谱模式进行排列组合生成候选的问句组合特征列表;
S3,三级知识检索器包括第一检索器、第二检索器和第三检索器,在知识检索阶段,基于S2中生成的问句组合特征列表,通过三级知识检索器从图数据库中获得与候选问句对应的候选答案;
S4,候选答案处理模块通过统计意图分类模型、答案排序模型和答案自然语言化模型对S3中生成的候选答案进行统计转换、排序和自然语言化,生成最终答案发送给用户。
2.根据权利要求1所述的一种自适应不同领域知识图谱的智能问答系统构建方法,其特征在于,所述S1中的构建用户问句分析模块的具体包括以下步骤:
S11,通过利用命名实体识别技术构建命名实体识别模型对用户问句进行图谱数据的实体识别,利用所标注的知识图谱的实体、关系和属性相关词汇所在的句子及其标注值和构建知识图谱中的Subject,Predict,Object三元组构建训练模型语料,通过训练语料优化命名实体识别模型效果,其中,三元组包括实体,实体属性名称,实体属性值和实体,关系,实体;
S12,利用结巴切词技术将图谱模式导入到切词词典中,利用切词词典从用户问句中提取与图谱模式相关的词汇,图谱模式包括实体类型名称,实体属性名称,关系类型名称和关系属性名称;
S13,利用全文检索技术将图谱数据导入到全文检索引擎的词典中,利用Elasticsearch工具从用户问句中提取与图谱数据相关的词汇和枚举字符串形式的属性值,全文检索技术基于还将用于召回命名实体识别相关的候选实体词汇,并利用语义匹配技术进行实体链接,获得准确的图谱数据相关的实体词汇;
S14,构建配置好的实体同义词词典和图谱模式同义词词典,通过实体同义词词典和图谱模式同义词词典扩展所检测到的实体词汇和图谱模式词汇,通过同义词策略进行同义替换,找到图谱数据中真实存在的实体词汇和图谱模式中真实存在的词汇。
3.根据权利要求1所述的一种自适应不同领域知识图谱的智能问答系统构建方法,其特征在于,所述S2中的问句组合特征列表将检索的图谱数据词汇和图谱模式词汇进行排列组合,得到所有问句组合情况。
4.根据权利要求1所述的一种自适应不同领域知识图谱的智能问答系统构建方法,其特征在于,所述S3中的第一级知识检索器为通过创建检索问句模板所建构的一个规则引擎,在知识检索阶段作为第一级知识检索器,在知识检索阶段,快速的配置进行意图判定的问句模板和目标检索语句,并支持不同规则之间的“与、或和条件”的任意组合,实现创建的问句模板的复用。
5.根据权利要求1所述的一种自适应不同领域知识图谱的智能问答系统构建方法,其特征在于,所述S3中的第二级知识检索器为基于意图分析的建立的第二级知识检索器,在知识检索阶段,当第一级知识检索器无法检索到有效的候选答案,则进行第二级知识检索器的运行,第二级知识检索器构建一个意图分类模型,该模型基于收集的开源语料和新标注语料训练得到,依据从知识图谱中获取的图谱数据和图谱模式进行二次检索得到候选答案。
6.根据权利要求1所述的一种自适应不同领域知识图谱的智能问答系统构建方法,其特征在于,所述S3中的第三级知识检索器为知识检索阶段的最后一级兜底检索器,在知识检索阶段,当第一级知识检索器和第二级知识检索器无法检索到有效的候选答案,则进行第三级知识检索器的运行,所述第三级知识检索器利用问句分析阶段所检测到的问句组合特征列表直接与知识图谱三元组数据中进行语义匹配检索,最终获得用户问句候选答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210199670.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示系统和显示装置
- 下一篇:拖擦模块的更换方法以及更换基站





