[发明专利]一种生成六维知识图谱的系统在审
申请号: | 201911370190.5 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111078897A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 曾勇 | 申请(专利权)人: | 国衡智慧城市科技研究院(北京)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06Q50/26 |
代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 陈万江 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 知识 图谱 系统 | ||
本发明涉及政务问询技术领域,尤其涉及一种生成六维知识图谱的系统,包括知识库、领域识别模块、意图识别模块、槽填充模块、相似度计算模块和评价模块;所述知识库为来自政府站点和各种垂直站点的民生、企业、办事领域的半结构化和结构化数据;所述领域识别模块用于对用户咨询的问题进行识别和划分相对应的政务领域;本发明在政务信息服务方面、政府网站智能搜索系统、智能问答系统,提供民生办事领域、政策咨询、投诉建议等交互服务。知识图谱是AI核心基础能力,在为政务知识库构建,比如政府门户网站知识库、AI人工智能+政务层面、政府部门专题分析和决策研究和舆情监控等方面提供基础的数据支持。
技术领域
本发明涉及政务问询技术领域,尤其涉及一种生成六维知识图谱的系统。
背景技术
知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。迄今为止,其实际应用在发达国家已经逐步拓展并取得了较好的效果,但它在我国仍属研究的起步阶段。
发明内容
有鉴于此,本发明的目的是提供一种生成六维知识图谱的系统,本发明在政务信息服务方面、政府网站智能搜索系统、智能问答系统,提供民生办事领域、政策咨询、投诉建议等交互服务。知识图谱是AI核心基础能力,在为政务知识库构建,比如政府门户网站知识库、 AI(人工智能)+政务层面、政府部门专题分析和决策研究和舆情监控等方面提供基础的数据支持。
本发明的目的是提供一种生成六维知识图谱的系统,包括知识库、领域识别模块、意图识别模块、槽填充模块、相似度计算模块和评价模块;所述知识库为来自政府站点和各种垂直站点的民生、企业、办事领域的半结构化和结构化数据;所述领域识别模块用于对用户咨询的问题进行识别和划分相对应的政务领域;所述意图识别模块对用户咨询的问题是否在相对应的政务领域,以及咨询的意图目的是否明确进行判断,意图识别模块的下一步与槽填充模块和相似度计算模块连接;所述槽填充模块根据与用户追问问答的过程中从数据库获取信息进行咨询问题的填充,所述槽填充模块下一步与相似度计算模块连接;所述相似度计算模块从知识库中的垂直站点和政府站点数据进行相似的数据获取,然后统计特定的指标生成问答答案;所述用户通过评价模块对生成的问答答案进行打分评价。
进一步,为了提高搜索质量,特别是提供如对话搜索和复杂问答等新的搜索体验,不仅要求知识图谱包含大量高质量的常识性知识,还要能及时发现并添加新的知识。在这种背景下,知识图谱通过自动提取来自政府站点和各种垂直站点的结构化数据来覆盖大部分常识性知识。为防止智能图谱自动学习模式获得的知识出现错误(比如可能会遗漏部分重要的属性,也可能产生错误的抽取结果),本发明通过构建工具来可视化这些模式,并人工调整或新增合适的模式用于抽取。此外,通过人工评估抽取的结果,将那些抽取结果不令人满意的典型数据进行再标注来更新训练样本,从而达到主动学习的目的。
而另一方面,通过搜索日志发现新的实体或新的实体属性从而不断扩展知识图谱的覆盖率。相比高质量的常识性知识,通过数据挖掘抽取得到的知识数据更大,更能反映当前用户的查询需求并能及时发现最新的实体或事实,但其质量相对较差,存在一定的错误。这些知识通过应用到智能问答项目中反复测试、总结、评估其置信度,最后通过人工审核加入到知识图谱中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国衡智慧城市科技研究院(北京)有限公司,未经国衡智慧城市科技研究院(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911370190.5/2.html,转载请声明来源钻瓜专利网。