[发明专利]一种生成六维知识图谱的系统在审
申请号: | 201911370190.5 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111078897A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 曾勇 | 申请(专利权)人: | 国衡智慧城市科技研究院(北京)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06Q50/26 |
代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 陈万江 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 知识 图谱 系统 | ||
1.一种生成六维知识图谱的系统,其特征在于,包括知识库、领域识别模块、意图识别模块、槽填充模块、相似度计算模块和评价模块;
所述知识库为来自政府站点和各种垂直站点的民生、企业、办事领域的半结构化和结构化数据;
所述领域识别模块用于对用户咨询的问题进行识别和划分相对应的政务领域;
所述意图识别模块对用户咨询的问题是否在相对应的政务领域,以及咨询的意图目的是否明确进行判断,意图识别模块的下一步与槽填充模块和相似度计算模块连接;
所述槽填充模块根据与用户追问问答的过程中从数据库获取信息进行咨询问题的填充,所述槽填充模块下一步与相似度计算模块连接;
所述相似度计算模块从知识库中的垂直站点和政府站点数据进行相似的数据获取,然后统计特定的指标生成问答答案;
所述用户通过评价模块对生成的问答答案进行打分评价。
2.根据权利要求1所述的一种生成六维知识图谱的系统,其特征在于,所述领域识别模块从人工标注的数据中抽取特征,并进行分类器的训练。
3.根据权利要求1所述的一种生成六维知识图谱的系统,其特征在于,所述槽填充模块针对与客户追问的问答中的文本信息进行设计标签和编写特征模块,然后将标签和特征模块进行模型训练并存储到政务知识图谱中。
4.根据权利要求1所述的一种生成六维知识图谱的系统,其特征在于,所述相似度计算模块从站点数据和垂直站点数据进行数据抓取,然后对抓取的数据进行结构化的处理存储到政务知识图谱中,自动对结构化的数据进行打分并增加到知识库。
5.根据权利要求1所述的一种生成六维知识图谱的系统,其特征在于,所述评价模块通过核查用户对答案的评价“不满意”数据或搜索历史日志数据人工调整或者添加模型用于抽取知识,将这些知识通过模型自动训练,最后通过人工审核加入到知识图谱中,进一步完善政务知识图谱。
6.根据权利要求1所述的一种生成六维知识图谱的系统,其特征在于,所述数据获取是从各种类型的数据源抽取构建知识图谱所需的各种候选实体及其属性关联,形成了一个个孤立的抽取知识,将这些信息孤岛集成在一起,形成政务知识图谱,所述从数据源抽取知识到形成政务知识图谱包括实体对齐、知识图谱构建、不一致性解决、数据分析和政务知识图谱的更新和维护。
7.根据权利要求6所述的一种生成六维知识图谱的系统,其特征在于,所述实体对齐采用聚类的系统将这些实体归并为一个具有全局唯一标识的实体对象添加到知识图谱中。
8.根据权利要求6所述的一种生成六维知识图谱的系统,其特征在于,所述知识图谱构建采用的系统是自顶向下和自底向上相结合的方式构建最基本的本体包括概念、概念层次、属性、属性值类型、关系、关系定义域概念集以及关系值域概念集。
9.根据权利要求6所述的一种生成六维知识图谱的系统,其特征在于,所述不一致性解决通过手工指定规则来定义或优先采用可靠性高的数据抽取得到的事实。
10.根据权利要求6所述的一种生成六维知识图谱的系统,其特征在于,所述数据分析通过定义知识属性和关系进行数据延伸推理和分析,所述政务知识图谱的更新和维护,实时的热点知识定义5个小时更新一次,通过搜索结果可以反映出来;其他Type数据由人工不定期审核后更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国衡智慧城市科技研究院(北京)有限公司,未经国衡智慧城市科技研究院(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911370190.5/1.html,转载请声明来源钻瓜专利网。