[发明专利]一种知识图谱构建方法及相关设备有效
| 申请号: | 201811160745.9 | 申请日: | 2018-09-30 |
| 公开(公告)号: | CN110110092B | 公开(公告)日: | 2021-03-09 |
| 发明(设计)人: | 韩旭红 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 知识 图谱 构建 方法 相关 设备 | ||
本发明公开了一种知识图谱构建方法及相关装置,方法包括:获取语料数据;对语料数据中的多个语句利用预设的实体对关系进行实体对匹配,得到匹配结果;利用训练学习模型对包含实体正例的语句和包含实体负例的语句进行训练,得到训练结果,训练结果至少包括语句中各词语在语句中的权重值;基于权重值满足第一预设条件的词语生成关系模板;基于正例语句及其概率值和负例语句及其概率值,计算关系模板的概率值;确定关系模板中概率值满足第三预设条件的目标关系模板,并对语句中的实体对利用目标关系模板计算相应实体对关系的比例值;选取实体对关系的比例值满足第四预设条件的实体对进行知识图谱的构建。
技术领域
本申请涉及数据处理技术领域,特别涉及一种知识图谱构建方法及相关设备。
背景技术
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。最近,大规模知识图谱库的研究和应用在学术界和工业界引起了足够的注意力。一个知识图谱旨在描述现实世界中存在的实体以及实体之间的关系。随着人工智能的技术发展和应用,知识图谱作为关键技术之一,已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。
知识图谱构建从最原始的数据(包括结构化、半结构化、非结构化数据)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取知识事实,并将其存入知识库的数据层和模式层。当前知识图谱构建方法主要有以下几种:一种为人工构建,通过人工整理结构化数据得到,这种方案通常存在耗时耗力构建效率较低的问题;另一种为自动构建,主要通过NLP技术对数据进行实体抽取,再通过模板匹配或者分类模型获取实体之间的关系,从而构建知识图谱,这种方案中虽然能够提高构建效率,但是分类模型仍然需要大量人工标注训练语料,导致仍然存在效率较低的问题,而且通过模板匹配或分类模型对从数据抽取到的实体进行关系获取时会产生很多噪声,导致构建准确率较低。
因此,亟需一种能够准确构建知识图谱的实现方案。
发明内容
鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的知识图谱的构建准确率较低的技术问题。
借由上述技术方案,本发明提供的一种知识图谱构建方法,包括:
获取语料数据,所述语料数据中包括多个语句;
对所述多个语句利用预设的实体对关系进行实体对匹配,得到匹配结果,所述匹配结果表明所述语句是否包含实体正例或者实体负例;
利用预设的训练学习模型对包含实体正例的语句和包含实体负例的语句进行训练,得到训练结果,所述训练结果至少包括所述语句为正例语句或负例语句的概率值以及所述语句中各词语在所述语句中的权重值;
基于所述权重值满足第一预设条件的词语、所述语句中实体词语中间的词语及其前后词语中N个参数值满足第二预设条件的词语,生成关系模板,N为大于或等于1的正整数;
基于所述正例语句及其概率值和所述负例语句及其概率值,计算所述关系模板的概率值;
确定所述关系模板中概率值满足第三预设条件的目标关系模板,并对所述语句中的实体对利用所述目标关系模板计算相应实体对关系的比例值;
选取所述实体对关系的比例值满足第四预设条件的实体对进行知识图谱的构建。
上述方法,优选的,在计算所述关系模板的概率值之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811160745.9/2.html,转载请声明来源钻瓜专利网。





