[发明专利]一种图谱推理规则的自动提取方法在审
申请号: | 202010467090.0 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111368069A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 俞山青;童天航;甘燃;陈晋音;宣琦 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/36;G06N3/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图谱 推理 规则 自动 提取 方法 | ||
本发明公开了一种图谱推理规则的自动提取方法,包括:1)使用图谱数据和所需提取规则的关系信息构建出一个正向种群和一个逆向种群,每个种群都包含一定数量的初代个体,每个个体包含若干的随机连接的处理节点和判断节点。2)在每个个体中提取节点链。3)通过图谱数据和节点链提取规则,计算规则的相关指标并根据结果反馈给相关的个体和节点。4)从本代两个种群中选出适应度较高的个体作为父母个体对所有个体进行随机变异和种群间的交叉,产生下一代的个体。5)重复执行上述步骤直至达到设定的目标代数或经过一定代数没有新的规则产生。该方法能有效的提取出符合要求的规则,且规则能有较好的可解释性。
技术领域
本发明属于数据挖掘与信息处理技术领域,具体涉及一种图谱推理规则的自动提取方法。
背景技术
随着信息技术的飞速发展,各个行业都产生了庞大的数据,其中大多数数据往往是无效数据并不能产生更多的价值,但是关系型数据却能通过分析能获得更多市场信息,创造更多的二次价值。为了更好的存储和分析这样的关系型数据,知识图谱技术应运而生。知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化,或知识领域映射地图,用来显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及载体,挖掘、分析、构建、绘制和显示知识及他们互相之间的关系。
知识图谱是实体和关系构成的有向图,图中的节点代表实体,边代表实体之间的语义关系。知识图谱中最基本的表现形式是三元组。目前的知识图谱一般规模较大,但是其中绝大多数的知识图谱都是不完备的,因为有大量的知识无法在其中有效地表达。
知识图谱能把复杂的知识领域及知识体系通过数据挖掘、信息处理、知识计量和图形绘制显示出来,表示该领域的发展动态及规律,为该领域的研究提供全方位、整体性、关系链的参考。为了更好的利用知识图谱获取数据的价值最大化,往往需要对图谱数据进行推理,这样才能从数据中产生新的价值。其中对知识图谱的数据进行规则提取是知识图谱推理的先决条件,更加迫切的需要技术上的支持。
现在虽然有了一些知识图谱规则的提取方法,但往往都存在着一定程度上的不足。例如路径排序算法PRA(Path Ranking Algorithm,以两个实体间的路径作为特征,来判断它们之间可能存在的关系)、SFE等方法通过近似路径遍历的方法虽然能得到在一定长度内的所有规则,但是往往会得到较多重复的规则,而且算法的时间复杂度很高,提取规则的效率较低,并且无法提取复杂和较长的规则。
图嵌入算法Node2vec、TransE(表示学习在自然语言处理领域受到广泛关注起源于Mikolov等人于2013年提出的word2vec词表示学习模型和工具包。利用该模型,Mikolov等人发现词向量空间存在平移不变现象)等方法通过将节点嵌入的方式比较向量的相似性,最终利用深度学习得出的结果虽然在指标上的表现不错但是提出的规则的解释性很差,并且往往难以应用到现实中获取更多的价值。
发明内容
为了更高效地获得图谱推理规则数据,增强提取出规则的可解释性,克服传统方法中对于复杂和长规则无法提取的情况,本发明提出了一种图谱推理规则的自动提取方法。
本发明解决其技术问题所采用的技术方案:
一种图谱推理规则的自动提取方法,包括以下步骤:
(1)提供需要提取规则的关系和图谱数据,图谱数据中包含若干个由头实体、实体间关系以及尾实体组成的样本,从随机选取的样本的头实体出发,根据该头实体在图谱数据中的连接关系随机生成的个体组成正向种群,从随机选取的样本的尾实体出发,根据该尾实体在图谱数据中的连接关系随机生成的个体组成逆向种群;针对个体,选取图谱数据中非提取规则关系的连接关系作为用于判断关系的判断节点,并为判断节点添加用于判定判断节点为起始节点或结束节点的处理节点,判断节点按照选取顺序依次连接后与处理节点组成个体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010467090.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多部件自注意力机制的行人重识别方法
- 下一篇:激光共聚焦测高方法