[发明专利]一种实体关系自动识别方法及系统有效

专利信息
申请号: 201711190865.9 申请日: 2017-11-24
公开(公告)号: CN107944559B 公开(公告)日: 2021-04-27
发明(设计)人: 王丽宏;彭浩;马宏远;刘哲;聂健;袁石;孙佩源;王博;贺敏;刘玮 申请(专利权)人: 国家计算机网络与信息安全管理中心
主分类号: G06N5/02 分类号: G06N5/02;G06N3/04
代理公司: 北京华夏泰和知识产权代理有限公司 11662 代理人: 陈英
地址: 100029*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实体 关系 自动识别 方法 系统
【权利要求书】:

1.一种实体关系自动识别方法,其特征在于,包括:

对每一种关系种类从知识图谱中获取具有所述关系种类的若干实体组;从知识库中分别获取对应不同所述实体组的语料库,将所述语料库中的语料进行分词,并将分词得到的词语转化为词向量;

将语料库中的所述词向量转化为矩阵作为输入,将所述语料库对应的实体组的关系种类作为输出,训练得到实体关系识别模型;

从知识库中获取对应待确认实体组的相关语料库;将所述相关语料库中的相关语料进行分词,并将分词得到的相关词语转化为相关词向量;

将所述相关词向量按相关语料转化为矩阵作为所述实体关系识别模型的输入,得到所述相关语料库中每一条相关语料的相关关系种类;并计算所述相关关系种类的相似度值;

将所有所述相似度值按大小进行排序,将排名名次高于预设排名名次的相似度值对应的所述相关关系种类作为所述待确认实体组的关系种类;

计算所述相关关系种类的相似度值,具体包括:

根据所述相关关系种类从知识图谱中获取具有所述相关关系种类的检测实体组,从知识库中获取对应所述检测实体组的检测语料;

将所述检测语料进行分词,并将分词得到的检测词语转化为检测词向量;

根据所有所述检测词向量的平均词向量和所述相关关系种类对应的所有所述相关词向量的平均词向量计算得到检测语料与相关语料的相似度值,即所述相关关系种类的相似度值。

2.根据权利要求1所述的一种实体关系自动识别方法,其特征在于,所述将排名名次高于预设排名名次的相似度值对应的所述相关关系种类作为所述待确认实体组的关系种类之后,该自动识别方法还包括:

根据所述待确认实体组的关系种类对所述知识图谱进行更新。

3.根据权利要求1所述的一种实体关系自动识别方法,其特征在于,所述实体关系识别模型的结构包括:卷积神经网络结合softmax分类器或深层卷积神经网络结合softmax分类器。

4.根据权利要求3所述的一种实体关系自动识别方法,其特征在于,所述将语料库中的所述词向量转化为矩阵作为输入,将所述语料库对应的实体组的关系种类作为输出,训练得到实体关系识别模型,具体包括:

将所述语料库中的所述词向量转化为矩阵输入所述卷积神经网络中,利用卷积神经网络的正向传播按预设权重进行迭代计算得到预测值;

利用卷积神经网络的反向传播计算预测值与所述语料库对应的实体组的关系种类的误差值,当所述误差值大于或等于预设阀值时,对预设权重进行调整,重新进行迭代计算预测值;当误差值小于预设阀值时,则得到所述实体关系识别模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711190865.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top