[发明专利]一种实体关系自动识别方法及系统有效
申请号: | 201711190865.9 | 申请日: | 2017-11-24 |
公开(公告)号: | CN107944559B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 王丽宏;彭浩;马宏远;刘哲;聂健;袁石;孙佩源;王博;贺敏;刘玮 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N3/04 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 陈英 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 关系 自动识别 方法 系统 | ||
1.一种实体关系自动识别方法,其特征在于,包括:
对每一种关系种类从知识图谱中获取具有所述关系种类的若干实体组;从知识库中分别获取对应不同所述实体组的语料库,将所述语料库中的语料进行分词,并将分词得到的词语转化为词向量;
将语料库中的所述词向量转化为矩阵作为输入,将所述语料库对应的实体组的关系种类作为输出,训练得到实体关系识别模型;
从知识库中获取对应待确认实体组的相关语料库;将所述相关语料库中的相关语料进行分词,并将分词得到的相关词语转化为相关词向量;
将所述相关词向量按相关语料转化为矩阵作为所述实体关系识别模型的输入,得到所述相关语料库中每一条相关语料的相关关系种类;并计算所述相关关系种类的相似度值;
将所有所述相似度值按大小进行排序,将排名名次高于预设排名名次的相似度值对应的所述相关关系种类作为所述待确认实体组的关系种类;
计算所述相关关系种类的相似度值,具体包括:
根据所述相关关系种类从知识图谱中获取具有所述相关关系种类的检测实体组,从知识库中获取对应所述检测实体组的检测语料;
将所述检测语料进行分词,并将分词得到的检测词语转化为检测词向量;
根据所有所述检测词向量的平均词向量和所述相关关系种类对应的所有所述相关词向量的平均词向量计算得到检测语料与相关语料的相似度值,即所述相关关系种类的相似度值。
2.根据权利要求1所述的一种实体关系自动识别方法,其特征在于,所述将排名名次高于预设排名名次的相似度值对应的所述相关关系种类作为所述待确认实体组的关系种类之后,该自动识别方法还包括:
根据所述待确认实体组的关系种类对所述知识图谱进行更新。
3.根据权利要求1所述的一种实体关系自动识别方法,其特征在于,所述实体关系识别模型的结构包括:卷积神经网络结合softmax分类器或深层卷积神经网络结合softmax分类器。
4.根据权利要求3所述的一种实体关系自动识别方法,其特征在于,所述将语料库中的所述词向量转化为矩阵作为输入,将所述语料库对应的实体组的关系种类作为输出,训练得到实体关系识别模型,具体包括:
将所述语料库中的所述词向量转化为矩阵输入所述卷积神经网络中,利用卷积神经网络的正向传播按预设权重进行迭代计算得到预测值;
利用卷积神经网络的反向传播计算预测值与所述语料库对应的实体组的关系种类的误差值,当所述误差值大于或等于预设阀值时,对预设权重进行调整,重新进行迭代计算预测值;当误差值小于预设阀值时,则得到所述实体关系识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711190865.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:餐椅(CJW1607Y)
- 下一篇:餐椅(H4010Y)