[发明专利]实体链接方法、系统、存储介质及电子设备在审
| 申请号: | 202110789062.5 | 申请日: | 2021-07-13 |
| 公开(公告)号: | CN113641922A | 公开(公告)日: | 2021-11-12 |
| 发明(设计)人: | 崔小波 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/34;G06F16/33;G06F16/36;G06F40/279 |
| 代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
| 地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实体 链接 方法 系统 存储 介质 电子设备 | ||
1.一种实体链接方法,其特征在于,包括:
文档实体列表获得步骤:使用实体识别模型对在线文档进行实体识别,获得文档实体列表;
用户名称获取步骤:为每一登陆用户分配一个ID获得标识id,通过所述标识id获得用户名称列表;
摘要向量获取步骤:根据在线文档通过TextRank算法获取所述在线文档的摘要向量;
链接步骤:根据所述文档实体列表及所述用户名称列表获取词向量,根据所述词向量及所述摘要向量获得相似度,根据所述相似度及所设置的阈值进行实体链接。
2.如权利要求1所述的实体链接方法,其特征在于,所述摘要向量获取步骤包括:
分割步骤:把所述在线文本分割成多个组成单元;
构建步骤:构建节点连接图;
计算步骤:用句子之间的相似度作为边的权重,通过TextRank公式循环迭代计算句子的TextRank值;
组成步骤:抽取所述TextRank值排名高的句子组合成文本摘要;
摘要向量计算步骤:对所述文本摘要进行处理后获得多个特征词向量,根据所述特征词向量获得所述摘要向量。
3.如权利要求2所述的实体链接方法,其特征在于,所述链接步骤包括:
记录每一条关系路径中的节点名称,节点属性,实体关系,获取关系路径中的节点名称,节点属性,实体关系的词向量,相加构成词向量值,记录节点的id值。
4.如权利要求3所述的实体链接方法,其特征在于,所述链接步骤包括:
组成步骤:获取所述在线文档实体列表中的每一个实体,与多用户名称列表中的每一个用户名称,组成实体对;
搜索步骤:在知识图谱中搜索名称为实体对中所指节点间的关系;
判断步骤:如果所述节点间存在关系路径,记录每一条所述关系路径中的节点名称,节点属性,实体关系,获取所述节点名称、所述节点属性及所述实体关系的词向量,相加构成词向量值,记录所述节点的id值。
5.如权利要求4所述的实体链接方法,其特征在于,所述判断步骤包括:
相似度的最大值获取步骤:取每一个用户名称和所述在线文档实体有关系的关系值与所述摘要向量计算相似度,并取所述相似度的最大值;
候选实体最大值获取步骤:对于所述在线文档中所有实体,在所述知识图谱中搜索相同名字的所有节点,获取所述节点名称、属性和它的每一条关系,获取词向量,相加构成中间值,并计算所述中间值向量与所述摘要向量的相似度,取多个候选实体中相似度的最大值;
根据权重计算得分步骤:如果相似度的最大值不为0,则给所述相似度的最大值较高的权重,所述候选实体最大值相对低的权重,组合成最后得分;如果所述相似度的最大值为0,则只取所述实体最大值分值。
6.一种实体链接系统,其特征在于,包括:
文档实体列表获得模块,所述文档实体列表获得模块使用实体识别模型对在线文档进行实体识别,获得文档实体列表;
用户名称获取模块,所述用户名称获取模块为每一登陆用户分配一个ID获得标识id,通过所述标识id获得用户名称列表;
摘要向量获取模块,所述摘要向量获取模块根据在线文档通过TextRank算法获取所述在线文档的摘要向量;
链接模块,所述链接模块根据所述文档实体列表及所述用户名称列表获取词向量,根据所述词向量及所述摘要向量获得相似度,根据所述相似度及所设置的阈值进行实体链接。
7.如权利要求6所述的实体链接系统,其特征在于,所述摘要向量获取模块包括:
分割单元,所述分割单元把所述在线文本分割成多个组成单元;
构建单元,所述构建单元构建节点连接图;
计算单元,所述计算单元用句子之间的相似度作为边的权重,通过TextRank公式循环迭代计算句子的TextRank值;
组成单元,所述组成单元抽取所述TextRank值排名高的句子组合成文本摘要;
摘要向量计算单元,所述摘要向量计算单元对所述文本摘要进行处理后获得多个特征词向量,根据所述特征词向量获得所述摘要向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110789062.5/1.html,转载请声明来源钻瓜专利网。





