[发明专利]数据验证方法和装置、电子设备、计算机可读介质在审
申请号: | 202110446545.5 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113127648A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 余金星;蔡云峰;孙明明;李平 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 验证 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种数据验证方法,所述方法包括:
将知识图谱的三元组转换到矩阵空间,得到与所述三元组的实体对应的实体矩阵,和与所述三元组的实体间的关系对应的两个关系矩阵;
基于所述实体矩阵、所述两个关系矩阵,得到所述三元组的距离值;
基于所述距离值,验证所述三元组,得到验证结果。
2.根据权利要求1所述的方法,其中,所述实体矩阵包括:分别与头实体和尾实体对应的头矩阵和尾矩阵,所述基于所述实体矩阵、所述两个关系矩阵,得到所述三元组的距离值,包括:
分别将所述头矩阵、所述尾矩阵、所述两个关系矩阵代入距离评分函数,计算得到所述三元组的距离值。
3.根据权利要求2所述的方法,其中,所述距离评分函数采用下式表示:
||F表示矩阵的F范数,H表示头矩阵,T表示尾矩阵,R、R’表示两个关系矩阵,h表示头实体,t表示尾实体,r表示头实体与尾实体之间的关系,f(h,r,t)表示三元组的距离值。
4.根据权利要求3所述的方法,所述方法应用于已训练的评分模型,所述评分模型的输入为所述知识图谱的三元组,所述评分模型的输出为所述知识图谱的三元组的真假概率值,在所述矩阵空间中各个矩阵的参数随机初始化之后,采用以下训练步骤训练得到所述评分模型:
选取所述知识图谱的预设数量的三元组作为正样本输入预设的网络,对所述正样本进行随机采样得到该三元组的负样本;
基于所述正样本、所述负样本计算所述网络的损失函数,更新各个实体矩阵的参数、各个关系矩阵的参数;
响应于所述网络满足训练完成条件,则将所述网络作为已训练的评分模型。
5.根据权利要求4所述的方法,其中,所述损失函数包括:
其中,γ为超参数,σ(x)表示sigmoid激活函数;k是负样本的个数;(h′i,r,t′i)表示第i个采样的负样本,(h′i,r,t′i)通过将三元组(h,r,t)的头实体或尾实体随机替换得到;p(h′i,r,t′i)表示负样本的权重,p(h′i,r,t′i)采用softmax函数。
6.根据权利要求4所述的方法,其中,所述损失函数包括:L=L1+λLreg;其中,λ为正则项系数,是超参数;
γ为超参数,σ(x)表示sigmoid激活函数;k是负样本的个数;(h′i,r,t′i)表示第i个采样的负样本,(h′i,r,t′i)通过将三元组(h,r,t)的头实体或尾实体随机替换得到;p(h′i,r,t′i)表示负样本的权重,p(h′i,r,t′i)采用softmax函数;
Lreg=|W2-W|F+|W′2-W′|F;
W=RTR,W′=R′TR′。
7.根据权利要求1-3之一所述的方法,其中,所述将知识图谱的三元组转换到矩阵空间,得到与所述三元组的实体对应的实体矩阵,和与所述三元组的实体间的关系对应的两个关系矩阵,包括:
将所述知识图谱的三元组输入已训练完成的知识图谱嵌入模型,得到所述知识图谱嵌入模型输出的与所述三元组的实体对应的实体矩阵,和与所述三元组的实体间的关系对应的两个关系矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110446545.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置