[发明专利]一种基于图神经网络的真值发现方法在审
申请号: | 202110666206.8 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113591903A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 董永权;陈华凤 | 申请(专利权)人: | 江苏师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京淮海知识产权代理事务所(普通合伙) 32205 | 代理人: | 周淑淑 |
地址: | 221116 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 真值 发现 方法 | ||
1.一种基于图神经网络的真值发现方法,其特征在于,包括以下步骤:
步骤1:源可靠性建模
步骤1-1:引入源可靠性建模的第一种交互:源-观测值交互:Gsc=(S∪C,GEsc),式中,S表示源的集合,C表示观测值集合,GEsc表示源和观测值之间的边,并定义源si提供的观测值cj的源感知得分rij作为边上权值;
步骤1-2:将所有源、观测值和源感知得分嵌入,得到它们的向量表示;
步骤1-3:将源-观测值交互中的每一个交互向量化;
步骤1-4:引入变量观测值注意力αia,其中αia表示在源si的观测值集合中的ca对源si在claim-space中的潜在因子的注意力权值,设计注意力网络来参数化αia,在实现过程中使用两层神经网络来获取,可靠性感知交互表示xia和目标源si的嵌入pi被作为网络的输入;
步骤1-5:计算源si在源-观测值交互中的潜在因子
步骤1-6:引入源可靠性建模的第二种交互:源-源交互:Gss=(S,GEss),式中,S表示源的集合,GEss表示源和源之间的边,并定义源si与源sj之间的相似度simij;
步骤1-7:引入变量源注意力βio,其中βio表示在源si的相似源集合中的so对源si在源-源交互中的潜在因子的注意力权值;
步骤1-8:计算源si在源-源交互中的潜在因子
步骤1-9:图神经网络模型聚合步骤1-5和步骤1-8两种交互中的潜在因子,学习源的可靠性嵌入hi;
步骤2:观测值可信度建模
步骤2-1:根据学习到的源的可靠性嵌入hi来表示观测值的可信度嵌入;
步骤3:真值推断
步骤3-1:将步骤2-1得到的所有观测值的可信度嵌入按照训练集:测试集=1:9比例划分,然后结合训练集中的观测值的标签,使用机器学习库中的梯度提升决策树分类器,训练分类模型TD分类器;
步骤3-2:推断未知真值的其他条目的真值,使用学习到的TD分类器计算并输出每一个观测值为真的概率值,最后取条目的互斥观测值集合中为真概率最大的观测值作为此条目的真值输出。
2.根据权利要求1所述的一种基于图神经网络的真值发现方法,其特征在于,所述步骤1-1中,如果一个源si提供了一个观测值cj,则定义观测值cj的源感知得分rij作为边上的权值,否则为0,其中rij的定义如下:
式中:为提供观测值cj的源的集合;
为提供观测值ci的源的集合;
为条目ei的所有互斥观测值集合。
3.根据权利要求1或2所述的一种基于图神经网络的真值发现方法,其特征在于,所述步骤1-2中源si的嵌入向量表示为pi,对于源si提供的一个观测值ca,得到观测值的嵌入向量qa,源感知得分ria的嵌入向量表示为ur,其中对应的嵌入向量pi,qa和ur的维度相同,都设置为d。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏师范大学,未经江苏师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110666206.8/1.html,转载请声明来源钻瓜专利网。