[发明专利]一种基于图神经网络的真值发现方法在审

申请号：	202110666206.8	申请日：	2021-06-16
公开（公告）号：	CN113591903A	公开（公告）日：	2021-11-02
发明（设计）人：	董永权;陈华凤	申请（专利权）人：	江苏师范大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08
代理公司：	北京淮海知识产权代理事务所(普通合伙) 32205	代理人：	周淑淑
地址：	221116 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于神经网络真值发现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图神经网络的真值发现方法，其特征在于，包括以下步骤：

步骤1：源可靠性建模

步骤1-1：引入源可靠性建模的第一种交互：源-观测值交互:G_sc＝(S∪C,GE_sc)，式中，S表示源的集合，C表示观测值集合，GE_sc表示源和观测值之间的边，并定义源s_i提供的观测值c_j的源感知得分r_ij作为边上权值；

步骤1-2：将所有源、观测值和源感知得分嵌入，得到它们的向量表示；

步骤1-3：将源-观测值交互中的每一个交互向量化；

步骤1-4：引入变量观测值注意力α_ia，其中α_ia表示在源s_i的观测值集合中的c_a对源s_i在claim-space中的潜在因子的注意力权值，设计注意力网络来参数化α_ia，在实现过程中使用两层神经网络来获取，可靠性感知交互表示x_ia和目标源s_i的嵌入p_i被作为网络的输入；

步骤1-5：计算源s_i在源-观测值交互中的潜在因子

步骤1-6：引入源可靠性建模的第二种交互：源-源交互:G_ss＝(S,GE_ss)，式中，S表示源的集合，GE_ss表示源和源之间的边，并定义源s_i与源s_j之间的相似度sim_ij；

步骤1-7：引入变量源注意力β_io，其中β_io表示在源s_i的相似源集合中的s_o对源s_i在源-源交互中的潜在因子的注意力权值；

步骤1-8：计算源s_i在源-源交互中的潜在因子

步骤1-9：图神经网络模型聚合步骤1-5和步骤1-8两种交互中的潜在因子，学习源的可靠性嵌入h_i；

步骤2：观测值可信度建模

步骤2-1：根据学习到的源的可靠性嵌入h_i来表示观测值的可信度嵌入；

步骤3：真值推断

步骤3-1：将步骤2-1得到的所有观测值的可信度嵌入按照训练集：测试集＝1:9比例划分，然后结合训练集中的观测值的标签，使用机器学习库中的梯度提升决策树分类器，训练分类模型TD分类器；

步骤3-2：推断未知真值的其他条目的真值，使用学习到的TD分类器计算并输出每一个观测值为真的概率值，最后取条目的互斥观测值集合中为真概率最大的观测值作为此条目的真值输出。

2.根据权利要求1所述的一种基于图神经网络的真值发现方法，其特征在于，所述步骤1-1中，如果一个源s_i提供了一个观测值c_j，则定义观测值c_j的源感知得分r_ij作为边上的权值，否则为0，其中r_ij的定义如下：

式中：为提供观测值c_j的源的集合；

为提供观测值c_i的源的集合；

为条目e_i的所有互斥观测值集合。

3.根据权利要求1或2所述的一种基于图神经网络的真值发现方法，其特征在于，所述步骤1-2中源s_i的嵌入向量表示为p_i，对于源s_i提供的一个观测值c_a，得到观测值的嵌入向量q_a，源感知得分r_ia的嵌入向量表示为u_r，其中对应的嵌入向量p_i，q_a和u_r的维度相同，都设置为d。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江苏师范大学，未经江苏师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110666206.8/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载